第七期 2004年01月
編者的話 首頁  

放大

學習評量
>> 教師談學習評量  

  2003年底,特區政府對澳門教育制度開展修訂工作,在諮詢公眾的《教育制度檢討建議案》內容第十二條提出:“評核學生的學習成效透過多元評核施行,以促進學生學習成功為主要目的”。這次向教師提出改革評量的方式,並不表示教師忽略學生態度和實作的學習結果,主要是因為傳統的紙筆測驗無法窺見學生的學習過程與真實應用的學習效果,亦因紙筆測驗本身的局限,無法確切評量認知領域較高層次以及技能領域與情意領域的學習效果。

  學習評量除了要達到既定教學目標外,學習過程的評量亦應受到重視。評量的目的與作用在於激勵學生學習,確認學生學習的成果,診斷學生學習的弱點,為學生修正錯誤提供回饋訊息。評量亦為教師改進教學提供可靠的依據。究竟現時一般學校施行何種學習評量的方式?在評量改革中遇到哪些問題?

  為了解本澳現時教師對學習評量的看法,以及在施行評量時所遇到的困難,今期《教師雜誌》邀請了來自四所學校的初中教師,就有關學生評量問題進行了座談會。參與座談的教師包括培華中學的潘燕華老師、蔡高中學的陳燕萍老師、聖保祿學校的黃錦歡老師以及濠江中學的周啟棻老師。同時,編輯組亦邀請了澳門大學教育學院梁成安博士參與座談會,以引領相關問題的探討。會上教師各抒己見,其中不少談及的問題均值得我們前線教師作進一步的思考。

對多元評量的看法

 編:現階段教育界正展開教育制度檢討工作,在有關的建議案中提到向學生施行多元評量,究竟何謂多元評量?我們先請梁博士談談對多元評量的看法。
 梁:理論上,所謂多元評量,可以指以下幾方面:首先它可以指在評量項目方面的多元化,例如在傳統評量中文、英文、數學等科目時,我們亦可嘗試同時評量其他的內容,例如音樂、體育或德育等方面。理念上評量學生應多元化,不應偏重某一方面,特別在初中或小學,評量的空間較高中為大,因為不像高中階段,學生需要面對公開考試的問題;而另一個概念是:多元評量是指不同形式的測驗,例如實作評量、做研究計劃等,這些都是運用不同的方式去評量學生的能力,所以多元評量可以從不同的角度去理解。但無論施行何種評量,都離不開它原先要達到的教學目標,有教學目標才有教學過程,最後產生教學評量。如果偏離了教學目標,評量本身就不能達到目的,亦失去評量的意義。在教學理論上,都強調教學目標、教學過程,以至最終的教學評量,這是三位一體的。意即教學要達到什麼目標,於是進行一個過程,最後評量的結果要反映教學的目標。如果目標不清晰時,評量的結果就不清晰,其效果亦不會理想。

評量方式面面觀

 編:現在請各位介紹你們所任教的學校正在實施的有哪些評量方式?
 黃:我校評量學生主要還是以紙筆考試方式為主,而平時的考核則會加入另類的評量方式,例如分小組完成專題習作(Project)、匯報演示(Presentation)等,現在對學生的評量正朝多元化方向發展,在考試的方式上亦會考慮加入多元化的元素。
 周:我校重視學生的素質培養,對於評量學生的能力以及學習以分數作為主要依據。當然,不同的學科有不同的評量情況,各有不同的評分方法和要求。以語文科為例,除了平時的測驗及考試外,平時上課我們會安排一個五分鐘的“課前小演講”活動,讓學生發表對預習內容的看法,目的是培養學生的表達能力,這些活動會打分,對提升學生的能力有一定的效果。另外,為鼓勵學生每星期閱讀報章,老師會根據報章資料選取一些專題,作為“寫作小評論”的題目,讓學生發表對報章內容的見解,提高寫作能力。以成績作為評量的結果,有它的優勢,例如:一般的測驗,它能及時反饋教師的教學質量,可以從紙面上的成績看到學生的不足,學生也可以從中看到自己有哪些需要補救的地方,這種方式較為明確及清晰。我覺得,分數在一定程度上起著鼓勵及促進學習的作用。很多學校到目前為止都是用分數作為評量學生學習成效的主要方式。當然,它亦有一定的片面性,例如試卷的批改,只由教師單方面去給予分數,這樣較為主觀;若以小組形式完成作業,然後在同學面前匯報,互相評比,這樣就較為客觀。我校亦有另一種評量方式,如地理科組,由科組長帶著一組教師組成評量小組,給學生做地震、環保綠化等專題作業,要求學生搜集資料寫報告,各組之間相互評量。音樂科亦進行音樂欣賞及音樂小評論活動,生物科組讓學生進行分組種植實驗活動,在植物收成時,由生物科組帶著全級班主任去對學生的成果進行集體評量,使評量更多元化、更靈活,而且效果頗佳。
 潘:我校亦以考試為主要的評量方式,並預計學生將會升讀大學,故此,在評量方面亦考慮到日後銜接的問題。現在所謂評量的多元化,我校除了考試的評量外,學生的操行我們也在評量。在成績考核方面,我校在去年將全學年分為三個學段,第一段及第三段各科均要考試,在第二段只考中、英、數三科,其他科目則以大測為一個基本分,目的是讓學生重視學習的過程,不會偏重考試。因為部分學生對考試十分緊張,現行減少考試次數的做法,收到較好的效果,同時也重視培養學生的品格素質。關於評量學生品格方面,我校有一個名為“十項全能”的指標,包括:公德、守紀、禮貌儀表、自信心、服務精神、學習態度、人際關係、參與精神、創意精神及課外活動。這十個項目的評量透過多種方式進行;首先要學生自評,再由班幹事去評,之後是各科任及班主任老師去評,最後由各級組及學校行政人員參與評量,使評量更加合理和準確。
 陳:我們認為評量的目的是促進學生學習的發展,既要發揮評量的激勵作用又要發揮評量的診斷作用。我校成績評定方面,總體上都是以筆試方式來評量學生,同時亦不斷推行和探索評量的多元化。自2000年在中學部推行ISO全面優質管理計劃以來,學校的教學工作包括評量都有既定的程序作為運作的基準。例如關於學生學年成績評量中規定:全學年分三個學段。全學年三個學段的成績分配比例為三三四,即第一學段成績佔全年成績的30%、第二學段成績佔全年成績的30%,第三學段成績佔全年成績的40%;每一學段的成績由考試成績和平時成績(佔50%)構成。平時成績的評量,由各學科根據本科的特點訂定出評量學生的準則及分數比例,作為老師評量平時成績的指引。以理科組為例,指引中規定每學段平時成績評量按七二一的比例實施,即測驗成績佔平時成績的70%,實驗操作、實驗考試、專題報告、作業講評、小製作等佔平時成績的20%,學習表現,包括學習態度、課堂上有否積極思考及發言,繳交功課表現等佔10%。從成績評量的構成中,體現了以筆試方式為主的多元評量方式,即除了測驗考試的成績外,還有實驗操作、專題報告、作業講評、小製作、學習態度、課堂上有否積極思考及發言、繳交功課等方面的多元評量。這種評量方式既考慮了學生的智力因素也考慮了學生的非智力因素兩個層面。同時,通過ISO全面優質管理之持續改善機制的每年檢討,保證了多元化評量的探索和深化,評量的作用得以有效的發揮,學生的智力因素和非智力因素均得到提升,理科組絕大多數班級的合格率達到或超過校本標準的要求。
 梁:理論上評量都會涉及兩個大方向;一是公平性,另一個是對學習者需要的鼓勵。兩者看似是不同的目標,這就要看你的教育目標為何,若果教學目標是要訂下一個公平的升留級準則,就不同於是對學生學習的激勵或鼓勵,這兩個目標是很不相同的,若在同一個教學環境下同時達到上述兩種目標,操作技巧要求較高,同時,現階段不宜將兩方面的目標混合一起實施。
 周:我們所採用的各種評量,目的都是以鼓勵為主,使學生能主動地、愉快地學習。
 梁:既然一些評量的目的是鼓勵性,那麼未必需要準確地評量,無需準確分辨兩個接近分數的分別,所以很多教育學家都建議,如果評量的目的是鼓勵或激勵性的話,就不必給予0 至 100分的分數,只需給予一些符號表示就足夠。
 周:若初中階段所有科目,包括中、英、數等科目都去實行這種方式,學生基本都可以升班,但到了高中,又要求以分數作評量的結果,那該怎麼辦?如何與高中應試模式銜接?

術科評量何去何從﹖

 編:如梁博士所講,那就要看評量的目的為何,不同的目的選取的評量方式會有所側重。以下想了解一下各校對於術科有哪些評量方式?
 周:音樂科的評量中,若學生成績差,我們會給予機會重考,直至學生能合格為止。本人認為音樂教育的目的主要是培養學生的音樂素質,對美的欣賞能力,懂得一些關於音樂的基礎知識等。考試除了要唱歌之外,平時還有一種名為“音樂小評論”的評量方式,就是當學生進行音樂欣賞之後,對所聽過的樂曲說出觀點。還有關於樂理知識的小測,如果學生不合格,我們會給予機會,並加以輔導,直至學生合格為止。
 潘:電腦科評量方面,因為應用資訊科技是現今生活的一部分,學生應該掌握一定的應用資訊科技的能力。若學生連最基本的技能都不能掌握,這不可能給予合格分數。若初中的學生電腦基礎能力未能達到要求,到了高中,要學的內容將更難,相信到時亦不會通過相關的評量。
 梁:有否考慮到學生電腦科不合格,當中的原因是學生的經濟條件未能擁有一部電腦,因而缺少練習的機會,而導致學生成績不合格?
 潘:教師會給予時間讓學生練習,放學後電腦室都開放給學生使用。我們曾觀察過一位電腦科不合格的學生,他雖然很努力學習,筆試都能通過,但到上機實習時不能達到我們最基本的要求,結果在學年中三段考始終都不及格。
 梁:這裡涉及兩個問題,第一,個別學生對電腦機械操作是否有障礙,當學生各方面的學習都能通過評量,但其中某科的某些項目因為出現學障或其他原因而未能達到要求,應否作彈性處理?就教學而言,可能需要個別輔導。第二,學生在校內或家中是否有足夠的電腦操作機會,這可能需要行政上配合。例如上述例子,雖然學校是開放電腦室讓學生去練習,但可能在北區某些學生,由於經濟條件差,無條件購買電腦,而在學校亦遇到限時使用的問題,這些學生比起其他家中有購置電腦的學生缺少練習的機會,這些都會影響學生的學習。在此,要強調的是無論什麼新的評量標準,我們都要有清晰的教學目標,要刺激學生,為了學生的學習,評量是為了學生學習而設的,另一方面,評量是令教學的素質有所保證,要求學生的學習達到某個標準。但每一個評量都要回應每一個目標。

評量工作困難多

 編:教師施行各種評量時,有哪些困難?
 黃:在試行多元評量時,確實遇到一些困難。雖然教師們都知道實施新的評量方式是好的,但由於每位教師面對學生的人數較多,很難全面照顧,而且由於多元評量的實施較傳統的紙筆考試費時,使教師的教學進程跟不上教學進度的要求。通常在教學過程中,在限定的教學時間內,為了完成預定的教學任務,我們都會為每個科目制定教學進度,要求在規定時間內完成為學生安排所教的內容。然而,平時要施行新的評量項目,同時還要照顧平時的測驗、考試,在加入另外一些評量方式去評量學生,所需時間較多,例如要分組安排學生進行研究,完成專題習作,之後又要安排匯報演示,以此評量學生的學習成果,由於所需時間較多,則會影響原有教學進程。
 周:無論施行哪一種評量方式,但最後要決定學生升留級方面,我們不得不跟從趨勢,以考試的分數作決定。雖然平時的考核加入了各種不同的評量方式,但仍以大測及小測為主。因為目前所使用的各種評量方式,除了一般的紙筆測驗外,如種植活動的評量、完成專題習作、匯報演示,其他的評量,較難有一個客觀準確的尺度標準去評量學生的成績,所以,上述這些評量方式實際上是把一些課外活動的形式引進課堂。我們現在雖然在討論初中教育,但這些學生亦會轉到高中學習,而高中階段將會面對日後升讀大學的公開考試問題,少不免是應試的教育,所以誰也不會在初中這個基礎階段進行大規模的改動。我覺得在評量的過程中,最困難的是摸索及試行的過程,若一旦完成這個過程,在學校的指導下開始改革,加以實施就會較好。但若果是處於試行的情況,教師一邊試行新的評量,一邊又要維持舊有的評量方式,工作量會增加很多。
 陳:實施多元評量時,在評量的方法、內容、要求、效果、時間、資源分配等方面都需要作周密的準備和精心的設計,否則容易流於形式,失去評量的意義,這體現了評量工作的困難。例如理科組在實施實驗操作的評量中,在怎樣評量學生的實驗操作,評量哪些操作,題目的設置、要求、尺度、操作時間、學生分組、儀器的準備、實驗室的安排、教師的安排等評量的運作方面,經歷了兩年的嘗試、實踐,多位老師的參與和共同努力,才摸索出一套較為可行的評量模式。目前實驗操作的評量,只處於評量基本操作技能和基本數據獲取的階段上。若要實施較高層次的實驗評量,如較高要求的實驗改良、實驗設計等,則需要較長的時間方可達到。
 潘:學校升留級的規定、學生未來升讀大學要應付的高考及其他不同升遷取向的考試都帶給教師很大壓力,這與學校施行多元評量互相產生矛盾。考試是一個最基本、最快捷的手段,因為通過考試可以評量學生基礎知識的掌握情況。教師面對的困難可以由我校其中的一個例子看到,例如:去年有一位中三畢業班的學生,全部科目中,只有電腦一科不合格,我們在評量時考慮到初三畢業班學生不能帶科升讀高一,所以在處理上感到困難。當然,除了成績之外,我們亦有查看該學生全年的學習發展情況,從全學年的成績紀錄中,發現他全年的電腦科成績均無多大進步,期間老師雖加以輔導,努力協助,但效果不明顯,如何評量該生升班還是留級呢?這給教師的決定帶來一定困難。

留級補修可行嗎﹖

 梁:你們有否考慮,有哪些科目是容許留級補修的?即讓學生升班,但不合格的科目就降一級去補修?
 潘:這種做法,對於學校的行政運作是較難實行的。
 梁:理論上這種做法對學生是好的,好像大學學分制一樣,不合格的科目就重讀。
 周:這個做法實行有一定困難,班多、學生人數多,在具體操作上會引致混亂。
 梁:當然,這是需要其他的配套支援才能施行。
 潘:無論如何,學生的基礎能力是需要由低班開始鞏固,例如英文科,若有些學生在小學時期學習成績已經特別差,那麼任由他繼續升讀中學,遇到的困難將會更大。我校曾有學生連續兩年英文科都不合格,其間老師不停地鼓勵,雖然該生也很努力,但不能吸收;一些轉讀生亦反映是因為連續兩年英語不合格,所以轉校,但第三年同樣因為英文基礎差而再面臨留級的厄運。面對評量差生的問題,老師也感到很矛盾,一般認為,為了學生將來的發展,不把焦點放在總結性評量上,而轉到檢視學生的學習過程是否有進步,同時亦觀察他在第三學段的成績,若果該科合格的話,所得分數距離合格要求差距不太遠,就會給予補考機會。我們嘗試用這個方法,幫助了有進步而成功升級的學生,但亦有不懂得珍惜這個機會而成為失敗者。
 周:有些學生,雖然學校給了機會,但由於分數很低,進步不大,所以僅一科不合格,仍然要留級。而學生的成績距離合格只差一點時,可以通過學校行政的討論,決定補考、升留問題。

新評量實施需要家長理解

 梁:家長對所謂新的評量反應如何?
 黃:在學習評量方面,我校前幾年已定下十五年多元智能評量計劃,逐步由幼稚園開始實行改革。不過,我們擔心家長是否認同我們的測量方式,因為這些多元評量並無一個具體的分數向家長呈現,家長將會質疑評量的準確性及公平性,若因為該種評量而導致學生留級或要離校,家長就會埋怨。
 陳:我校幼稚園推行校本多元智能學習評量已有兩年時間,以智能光譜系統作為評量工具評量學生。開始實施時,因為智能光譜系統沒有具體的分數顯示,有部分家長不大理解。其間,學校通過各種渠道與家長溝通,向家長解釋該評量系統的特點,發出評量指引,讓家長認識學校實施的新評量方式及此種評量方式對了解學生的成長,發展歷程和實施適切的教學,教育方法所帶來的好處,現時家長已理解和適應這種評量方式了。
 潘:評量學生的行為若得不到家長的認同或家長不明白的就會反對。就評量學生的行為,我校設計了一個25問的評量表,列出多項學生行為的評量準則,用以評量學生每週的行為,通過這個評量表,讓學生回顧過去一星期行為上要發揚和改善的地方,讓學生自我完善。我們會讓學生知道這25問的填寫是要計算在操行分數內的,評量的方式是由學生本人自行填寫,由班主任統計。

  在短短兩個小時的座談中,四位教師對於要實施評量改革的困境仍有說不完的個人體會。無可置疑,評量引導教學是既存的現象,教師面對評量的變革將面臨許多技術上的難題。然而,評量改革是提升教學效果以及學習質量的重要策略,教育改革者須透過多種渠道,提升教師評量的知識與評量素養,推動整個社會關注評量的實質意義、功能與影響,使評量改革從形式上追求多元的評量方式回歸到教育的本質。


教育及青年發展局