教育評價數(shù)字化轉(zhuǎn)型既是信息化時代教育事業(yè)發(fā)展的重要內(nèi)容,也是疫情常態(tài)化背景下教學(xué)實踐倒逼評價改革的迫切要求。具體教育評價數(shù)字化轉(zhuǎn)型內(nèi)容快跟著信息技術(shù)考試系統(tǒng)的小編來看看吧~
教育評價數(shù)字化轉(zhuǎn)型應(yīng)遵循真實性、通用性、自動性、形成性及安全性原則,從效度、公平、效率、個性、道德5個層面規(guī)約改革實踐行為。網(wǎng)上評閱系統(tǒng)、自適應(yīng)評判系統(tǒng)、數(shù)字評估與反饋系統(tǒng)等相對成熟的評價技術(shù),在優(yōu)化教育評價程序、革新評價方法、整合評價資源等方面取得明顯成效。教育評價數(shù)字化將向主體多元化、工具智能化、方式多樣化與功能實效化方向發(fā)展。
隨著人工智能、大數(shù)據(jù)等現(xiàn)代信息技術(shù)的發(fā)展,教育進(jìn)入以信息智能文明為特征的4.0時代。2022年2月,教育部部長懷進(jìn)鵬在部黨組理論學(xué)習(xí)中心組集體學(xué)習(xí)會議上指出,習(xí)近平總書記高度重視信息化建設(shè)和數(shù)字經(jīng)濟(jì)、數(shù)字中國建設(shè)發(fā)展,多次強(qiáng)調(diào)數(shù)字化、網(wǎng)絡(luò)化、智能化在中國特色社會主義現(xiàn)代化建設(shè)中的重要意義,教育系統(tǒng)要深入學(xué)習(xí)領(lǐng)會,認(rèn)真貫徹落實,把教育信息化作為發(fā)展的戰(zhàn)略制高點,以教育信息化推動教育高質(zhì)量發(fā)展,以教育信息化引領(lǐng)教育現(xiàn)代化[1]?!督逃?022年工作要點》中明確提出實施教育數(shù)字化戰(zhàn)略行動?!渡罨聲r代教育評價改革總體方案》強(qiáng)調(diào),要充分利用信息技術(shù),提高教育評價的科學(xué)性、專業(yè)性、客觀性[2]。所有這些要求都呼喚教育評價向數(shù)字化轉(zhuǎn)型,而疫情常態(tài)化更是加速了在線考試、數(shù)字化評價的發(fā)展。教育評價數(shù)字化轉(zhuǎn)型既是信息化時代教育事業(yè)發(fā)展的重要內(nèi)容,也是疫情常態(tài)化背景下教學(xué)實踐倒逼教育評價改革的迫切要求。本文圍繞教育評價數(shù)字化轉(zhuǎn)型的基本原則、應(yīng)用場域與發(fā)展方向3個問題,結(jié)合國內(nèi)外教育評價數(shù)字化建設(shè)的成果與探索,嘗試從價值、技術(shù)與實踐3個層面勾畫我國教育評價數(shù)字化轉(zhuǎn)型的發(fā)展圖景。
教育評價數(shù)字化轉(zhuǎn)型的基本原則是由教育評價的本質(zhì)屬性所決定的,是教育評價數(shù)字化轉(zhuǎn)型需要明確的首要問題。參考英國聯(lián)合信息系統(tǒng)委員會(Joint Information Systems Committee,JISC)2020年發(fā)布的《評價的未來:2025年的5項原則與目標(biāo)》(The Future of Assessment: Five Prin ciples, Five Targets for 2025)[3],數(shù)字化時代的教育評價應(yīng)遵循真實性、通用性、自動性、形成性與安全性原則[3],從效度、公平、效率、個性、道德5個層面規(guī)約改革實踐行為。
1.1 真實性原則是教育評價數(shù)字化轉(zhuǎn)型的效度保證
真實性指反映事物真實情況的程度,是教育評價數(shù)字化轉(zhuǎn)型的效度保證。真實性原則意味著讓學(xué)習(xí)者在評價過程中展現(xiàn)出最自然的狀態(tài),使教育評價能夠測試出學(xué)習(xí)者的真實水平。
信息技術(shù)有助于提高教育評價的真實性。以人機(jī)互動為特征的在線考試,為學(xué)習(xí)者創(chuàng)造的網(wǎng)上私密空間,能夠在一定程度上消解學(xué)習(xí)者的緊張情緒。特別是在面試環(huán)節(jié),以計算機(jī)為中介進(jìn)行的互動過程極大減輕了一部分面試者的心理負(fù)擔(dān),有利于學(xué)習(xí)者展現(xiàn)出最真實的水平與狀態(tài)。利用信息技術(shù)實現(xiàn)的即時評價,也突破了傳統(tǒng)教育評價的時空限制,實時監(jiān)控與行為識別功能可以對學(xué)習(xí)者的學(xué)習(xí)過程進(jìn)行及時反饋與糾正。然而,信息技術(shù)無形中也帶來了影響評價真實性的一些風(fēng)險因素,其中以考試作弊最為典型。疫情常態(tài)化背景下在線考試作弊事件頻發(fā),如:2020年12月初美國德州農(nóng)工大學(xué)800多名考生購買齊格(Chegg)公司服務(wù),在課程考試中作弊;疫情期間英國大學(xué)生作弊率升高200%,并且出現(xiàn)了代考產(chǎn)業(yè)鏈,每次費用約250~300英鎊[4]。
1.2 通用性原則是教育評價數(shù)字化轉(zhuǎn)型的公平應(yīng)允
通用性指事物適用對象與范圍的普及程度,是教育評價數(shù)字化轉(zhuǎn)型的重要追求。通用性原則要求數(shù)字化教育評價工具最大程度上為所有學(xué)習(xí)者無差別使用,這是出于保證教育公平的考量。
常用的數(shù)字技術(shù)通用性功能包括字體大小、顏色的更改、語音到文本和文本到語音的轉(zhuǎn)換,以支持有視力或閱讀障礙的學(xué)習(xí)者。一些發(fā)達(dá)國家已經(jīng)意識到教育評價工具通用性的重要價值,如:英國明確了公共部門網(wǎng)站與移動應(yīng)用程序的通用標(biāo)準(zhǔn),并在法律層面作出相應(yīng)規(guī)定;挪威在《國家指南》(Norway National Guidance)中建議大學(xué)在數(shù)字評價上采用屏幕閱讀器或放大鏡技術(shù)、可刷新的盲文顯示器和眼控技術(shù)、全功能的語音控制選項、支持語音合成的閱讀和寫作、支持所有官方語言的音頻輸出等,以便在最大范圍內(nèi)讓每個人都可以便捷使用[3]。但是,總體來看,教育評價領(lǐng)域?qū)ぞ咄ㄓ眯缘年P(guān)注仍然不夠,通用性原則并不總是作為檢測教育評價工具可否交付使用的前提標(biāo)準(zhǔn)。因而,通用性原則要求教育評價技術(shù)工具在設(shè)計階段就應(yīng)考慮殘疾人、弱勢群體等特殊背景學(xué)習(xí)者的特別需求,以保證所有學(xué)習(xí)者的無差別體驗,避免數(shù)字評價可能帶來新一輪教育不公平風(fēng)險。
1.3 自動性原則是教育評價數(shù)字化轉(zhuǎn)型的效率要求
自動性指評價工具按照特定規(guī)則與程序運行的自動化程度,是技術(shù)革新促進(jìn)教育評價智能化的直接體現(xiàn)。自動性原則意味著信息技術(shù)將教師從簡單重復(fù)的活動中解放出來,通過技術(shù)工具實現(xiàn)對學(xué)習(xí)者的自動評價。
傳統(tǒng)教育評價以人工評閱為主,為教師增添了不少負(fù)擔(dān)。通過技術(shù)優(yōu)化實現(xiàn)的自動化評價可以改善學(xué)習(xí)者的學(xué)習(xí)體驗,并為教師節(jié)省出時間去做更有價值的工作。2019年,英國在教育科技戰(zhàn)略議程中將利用信息技術(shù)減少教師準(zhǔn)備和批改作業(yè)的時間列為要解決的重要問題之一[5]。目前,選擇類客觀題型的自動評閱技術(shù)臻于成熟,還需要進(jìn)一步將自動評閱功能擴(kuò)展到涉及自然語言處理和分類的主觀題型,為學(xué)習(xí)者提供精確及時的學(xué)習(xí)反饋。英國博爾頓大學(xué)在教學(xué)中試用亞馬遜、谷歌和微軟等公司提供的自然語言處理和分類技術(shù),教師和學(xué)生都給予積極回應(yīng)。學(xué)生喜歡在回答開放式問題時收到及時反饋,教師表示自動化評價工具極大減輕了評分工作量[3]。值得注意的是,業(yè)界仍然擔(dān)憂數(shù)字教育評價自動化發(fā)展可能會減少學(xué)習(xí)者與教師的互動,以及信息技術(shù)能夠在多大程度完全取代人工評判。因此,自動性原則要求在利用信息技術(shù)提升評價效率的同時,也要循序漸進(jìn),把握好自動化評價的尺度。
1.4 形成性原則是教育評價數(shù)字化轉(zhuǎn)型的個性需求
形成性指成為某種事物或生成某種特性的發(fā)展變化過程。形成性原則是信息化時代為學(xué)習(xí)者提供持續(xù)性、定制化教育評價的要求,也是適應(yīng)學(xué)習(xí)者終身學(xué)習(xí)的需要。
信息技術(shù)使形成性評價更為便利,極大推動了循證教育評價的進(jìn)程。教育評價數(shù)字化轉(zhuǎn)型的形成性原則要求教育評價根植于學(xué)習(xí)者的學(xué)習(xí)過程,將教育評價作為觀察、反思、改善學(xué)習(xí)者學(xué)習(xí)行為的依據(jù)憑證。例如,荷蘭的量化學(xué)生(Quantified Student)項目,通過開發(fā)一系列應(yīng)用程序?qū)崿F(xiàn)對學(xué)習(xí)者的實時學(xué)情分析,讓學(xué)習(xí)者更好了解他們自己的學(xué)習(xí)行為,并將其與同齡人進(jìn)行比較,幫助學(xué)習(xí)者管理學(xué)習(xí)過程[3]。在形成性原則指導(dǎo)下,以往對學(xué)習(xí)者進(jìn)行的統(tǒng)一定期評價可能會被基于學(xué)習(xí)者需要的非定期教育評價所取代,使數(shù)字化教育評價真正滿足學(xué)習(xí)者的個性化需求,促進(jìn)學(xué)習(xí)者的形成性發(fā)展。
1.5 安全性原則是教育評價數(shù)字化轉(zhuǎn)型的道德檢視
安全性是規(guī)范教育評價相關(guān)行為的底線要求。安全性原則從道德層面檢視教育評價數(shù)字化轉(zhuǎn)型,主要包括防止考生作弊的考試過程安全與防止教育評價數(shù)據(jù)誤用的信息資源安全。
防止在線考試作弊的常用方法包括對考生面部或指紋等生物特征的數(shù)據(jù)識別,以及對考生異常反應(yīng)模式的數(shù)據(jù)取證。異常反應(yīng)模式取證將考試活動視為一個整體時間序列,假設(shè)大多數(shù)考生會在相對均勻的時間內(nèi)思考與作答,作弊則表現(xiàn)出不同的行為模式,如會出現(xiàn)一段時間不活動,隨之又有大量答案材料輸入的現(xiàn)象,以此識別出考試中的異常情況。還有研究者認(rèn)為,擊鍵動力學(xué)(keystroke dynamics)是高度個性化的“指紋”,可以辨別考生身份與答題風(fēng)格[6]。防止數(shù)據(jù)誤用的信息資源安全也是教育評價數(shù)字化轉(zhuǎn)型需要關(guān)注的一個重要問題。教育評價數(shù)據(jù)作為學(xué)習(xí)者的私人信息,也是改善教育方式與教學(xué)方法的重要數(shù)據(jù)資源。明確教育評價數(shù)據(jù)使用、傳播的相關(guān)規(guī)定,既是保護(hù)學(xué)習(xí)者個人隱私安全的必然要求,也是數(shù)字化教育評價有序發(fā)展的重要保障。
信息技術(shù)是教育評價數(shù)字化轉(zhuǎn)型的重要載體與媒介,在一定程度上決定了教育評價數(shù)字化轉(zhuǎn)型的應(yīng)用場域與范圍。國內(nèi)外相對成熟的數(shù)字化教育評價技術(shù)包括網(wǎng)上評閱系統(tǒng)、自適應(yīng)評判系統(tǒng)、數(shù)字評估與反饋系統(tǒng)等。這些技術(shù)及場景已應(yīng)用到各類教育評價實踐活動中,在優(yōu)化評價程序、革新評價方法、整合評價資源等方面取得了明顯成效。
2.1 網(wǎng)上評閱系統(tǒng)優(yōu)化教育評價程序
傳統(tǒng)人工閱卷存在評卷速度慢、效率低,錄分統(tǒng)計與數(shù)據(jù)分析困難,閱卷質(zhì)量與公平性難以保證等問題。2005年,教育部下發(fā)通知,要求各地推廣網(wǎng)上閱卷系統(tǒng),最大限度地減少評分誤差,提高工作效率,保證閱卷工作的穩(wěn)定性和可靠性[7]。2007年,教育部頒布《國家教育統(tǒng)一考試網(wǎng)上評卷工作管理辦法》,對答題卡的設(shè)計、印刷、運送和保管、評卷工作的組織管理、數(shù)據(jù)的安全和管理、網(wǎng)上評卷的環(huán)境和設(shè)備及技術(shù)維護(hù)等涉及網(wǎng)上評卷工作的重要事項提出了要求[8]。
作為教育評價數(shù)字化轉(zhuǎn)型最為基礎(chǔ)的技術(shù)工具之一,網(wǎng)上評閱系統(tǒng)經(jīng)過10多年的發(fā)展取得長足進(jìn)步。以我國科大訊飛網(wǎng)上評閱系統(tǒng)為例,訊飛啟明智能閱卷系統(tǒng)主要由數(shù)據(jù)掃描系統(tǒng)、自動評分系統(tǒng)、網(wǎng)上評卷系統(tǒng)與數(shù)據(jù)監(jiān)控系統(tǒng)構(gòu)成,以計算機(jī)網(wǎng)絡(luò)技術(shù)與圖像處理技術(shù),以及自然語言理解、智能測評等人工智能技術(shù)為依托,對各類考試答卷和文檔進(jìn)行掃描和處理,實現(xiàn)了客觀題機(jī)器自動判定和主觀題智能評分[9]。目前,訊飛啟明智能閱卷系統(tǒng)已在多個省份的高考、中考、自學(xué)考試及社會證書考試中得到應(yīng)用。
網(wǎng)上評閱系統(tǒng)通過人工智能技術(shù)優(yōu)化教育評價程序,在提升效率的同時保證教育評價的質(zhì)量與公平。第一,網(wǎng)上閱卷系統(tǒng)通過客觀題自動批閱與主觀題輔助評閱,能夠加快評分過程,降低教育評價組織成本,減少閱卷人員的簡單重復(fù)勞動,極大減輕閱卷人員的工作量,從而明顯提升教育評價效率。第二,以往在主觀題型的評分過程中,閱卷人員會不可避免地受到諸如考生書面印象、評分進(jìn)度等非客觀因素影響,網(wǎng)上評閱系統(tǒng)智能化的評分過程則不受人為干擾,能夠保證教育評價的公平公正。第三,網(wǎng)上評閱系統(tǒng)對于考試分?jǐn)?shù)與等級的自動計算與統(tǒng)計,能夠保證考試計分的準(zhǔn)確性。第四,基于卷面信息提供多維度、精細(xì)化的數(shù)據(jù)分析,有助于提升教育評價質(zhì)量,持續(xù)改進(jìn)評價結(jié)果。有研究表明,智能機(jī)器閱卷與人工閱卷在評分結(jié)果的準(zhǔn)確性上相差無幾,但在效率、質(zhì)量和公平上,前者更勝一籌。例如,有研究者選取2017年安徽省841610份高考語文作文和英語作文試卷,對智能閱卷與人工網(wǎng)上評卷進(jìn)行多維度的數(shù)據(jù)比較,發(fā)現(xiàn)智能閱卷基本達(dá)到與評卷教師相當(dāng)?shù)乃?;而智能閱卷始終嚴(yán)格按照統(tǒng)一的評分標(biāo)準(zhǔn),更具客觀公正性,還能為人工網(wǎng)上評卷提供有效的質(zhì)量監(jiān)控[10]。
2.2 自適應(yīng)評判系統(tǒng)革新教育評價方法
傳統(tǒng)評價方法通常參照一定的標(biāo)準(zhǔn),更多時候是依據(jù)標(biāo)準(zhǔn)來進(jìn)行評價的。不少學(xué)者對這種參考固定標(biāo)準(zhǔn)的絕對化評價提出質(zhì)疑,開始尋覓一條比較判斷的評價之路。通過借鑒美國芝加哥大學(xué)心理學(xué)教授 Thurstone提出的比較判斷定律,Pollitt將比較判斷法引入教育評價,最終形成基于網(wǎng)絡(luò)的自適應(yīng)評判系統(tǒng)[11]。
自適應(yīng)評判系統(tǒng)的核心技術(shù)是適應(yīng)性比較判斷(adaptive comparative judgement),主要依據(jù)自適應(yīng)算法,在不參考標(biāo)準(zhǔn)的情況下,根據(jù)特定算法向考官展示考生的成對作品,要求他們判斷哪一個更好,以此往復(fù)形成對考試作品更直觀的相對評價與整體判斷。適應(yīng)性比較判斷對于有明確標(biāo)準(zhǔn)答案的評價項目作用有限,但對寫作、設(shè)計等復(fù)雜主題和開放創(chuàng)意性題目非常適用。2009年底,Pollitt組織54名專家利用自適應(yīng)評判系統(tǒng)評閱學(xué)生寫作作業(yè),每份作業(yè)在被比較16次后所得分?jǐn)?shù)的可靠性系數(shù)達(dá)到0.96,遠(yuǎn)高于其他評價方法;進(jìn)一步測驗表明,每份作業(yè)進(jìn)行約9次比較判斷后,所得分?jǐn)?shù)的可靠性系數(shù)能達(dá)到0.93[11]。
自適應(yīng)評判系統(tǒng)的技術(shù)魅力在于使教育評價活動更加專業(yè),并且重新調(diào)整了評價與學(xué)習(xí)之間的關(guān)系。教師與學(xué)生在自適應(yīng)評判系統(tǒng)的引導(dǎo)下,將教育評價變?yōu)閹熒餐瑢W(xué)習(xí)過程。學(xué)生通過將自己的作業(yè)與更好或更差的相比較,可以更直觀地感受到什么是好、什么是差,以及為什么好和為什么差,對他們來說這是通過比較判斷獲得同輩經(jīng)驗的學(xué)習(xí)過程。例如,美國普渡大學(xué)(Purdue University)在技術(shù)設(shè)計思維課的550名一年級學(xué)生中,隨機(jī)選擇一半學(xué)生參加使用適應(yīng)性比較判斷的教育評價試驗,結(jié)果顯示:學(xué)生在與同輩和教師的合作中成功提高了課程成績,評價過程變成一種學(xué)習(xí)過程[12]。教師在適應(yīng)性比較判斷的過程中,可以更細(xì)致地觀察到不同學(xué)生在不同任務(wù)中的表現(xiàn),有助于優(yōu)化課程設(shè)計。教師還可以將自己的判斷與其他學(xué)校教師的判斷進(jìn)行比較,也有助于教師的專業(yè)發(fā)展,正如英國一所小學(xué)在聯(lián)合14所學(xué)校采用自適應(yīng)比較判斷法對學(xué)生寫作進(jìn)行評價后,該校校長指出:適應(yīng)性比較判斷有助于提高學(xué)習(xí)者的學(xué)業(yè)水平與教師的判斷力,他們對高質(zhì)量的寫作有了更清晰的認(rèn)識,促進(jìn)了不同學(xué)校教師之間的專業(yè)對話[13]。
2.3 數(shù)字評估與反饋系統(tǒng)整合教育評價資源
傳統(tǒng)評價過程大多是以評價者為中心的單向度反饋。學(xué)習(xí)者只收到零散評價信息,很少根據(jù)評價結(jié)果作出進(jìn)一步行動。數(shù)字評估與反饋系統(tǒng)將評價結(jié)果整合成教育評價數(shù)據(jù)資源庫,通過對評價數(shù)據(jù)的整理與分類,幫助學(xué)生制訂符合其學(xué)習(xí)需求的行動計劃,并就相應(yīng)的學(xué)習(xí)資源提出建議,充分發(fā)揮學(xué)習(xí)者在教育評價過程中的能動作用。
英國薩里大學(xué)(University of Surrey)的Winstone博士團(tuán)隊開發(fā)的反饋參與和追 蹤系統(tǒng)(Feedback Engagement and Tracking System)[14]是數(shù)字評估與反饋系統(tǒng)應(yīng)用的知名案例。該系統(tǒng)獲得了英國員工和教育發(fā)展協(xié)會(The Staff and Educational Development Association)頒發(fā)的2018年度教育發(fā)展倡議獎(Educational Development Initiative of the Year Award)。反饋參與和追蹤系統(tǒng)包括查看反饋、瀏覽資源與制訂行動計劃3大板塊。查看反饋部分匯集了學(xué)習(xí)者終結(jié)性評價、形成性評價、同伴評價與自我評價的所有數(shù)據(jù)信息,為學(xué)習(xí)者自動分析評價結(jié)果,明確顯示其需要改進(jìn)的地方,并根據(jù)評價結(jié)果為學(xué)習(xí)者提供發(fā)展技能評估,以幫助了解他們的發(fā)展優(yōu)勢與不足。瀏覽資源部分是為學(xué)習(xí)者技能發(fā)展提供的資源庫。學(xué)習(xí)者選擇想要學(xué)習(xí)的技能,資源庫自動匹配技能發(fā)展需要的學(xué)術(shù)資源。在制訂行動計劃部分,學(xué)習(xí)者可以創(chuàng)建一個個行動計劃,選擇計劃完成的階段性目標(biāo)與最終日期,系統(tǒng)就會根據(jù)學(xué)習(xí)者制定的行動計劃顯示相應(yīng)的完成進(jìn)度。反饋參與和追蹤系統(tǒng)配備的成績追蹤器,還能對學(xué)習(xí)者的學(xué)習(xí)情況進(jìn)行智能追蹤與分析,根據(jù)學(xué)習(xí)者的發(fā)展優(yōu)勢與需求提供個性化的學(xué)習(xí)建議。針對臨近畢業(yè)的高年級學(xué)生,反饋參與和追蹤系統(tǒng)依據(jù)大量評價數(shù)據(jù),為學(xué)生提供相應(yīng)的職業(yè)建議與職業(yè)素養(yǎng)培養(yǎng)方案,以此提高畢業(yè)生的就業(yè)能力。Winstone博士指出,以前許多學(xué)生收到評價反饋后,評價過程隨之終止;現(xiàn)在通過反饋參與和追蹤系統(tǒng),學(xué)生可以根據(jù)評價結(jié)果把控自己的學(xué)習(xí)過程,推動自己的學(xué)業(yè)發(fā)展[14]。總之,數(shù)字評估與反饋系統(tǒng)是整合學(xué)習(xí)者教育評價資源的平臺,將評價與學(xué)習(xí)更緊密結(jié)合起來。學(xué)習(xí)者可以借助教育評價結(jié)果與相關(guān)學(xué)習(xí)資源,不斷反思學(xué)習(xí)過程,改進(jìn)學(xué)習(xí)方法,實現(xiàn)持續(xù)發(fā)展與進(jìn)步。
從國內(nèi)外教育評價改革實踐來看,數(shù)字化信息技術(shù)的應(yīng)用為教育評價帶來嶄新面貌,推動教育評價向著主體多元化、工具智能化、方式多樣化與功能實效化的方向發(fā)展,將逐步實現(xiàn)家校社企參與的協(xié)同評價、人機(jī)交互協(xié)作的精準(zhǔn)評價、關(guān)注學(xué)習(xí)過程的智慧評價與彰顯本體價值的發(fā)展評價。
3.1 從以教師評價為主走向家校社企參與的協(xié)同評價,評價主體日益多元
教育評價主體是回答誰來評價的問題,誰來評價關(guān)乎教育評價權(quán)的歸屬。以往以教師為代表的校方掌握教育評價權(quán),學(xué)習(xí)者處于被評價的位置,家長、社會、企業(yè)等主體的參與感不強(qiáng)。信息技術(shù)的發(fā)展與應(yīng)用使得評價主體多元化成為可能,家校社企參與的協(xié)同評價變成教育評價數(shù)字化轉(zhuǎn)型的重要追求。
家校社企參與的協(xié)同評價意味著教育評價立場的轉(zhuǎn)變,“教育評價是一種價值判斷,表征教育活動之于主體需要的滿足程度?!盵15]不同利益主體對教育評價的需求側(cè)重有所不同。長期以來,學(xué)生、家長、社會與企業(yè)在教育評價中未能充分發(fā)揮作用,以學(xué)校為單一主體的評價機(jī)制不利于協(xié)調(diào)各利益主體的需求與意見。特別是在職業(yè)教育評價中,作為職業(yè)教育的重要利益相關(guān)者,行業(yè)與企業(yè)對職業(yè)人才素質(zhì)的要求在一定程度上決定著職業(yè)教育評價的內(nèi)容與發(fā)展方向,將行業(yè)與企業(yè)納入評價主體是改進(jìn)職業(yè)教育質(zhì)量的必要措施。
3.2 從以人工評價為主走向人機(jī)交互協(xié)作的精準(zhǔn)評價,評價工具更加智能
教育評價工具是關(guān)于如何評價的問題。評價工具智能化是教育評價數(shù)字化轉(zhuǎn)型的顯著特征之一。從以人工評價為主到人機(jī)交互協(xié)作的精準(zhǔn)評價,是信息技術(shù)發(fā)展推動教育評價變革的必然結(jié)果。
當(dāng)前,智能化教育評價工具的發(fā)展還停留在相對簡單的人機(jī)交互協(xié)作階段,存在依靠機(jī)器的完全自動化評價、機(jī)器輔助的半自動化評價及機(jī)器檢測教育評價質(zhì)量等應(yīng)用模式。其中,機(jī)器檢測教育評價質(zhì)量是通過對評價數(shù)據(jù)的統(tǒng)計分析,觀測評價者在教育評價中的穩(wěn)定性與準(zhǔn)確度,以此判斷評價者的評價水平。目前,國內(nèi)外教育評價數(shù)字化實踐更多使用的是機(jī)器輔助的半自動化評價模式,距離完全自動化評價尚有一定距離,但可以肯定的是,評價工具智能化的發(fā)展前景值得期許。在人工智能技術(shù)持續(xù)發(fā)展與不斷革新的將來,以人工智能加持的教育信息技術(shù)可以在教育評價中完全代替人的判斷,達(dá)到比人工評價更準(zhǔn)確的評價效果,實現(xiàn)更深層次、更優(yōu)體驗的人機(jī)交互協(xié)作的精準(zhǔn)評價。
3.3 從以結(jié)果評價為主走向關(guān)注學(xué)習(xí)過程的智慧評價,評價方式更為多樣
教育評價方式是關(guān)于作何評價的問題。隨著教育評價數(shù)字化轉(zhuǎn)型,以結(jié)果評價為主的教育評價方式將轉(zhuǎn)變?yōu)樵\斷性、形成性、總結(jié)性、增值性評價相結(jié)合,形成重點關(guān)注學(xué)習(xí)者學(xué)習(xí)過程的智慧評價。
智慧評價的關(guān)鍵在于將評價扎根于學(xué)習(xí)者的學(xué)習(xí)過程,通過對學(xué)習(xí)者思維動態(tài)與行為過程的實時監(jiān)控,實現(xiàn)即時評價與反饋。JISC提出,人工智能不僅能夠為學(xué)習(xí)者定制符合他們能力與需求的學(xué)習(xí)內(nèi)容,還能夠理解他們學(xué)習(xí)過程中的行為動機(jī)與心理變化,總結(jié)出學(xué)習(xí)者的固定思維方式與行動步驟[3]。另外,關(guān)注學(xué)習(xí)過程的智慧評價能夠超越“抽象的人”,將教育評價落實到“具體的人”,即“將人視為一種獨特的生命,強(qiáng)調(diào)完整的人、參與的人與個性化的人,突出評價的全面性、真實性及欣賞性,追求教育評價的平易近人,促使人的完整價值真正實現(xiàn)”[16]。總之,智慧評價將評價落實到每一個人與具體的學(xué)習(xí)過程,圍繞學(xué)習(xí)者特點與需求,對學(xué)習(xí)動態(tài)進(jìn)行實時監(jiān)控,并輔以多種評價方法開展評價。
3.4 從以工具性評價為主走向彰顯本體價值的發(fā)展評價,評價功能更加注重實效
教育評價功能是回答為何評價的問題。評價最重要的意圖不是為了證明,而是為了改進(jìn)[17]。教育評價的本體價值在于通過評價及時反饋存在的問題,促使評價對象不斷完善與優(yōu)化。教育評價數(shù)字化轉(zhuǎn)型要求評價功能更加注重實效,從以工具性評價為主轉(zhuǎn)向彰顯本體價值的發(fā)展評價。
長期以來,利用教育評價結(jié)果對學(xué)生進(jìn)行排名、分類的工具價值遮蔽了教育評價促進(jìn)學(xué)生成長、改進(jìn)教育教學(xué)、推動教育事業(yè)發(fā)展的本體價值。作為教育改革的指揮棒,教育評價的工具價值凸顯與本體價值弱化無形中催生了重分?jǐn)?shù)、重排名等不良風(fēng)氣,不利于立德樹人教育目標(biāo)的實現(xiàn),也不利于學(xué)習(xí)者的終身學(xué)習(xí)與可持續(xù)發(fā)展。因而,以教育評價數(shù)字化轉(zhuǎn)型為契機(jī),助力教育評價彰顯本體價值,具有重要意義。將教育評價真正融入學(xué)生學(xué)習(xí)成長過程和教師專業(yè)發(fā)展過程,真正發(fā)揮教育評價的實際效用,實現(xiàn)本體價值與工具價值的平衡,既是教育評價發(fā)展的內(nèi)在訴求,也是充分發(fā)揮教育評價重要作用的關(guān)鍵之舉。
原文刊載于《中國考試》2022年第6期第16—23頁。
作者:黃晶晶,武漢職業(yè)技術(shù)學(xué)院副教授。劉宇佳,武漢大學(xué)教育科學(xué)研究院在讀博士生(通信作者)。
參考文獻(xiàn)

