教育評價改革事關教育發(fā)展方向,事關建設教育強國成敗。2020年中共中央、國務院印發(fā)《深化新時代教育評價改革總體方案》(簡稱《總體方案》),這是新中國第一個關于教育評價系統(tǒng)性改革的文件。2023年5月,習近平總書記在中共中央政治局第五次集體學習時再次強調(diào),“要在全社會樹立科學的人才觀、成才觀、教育觀,加快扭轉教育功利化傾向,形成健康的教育環(huán)境和生態(tài)”“要緊扣建設教育強國目標,深化新時代教育評價改革,構建多元主體參與、符合我國實際、具有世界水平的教育評價體系”。
一、教育評價改革落實與未來發(fā)展
《總體方案》印發(fā)以來,各地重視政策引導、專業(yè)引領和典型引路,以評價改革重點任務為抓手,發(fā)揮基層首創(chuàng)精神,推動本地區(qū)本單位教育評價改革發(fā)生顯著性變化,形成了一批典型經(jīng)驗,如上海市義務教育學業(yè)質量“綠色指標”和評價數(shù)據(jù)的“無感采集”、湖南省長沙市基礎教育的“增值評價”、清華大學的體育評價改革等。根據(jù)第三方的監(jiān)測結果,在教育評價改革中,“十不得一嚴禁”等負面清單管理取得明顯成效,違規(guī)事項總體呈明顯下降態(tài)勢?!爸袊厣逃u價體系”“多元評價”“分類評價”等價值理念得到社會的廣泛認可。
按照《總體方案》要求,到2035年基本形成“富有時代特征、彰顯中國特色、體現(xiàn)世界水平的教育評價體系”,需要在教育評價的理念、理論、主體、對象、內(nèi)容、標準、方法、技術、制度、文化等方面進行體系性重塑?!案挥袝r代特征”就是要體現(xiàn)新時代的人才觀、成才觀、教育觀,特別是針對當下和未來的人才需求、拔尖創(chuàng)新人才的成長規(guī)律、教書育人的本質和規(guī)律,校準教育評價的發(fā)展方向?!罢蔑@中國特色”就是要體現(xiàn)中國教育評價的主體性、原創(chuàng)性,特別是發(fā)掘我國科學評價的典型經(jīng)驗,彰顯中國教育評價的人文精神傳統(tǒng)。“體現(xiàn)世界水平”就是要提高中國教育評價理論和評價標準的國際影響力,特別是要提出諸如“CIPP”(背景—投入—過程—結果)評價模型和“PISA”學生素養(yǎng)評價等先進評價理念和項目,能夠引領國際教育評價方向,影響各國教育政策制定。
面向2035年建成教育強國的戰(zhàn)略目標,推進新時代教育評價改革還有一些需要啃的“硬骨頭”,這些方面的探索和突破將撬動教育評價改革取得更為明顯的實質性進展。
二、面向教育強國建設推進教育評價改革的難點與探索
(一)學生評價:怎樣的評價可以促進創(chuàng)新素養(yǎng)發(fā)展
從19世紀末以來,國際教育評價理論和實踐經(jīng)歷了“測量、描述、判斷和協(xié)商”四次演進和迭代。從教育評價的歷史來看,智力測驗、認知能力評價相對比較成熟,由此形成了科學主義、管理主義的評價模式,使得“唯分數(shù)”等簡單化、單一化的量化評價長期占據(jù)主導地位。在學生德智體美勞的發(fā)展評價中,非認知能力由于難以量化和客觀測量而長期受到忽視。在建設教育強國的時代背景下,我們究竟要培養(yǎng)什么樣的人,未來對人才素養(yǎng)的要求是什么,生成式人工智能對人才培養(yǎng)的挑戰(zhàn)是什么,這些問題的答案都指向在未來社會中將居于更加重要位置的“非認知能力、社會情感能力、創(chuàng)新素養(yǎng)、高階思維和人文素養(yǎng)”,這些才是“人之為人”而無法完全被機器取代的素質,而新時代教育評價改革正是要回歸人的本質。在新時代教育評價改革中,“幸福比成功更重要,素質比分數(shù)更重要,成人比成才更重要”。[1] 推進教育評價改革,需要更加重視多元、多維、全面、高級的學生素養(yǎng)評價。
一是更重視非認知能力評價。在數(shù)字時代和創(chuàng)新時代,社會情感能力、想象力、學習興趣和幸福感變得更加重要。對學生的評價不僅要關注學習結果(學得怎么樣),更要重視學習狀態(tài)(學得快不快樂、輕不輕松)?!吧虾J兄行W生學業(yè)質量綠色指標”關注學業(yè)成績,更關注學習成本(學習投入和時間);關注學業(yè)質量,更關注學生快樂成長、全面發(fā)展的過程。山東省淄博市淄川區(qū)的初中生“學習興趣指數(shù)評價”,關注學生的學習狀態(tài)、學習動力和學習體驗。
二是更重視高級能力評價。從PISA等國際大規(guī)模教育評價來看,國際社會越來越重視學習素養(yǎng)、創(chuàng)新素養(yǎng)、高階思維、批判性思維、分析和解決問題能力等高級能力評價。在實踐探索方面,北京大學附屬小學的“學生創(chuàng)新素養(yǎng)評價體系”從創(chuàng)新意識、創(chuàng)新思維、創(chuàng)新能力、創(chuàng)新精神、創(chuàng)新人格5個維度構建了25個觀測點,推動小學階段拔尖創(chuàng)新人才早期培養(yǎng)走向深入。
三是更重視影響因素的復雜性。學生發(fā)展受到多種因素影響,學業(yè)水平和非學業(yè)水平是各種力量相互作用的結果。浙江省溫州市的“初中綠色增值評價”從學業(yè)和非學業(yè)發(fā)展(學生品德發(fā)展、身心健康和學習生活幸福)兩個方面考查學生學習結果和增值,特別注意考查前期學習基礎、家庭背景、學校水平等因素對增值結果的影響。
四是更重視評價形式的多樣性。評價形式對于創(chuàng)新素養(yǎng)的表現(xiàn)和觀測極為重要。山東省德州市低年級的“非紙筆綠色測評框架”采用“游戲闖關、模塊游考、實踐活動和項目學習”等形式,克服書面測評過于強調(diào)知識記憶的局限,對學生的想象力、創(chuàng)造力等素養(yǎng)開展表現(xiàn)性評價。
(二)教師評價:怎樣的評價可以促進教師潛心育人
教師評價本質上是對教師的專業(yè)實踐進行評價,屬于實踐評價范疇。教師的專業(yè)實踐不僅是在實踐中發(fā)展自我,更是為學生的學習和發(fā)展提供專門性服務。[2] 20世紀80年代之后,我國教師評價雖幾經(jīng)改革,但仍以獎懲功能為主,主要為教師聘用、晉升、加薪、選拔等提供依據(jù),教師評價的發(fā)展性功能未能真正落實。[3]“教書育人”是一種道德實踐,對教師業(yè)績的評價不能等同于企業(yè)的績效管理。實證研究表明,問責式教師評價對教師專業(yè)表現(xiàn)影響的直接效應不顯著,甚至產(chǎn)生顯著的負向影響;而發(fā)展性教師評價對教師專業(yè)表現(xiàn)的總效應、直接效應和間接效應皆為顯著正向影響。[4] 新時代教師評價改革應更強調(diào)“育人”職責而非問責,更重視分類評價、多元評價、發(fā)展性評價、表現(xiàn)性評價和長周期評價。
一是更重視教師的道德實踐和情感付出。教師的勝任力、工作業(yè)績和效果不僅體現(xiàn)在知識傳授上,更體現(xiàn)在道德引領上。在教師評價改革中,師德師風、教師情感勞動和學生工作盡管難以量化和評價,但最能體現(xiàn)教師工作的本質特征,一些學校和地區(qū)已將其納入教師評價體系。中南大學的教師評價將教學競賽獲獎、指導學生競賽獲獎等納入職稱評聘和教學獎項申報成果要求,教育教學、學生工作與科研成果同等重要。
二是更重視發(fā)展性評價。發(fā)展性評價可以激發(fā)教師內(nèi)在的專業(yè)力量,培育教育家精神。山東省日照第一中學的“發(fā)展性教師評價”制定了多元化的評價指標,不同系列教師的評價內(nèi)容和權重各有側重,考核內(nèi)容涵蓋學校各項工作,評價主體多元化,并將發(fā)展性評價與總結性評價結合起來,以教師評價提升教師幸福感。
三是更重視表現(xiàn)性評價。教師評價特別強調(diào)教學情境,評價的是教師的實踐智慧,這就需要超越傳統(tǒng)紙筆測驗,通過觀察教師的專業(yè)實踐來獲取評價信息,而評價者則需要運用豐富的實踐智慧進行專業(yè)判斷。[5] 表現(xiàn)性評價不是只關注優(yōu)質課比賽等具有“可看性”的專業(yè)實踐,而是重在日常行為表現(xiàn)及其產(chǎn)生的育人效果。經(jīng)合組織(OECD)發(fā)起的“全球教學洞察”(GTI)項目,以視頻研究的形式收集并觀察分析了來自8個不同國家和地區(qū)教師的課堂錄像,用以考查教師的教學質量,我國上海市也參與了這一項目。
四是更重視長周期評價。教育效果具有滯后性、集體性、復雜性,教師對學生發(fā)展的影響通常在多年后才充分顯現(xiàn),教師以集體合力的方式對學生施加影響,而學生發(fā)展也受到同伴、家庭、社會等因素的影響。立竿見影的問責式評價難以適應教師工作的特殊性。廣東省深圳市龍華區(qū)教科院附屬外國語學校的“生態(tài)型教師評價體系”以教師發(fā)展檔案為載體,構建過程性多維度評價體系,實行個體多元的發(fā)展性評價制度,讓評價主體多元化,評價對象個性化,評價方向多維化,變定性為過程性,實現(xiàn)綠色生態(tài)型評價。
(三)學校評價:怎樣的評價可以提升學習體驗和社會貢獻
學校是資源依賴型組織,外部環(huán)境和外部評價對辦學行為產(chǎn)生重大影響。評價學校效能的主要指標包括教育目標達成、教育輸入與輸出以及關鍵人群滿意度等。[6] 相應地,學校評價的形式主要有政治學視域下的政府督導評估、經(jīng)濟學視域下的學校績效評價和社會學視域下的家長滿意度評價。我國學校評價長期以政府單一主體評價為主,看重以分數(shù)為主的升學率競爭評價。由于學校評價結果與教育資源配置掛鉤,學校極為重視政府的績效評價和學校排名等聲譽評價,而學校的自我評價以及以學生為中心的評價相對較弱,在一定程度上忽視學生的就讀體驗和身心全面發(fā)展,學生畢業(yè)后對母校的歸屬感和認同感不強。學校評價應增強學校自主發(fā)展的能力,引導學校更加重視以學生發(fā)展為中心的立德樹人實踐,更加強調(diào)人才培養(yǎng)和知識創(chuàng)造的社會貢獻。
一是更重視以學生發(fā)展為中心的評價。教育質量應該首先是指學生的發(fā)展質量,即學生在整個學習歷程中所學的“東西”(所知、所能做的及其態(tài)度)是衡量教育質量的核心標準。[7] 學校辦學規(guī)模擴大、條件設施改善、辦學經(jīng)費增長不代表辦學水平的同步提高,而學生的就讀體驗和學習收獲才能真正反映學校的辦學質量。但“以學生發(fā)展為中心”不能等同于“以學生滿意度為中心”,“學生評教”也可能使教師為“討好”學生而降低學業(yè)標準和要求,“以學生發(fā)展為中心”的核心是要促進學生發(fā)展。
二是更重視特色化和分類評價。學校評價最終要增強學校發(fā)展的內(nèi)生動力,形成學校對于教育發(fā)展規(guī)律的獨特認識和創(chuàng)造性實踐。學校同質化和過度追求排名是對自身特色和發(fā)展定位不清所致。有學者構建了學校特色發(fā)展測評模型,包括文化特色、課程特色、組織管理和質量改進4個維度15個指標。[8] 學校的分類發(fā)展和分類評價有助于推動學校特色化發(fā)展。
三是更重視發(fā)展性和增值性評價。增值評價以學校教育活動對學生預期成績的增值為教育評價標準,用來判定學校對學生發(fā)展的影響,是一種綠色升學率理念下的發(fā)展性學校評價模式。[9] 山東省濟南市“區(qū)域初中學生綜合素質增值評價”從學校辦學質量和學生發(fā)展質量兩個維度建立增值評價體系,采用多水平線性分位數(shù)回歸模型,分析學生增值發(fā)展狀況和學校辦學水平。
四是更重視學校和學科的社會貢獻。西方主導的大學排名和學科排名追求的是形式評價,中國特色的教育評價體系要體現(xiàn)我國農(nóng)林、國防、師范和人文社科等專業(yè)的特點。東北師范大學在教師教育學科領域人才評價中,將優(yōu)秀教學案例、課程標準制定及國家考試命題等作為特色指標,引導高水平科研成果向教學內(nèi)容轉化,推動教研成果示范與推廣。
(四)政府評價:怎樣的評價可以提升政府的“元治理”能力
新時代教育評價改革涉及學生、教師和學校三個教育系統(tǒng)內(nèi)部主體,以及政府和社會兩個外部主體。相對而言,教育系統(tǒng)內(nèi)部的改革推進比較容易,系統(tǒng)外部的改革則推進艱難。對部分省份教育評價改革的政策文本分析發(fā)現(xiàn),政策關注點聚焦學生、教師和學校評價,對政府評價和用人評價不夠重視,政策的可操作性有待提高。[10] 總體而言,教育評價具有高度社會敏感性、高度依賴社會環(huán)境等特點,因而每項改革都可能會引起相關利益主體的極大關注。改進黨委和政府評價需要更加重視黨委統(tǒng)籌能力、政府履行教育職責、區(qū)域教育結構型質量評價,并準確把握教育評價的敏感因子。
一是更重視黨委統(tǒng)籌能力評價。黨委和政府既是推動評價改革的主體,又是評價改革的對象,其統(tǒng)籌能力體現(xiàn)了推進評價改革的力度和成效。從國家和省級層面來看,各級黨委教育工作領導小組作為議事協(xié)調(diào)機構,可以統(tǒng)籌教育、發(fā)改、財政、編辦、宣傳、人社等部門的力量推進評價改革,但在人才選聘和專業(yè)技術人員評聘等領域,教育評價改革與部門利益或政策還不完全適應。教育系統(tǒng)外部的評價改革需要充分發(fā)揮黨委統(tǒng)攬全局和統(tǒng)籌協(xié)調(diào)的能力,提升黨委對各類評價的“元治理”能力。
二是更重視政府履行教育職責評價。2017年國務院辦公廳印發(fā)《對省級人民政府履行教育職責的評價辦法》,此后每年由國務院教育督導辦公室組織對省級政府加強黨的領導、優(yōu)先發(fā)展教育等職責的督導評估。開展政府履行教育職責評價,應對評價內(nèi)容或事項進行分類設置評價指標,包括對政府統(tǒng)籌推進教育工作表現(xiàn)的質性評價、區(qū)域教育發(fā)展水平的量化評價、政府教育工作進步程度的肯定評價、政府教育工作的社會滿意度評價等。[11]
三是更重視區(qū)域教育的結構型質量評價。在教育強國建設背景下,各級黨委和政府的主要教育責任是構建區(qū)域高質量教育體系。浙江省“區(qū)域教育發(fā)展結構型質量評價”著力破解“唯分數(shù)、唯升學”的“學業(yè)成績政績化”,構建區(qū)域教育新生態(tài)。結構型質量體現(xiàn)在區(qū)域內(nèi)教育資源配置的科學性與合理性、各類教育的協(xié)調(diào)發(fā)展以及發(fā)展狀態(tài)的可持續(xù)性,包括學校的規(guī)劃布局、教育發(fā)展的均衡狀態(tài)、師資隊伍建設與經(jīng)費使用等方面。
四是更重視把握區(qū)域評價改革的敏感因子。不同區(qū)域在不同階段推進教育評價改革面臨不同的關鍵制約因素。對于缺少政策支持的區(qū)域,應著力構建教育評價改革“特區(qū)”政策。對于缺少評價理論和技術支持的區(qū)域,應著力發(fā)揮科研的支撐引領作用,研發(fā)評價工具。對于缺少專業(yè)人才支撐的區(qū)域,應推進高校設置教育評價專業(yè),并加強教師評價素養(yǎng)的專業(yè)培訓。2023年山東省依托山東師范大學、山東省教育科學研究院等單位共同組建山東省教育評價研究中心,為區(qū)域深化新時代教育評價改革夯實理論與實踐支撐。
(五)用人評價:怎樣的評價可以促進人崗相適
依據(jù)信號理論和篩選理論,在用人單位看來,教育標簽(學歷文憑)是一種潛在生產(chǎn)力的信號,可以反映其需要的培訓成本的高低。因此,高學歷者更易獲得排名靠前的機會,也更容易被用人單位選聘。然而在現(xiàn)實中,高學歷并不一定具有較高的職業(yè)勝任力,在具體工作崗位中經(jīng)常出現(xiàn)教育錯配或人崗不相適應的情況。過度教育與教育不足會降低勞動者的工作滿意度,過度教育具有工資懲罰效應,教育不足具有工資溢價效應。[12] 改進社會選人用人評價應更加重視職業(yè)勝任力評價、人才發(fā)展?jié)撃茉u價、人崗相適評價,以及大數(shù)據(jù)在人才評價中的應用。
一是更重視勝任力評價。勝任力通常包括外顯勝任力(知識、技能等)和內(nèi)隱勝任力(價值觀、能力和特質等),前者是基準性特征,是對勝任者的基本素質要求;而后者是鑒別性特征,是區(qū)分優(yōu)異者和平平者的關鍵因素。[13] 用人單位實際上更看重求職者的內(nèi)隱勝任力。西南大學在引育人才、促進人崗相適方面,結合學院、學科特色“一院一策”引育新人,如農(nóng)學與生物科技學院就針對“農(nóng)科”特色,對新進教師進行為期4年的較長周期評價,避免短期評價功利化。
二是更重視人才發(fā)展?jié)撃茉u價。促進人崗相適、實現(xiàn)事業(yè)發(fā)展與個人發(fā)展同步提高,是用人單位提高人才使用效率的著力點。對人才發(fā)展的潛能和可持續(xù)性的評價,建立在對人才綜合素質的評價基礎之上。美國教育考試服務中心(ETS)的研究生招生“個人潛能指標測評”(PPI),就涵蓋了知識與創(chuàng)新能力、溝通技能、團隊能力等6個一級指標,以便更加全面綜合地了解學生的個人品質。[14] 中山大學在制定人才引進條件時,綜合考查引進人才的學術水平和發(fā)展?jié)撃?,不把SCI論文相關指標、人才“帽子”等作為引進和聘用的前置條件。
三是更重視依據(jù)崗位標準選聘人才。科學設置教師崗位是做好教師聘任制的首要問題。2023年山東省發(fā)布的《關于進一步深化中小學教師職稱評聘改革的意見》就提出,在中小學教師評價中,德育、體育、美育、勞動教育、科學、心理健康教師可單列指標、單設學科組評審,幼兒園教師評價突出保教實踐,教研員評價突出教育教學研究實效。在中小學教師崗位設置和聘用方面,一些地方也在探索“高評低聘、低評高聘”來解決人崗相適的問題。
四是更重視大數(shù)據(jù)在用人評價中的應用。國內(nèi)外大量研究表明,大數(shù)據(jù)技術賦能的人才招聘能幫助用人單位對大批量人才信息快速篩選,特別有助于提升人才內(nèi)隱特征的甄別效率,促進人才與用人單位間的雙向溝通效能。北京市海淀區(qū)建立了“干部教師交流數(shù)據(jù)分析平臺”,平臺導入所有義務教育學校教師職稱、年齡以及骨干教師學科分布等教師隊伍情況,匹配學校學生學業(yè)成績、中考增值評價和監(jiān)測等,按需開展精準交流和校際聯(lián)動。
三、結語
教育評價改革是教育強國建設的“牛鼻子”,《總體方案》作為新中國成立以來第一份關于教育評價系統(tǒng)性改革的文件,將教育評價改革置于前所未有的重要位置。深入推進新時代教育評價改革,不僅要聚焦學生評價、教師評價、學校評價、政府評價和用人評價五大領域久久為功,而且要構建教育評價的專業(yè)化支撐體系,在教育評價理論研究、教育評價專業(yè)人才培養(yǎng)、評價工具研發(fā)以及大數(shù)據(jù)、人工智能賦能教育評價改革等配套領域取得實質性突破?!犊傮w方案》發(fā)布3年來,各地各校探索推進落實落地,已經(jīng)構建起評價改革的四梁八柱,并且在操作性強的改革舉措上建章立制、深入實施,但在系統(tǒng)性強、協(xié)調(diào)難度大、利害攸關和傳統(tǒng)觀念牢固的領域,還有一些難啃的“硬骨頭”,這些領域的突破和創(chuàng)新將帶來教育評價改革的格局性變化。
注釋:
[1] 朱永新. 把教育常識變成社會共識[J]. 中國教育學刊,2023(04):1.
[2] 周文葉. 試論“學為中心”的教師評價框架[J]. 教育研究,2021,42(07):150-159.
[3] 申繼亮,孫炳海. 教師評價內(nèi)容體系之重建[J]. 華東師范大學學報(教育科學版),2008,26(2):38-43.
[4] 劉偉,李瓊. 怎樣的評價可以促進教師潛心育人:來自中小學教師專業(yè)表現(xiàn)的實證證據(jù)[J]. 教師教育研究,2022,34(01):49-56.
[5] 周文葉. 教師評價:評什么和怎么評——訪斯坦福大學李·舒爾曼教授[J]. 全球教育展望,2020,49(12):3-12.
[6] 李永生. 學校效能評價:一種評估中小學工作績效的工具[J]. 教育研究,2013,34(07):105-115.
[7] 陳玉琨. 高等教育質量保障體系概論[M]. 北京:北京師范大學出版社,2004:59.
[8] 范涌峰,宋乃慶. 學校特色發(fā)展測評模型構建研究[J]. 華東師范大學學報(教育科學版),2018,36(02):68-78+155-156.
[9] 邊玉芳,林志紅. 增值評價:一種綠色升學率理念下的學校評價模式[J]. 北京師范大學學報(社會科學版),2007(06):11-18.
[10] 劉國瑞,張怡. 省級政府履行新時代教育評價改革職責情況分析——基于10省份教育評價政策文本的研究[J]. 沈陽師范大學學報(教育科學版),2023,2(02):92-99.
[11] 韋蘭明,覃淮宇. 研制政府履行教育職責評價指標的依據(jù)、原則及策略[J]. 上海教育評估研究,2022,11(02):1-6.
[12] 李根麗,周泰云. 教育錯配會影響工作滿意度嗎——機制分析與實證檢驗[J]. 山西財經(jīng)大學學報,2021,43(08):30-42.
[13] 彭本紅,陶友青,鄧瑾. 大學高層次人才勝任力的評價[J]. 統(tǒng)計與決策,2007(15):143-145.
[14] 陳瑤,邵福球,高進軍. 美國研究生招生的新評價手段——“個人潛能指標測評”(PPI)評介[J]. 學位與研究生教育,2010(03):74-77.
(孟照海,中國教育科學研究院副研究員)
《人民教育》2023年第20期
工信部備案號:京ICP備05071141號
互聯(lián)網(wǎng)新聞信息服務許可證 10120170024
中國教育報刊社主辦 中國教育新聞網(wǎng)版權所有,未經(jīng)書面授權禁止下載使用
Copyright@2000-2022 m.mbbaget.com All Rights Reserved.