謝小慶:如何進(jìn)行高考改革
發(fā)布時(shí)間:2020-06-15 來源: 人生感悟 點(diǎn)擊:
在2007年夏天一次《考試研究》雜志的編委會(huì)上,原教育部考試中心主任楊學(xué)為講到這樣一件事情:一次,河南一個(gè)重點(diǎn)中學(xué)的校長(zhǎng)對(duì)楊講:“高考已經(jīng)走進(jìn)了死胡同!睏顔査骸坝懈玫母咝U猩k法嗎?”他想了想說:“沒有!眱蓚(gè)人的這段對(duì)話,突出體現(xiàn)了教育領(lǐng)域中許多人關(guān)于高考改革“沒有出路”的看法。
在2007年3月舉行的“兩會(huì)”上,來自寧波教育戰(zhàn)線的全國(guó)人大代表范誼教授提交了《關(guān)于廢除高考,創(chuàng)新高校招生制度的建議》。范誼代表認(rèn)為:“高考以及它所派生的應(yīng)試教育已經(jīng)使我國(guó)的教育迷失了方向,失去了教育的本性和靈魂。它使我們的兒童失去了天真和幻想,失去了對(duì)學(xué)習(xí)的熱情和能力;
它使我們的青年戴上了思維的枷鎖,只能對(duì)規(guī)定知識(shí)反復(fù)記憶和辨析,扼殺了他們對(duì)生活的熱愛和創(chuàng)造沖動(dòng);
它使我們的民族習(xí)慣于接受和模仿,一個(gè)曾經(jīng)最富有創(chuàng)造力的民族今天必須重新學(xué)會(huì)創(chuàng)造!币虼耍墩x認(rèn)為:“我們已經(jīng)到了必須考慮廢除高考的時(shí)候,必須從現(xiàn)在開始研究和開發(fā)一種能夠取代高考的新的高校招生體制!
范誼的議案代表了相當(dāng)一部分人的意見。舒云發(fā)表在長(zhǎng)篇報(bào)告文學(xué)《高考?xì)憽分性赋,一些人認(rèn)為“高考已經(jīng)到了徹底變革的時(shí)候了”;
認(rèn)為高考是“地獄”;
是“懸在中小學(xué)頭上的劍”;
認(rèn)為高考傷害了中小學(xué)生的健康;
認(rèn)為高考“偷”走了中國(guó)人的創(chuàng)造力,主張“將高考送進(jìn)墳?zāi)埂薄?/p>
2007年初,《中國(guó)青年報(bào)》社會(huì)調(diào)查中心完成了一項(xiàng)有2165人參加的關(guān)于高考改革的調(diào)查。結(jié)果顯示,92.8%的人認(rèn)為,目前的高考制度有必要改革。35.2%的人認(rèn)為“只需小改”,57.6%的人則認(rèn)為需要“動(dòng)大手術(shù)”。
與范誼代表的看法相反,出席“兩會(huì)”的全國(guó)政協(xié)委員、原教育部副部長(zhǎng)張保慶在接受媒體采訪時(shí)卻認(rèn)為,廢除高考將“天下大亂”。張保慶認(rèn)為,從社會(huì)發(fā)展來看,中國(guó)現(xiàn)行的高考制度還是比較成功的、公平的一種考試選拔制度,在沒有找到更好、更公平的辦法之前不能廢除高考。在現(xiàn)階段只能采取國(guó)家統(tǒng)一高考形式來選拔高等教育人才。
范誼教授的看法是有道理的。今天,以高考為指揮棒的“應(yīng)試教育”正在摧殘著兒童脆弱的好奇心,正在造成普遍的厭學(xué)現(xiàn)象。這種局面必須改變。另一方面,張保慶同志的看法也是有道理的。在今天缺乏有效制約機(jī)制的社會(huì)條件下,在今天社會(huì)信譽(yù)系統(tǒng)缺失的環(huán)境下,取消統(tǒng)一考試會(huì)使大學(xué)招生的公平公正受到傷害。沒有公平公正,也談不到人才選拔的效率。
既不能容忍現(xiàn)狀的繼續(xù),又不能取消考試,是否真的沒有出路呢?不是,高考改革的出路是存在的。當(dāng)我在大學(xué)讀書時(shí),我與同學(xué)們共同完成的《對(duì)高考試題的統(tǒng)計(jì)分析》一文發(fā)表于《北京師范大學(xué)學(xué)報(bào)》1981年第5期。從那時(shí)算起,我思考高考問題已經(jīng)有27年。世紀(jì)之交,我曾在負(fù)責(zé)SAT(美國(guó)高考)、GRE(美國(guó)研究生考試)、托福等考試的美國(guó)教育測(cè)驗(yàn)服務(wù)中心(ETS)從事博士后研究。27年來,考試問題一直是我的主要研究課題,我的職業(yè)活動(dòng)一直圍繞著考試研究。根據(jù)我的研究和思考,高考改革的出路是存在的。在指出“出路何在”之前,首先需要認(rèn)真思考一下——
我們究竟為什么要進(jìn)行高考改革?
一、維護(hù)公平不是高考改革的任務(wù)
世界聞名的科舉考試在中國(guó)延續(xù)了1300年?婆e考試是一種形式上非常公平的考試,許多保證考試公平性的措施今天都很難做到。例如,科舉的“單間”施測(cè),進(jìn)場(chǎng)搜身,謄錄(為了避免閱卷人根據(jù)筆跡作弊將所有答卷全部重新抄錄),等等。17世紀(jì)傳教士將中國(guó)的“考試取人”方法介紹到西方,得到西方進(jìn)步思想家的高度贊揚(yáng)。今天在世界許多國(guó)家實(shí)行的公務(wù)員錄用考試,大都源于中國(guó)的科舉。
但是,形式非常公平的科舉卻遭到近代幾乎所有進(jìn)步思想家的切齒痛恨,嚴(yán)詞撻伐。例如,明末的進(jìn)步思想家顧炎武痛斥“八股之害,甚于焚書,而敗壞人材,有甚于咸陽之郊之所坑者”。康有為認(rèn)為“中國(guó)之割地?cái)”,非他為之,而八股致之也”?
梁?jiǎn)⒊v“救弊之法歸之于廢科舉”。譚嗣同講“變科舉誠(chéng)為旋乾斡坤轉(zhuǎn)移風(fēng)會(huì)之大權(quán)而根本之尤要者也”。
在朝野的一片批評(píng)聲中,清廷終于在1906年取消了科舉考試。
科舉考試為什么遭到進(jìn)步人士猛烈攻擊?科舉為什么最終被“改革”掉了?并不是由于科舉不夠公平。科舉被取消的原因是由于它既沒有為中國(guó)帶來政府人員素質(zhì)的提高,也沒有帶來國(guó)富民強(qiáng)和國(guó)家尊嚴(yán)?婆e失敗的原因在于考試脫離實(shí)際,引導(dǎo)人死讀書,讀死書。科舉不是以“德才”取人,而是以“背書”取人。清廷是迫于“文無經(jīng)世致用之臣,武無統(tǒng)兵御敵之將”的局面,迫于“圣闕涂炭、祖陵震動(dòng)”的壓力,才取消了科舉。
作為一個(gè)職業(yè)的考試研究者,我清楚地知道,考試是追求效率的工具,考試所追求的并不是公平。多數(shù)情況下,考試都會(huì)造成社會(huì)的不平等。今天,國(guó)家政策明確規(guī)定不允許在小學(xué)和初中入學(xué)中采用考試,為什么?就是因?yàn)椴捎每荚嚲蛽p害了每個(gè)兒童與生俱來的平等的受教育權(quán)利,就是因?yàn)椴捎每荚嚲蛽p害了每個(gè)兒童都應(yīng)平等分享優(yōu)質(zhì)教育資源的權(quán)利。盡管我本人是靠考試吃飯的,這種禁止考試的政策一定程度上會(huì)影響到我的“飯碗”,但我一直是旗幟鮮明、毫不含糊地堅(jiān)決支持教育部禁止小學(xué)、初中入學(xué)考試的政策。為什么禁止考試?就是由于考試導(dǎo)致不平等。
我反對(duì)在小學(xué)、初中采用入學(xué)考試,卻支持在高中、大學(xué)和研究生招生中采用考試。支持采用考試,主要是出于提高教育效率的考慮。借助考試,可以更好地實(shí)現(xiàn)“因材施教”,可以提高高中、大學(xué)和研究生教育的效率。
2008年是高考恢復(fù)30年。30年前,鄧小平同志為什么要恢復(fù)高考?顯然是為了“效率”而不是“公平”。與原來的“推薦方式”相比較,考試方式明顯有利于城鎮(zhèn)居民而不利于農(nóng)村居民。與“推薦方式”相比,恢復(fù)高考以后城鎮(zhèn)居民的子女進(jìn)入大學(xué)的比例明顯提高。
反對(duì)在大學(xué)招生中降低考試比重的人往往說,這樣做會(huì)損害大學(xué)招生的公平性。這些人沒有想清楚,我們今天進(jìn)行高校招生多元化改革的目的不是為了維護(hù)公平,而是像百年前廢除科舉一樣,像30年前恢復(fù)高考一樣,是為了提高教育的效率。
我們今天進(jìn)行高考改革,主要是為了改變青少年的普遍厭學(xué)狀況,主要是為了保護(hù)青少年的好奇心和發(fā)展青少年的創(chuàng)新能力。2005年5月在巴黎進(jìn)行的中歐貿(mào)易談判中,時(shí)任商務(wù)部部長(zhǎng)的薄熙來曾說:“為了買回一架空中客車A380,中國(guó)需要出口8億件襯衣!边@句話,凸顯了中國(guó)經(jīng)濟(jì)發(fā)展中缺乏自主創(chuàng)新的問題。在許多尖端科技領(lǐng)域,中國(guó)與發(fā)達(dá)國(guó)家的距離不是在縮小,而是在擴(kuò)大。例如,蘇聯(lián)和中國(guó)分別在1949年和1964年爆炸了自己的第一顆原子彈。1961年,蘇聯(lián)實(shí)現(xiàn)了首次載人航天飛行。2003年,“神舟5號(hào)”的發(fā)射,意味著中國(guó)與俄羅斯的差距從1964年的15年擴(kuò)大到2003年的42年。又如,根據(jù)2007年8月30日《南方周末》報(bào)道,“在液晶面板領(lǐng)域,國(guó)內(nèi)企業(yè)與國(guó)際領(lǐng)先企業(yè)的差距從2代擴(kuò)大到4代”,中國(guó)彩電企業(yè)將“踏空”液晶時(shí)代,將被“邊緣化”。要知道,在今天,“液晶”可能還算不到“尖端科技”。
“應(yīng)試教育”從童年起就挫傷了中國(guó)兒童的好奇心和創(chuàng)造力,影響到從基礎(chǔ)教育到高等教育的整個(gè)國(guó)民教育體系,影響到我國(guó)的國(guó)民素質(zhì),摧殘著中華民族的自主創(chuàng)新能力。這種“應(yīng)試教育”,造成普遍的“讀一本書、教一本書、背一本書、考一本書”的局面。進(jìn)行高校招生的多元評(píng)價(jià)改革,就是為了改變這種局面。
保護(hù)兒童的好奇心和創(chuàng)造力是進(jìn)行高校招生改革的重要原因,但不是最重要的原因。更重要的原因是——為了保證學(xué)生健康人格的發(fā)展;
為了挽救教育的“傳道”功能。
2007年8月17日,由來自內(nèi)蒙古呼倫貝爾草原深處的37名6—13歲的少數(shù)民族兒童組成的“五彩傳說”兒童合唱團(tuán)在北京展覽館劇場(chǎng)演出,感動(dòng)了到場(chǎng)的觀眾。余秋雨先生寫出《追回天籟》一文,表達(dá)自己所受到的感動(dòng)。他在這篇文章中談到自己在多次擔(dān)任青年歌手大獎(jiǎng)賽評(píng)委時(shí)的感受——
歌手都很年輕,絕大多數(shù)受過嚴(yán)格的專業(yè)訓(xùn)練,擁有大專學(xué)歷。但是,一旦讓他們談?wù)勛约,談(wù)劯改,談(wù)劶亦l(xiāng),談?wù)勔魳,立即出現(xiàn)一種驚人的景象。多數(shù)人都不假思索,隨口吐出,用詞華麗,充滿成語、形容詞和排比,卻又都嚴(yán)重雷同。他們誰也沒有意識(shí)到,他們說得多么虛假和空洞。不管你怎么追問,他們還給你的,是加倍的虛假和空洞。
余秋雨對(duì)青年歌手的批評(píng),折射出今天在高考指揮棒驅(qū)使下的“應(yīng)試教育”中缺乏“愛心教育”的嚴(yán)重問題,這是比“應(yīng)試教育”挫傷兒童好奇心和摧殘創(chuàng)造力更嚴(yán)重的問題。這使我們聯(lián)想到夏尊在他為《愛的教育》一書寫的《譯者序言》中對(duì)當(dāng)時(shí)的教育的批評(píng)——
單從外形的制度方法上,走馬燈似的更變迎合,而于教育的生命,從未有人培養(yǎng)顧及。好像掘池,有人說四方形好,有人說圓形好,朝三暮四地改個(gè)不休,而對(duì)于池所以為池的要素的水,反無人注意。教育上的水是什么?就是情,就是愛。教育沒有了情愛。就成了無水的池。任你四方形也罷,圓形也罷,總逃不了一個(gè)空虛。
筆者歷來認(rèn)為,教育的第一職能是發(fā)展學(xué)生的人格,其核心是品德,其次才是發(fā)展學(xué)生的能力,再次才是傳授學(xué)生以知識(shí)。在1980年代,筆者曾經(jīng)批評(píng)當(dāng)時(shí)的教育——
恰恰是本末倒置了,注重傳授知識(shí)而忽視發(fā)展能力,更不重視發(fā)展學(xué)生的人格。在這種教育狀況下,不僅學(xué)生知識(shí)面窄,實(shí)際分析問題和解決問題能力差,獨(dú)立思考能力差,而且缺乏社會(huì)責(zé)任感,缺乏理想和抱負(fù),審美能力低,興趣狹窄。
近20年過去了,令人遺憾甚至沮喪的是,這種局面不僅沒有絲毫扭轉(zhuǎn),而且愈演愈烈。這種忽視學(xué)生人格發(fā)展的局面,與20年來高校招生改革的腳步遲緩有很大關(guān)系。
大學(xué)畢業(yè)生本來應(yīng)是我們民族最寶貴的人力資源,不幸的是,一些“寶貴資源”經(jīng)過高等教育卻被轉(zhuǎn)化成“人口負(fù)擔(dān)”。
數(shù)以百萬計(jì)的大學(xué)生“畢業(yè)即待業(yè)”的現(xiàn)狀,已經(jīng)將教育的“低效率”問題凸顯。根據(jù)《中國(guó)青年報(bào)》2007年8月21日的報(bào)道,在8月12日舉行的“中國(guó)有色金屬工業(yè)發(fā)展與人力資源開發(fā)高層論壇”上,有色金屬工業(yè)人才中心總經(jīng)理丁學(xué)全指出:“一邊是企業(yè)招不到人,一邊是學(xué)生找不到合適的企業(yè)!边@種“企業(yè)為找人發(fā)愁、畢業(yè)生為找工作發(fā)愁”的現(xiàn)象在今天的各行各業(yè)都很普遍。這種現(xiàn)象,突出反映了今日中國(guó)教育的“缺乏效率”。這之中,既有能力發(fā)展方面的問題,也有人格發(fā)展方面的問題。
有色金屬工業(yè)人才中心丁學(xué)全總經(jīng)理在分析“企業(yè)找不到人、畢業(yè)生找不到工作”時(shí),指出了兩方面的原因:一是由于“行業(yè)已經(jīng)發(fā)展到21世紀(jì)的高科技了,一些大學(xué)還在用20世紀(jì)的教材,講授20世紀(jì)的知識(shí)”;
一是由于“有色金屬企業(yè)大多在深山里,學(xué)生們都不愿去”。前者是由于學(xué)校教育在能力培養(yǎng)方面的低效率;
后者則是由于學(xué)校教育在人格發(fā)展方面的低效率。今天,在我國(guó)的許多欠發(fā)達(dá)地區(qū)對(duì)大學(xué)畢業(yè)生有較高的需求,但相當(dāng)數(shù)量的大學(xué)畢業(yè)生寧愿留在家中“啃老”或“混在城市”,也不愿到非常需要他們的欠發(fā)達(dá)地區(qū)去工作。這已經(jīng)主要不是能力發(fā)展方面的問題,而是人格發(fā)展方面的問題了。
“一卷定終生”的招生制度不僅造成“高分低能”問題,而且造成“重才輕德”問題!拔ǚ?jǐn)?shù)取人”的高校招生制度,所損害的不僅是學(xué)生的能力發(fā)展,更嚴(yán)重的問題是損害學(xué)生的人格發(fā)展;
所損害的不僅是教育“授業(yè)”的效率,更嚴(yán)重的是損害教育“傳道”的效率。在這種應(yīng)試教育中,人格發(fā)展成為當(dāng)今教育最薄弱的環(huán)節(jié)。
對(duì)高校招生制度進(jìn)行更大力度的改革,把學(xué)生從“死記硬背”的重負(fù)下解放出來,不僅是為了使他們可以更好地“格物致知”,更是為了使他們可以更好地“正心修身”。招生改革,不僅是為了保護(hù)學(xué)生的好奇心和創(chuàng)造力,更是為了讓教師和家長(zhǎng)更多地注意培養(yǎng)學(xué)生的愛心,更多地注意培養(yǎng)學(xué)生的社會(huì)責(zé)任感和審美能力。這些,不論是對(duì)學(xué)生自身的未來發(fā)展,還是對(duì)國(guó)家的未來發(fā)展,都是至關(guān)重要的。
二、考試工具的局限性
許多沒有對(duì)考試進(jìn)行深入研究的人,對(duì)于考試作為工具的局限性并不了解。與美國(guó)的“高考”——“學(xué)習(xí)能力評(píng)價(jià)測(cè)驗(yàn)(SAT)”相比,我國(guó)現(xiàn)行高考在科學(xué)性方面存在明顯距離,缺乏考試效度證據(jù)的支持,沒有預(yù)測(cè),沒有考前的試題統(tǒng)計(jì)分析篩選,沒有分?jǐn)?shù)等值等等。例如,今天仍然沿用粗糙的、不合理的“原始分相加計(jì)算總分”的方法,而不是像包括我國(guó)的“漢語水平考試(HSK)”在內(nèi)的世界上多數(shù)標(biāo)準(zhǔn)化考試那樣,采用標(biāo)準(zhǔn)分。用原始分直接相加計(jì)算總分,意味著假設(shè)地理的10分與數(shù)學(xué)的10分等價(jià),意味著可以用地理的10分補(bǔ)償數(shù)學(xué)的10分。(點(diǎn)擊此處閱讀下一頁)
這種假設(shè),是毫無道理的。
即使我國(guó)的高考在經(jīng)過科學(xué)化改進(jìn)后達(dá)到了SAT的科學(xué)化程度,仍然存在著重要的局限性。這種局限性主要表現(xiàn)在以下幾個(gè)方面——
、 有效性(效度)標(biāo)準(zhǔn)的確定
考試最重要的質(zhì)量要求是效度。為了對(duì)效度進(jìn)行評(píng)價(jià),就需要有評(píng)價(jià)的標(biāo)準(zhǔn)。當(dāng)涉及人的較復(fù)雜的心理能力時(shí),用來評(píng)價(jià)考試效度的標(biāo)準(zhǔn),其本身的有效性又會(huì)受到質(zhì)疑。例如,我們用大學(xué)的學(xué)習(xí)成績(jī)作為效度標(biāo)準(zhǔn)來檢驗(yàn)高考的效度。大學(xué)學(xué)習(xí)成績(jī)本身是否可以體現(xiàn)出學(xué)生的學(xué)習(xí)能力?對(duì)此,完全可以質(zhì)疑。我們用漢語教師的主觀評(píng)價(jià)作為效度標(biāo)準(zhǔn)來檢驗(yàn)HSK的效度。漢語教師的主觀評(píng)價(jià)是否可以體現(xiàn)出學(xué)生的漢語水平?對(duì)此,也完全可以質(zhì)疑。因此,雖然我們可以通過效度研究為考試提供效度支持,但通常卻不能為考試的效度建立堅(jiān)實(shí)的邏輯基礎(chǔ)。
、 概率的邏輯基礎(chǔ)
今天對(duì)于考試效度、信度、分?jǐn)?shù)可比性、公平性的質(zhì)量檢驗(yàn),大部分是基于概率理論之上。然而,概率理論能否應(yīng)用于考試研究,尚是個(gè)頗值懷疑和非常棘手的問題。
何謂概率?通俗講即“重復(fù)試驗(yàn)中事件發(fā)生的可能性”。對(duì)于概率概念,“重復(fù)試驗(yàn)”是一個(gè)非常重要的前提。例如,只有多次重復(fù)拋擲硬幣,才可能得到“正面朝上”的概率。倘若是不可重復(fù)的試驗(yàn),倘若每次拋擲都會(huì)使硬幣的重量、質(zhì)地、成分、形狀等發(fā)生變化,就無所謂概率?荚嚨膶(duì)象是人。每個(gè)人不僅具有不同的遺傳特點(diǎn),而且經(jīng)歷、需要、欲望、情感等各異。對(duì)不同的人進(jìn)行的測(cè)試能否被視作重復(fù)試驗(yàn)?zāi)?能否被視作與一枚硬幣多次拋擲相似的重復(fù)試驗(yàn)?zāi)?這個(gè)問題的答案并不是不言而喻的。
退一步,既使我們把對(duì)不同的人的測(cè)試視為重復(fù)試驗(yàn),這種基于概率基礎(chǔ)之上的統(tǒng)計(jì)規(guī)律性,是否可以被用來預(yù)測(cè)具有個(gè)性的人的行為呢?這仍然是一個(gè)值得懷疑和需要討論的問題。即使根據(jù)我們的調(diào)查知道具有某些心理特點(diǎn)的人中有90%的人難以適應(yīng)大學(xué)的學(xué)習(xí),能否根據(jù)這一研究結(jié)果而預(yù)言某一個(gè)具有這些心理特點(diǎn)的人,一定難以適應(yīng)大學(xué)的學(xué)習(xí)呢?這里,人的能動(dòng)性是一個(gè)不容忽視的因素。不用說預(yù)測(cè)一個(gè)具有能動(dòng)性、選擇性的人,即使是從多次拋擲硬幣中得到的統(tǒng)計(jì)規(guī)律,對(duì)于預(yù)測(cè)下一次拋擲硬幣的結(jié)果也是毫無意義的。
再退一步,即使我們得到的定量研究結(jié)果不是90%而是100%,不是以“幾分之幾”形式表達(dá)的概率命題,而是一個(gè)全稱命題,這種全稱命題能否成為做出有關(guān)個(gè)人行為的預(yù)測(cè)依據(jù)呢?也不一定。在貝多芬之前,即使我們的研究結(jié)論是“所有聾子都不能成為杰出的音樂家”,事實(shí)說明,若將這一研究結(jié)論用于關(guān)于個(gè)人行為的預(yù)測(cè),也可能犯錯(cuò)誤。
歸根結(jié)底,概率方法是基于歸納邏輯之上的。然而,正如恩格斯所指出的:“按照歸納派的意見,歸納法是不會(huì)錯(cuò)誤的方法,但事實(shí)上它是很不中用的,甚至它的似乎最可靠的結(jié)果,每天都被新的發(fā)現(xiàn)所推翻!保▽(duì)于研究死的、被動(dòng)的“物”,概率方法尚存在著“不中用”的一面;
對(duì)于研究能動(dòng)的、有選擇性的“人”,則概率方法具有更大的局限性。
、 相關(guān)分析
在考試研究中經(jīng)常被應(yīng)用的一種數(shù)學(xué)工具是相關(guān)分析,包括回歸分析、因素分析等。這些方法可以揭示出事物之間的相關(guān)關(guān)系。然而,相關(guān)并不等于因果。學(xué)校早上8:00上課,商店早上9:00開門,二者相關(guān)很高,并不存在因果關(guān)系!靶呐K是思維的器官”這一延續(xù)幾千年的錯(cuò)誤看法,就是因?yàn)槿藗儗?duì)心跳與思維之間的相關(guān)關(guān)系給予了錯(cuò)誤的因果的解釋。
在定量研究中,我們很容易錯(cuò)誤地對(duì)相關(guān)關(guān)系做出因果的解釋。“遺傳與環(huán)境的作用”是教育界爭(zhēng)論已久的問題。一項(xiàng)研究表明,能力較高的父母的子女們的能力也較高。據(jù)此,我們可能會(huì)認(rèn)為遺傳是較高能力的原因。顯然,這很可能是錯(cuò)誤的。這種相關(guān)完全可能與遺傳因素?zé)o關(guān),既可能是由于能力較高的父母為他們的子女提供了更好的教育條件,也可能僅僅是由于兩代人都生活在較優(yōu)越的環(huán)境之中。
許多考試研究的目的都是試圖揭示出分?jǐn)?shù)與能力之間的因果聯(lián)系,從而為人事決策提供依據(jù)。相關(guān)關(guān)系是因果關(guān)系的必要條件,但不是充分條件。定量方法只能揭示出事物之間的相關(guān)關(guān)系,但不能對(duì)這種關(guān)系做出因果的解釋。
正是由于考試工具的這些局限性,盡管SAT的科學(xué)化程度很高,被國(guó)際教育測(cè)量界公認(rèn)為一個(gè)標(biāo)準(zhǔn)化考試的范本,SAT在美國(guó)大學(xué)招生考慮中所占比重也不過30%左右。在大學(xué)招生的決策中,還要考慮包括高中表現(xiàn)在內(nèi)的多種因素。
三、出路:具有中國(guó)特色的“校準(zhǔn)高中成績(jī)”
現(xiàn)行高校招生制度存在許多不合理之處,其中最不合理的是高中教師沒有發(fā)言權(quán)。如上所述,即使僅就能力評(píng)價(jià)而言,再好的考試也不如教師對(duì)學(xué)生的長(zhǎng)期觀察更準(zhǔn)確,更不用說非智力方面的評(píng)價(jià)。今天的情況是,對(duì)學(xué)生觀察一年以至幾年的高中教師對(duì)學(xué)生升學(xué)卻沒有發(fā)言權(quán)。相反,招生決策幾乎完全依據(jù)在評(píng)價(jià)學(xué)生能力的有效性(效度)方面頗值懷疑的考試。
為了改變這種局面,需要使本應(yīng)最具有發(fā)言權(quán)的高中教師在大學(xué)招生中發(fā)揮評(píng)價(jià)作用。在我國(guó)目前信用制約缺失的環(huán)境下,需要進(jìn)行符合中國(guó)國(guó)情的制度設(shè)計(jì)。為此,我設(shè)計(jì)了一個(gè)符合中國(guó)國(guó)情的高考改革方案。這一方案的主要特點(diǎn)是以高中校內(nèi)成績(jī)作為高校招生錄取的主要依據(jù),以全國(guó)或全省統(tǒng)一考試作為高中成績(jī)的校準(zhǔn)參照,統(tǒng)一考試成績(jī)完全與考生脫鉤。
這是一個(gè)充分考慮中國(guó)國(guó)情的高考改革方案。在美國(guó)、英國(guó)等發(fā)達(dá)國(guó)家中,高中成績(jī)、統(tǒng)一的標(biāo)準(zhǔn)化考試成績(jī)和大學(xué)自己組織的考試(可能包含筆試和面試)互相補(bǔ)充,共同成為招生決策的依據(jù)。在中國(guó),很難照搬這些在發(fā)達(dá)國(guó)家行之有效的做法。在中國(guó),缺乏制約高中教師和大學(xué)招生教師正當(dāng)行使自己發(fā)言權(quán)的信用環(huán)境。因此,一方面我們需要給高中教師發(fā)言權(quán),給大學(xué)招生自主權(quán),另一方面也需要借助統(tǒng)一考試來約束高中和大學(xué)適當(dāng)?shù)匦惺棺约旱陌l(fā)言權(quán)。
㈠ 招生工作的組織
招生工作在省/市(直轄市)教育廳的領(lǐng)導(dǎo)之下,由省/市招生辦公室具體組織。在進(jìn)行全省/市統(tǒng)一考試以前,本省/市所有高中都需要將本?忌男(nèi)評(píng)定成績(jī)上報(bào)省/市招生辦公室封存。統(tǒng)一考試以后,根據(jù)統(tǒng)一考試的成績(jī),以學(xué)校為單位,對(duì)各個(gè)學(xué)校的高中校內(nèi)成績(jī)進(jìn)行校準(zhǔn),校準(zhǔn)為具有可比性的“校準(zhǔn)校內(nèi)成績(jī)”。
考慮到中國(guó)今天的實(shí)際情況,為了保證招生的公平和防止不正之風(fēng),可以在若干年內(nèi)繼續(xù)沿用以往的“分?jǐn)?shù)分段投檔”的錄取辦法,保證各個(gè)高?梢园凑铡靶(zhǔn)校內(nèi)成績(jī)”從高到低錄取學(xué)生。
每個(gè)考生在統(tǒng)一考試中的成績(jī)將作為國(guó)家機(jī)密嚴(yán)格保密,完全與考生脫鉤。以往,整個(gè)閱卷評(píng)分工作都是在“糊名”的情況下進(jìn)行的,直到最后階段才與考生姓名掛鉤。今后,統(tǒng)一考試成績(jī)?cè)谕瓿闪藢?duì)“校內(nèi)成績(jī)”進(jìn)行校準(zhǔn)、將學(xué)校上報(bào)存檔的校內(nèi)成績(jī)轉(zhuǎn)化為“校準(zhǔn)校內(nèi)成績(jī)”之后,即完成任務(wù),封存若干年后銷毀。
為避免作弊,成績(jī)校準(zhǔn)工作可以委托3家外省/市的不同中介服務(wù)機(jī)構(gòu)來完成。例如,安徽省招辦可以將分?jǐn)?shù)校準(zhǔn)工作委托北京、上海、天津三地的教育考試院來完成。北京、上海教育考試院將分別獨(dú)立對(duì)校內(nèi)成績(jī)進(jìn)行校準(zhǔn),天津考試院將負(fù)責(zé)對(duì)北京、上海兩家的校準(zhǔn)結(jié)果進(jìn)行對(duì)照比較。只有兩家的校準(zhǔn)成績(jī)完全一致時(shí),才將最終校準(zhǔn)結(jié)果用于高校錄取。所有參與的中介機(jī)構(gòu)都須簽署保密協(xié)議,并承擔(dān)相應(yīng)的法律責(zé)任。
、 校內(nèi)評(píng)定和統(tǒng)一考試的科目設(shè)定
校內(nèi)評(píng)定成績(jī)將包含交流溝通能力、數(shù)學(xué)能力和外語3科,各科都以百分制進(jìn)行評(píng)定,最高分100分?偡肿罡叻300分。
各省/市可以根據(jù)本省的實(shí)際情況,確定科目數(shù)量。在改革的開始階段,科目不宜過多。
㈢ 成績(jī)的校準(zhǔn)
統(tǒng)一考試成績(jī)不再作為大學(xué)錄取新生的依據(jù),其作用僅僅是對(duì)各個(gè)高中的校內(nèi)成績(jī)進(jìn)行校準(zhǔn),在不同學(xué)校的校內(nèi)成績(jī)之間建立起可比性。用教育測(cè)量學(xué)的術(shù)語說,就是以統(tǒng)一考試作為“外部共同題”或“外鉚”,對(duì)各個(gè)學(xué)校的高中成績(jī)進(jìn)行等值,以經(jīng)過等值的“校準(zhǔn)高中成績(jī)”作為大學(xué)招收新生的依據(jù)。
各個(gè)學(xué)校在統(tǒng)一考試前上報(bào)存檔的高中校內(nèi)成績(jī)將不僅僅是期終的筆試成績(jī),而是一個(gè)包含平時(shí)成績(jī)和教師主觀評(píng)價(jià)在內(nèi)的綜合性成績(jī)。
近20年來,測(cè)驗(yàn)分?jǐn)?shù)等值問題是國(guó)際教育測(cè)量學(xué)界的研究熱點(diǎn),已經(jīng)取得大量具有實(shí)用價(jià)值的科學(xué)研究成果,其中許多比較成熟的技術(shù)可用于高中校內(nèi)成績(jī)校準(zhǔn)。這些技術(shù)基本分兩大類:一類是基于經(jīng)典測(cè)驗(yàn)理論的方法;
一類是基于現(xiàn)代題目反應(yīng)理論(Item Response Theoty, IRT)的方法。為便于直觀理解,在此我們僅以最簡(jiǎn)單直觀的、基于經(jīng)典測(cè)量理論的線性等值方法為例,說明分?jǐn)?shù)校準(zhǔn)過程。今后,在實(shí)際測(cè)驗(yàn)分?jǐn)?shù)校準(zhǔn)過程中,我們既可采用更精致的基于IRT的等值技術(shù),也可綜合多種技術(shù)設(shè)計(jì)出比線性等值更為穩(wěn)妥可靠的校準(zhǔn)方案。
下面,我們根據(jù)一組模擬數(shù)據(jù)來予以說明!颈1】給出了全省的統(tǒng)考成績(jī)統(tǒng)計(jì);
【表2】給出了甲校的校內(nèi)成績(jī)和統(tǒng)考成績(jī);
【表3】給出了乙校的校內(nèi)成績(jī)和統(tǒng)考成績(jī)。
從【表1】/【表2】/【表3】可以看出,甲校的統(tǒng)考成績(jī)高于全省平均,是一個(gè)教學(xué)水平較好的學(xué)校。乙校的統(tǒng)考成績(jī)低于全省平均,是一個(gè)教學(xué)水平較差的學(xué)校。
從【表2】/【表3】中可以看出,與甲校相比,乙校校內(nèi)成績(jī)授予標(biāo)準(zhǔn)較寬松,乙校的校內(nèi)成績(jī)的“含金量”顯然不如甲校。比較明顯的是數(shù)學(xué)成績(jī)。甲校統(tǒng)考數(shù)學(xué)平均成績(jī)(58.7分)高出乙校(43.925分)約15分,但校內(nèi)平均成績(jī)卻相差不到1分(51.7分和50.925分)。顯然,乙校的校內(nèi)成績(jī)給得較高。
上式中的X表示考生分?jǐn)?shù);
S表示分?jǐn)?shù)的標(biāo)準(zhǔn)差;
下標(biāo)t表示統(tǒng)考成績(jī);
下標(biāo)h表示高中成績(jī);
下標(biāo)et表示“根據(jù)統(tǒng)考成績(jī)計(jì)算得到的等值分?jǐn)?shù)”, 表示平均分。據(jù)此,可以根據(jù)統(tǒng)考成績(jī)計(jì)算出經(jīng)過校準(zhǔn)的高中成績(jī),計(jì)算出每個(gè)考生的校準(zhǔn)高中成績(jī)。
將【表2】中的數(shù)據(jù)代入線性等值公式,可以得到甲校校內(nèi)語文成績(jī)的校準(zhǔn)公式
甲校一個(gè)校內(nèi)評(píng)定成績(jī)80分的學(xué)生,經(jīng)過校準(zhǔn)以后,校準(zhǔn)成績(jī)?yōu)?5.75分。
將【表3】中的數(shù)據(jù)代入線性等值公式,可以得到乙校校內(nèi)語文成績(jī)的校準(zhǔn)公式
乙校一個(gè)校內(nèi)評(píng)定成績(jī)80分的學(xué)生,經(jīng)過校準(zhǔn)以后,校準(zhǔn)成績(jī)?yōu)?3.34分。
可以看到,校內(nèi)成績(jī)給分較嚴(yán)的甲校,經(jīng)過校準(zhǔn)后分?jǐn)?shù)得到提高。校內(nèi)成績(jī)給分較寬的乙校,經(jīng)過校準(zhǔn)后分?jǐn)?shù)有所下降。
在未根據(jù)統(tǒng)考成績(jī)進(jìn)行校準(zhǔn)之前,兩校的校內(nèi)成績(jī)差別很小。比較【表5】/【表6】可以看出,經(jīng)過校準(zhǔn)以后,校內(nèi)成績(jī)之間出現(xiàn)明顯差距——甲校的校準(zhǔn)校內(nèi)成績(jī)已經(jīng)明顯高于乙校的校準(zhǔn)校內(nèi)成績(jī)。甲校的校準(zhǔn)校內(nèi)成績(jī)明顯高于乙校校準(zhǔn)校內(nèi)成績(jī)的原因在于:甲校的統(tǒng)考成績(jī)明顯高于乙校。
比較【表2】/【表5】和【表3】/【表6】,可以看到,經(jīng)過校準(zhǔn)的校內(nèi)平均成績(jī),基本等于統(tǒng)考的全校平均成績(jī)。
在實(shí)際的分?jǐn)?shù)校準(zhǔn)過程中,不僅要考慮各校校內(nèi)成績(jī)與統(tǒng)考成績(jī)各自平均分之間的關(guān)系,還要考慮校內(nèi)成績(jī)與統(tǒng)考成績(jī)之間的相關(guān)關(guān)系——二者之間須達(dá)到一定程度的正相關(guān)。這個(gè)正相關(guān)應(yīng)是一個(gè)中等程度的相關(guān)。如果相關(guān)太高,就不能通過校內(nèi)成績(jī)體現(xiàn)高中教師的主觀評(píng)價(jià),與改革前根據(jù)統(tǒng)一考試成績(jī)錄取考生沒什么區(qū)別;
如果相關(guān)太低,校內(nèi)評(píng)價(jià)與統(tǒng)考成績(jī)之間的一致性太低,也可能存在問題。對(duì)于那些相關(guān)系數(shù)過低(如低于0.6)的學(xué)校,需要進(jìn)行調(diào)研!颈7】給出了根據(jù)這一組模擬數(shù)據(jù)計(jì)算得到的校內(nèi)成績(jī)與統(tǒng)考成績(jī)的相關(guān)。真實(shí)的數(shù)據(jù),估計(jì)不會(huì)達(dá)到這樣高的相關(guān)。從【表7】的數(shù)據(jù)可以看出,乙校的校內(nèi)成績(jī)雖然給得比較寬松,但與統(tǒng)考成績(jī)的一致性還是很高的。
從模擬數(shù)據(jù)中可明顯看到,兩個(gè)統(tǒng)考成績(jī)相同的考生,獲得的校內(nèi)成績(jī)可能不同,經(jīng)過校準(zhǔn)的校內(nèi)成績(jī)也不同。兩個(gè)獲得相同校內(nèi)成績(jī)的考生,其經(jīng)過校準(zhǔn)的校內(nèi)成績(jī)也一定是相同的。當(dāng)高校在根據(jù)校準(zhǔn)校內(nèi)成績(jī)錄取新生的時(shí)候,統(tǒng)考成績(jī)不會(huì)產(chǎn)生任何影響,錄取完全是根據(jù)高中評(píng)定的校內(nèi)成績(jī)進(jìn)行的。(點(diǎn)擊此處閱讀下一頁)
、 社會(huì)考生的報(bào)考問題
高考改革的一個(gè)基本方向是擴(kuò)大大學(xué)的招生自主權(quán),讓大學(xué)自己設(shè)計(jì)、自己選擇自己的招生方案。大學(xué)在獲得一定的招生自主權(quán)后,既可設(shè)計(jì)自己從應(yīng)屆高中畢業(yè)生中招生的方案,也可設(shè)計(jì)自己從社會(huì)考生中招生的方案。大學(xué)可以有多種選擇,也可以綜合采用多種選拔方式,包括——
1、單獨(dú)組織考試。考試可以包括筆試和面試。由于社會(huì)考生人數(shù)較少,單獨(dú)組織考試是可能的。
2、大學(xué)可以采用一些社會(huì)化的考試作為錄取社會(huì)考生的依據(jù)。如國(guó)家職業(yè)漢語能力測(cè)試(ZHC)、英語四六級(jí)考試,等等。
3、業(yè)績(jī)考察。社會(huì)考生不同于高中畢業(yè)生,有些人可能已經(jīng)具有了一定的“業(yè)績(jī)”。這些“業(yè)績(jī)”將成為大學(xué)錄取新生的非常重要的參考依據(jù)。
社會(huì)人員要申請(qǐng)進(jìn)入大學(xué),需要向大學(xué)證明自己的學(xué)習(xí)和研究潛力。他們也可以有多種選擇:可以通過參加一些社會(huì)化的考試來為自己提供證明,也可以像今天的復(fù)讀生一樣,通過某一所高中報(bào)考,實(shí)際上是委托某一所高中來對(duì)自己的能力進(jìn)行認(rèn)證。由于不同高中給出的認(rèn)證具有不同的權(quán)重,他/她可以有多種選擇。
此方案的突出特點(diǎn)是,既給了最應(yīng)具有發(fā)言權(quán)的高中教師充分的發(fā)言權(quán),又保證了大學(xué)招生的公平性,使受到不同學(xué)校綜合評(píng)價(jià)的考生在大學(xué)招生選拔中受到同等的對(duì)待。既注意到評(píng)價(jià)的效度,也注意到評(píng)價(jià)的信度和可比性。
另一特點(diǎn)是,以長(zhǎng)期的“形成性評(píng)價(jià)”取代一次性的“終結(jié)性評(píng)價(jià)”。由于高中教師參與評(píng)價(jià),影響評(píng)價(jià)的就不僅是一次的考試(高考)成績(jī),還包括教師對(duì)學(xué)生平時(shí)學(xué)習(xí)狀況的綜合評(píng)價(jià)。
在此方案中,實(shí)際上是以“筆試和面試相結(jié)合”的評(píng)價(jià)方式取代原來單純筆試的評(píng)價(jià)方式?陬^表達(dá)能力/應(yīng)變能力等許多重要的能力因素,很難通過筆試來考查,且在大規(guī)模統(tǒng)一考試中進(jìn)行面試很難操作。在這種中學(xué)教師參與的招生方式中,實(shí)際上實(shí)現(xiàn)了筆試和面試的結(jié)合。
此方案使一些非智力因素被包含進(jìn)招生考慮之中。智力固然是一個(gè)人成功的重要因素,責(zé)任感/勤奮/毅力等非智力因素,也同樣是成功的重要因素。在一些特定條件下,甚至比智力因素更重要。忽視非智力因素的考查是現(xiàn)行招生制度的重大缺陷,也是中國(guó)大學(xué)與世界上真正一流大學(xué)在招生方面的本質(zhì)差距。在這種中學(xué)教師參與的招生方式中,將會(huì)在一定程度上將一些非智力因素包含在評(píng)價(jià)過程中。
測(cè)驗(yàn)等值(或曰考試成績(jī)的可比性)是我近10年的主要研究課題。借助現(xiàn)代教育測(cè)量學(xué)的研究成果/計(jì)算機(jī)技術(shù)/網(wǎng)絡(luò)技術(shù),完全可以借助統(tǒng)一考試在各個(gè)學(xué)校的校內(nèi)考試成績(jī)之間建立可比性。這一方案不是一介書生在書齋中憑空想出的理論方案,而是一個(gè)長(zhǎng)期工作在考試實(shí)踐第一線的實(shí)踐者提出的操作方案,具有很強(qiáng)的可行性和操作性。這一方案不是一個(gè)“理想方案”,而是一個(gè)從中國(guó)國(guó)情出發(fā)的“妥協(xié)方案”。
這一方案僅僅試圖解決給高中教師發(fā)言權(quán)的問題,試圖解決“降低一次性考試在招生決策中比重過大”的問題,并沒有針對(duì)解決考試內(nèi)容方面所存在的問題。不同的考試內(nèi)容,仍然會(huì)對(duì)教學(xué)產(chǎn)生重要的導(dǎo)向作用,因此,在改革招生制度的同時(shí),還需要同時(shí)進(jìn)行考試內(nèi)容方面的改革。
四、結(jié)語
在招生中降低考試分?jǐn)?shù)的比重,在考試中增加能力考查的比重,是今天高考改革的任務(wù)。給高中教師發(fā)言權(quán),給大學(xué)校長(zhǎng)招生權(quán),是今天高考改革的主要方向。在今天普遍社會(huì)風(fēng)氣令人沮喪的情況下,高中教師和大學(xué)校長(zhǎng)能否正當(dāng)?shù)匦惺惯@些權(quán)力,確實(shí)是一個(gè)嚴(yán)肅的問題。
首先,由于大學(xué)生就業(yè)問題的凸顯,必要的制約機(jī)制正在逐漸形成。以往那種權(quán)力不受制約的局面已經(jīng)發(fā)生變化。
其次,還要相信也需要相信大多數(shù)。毛澤東同志曾經(jīng)說:“我們應(yīng)該相信群眾,我們應(yīng)該相信黨,這是兩條基本的原理。如果懷疑這兩條原理,那就什么事情也做不成了!蔽覀儜(yīng)該相信,大多數(shù)高中教師和大學(xué)校長(zhǎng)的胸中都跳動(dòng)著一顆向往高尚生活的心。
第三,任何進(jìn)步都需要付出必要的代價(jià)。容忍一些腐敗,容忍一些貪官污吏、豪門權(quán)貴將自己的子女送進(jìn)大學(xué),是為了發(fā)展素質(zhì)教育不得不付的代價(jià)。高考改革方案的選擇不是選擇最佳,而是避免最劣。不是兩利相權(quán)取其重,而是兩害相權(quán)取其輕,F(xiàn)實(shí)生活中,很少有兩利相權(quán)取其重的時(shí)候。今天,最大的“害”是兒童的好奇心被磨滅,兒童的學(xué)習(xí)興趣被摧殘,兒童的健康人格發(fā)展受到損害。今天,最大的“害”是學(xué)生厭學(xué)。按照我提出的方案改革高考,或許有少量的權(quán)錢介入。在“權(quán)錢介入”和“厭學(xué)”這兩害之間,我們必須選擇保護(hù)兒童的學(xué)習(xí)興趣。為了保護(hù)幾代人的自主創(chuàng)新能力,為了爭(zhēng)取21世紀(jì)中國(guó)的發(fā)展機(jī)會(huì),容忍一些腐敗是值得的。
反對(duì)給高中教師發(fā)言權(quán)的人總是在說現(xiàn)在沒有深化高考改革的信用環(huán)境。問題是,如果擔(dān)任塑造靈魂責(zé)任的教師不首先去致力于建立信用環(huán)境,那么,我們指望什么人來為我們建立起一個(gè)信用環(huán)境呢?我們指望什么人建立起一個(gè)信用環(huán)境來讓我們享用呢?作為“行為世范”的教師,有責(zé)任在建立信用環(huán)境方面先行一步。
中國(guó)改革面臨的是一個(gè)“鏈環(huán)型制約”:政治發(fā)展制約經(jīng)濟(jì)發(fā)展,經(jīng)濟(jì)發(fā)展制約教育發(fā)展,教育發(fā)展制約社會(huì)文化發(fā)展,社會(huì)文化發(fā)展又制約政治發(fā)展。在這個(gè)制約鏈條中,沒有“關(guān)鍵環(huán)節(jié)”,也不可能有“革命”或“突破”——任何一個(gè)領(lǐng)域都不可能“突飛猛進(jìn)”,只能以“蠶食”/“蠕動(dòng)”/“進(jìn)兩步退一步”的方式前進(jìn)。在這種局面中,某一個(gè)領(lǐng)域如果先行一步,就會(huì)承受更大壓力,付出更大代價(jià),遭遇更多傷亡。如果誰也不愿做先行者并為之付出代價(jià),改革步伐就只能遲緩澀滯。長(zhǎng)期以來,教育領(lǐng)域就一直在中國(guó)的改革中扮演“跟進(jìn)者”的角色。這種角色雖然使教育界官員獲得更高的安全性和更平穩(wěn)的仕途,卻使教育領(lǐng)域?qū)χ袊?guó)改革的進(jìn)程貢獻(xiàn)較小。
1989年初,我曾當(dāng)面對(duì)當(dāng)時(shí)分管教育的政治局委員講:今天,發(fā)展教育的一個(gè)重要舉措是“取消包分配”。“包分配”是遲早要取消的,或者自己主動(dòng)取消,加速教育改革和教育發(fā)展,或者伴隨《企業(yè)法》和《公務(wù)員條例》的逐步落實(shí)而被動(dòng)地取消。
16年過去了,“包分配”最終被動(dòng)地取消了。在這一過程中,教育部扮演了“跟進(jìn)者”的角色。可以設(shè)想,16年前的教育主管領(lǐng)導(dǎo)如果選擇“先行者”角色,他將承擔(dān)大得多的改革風(fēng)險(xiǎn),但他也可能對(duì)中國(guó)的改革做出大得多的貢獻(xiàn),使中國(guó)的教育至少早10年走出“應(yīng)試教育”的陰影。
“先行”還是“跟進(jìn)”?今天的教育主管官員仍然面臨選擇。不同的選擇,將使他們?cè)谥袊?guó)的現(xiàn)代化進(jìn)程中留下不同的足跡,也將賦予他們的人生截然不同的意義。
謝小慶,1951年生,北京語言大學(xué)教育測(cè)量研究所所長(zhǎng)。
本文發(fā)表于《領(lǐng)導(dǎo)者》(雙月刊)2009/2月號(hào),總第26期。天益網(wǎng)受權(quán)發(fā)布。
熱點(diǎn)文章閱讀