國外關(guān)于測試效應(yīng)的研究概述 心理學(xué)常見的166個(gè)效應(yīng)
發(fā)布時(shí)間:2020-03-03 來源: 感恩親情 點(diǎn)擊:
摘要 測試效應(yīng)的研究表明,“學(xué)習(xí)”并非只發(fā)生在編碼階段,測試或提取練習(xí)除了可評估知識掌握程度之外,在某些情況下它比再次學(xué)習(xí)能更好地促進(jìn)長時(shí)記憶保持。文章從如下方面概述了國外關(guān)于測試效應(yīng)的研究:(1)在自由回憶、配對聯(lián)想學(xué)習(xí)、再認(rèn)和模擬教育情境等不同性質(zhì)的實(shí)驗(yàn)任務(wù)下測試對學(xué)習(xí)的積極作用;(2)測試可能導(dǎo)致的消極作用,介紹有關(guān)提取導(dǎo)致遺忘,測試的消極暗示效應(yīng),測試與錯(cuò)誤記憶等方面的研究;(3)介紹信息額外呈現(xiàn)理論,過度學(xué)習(xí)理論,提取努力理論,必要難度理論,遷移適當(dāng)加工理論等測試效應(yīng)的有關(guān)理論及其發(fā)展沿革。最后,結(jié)合研究中的爭議及教學(xué)應(yīng)用做了思考,并指出有待進(jìn)一步研究的問題。
關(guān)鍵詞 測試效應(yīng),消極效應(yīng),提取,長時(shí)記憶。
分類號 B849;G442
1 什么是測試效應(yīng)
1.1測試效應(yīng)的概念
測試效應(yīng)(testing effect)指學(xué)習(xí)某一內(nèi)容時(shí),進(jìn)行測試比額外學(xué)習(xí)能更好地提高后來對它的記憶保持水平,即便在測試無反饋時(shí)也是如此。理解這一概念應(yīng)先區(qū)分測試的間接作用和直接作用,測試的間接作用指測試可通過各種方式促進(jìn)學(xué)習(xí),如,課堂測試可促使學(xué)生在一堂課中不斷地學(xué)習(xí),測試還可使學(xué)生從測試結(jié)果中得到反饋,學(xué)習(xí)過程中的自我測試可引導(dǎo)學(xué)生下一步應(yīng)學(xué)什么等。而測試的直接作用指測試這一行為本身提高了學(xué)習(xí)和長時(shí)記憶,即測試效應(yīng)。
通過測試提高記憶保持水平并非新觀點(diǎn),James(1890)在其《心理學(xué)原理》一書中就討論了測試的作用,“……”我們的記憶有一個(gè)奇怪的特性,即積極的重復(fù)比消極的重復(fù)能讓我們更好地記憶。我的意思是,當(dāng)我們幾乎學(xué)會(huì)了某一內(nèi)容時(shí),與其再看一遍這些內(nèi)容,不如停下來試著回憶一下。如果我們能通過后一種方式回憶出一些內(nèi)容,那么在下一次我們應(yīng)該也能回憶出來;而如果是以前一種方式,我們很可能需要再學(xué)一次……”。這一現(xiàn)象雖然早已為認(rèn)知心理學(xué)家所關(guān)注,但一直以來并未有系統(tǒng)的研究。人們往往認(rèn)為測試只是衡量學(xué)生學(xué)習(xí)水平的一種評估工具,而只有通過學(xué)習(xí)或?qū)Σ牧系木幋a才是真正地“學(xué)習(xí)”。新近一些研究重新關(guān)注測試效應(yīng),這些研究使我們進(jìn)一步認(rèn)識到測試不僅可用于評估知識掌握水平,還能使個(gè)體所掌握的知識結(jié)構(gòu)發(fā)生變化,極大地提高知識的記憶保持程度。例如,有關(guān)測試效應(yīng)的研究表明,學(xué)習(xí)某一內(nèi)容時(shí),重學(xué)一遍可增強(qiáng)提取流暢性(retrieval fluency),它使個(gè)體對自己的記憶水平更自信,從而在學(xué)習(xí)時(shí)傾向于選擇重學(xué),而實(shí)際上重學(xué)只促進(jìn)了短期記憶水平,測試則導(dǎo)致了更好的長時(shí)記憶水平。因此,理解測試效應(yīng),掌握科學(xué)的自我測試策略,可使學(xué)生改變錯(cuò)誤的或低效的學(xué)習(xí)觀念,在相同的甚或更少的時(shí)間(與重復(fù)學(xué)習(xí)相比)星取得更好的學(xué)習(xí)效果,實(shí)現(xiàn)高效率學(xué)習(xí)。
1.2測試效應(yīng)的基本研究范式
研究測試效應(yīng)的最常見的實(shí)驗(yàn)設(shè)計(jì)是:學(xué)習(xí)材料→一次或多次初始測試(initial test)→衡量被試記憶保持程度的最終測試(final test)。實(shí)驗(yàn)一般設(shè)立一個(gè)實(shí)驗(yàn)組(進(jìn)行測試)和一個(gè)或兩個(gè)控制組,考查實(shí)驗(yàn)結(jié)果時(shí)將測試組的成績與控制組進(jìn)行對比?刂平M一般有兩種:①學(xué)習(xí)材料→無初始測試→最終測試;②學(xué)習(xí)材料→再次學(xué)習(xí)→最終測試,該條件下控制組和測試組接觸材料的總的時(shí)間相同。
通過修改基本范式,研究者可以探討各種條件下的測試效應(yīng),如學(xué)習(xí)的材料(無關(guān)詞對、聯(lián)想詞對、散文等),初始和最終測試的形式(自由回憶、再認(rèn)、線索回憶等),是否對測試提供反饋以及反饋的形式,學(xué)習(xí)階段和第一次測試的時(shí)間間隔,最終測試之前的記憶保持間隔(retention interval)等。
1.3 Tulving的經(jīng)典研究
人們往往認(rèn)為學(xué)習(xí)只發(fā)生在學(xué)習(xí)(編碼)階段,而測試的作用僅是顯示個(gè)體在之前的學(xué)習(xí)階段學(xué)到了什么。Tulving(1967)用實(shí)驗(yàn)證明了學(xué)習(xí)不僅只發(fā)生在編碼階段,測試本身也是一種學(xué)習(xí)。TuNing讓被試在三種實(shí)驗(yàn)條件下學(xué)習(xí)包含36個(gè)單詞的詞表。一是標(biāo)準(zhǔn)學(xué)習(xí)條件:學(xué)詞表(study),回憶(test),再學(xué),再回憶,即STST:一是重復(fù)學(xué)習(xí),被試學(xué)習(xí)三次測試一次,即SSST;一是重復(fù)測試,被試學(xué)習(xí)一次測試三次,即STTT。三種學(xué)習(xí)條件下的學(xué)習(xí)次數(shù)共為24次,因此標(biāo)準(zhǔn)學(xué)習(xí)條件下分別為12次學(xué)習(xí),12次測試,重復(fù)學(xué)習(xí)條件下為18次學(xué)習(xí),6次測試,重復(fù)測試條件下為6次學(xué)習(xí),18次測試。如果“學(xué)習(xí)”(對某一內(nèi)容的最終掌握)僅在學(xué)習(xí)或編碼時(shí)發(fā)生,那么SSST組的掌握水平應(yīng)比STST組來得更好,因?yàn)樗嗔?次學(xué)習(xí),而STTT組由于學(xué)習(xí)的次數(shù)最少最終掌握水平理應(yīng)最差。但Tulving的實(shí)驗(yàn)發(fā)現(xiàn)三種學(xué)習(xí)條件下的被試在最終測試上的成績幾乎是相同的,STST組和SSST組都回憶了約20個(gè)單詞,STTT組回憶了約18.5個(gè)單詞。從某種意義上來說,一次測試可相當(dāng)于一次學(xué)習(xí)。
2 不同實(shí)驗(yàn)條件下測試對學(xué)習(xí)的促進(jìn)作用
Tulving(1967)的經(jīng)典研究探討了測試對自由回憶的促進(jìn)作用,之后的研究者陸續(xù)對配對聯(lián)想任務(wù)、再認(rèn)等其他回憶形式的測試效應(yīng)進(jìn)行了研究。此外,研究者還以散文、GRE單詞等為實(shí)驗(yàn)材料考察了真實(shí)教育情境中的測試效應(yīng)。
2.1自由回憶中的測試效應(yīng)
Tulving(1967)的研究引發(fā)了大量的相關(guān)研究,但大多數(shù)研究都仿照Tulving的設(shè)計(jì)或僅改變一些變量。這些研究在方法上有一個(gè)共同之處,即學(xué)習(xí)時(shí)間和測試時(shí)間是均等的,且在學(xué)習(xí)階段呈現(xiàn)單詞的速度和最終測試的時(shí)間都很短,實(shí)驗(yàn)中的測試都采用自由回憶形式。如Tulving(1967)的研究中,學(xué)習(xí)階段36個(gè)單詞的呈現(xiàn)速度為1個(gè)/秒,在測試階段被試回憶這些單詞的時(shí)間也僅為36秒。在這種實(shí)驗(yàn)條件下,是否有可能因?yàn)闀r(shí)間過短而使得被試即便學(xué)會(huì)了36個(gè)單詞也無法在規(guī)定時(shí)間內(nèi)將其回憶出來?Roediger和Thorpe(1978)對自由回憶與回憶時(shí)間的關(guān)系的研究表明,過短的測試時(shí)間將大大低估被試所習(xí)得的知識量,從而可能低估了測試效應(yīng),但研究者未在這一發(fā)現(xiàn)的基礎(chǔ)之上做進(jìn)一步的探索。為更準(zhǔn)確地考查被試的回憶量,Karpicke和Roediger(2007)模仿了Tulving的三種實(shí)驗(yàn)條件,即STST,SSST,STTT,但為避免對被試回憶水平的低估,以3秒1個(gè)的速率呈現(xiàn)單詞,這樣測試和學(xué)習(xí)的時(shí)間都增加到2分鐘,每種實(shí)驗(yàn)條件都進(jìn)行5次循環(huán)(如標(biāo)準(zhǔn)測試條件下為STST,STST,STST,STST,STST)。為考查三種實(shí)驗(yàn)條件對長時(shí)記憶的不同作用,研究者進(jìn)一步探討了一周后三種學(xué)習(xí)條件下被試的記憶保持水平。結(jié)果表明,STTT組在開始階段(第一次和第二次循環(huán)的最后一次測試)處于劣勢,但很快地趕上SSST組,兩種條件在后面的測試中差異很小。STST組被試在最后4次測試上 的回憶水平都顯著地好于SSST和STTT。因此,總體而言該研究結(jié)果與Tulving(1967)的結(jié)果相符,三種實(shí)驗(yàn)條件下的學(xué)習(xí)曲線很相似,但該研究還發(fā)現(xiàn)了STST的測試成績與STTT和SSST的差異,研究者認(rèn)為這是由于在STST中,測試(T)之后伴隨學(xué)習(xí)(S),這相當(dāng)于對回憶失敗內(nèi)容的反饋,在STST中這種反饋的機(jī)會(huì)多于其他兩種條件。此外,更重要的是,該研究考查了被試在1周后的記憶保持水平,發(fā)現(xiàn)SSST的回憶率顯著低于STST和STTT,后兩者無顯著差異,這證明了測試對于提高長時(shí)記憶保持的作用。
為更具體地考察多次測試與多次學(xué)習(xí)的效應(yīng),研究者還考查了不同的重復(fù)測試與重復(fù)學(xué)習(xí)條件下的學(xué)習(xí)效果,以及測試次數(shù)對測試效應(yīng)的影響。
Thompson等(1978)的實(shí)驗(yàn)發(fā)現(xiàn)適當(dāng)?shù)摹皩W(xué)習(xí)一測試”方式將導(dǎo)致更好的學(xué)習(xí)效果。實(shí)驗(yàn)設(shè)計(jì)了三種條件,一為SSSS,詞表呈現(xiàn)4次;一為STTT,學(xué)一次,進(jìn)行三次自由回憶;一為STRTRTR(TR指再次學(xué)習(xí)回憶失敗的單詞后進(jìn)行自由回憶),學(xué)一遍詞表后進(jìn)行回憶,再學(xué)時(shí)僅學(xué)習(xí)那些回憶失敗的單詞,然后再回憶所有單詞,如此重復(fù)三次,該設(shè)計(jì)實(shí)際上模擬學(xué)生在學(xué)習(xí)過程中可能存在的學(xué)習(xí)方式,即學(xué)生往往是先學(xué)習(xí)某一內(nèi)容,接著通過自我測試看看自己是否掌握,然后再學(xué)習(xí)那些未掌握的內(nèi)容,如此反復(fù),直到完全掌握。最終測試分別在5分鐘或2天后進(jìn)行。結(jié)果發(fā)現(xiàn),5分鐘后的測試中,三種實(shí)驗(yàn)條件下的回憶成績?yōu)镾TRTRTR>SSSS>STTT。但兩天后的回憶成績發(fā)生變化,STRTRTR>STTT>SSSS,SSSS組在前一次所能回憶出的單詞的基礎(chǔ)上遺忘率為56%,STRTRTR組被26%,而STTT組僅為13%。
受Thompson等的研究的啟發(fā),Karpicke和Roediger(2007)在其研究的一個(gè)實(shí)驗(yàn)中讓被試在四種學(xué)習(xí)條件下學(xué)習(xí),分別為STST,SSTT,STSnT(Sn指只學(xué)回憶失敗的詞),STSnTn(Tn指只回憶之前無法回憶的詞),結(jié)果發(fā)現(xiàn),在一周后的測試中STSnTn組的回憶水平最差,因此是否進(jìn)行回憶測試是決定長時(shí)記憶保持水平的重要因素。Wheeler等(2003)的研究對比了重復(fù)學(xué)習(xí)和重復(fù)測試在即時(shí)和延時(shí)測試中的不同影響。實(shí)驗(yàn)擴(kuò)展了學(xué)習(xí)和測試的次數(shù),被試在重復(fù)學(xué)習(xí)(SSSSS)和重復(fù)測試(STTTT)兩種條件下學(xué)習(xí)40個(gè)單詞,然后在5分鐘和1周后進(jìn)行自由回憶測試。結(jié)果發(fā)現(xiàn),雖然在SSSSS條件下,每個(gè)學(xué)習(xí)階段被試都學(xué)習(xí)了所有的40個(gè)單詞,而在STTTT條件下,被試所接觸的僅是他們能回憶起的那些單詞,但SSSSS組被試僅在5分鐘后進(jìn)行的回憶測試中好于STTTT組,而在一周后的測試中結(jié)果完全相反,這強(qiáng)有力地證明了測試效應(yīng)顯著作用。Wheeler和Roediger(1992)的一項(xiàng)研究探討了多次測試的效果與單次測試效果的差異。實(shí)驗(yàn)讓被試聽一個(gè)包含60個(gè)具體物體名稱的故事,每一物體在故事中第一次出現(xiàn)時(shí)都在顯示屏上以圖片形式呈現(xiàn),最終測試要求被試回憶圖片的名稱。呈現(xiàn)結(jié)束后,實(shí)驗(yàn)組1進(jìn)行一次7分鐘的回憶測試后離開,實(shí)驗(yàn)組2進(jìn)行了三次回憶測試后離開,控制組在呈現(xiàn)結(jié)束后離開實(shí)驗(yàn)室,要求所有被試一周后回來繼續(xù)實(shí)驗(yàn)。結(jié)果發(fā)現(xiàn),從遺忘率來看,實(shí)驗(yàn)組2一周后遺忘率為13%,實(shí)驗(yàn)組1為27%,控制組為46%,重復(fù)測試促成最低的遺忘率。
2.2配對聯(lián)想學(xué)習(xí)中的測試效應(yīng)
配對聯(lián)想學(xué)習(xí)往往以不同聯(lián)想度的詞對或“非詞一詞”(如,“BLSM一筆畫”)為任務(wù),在測試效應(yīng)的有關(guān)研究中經(jīng)常使用,因?yàn)樗寡芯空呖梢院芊奖愕乜刂茖W(xué)習(xí)和測試之間的時(shí)間間隔,而且也很容易控制反饋。下面介紹Alan(1969)和Jacoby(1978)以配對聯(lián)想學(xué)習(xí)為任務(wù)探討測試效應(yīng)的兩個(gè)代表性研究,并著重介紹采用配對聯(lián)想學(xué)習(xí)任務(wù)進(jìn)行的集中與分散測試對記憶水平影響的有關(guān)研究。
2.2.1配對聯(lián)想測驗(yàn)中的測試效應(yīng)
Allen等(1969)讓兩組被試分別學(xué)習(xí)配對聯(lián)想詞表5次或10次,然后分無測試,一次測試,五次測試三種測試情況,一天后進(jìn)行最終測試(形式為horse-?),結(jié)果發(fā)現(xiàn)學(xué)習(xí)10次的效果僅稍好于5次,但進(jìn)行一次測試后則使10次學(xué)習(xí)組的成績遠(yuǎn)高于5次學(xué)習(xí)組;學(xué)習(xí)5次測試1次的被試在最終測試中的成績相當(dāng)于學(xué)習(xí)10次無初始測試的被試,也即單次測試對長期記憶保持的效果相當(dāng)于5次學(xué)習(xí)。
Jacoby(1978)著名的殘?jiān)~補(bǔ)全實(shí)驗(yàn)也證明了配對聯(lián)想學(xué)習(xí)中的測試效應(yīng),實(shí)驗(yàn)采用了2(重學(xué)、測試)×2(即時(shí)、延時(shí))的實(shí)驗(yàn)設(shè)計(jì)。讓被試先學(xué)習(xí)聯(lián)想詞對(如,foot-shoe),再學(xué)時(shí)分兩種條件:一是重學(xué)完整詞對;一是給被試提供詞對左邊的單詞,要求將右邊的殘?jiān)~補(bǔ)全,如(foot-se)。這兩種條件又各分兩種情況,一是學(xué)習(xí)后立即進(jìn)行(即時(shí)),一是插入20個(gè)詞對(延遲)。最終測試的形式“foot-????”。結(jié)果表明,殘?jiān)~補(bǔ)全測試比重學(xué)完整詞導(dǎo)致了更好的記憶保持水平,延時(shí)測試的效果要好于即時(shí)測試,Jacoby認(rèn)為這是由于學(xué)習(xí)之后的即時(shí)測試減小了記憶提取過程中努力加工的程度,從而削弱了測試效應(yīng)。Jaeoby的這一實(shí)驗(yàn)往往被看作是研究生成效應(yīng)(generation effect)的先驅(qū),生成效應(yīng)指學(xué)習(xí)某一材料時(shí),生成相關(guān)知識比閱讀材料將導(dǎo)致更好的回憶或再認(rèn)水平),而生成效應(yīng)從某種程度上來說是測試效應(yīng)的一種。
Jocoby的實(shí)驗(yàn)中殘?jiān)~補(bǔ)全測試導(dǎo)致了極高水平的回憶率(大于90%),雖然Carrier和Pashler(1992),Kuo和Hirshrnan(1996)使用標(biāo)準(zhǔn)的線索一回憶測驗(yàn)作為測試任務(wù)并未產(chǎn)生如此高水平的回憶成績,但總的來說都發(fā)現(xiàn)了測試對配對一聯(lián)想詞對的記憶保持的積極作用。Cull(2000),Pashler等(2005)的研究還發(fā)現(xiàn),對測試中未能回憶出的詞對給予反饋將增強(qiáng)測試效應(yīng)。
2.2.2配對聯(lián)想學(xué)習(xí)的集中與分散測試效應(yīng)
由于配對聯(lián)想學(xué)習(xí)任務(wù)易于控制學(xué)習(xí)與測試之間的時(shí)間間隔,便于研究者探討集中或分散測試對學(xué)習(xí)的不同影響,因此配對聯(lián)想學(xué)習(xí)任務(wù)成為研究集中或分散測試效應(yīng)的主要任務(wù)形式。
雖然早在19世紀(jì)初Ebbinghaus等就探討集中學(xué)習(xí)與分散學(xué)習(xí)的關(guān)系,但對提取是否也具有集中和分散效應(yīng)的研究則以Landauer和Bjork(1978)的研究為標(biāo)志。Landauer和Bjork(1978)通過兩個(gè) 實(shí)驗(yàn)比較了配對一聯(lián)想學(xué)習(xí)中,擴(kuò)展式測試與等間隔測試對學(xué)習(xí)的不同影響,實(shí)驗(yàn)1采用“名-姓”詞對,實(shí)驗(yàn)2采用“名字-人面”詞對。實(shí)驗(yàn)中的擴(kuò)展式測試的形式為1―5―9(數(shù)字代表學(xué)習(xí)某一詞對A-B后進(jìn)行測試之前插入的學(xué)習(xí)或測試的次數(shù)),等間隔測試的形式即為5―5―5,二者的平均間隔數(shù)相等,實(shí)驗(yàn)另外還設(shè)立了集中測試組,即學(xué)完之后連續(xù)測試,0-0-0;各條件下的測試都不提供反饋。結(jié)果表明,擴(kuò)展式測試組在最終的延時(shí)測試上的回憶成績好于等間隔測試組,而等間隔測試組的成績好于集中測試組。雖然集中測試使被試在學(xué)習(xí)的開始階段幾乎不發(fā)生錯(cuò)誤,但在最終測試上擴(kuò)展式測試和等間隔式測試的成績比集中測試更好,擴(kuò)展式測試組的成績略好于等間隔式測試。
Landauer和Bjork的研究引發(fā)了一系列相關(guān)研究,大多數(shù)研究都發(fā)現(xiàn)兩種分散測試形式在延時(shí)測試中的成績都好于集中測試,但對于擴(kuò)展式測試在促進(jìn)長時(shí)記憶上是否優(yōu)于等間隔測試的問題則存在較大的爭議。Balom等(2006)比較了擴(kuò)展性測試、等間隔測試和集中測試對三組被試(年輕成人、健康的年長成人、Alzheimer病的年長成人)的不同影響。被試學(xué)習(xí)材料(低關(guān)聯(lián)度詞對)后分三種實(shí)驗(yàn)條件進(jìn)行初始測試:集中測試(0-0-0),等間隔測試(3-3-3),擴(kuò)展式測試(1-3-5),最后進(jìn)行最終測試。結(jié)果發(fā)現(xiàn),在學(xué)習(xí)階段,三組被試在集中測試的情況下均表現(xiàn)了最好的水平,在擴(kuò)展式測試情況下其次,而在等間隔測試情況下表現(xiàn)最差。但在最終測試中,三組被試在等間隔測試和擴(kuò)展式測試情況下并無差異,但都好于集中測試情況下的成績。Carpenter和Delosh(2005)以“姓名-人面”配對為實(shí)驗(yàn)材料的研究也發(fā)現(xiàn)了類似的現(xiàn)象,但研究發(fā)現(xiàn)在最終測試上等間隔測試組的成績略好于擴(kuò)展性測試組。
Karpieke和Roediger(2007)讓被試學(xué)習(xí)“詞匯一釋義”類型的詞對,然后分別在三種測試形式下學(xué)習(xí):集中測試(0-0-0),等間隔測試(5-5-5),擴(kuò)展式測試(1-5-9),最后分別在10分鐘或2天后對被試進(jìn)行測試。結(jié)果發(fā)現(xiàn),在兩種最終測試條件下,分散測試的成績都優(yōu)于集中測試。在10分鐘后的測試中,擴(kuò)展性測試組的成績略好于等間隔測試,但在48小時(shí)之后的測試中,等間隔測試組的回憶成績高于擴(kuò)展式測試組。這一研究表明,等間隔測試可能比擴(kuò)展式測試能更好地促進(jìn)長時(shí)記憶,研究者認(rèn)為初次提取嘗試的時(shí)間間隔是關(guān)鍵因素,即初次提取的間隔越長將導(dǎo)致提取的難度越大。這與Bjork(1992)的提取難度理論一致,該理論認(rèn)為提取時(shí)一定的難度將導(dǎo)致更好的記憶保持。Pashler等(2003)以配對聯(lián)想詞為材料的研究也表明,雖然隨著學(xué)習(xí)之后進(jìn)行首次測試的間隔時(shí)間的增大,被試在初次測試中的成績往往是呈下降趨勢的,但延長首次測試的時(shí)間間隔促進(jìn)了長時(shí)記憶。
2.3再認(rèn)任務(wù)中的測試效應(yīng)
有關(guān)測試效應(yīng)的研究大都使用自由回憶或配對聯(lián)想學(xué)習(xí)任務(wù),而較少采用再認(rèn)任務(wù),這可能與采用再認(rèn)任務(wù)探討測試效應(yīng)時(shí)結(jié)論不盡一致有關(guān)。如,Roediger和McDermott(1995),Hicks和Stams(2004),以及Verde(2004)等的研究讓被試在學(xué)習(xí)之后進(jìn)行回憶測試,而最終測試為再認(rèn)測試,發(fā)現(xiàn)回憶測試提高了再認(rèn)測試的成績。但Jones和Roediger(1995)的研究采用類似的實(shí)驗(yàn)程序卻未發(fā)現(xiàn)測試效應(yīng)。
Chan和McDermott(2007)為澄清再認(rèn)任務(wù)中的測試效應(yīng),借用了Sacoby(1991)的再認(rèn)的雙過程理論,Jacoby認(rèn)為再認(rèn)水平由有意識控制下的回憶過程(recollection)和自動(dòng)加工的熟悉性(familiarity)共同決定。Chan等假設(shè),當(dāng)最終測試任務(wù)為回憶任務(wù)時(shí)總能出現(xiàn)測試效應(yīng)是因?yàn)榛貞洔y試對隨后的有意識回憶產(chǎn)生了促進(jìn)作用,而當(dāng)最終測試為再認(rèn)任務(wù)時(shí),雖然測試也提高了再認(rèn)中的有意回憶成分,但這一作用被起更大作用的熟悉性所掩蔽。Chan等用三個(gè)實(shí)驗(yàn)探討了初始測試在有意識回憶和熟悉性上對最終測試的影響作用,結(jié)果發(fā)現(xiàn),測試雖然未影響再認(rèn)擊中率,但它改變了做出再認(rèn)判斷的內(nèi)在過程,初始測試提高了再認(rèn)中的有意回憶成分,但不改變其中的熟悉性。Chan等的研究對于探討測試效應(yīng)的機(jī)制有重要啟示,如,有關(guān)自由回憶的測試效應(yīng)的研究表明測試促進(jìn)了長時(shí)記憶,而重學(xué)則促進(jìn)了短期內(nèi)的記憶水平,這一現(xiàn)象是否由測試促進(jìn)了有意回憶、重學(xué)增強(qiáng)了熟悉性所導(dǎo)致?也即,正是由于測試促進(jìn)了有意回憶并因而促進(jìn)了長時(shí)記憶,重學(xué)增強(qiáng)了熟悉性并因而僅促進(jìn)了短期內(nèi)的記憶水平?
2.4對真實(shí)教育情境中的測試效應(yīng)的探討
關(guān)于測試效應(yīng)的研究大部分是通過實(shí)驗(yàn)室實(shí)驗(yàn)進(jìn)行的,為便于實(shí)驗(yàn)控制,實(shí)驗(yàn)材料多采用詞表或無關(guān)詞對,但真實(shí)教育情境中的學(xué)習(xí)材料與詞表或無關(guān)詞對畢竟是不同的,當(dāng)以教育實(shí)踐中的學(xué)習(xí)材料為實(shí)驗(yàn)材料時(shí)是否仍然產(chǎn)生測試效應(yīng)呢?現(xiàn)有的相關(guān)研究主要通過操縱材料和測試形式探討真實(shí)教育情境中的測試效應(yīng)。
2.4.1不同學(xué)習(xí)材料和測試形式的測試效應(yīng)
當(dāng)前以真實(shí)教育材料作為實(shí)驗(yàn)材料探討測試效應(yīng)的有代表性的研究主要有Carrier和Pashler(1992)年以外語詞匯為實(shí)驗(yàn)材料的研究,Karpicke和Roediger(2006)以GRE備考書中的材料作為實(shí)驗(yàn)材料的研究,以及Roediger和Karpicke(2006)以科學(xué)小品文為實(shí)驗(yàn)材料的研究等1221,這些研究總體而言都發(fā)現(xiàn)了顯著的測試效應(yīng)。下面以Roediger和Karpieke(2006)的研究為典型進(jìn)行介紹。
Roediger和Karpicke的研究中的第一個(gè)實(shí)驗(yàn)讓大學(xué)生被試在兩種實(shí)驗(yàn)條件下學(xué)習(xí)科學(xué)小品文,一組為重學(xué)組,即被試在首次學(xué)習(xí)之后重復(fù)學(xué)習(xí)整篇文章,另一組為自由回憶組,即在首次學(xué)習(xí)后要求被試盡可能地將其所能回憶起的文章內(nèi)容寫下,但不提供反饋。重學(xué)和自由回憶的時(shí)間都為7分鐘。最后考查各實(shí)驗(yàn)條件下的被試在5分鐘、3天、1周后的測試成績。結(jié)果發(fā)現(xiàn),5分鐘后的測試中,重學(xué)組的回憶率稍好于測試組;但在2天后的測試中,測試組和重學(xué)組的回憶率分別為68%和54%,一周后兩組的回憶率分別為56%和42%,測試組明顯高于重學(xué)組。為進(jìn)一步探討重復(fù)學(xué)習(xí)和重復(fù)測試對記憶保持的影響,Roediger和Karpicke進(jìn)行了第二個(gè)實(shí)驗(yàn)。實(shí)驗(yàn)條件為SSSS、SSST、STTT。分別在5分鐘和1周后進(jìn)行最終測試。結(jié)果表明,在5分鐘后的測試中,回憶率與重復(fù)學(xué)習(xí)呈正相關(guān),即SSSS組好于SSST組,而SSST組好于STTT組;在1周后的測試中,回憶率轉(zhuǎn)變?yōu)榕c測試次數(shù)呈正相關(guān),即STTT組的回憶率要好于SSST組,SSST組好于SSSS組。
2.4.2不同測試形式之間的相互作用 真實(shí)教育情境中充滿各種不同形式的測試,是否某種測試形式比其他的形式更能促進(jìn)記憶保持,或是否某一特定的測試形式只能對后來的測試中的相同形式起促進(jìn)作用?Duchastel(1981)的一個(gè)實(shí)驗(yàn)對不同測試形式的作用做了初步探討。實(shí)驗(yàn)將被試分三組,一組在學(xué)完之后進(jìn)行簡答式測試,一組進(jìn)行選擇題測試,另一組只繼續(xù)學(xué)習(xí)。兩周后進(jìn)行簡答式測試,結(jié)果發(fā)現(xiàn)進(jìn)行測試的兩組被試比繼續(xù)學(xué)習(xí)組被試表現(xiàn)了更好的記憶保持力,而簡答式測試組比選擇題測試組表現(xiàn)了更好的記憶保持水平。
Kang等(2007)的一個(gè)實(shí)驗(yàn)進(jìn)一步考查了簡答式測試和選擇題測試的測試效應(yīng)。實(shí)驗(yàn)讓被試先學(xué)習(xí)文章,實(shí)驗(yàn)組每學(xué)完一篇文章后進(jìn)行一次簡答式測試或選擇題測試,測試之后提供反饋;控制組被試讀完文章后接著閱讀一些選自文章的句子,它們與選擇題測試和簡答式測試中所涉及的內(nèi)容相同。三天后進(jìn)行測試,測試形式包括簡答式測試及選擇題測試。結(jié)果發(fā)現(xiàn),初始測試為簡答式測試的被試在兩種測試形式中都表現(xiàn)出最好的記憶保持水平。Butler和Roediger(2007),MeDaniel等(2007)采用類似的實(shí)驗(yàn)設(shè)計(jì)也報(bào)告了相似的結(jié)果。
3 對測試可能存在的消極效應(yīng)的研究
狹義的測試效應(yīng)往往指測試對學(xué)習(xí)的積極作用,但研究發(fā)現(xiàn)測試還可能對學(xué)習(xí)產(chǎn)生消極影響,當(dāng)前的相關(guān)研究主要集中在兩個(gè)方面:一是先前測試時(shí)的提取可能會(huì)干擾或削弱個(gè)體在后來測試時(shí)對材料的回憶;二是某些類型的測試會(huì)對個(gè)體掌握知識產(chǎn)生消極作用。
3.1提取導(dǎo)致遺忘
有關(guān)提取導(dǎo)致遺忘的(Retrieval induced forgetting,RIF)研究揭示了之前的提取對后來回憶的抑制作用。Roediger(1978)早期的一個(gè)實(shí)驗(yàn)說明了回憶的抑制作用。實(shí)驗(yàn)材料為10個(gè)類別性詞表,每一類包括5個(gè)詞,實(shí)驗(yàn)有四種條件,分別為不提示類別名稱,提示3個(gè)、5個(gè)或7個(gè)類別名稱。最終測試要求被試回憶所有詞。結(jié)果發(fā)現(xiàn),提示類別名稱組比無提示組的回憶成績更好,但當(dāng)要求被試在無提示的情況下回憶時(shí),提示組的成績反而比無提示組差。研究者認(rèn)為這是由于提示組被試借助各類別線索進(jìn)行回憶,從而限制了在各類別間的儲(chǔ)存和提取,而類別名稱的提示越多,這種限制就越大。
Anderson等(1994)采用提取練習(xí)范式(retrieval practice paradigm)對RIF進(jìn)行了研究。實(shí)驗(yàn)包括三個(gè)階段:學(xué)習(xí),提取練習(xí)和最終測試(類似于測試效應(yīng)的實(shí)驗(yàn)設(shè)計(jì))。學(xué)習(xí)階段,被試學(xué)習(xí)“類別名稱一所屬項(xiàng)目”形式的詞對,如“fruit-orange”;練習(xí)階段,形式為“fruit-o_____”,要求回憶缺失部分,但只對其中的部分項(xiàng)目進(jìn)行測試。最后測試形式為提供類別名稱,要求回憶出該類別下的所有項(xiàng)目。采用提取練習(xí)范式的實(shí)驗(yàn)結(jié)果都表明,學(xué)習(xí)階段得到提取練習(xí)的項(xiàng)目在最后測試中的回憶水平得到了明顯的提高(測試效應(yīng)),但未得到練習(xí)的另一部分項(xiàng)目的回憶水平卻受到抑制。
3.2測試的消極暗示效應(yīng)
測試的消極暗示效應(yīng)(hegative suggestion effects)指由于測試時(shí)的提取行為強(qiáng)化了后來的提取過程,而如果個(gè)體在測試過程中出現(xiàn)錯(cuò)誤,則可能因此而習(xí)得錯(cuò)誤的信息。例如在選擇題或是非判斷題形式的測試中,學(xué)生有可能將錯(cuò)誤的選項(xiàng)看作是正確的,甚至即便學(xué)生在閱讀一個(gè)錯(cuò)誤的句子時(shí)知道它是錯(cuò)誤的,他們在將來也可能會(huì)把錯(cuò)誤的句子看作是正確的。早在20世紀(jì)八九十年代研究者就對這一現(xiàn)象做了探討。Toppino和Brochin(1989)讓學(xué)生完成是非判斷題,測試結(jié)束后,將之前出現(xiàn)過的錯(cuò)誤句和未出現(xiàn)過的與之相似的錯(cuò)誤句混在一起,要求被試判斷正誤,結(jié)果發(fā)現(xiàn)重復(fù)出現(xiàn)的句子比未出現(xiàn)過的新句子更容易被判斷為正確。Tippino和Luipersbeck(1993)以選擇題的錯(cuò)誤選項(xiàng)為材料也得到類似的結(jié)論。Brown等(1999)的實(shí)驗(yàn)在被試完成測驗(yàn)后呈現(xiàn)錯(cuò)誤信息,結(jié)果發(fā)現(xiàn)被試在隨后的“線索一回憶”和選擇題測驗(yàn)中都受到消極影響,而且即便研究者告知被試那些信息是錯(cuò)誤,仍然出現(xiàn)這種消極作用。
Roediger和Marsh(2005)以選擇題為實(shí)驗(yàn)材料,探討了是否測驗(yàn)的消極暗示效應(yīng)大于測驗(yàn)的積極效應(yīng)。實(shí)驗(yàn)的基本程序?yàn)椤伴喿x短文一選擇題測試一視覺空間推理任務(wù)(分心任務(wù))一線索回憶測試”。結(jié)果發(fā)現(xiàn),選擇題測試(未提供反饋)對隨后的線索回憶任務(wù)有促進(jìn)作用,但也可能會(huì)使被試將錯(cuò)誤選項(xiàng)誤認(rèn)為是正確的(當(dāng)材料陌生時(shí)這種效應(yīng)更明顯),而且選項(xiàng)越多,積極的測試效應(yīng)越小。增加干擾選項(xiàng)不僅降低了線索回憶的正確反應(yīng)率,還提高了被試在線索回憶中用干擾選項(xiàng)回答的概率[27]。 Butler等(2006)對選擇題測試中出現(xiàn)消極暗示效應(yīng)的原因進(jìn)行了探討,認(rèn)為被試在選擇題測試中的表現(xiàn)水平是決定選擇題測試起積極還是消極作用的關(guān)鍵因素,如果測驗(yàn)非常簡單,被試幾乎都能選擇正確答案,那么測驗(yàn)的干擾題項(xiàng)數(shù)就能起積極作用;而如果選擇題較難,被試容易出錯(cuò),則易導(dǎo)致消極暗示效應(yīng),并且隨選擇題干擾項(xiàng)的增加而增加。
此外,消極暗示效應(yīng)并不只限于選擇題或是非判斷題。Henkel(2004)讓被試觀看一些圖片并進(jìn)行想象,然后進(jìn)行一系列回憶測試,結(jié)果發(fā)現(xiàn)測試將使被試更有可能錯(cuò)誤地將之前所想象的圖判斷為是原來觀察過的圖,Henkel認(rèn)為“識記時(shí)的反復(fù)嘗試……可能為來源誤判提供了豐富的土壤”,包括將自認(rèn)為的、推測的或想象的內(nèi)容記作是確實(shí)出現(xiàn)過的,“個(gè)體為更好地記住某些信息而進(jìn)行提取練習(xí)的過程包含了多個(gè)不同的認(rèn)知過程,如提取最易提取的信息,搜索額外信息,對信息進(jìn)行評價(jià)等,每一過程都融合了個(gè)體的想象、修飾和重構(gòu)的過程。多次的重復(fù)提取可能同時(shí)增強(qiáng)了個(gè)體正確地或錯(cuò)誤地回憶起信息的信心,以及鮮明程度”。Meade和Roediger(2006)的實(shí)驗(yàn)研究也表明,被試在一次測驗(yàn)中錯(cuò)誤回憶的信息很可能在下一次測驗(yàn)中再次出現(xiàn)。
3.3測試與錯(cuò)誤記憶
Roediger和McDermott的系列研究表明,測試將可能增強(qiáng)錯(cuò)誤記憶(false memory)。Roediger和McDermott(1995)采用DRaM(Deese-Roediger-McDermott)范式的研究發(fā)現(xiàn)在并無明顯誤導(dǎo)信息的情況下,測試也將導(dǎo)致錯(cuò)誤再認(rèn)。實(shí)驗(yàn)采用被試內(nèi)設(shè)計(jì),被試學(xué)習(xí)16份詞表,每份詞包含15個(gè)語義關(guān)聯(lián)詞對(如,hill,valley),每學(xué)完一份詞表后提示被試回憶詞表或解數(shù)學(xué)題,5分鐘后進(jìn)行再認(rèn)測試。結(jié)果表明,與學(xué)習(xí)后解數(shù)學(xué)題的情況相比,進(jìn)行初始測試既提高了對已學(xué)詞的擊中率,也提高了對關(guān)鍵誘餌(critical lure,如mountain)的虛驚率。 且“記得-熟悉”(remember-know)判斷的結(jié)果表明測試還使被試更堅(jiān)信自己記得關(guān)鍵誘餌呈現(xiàn)時(shí)的具體信息。由于后來的相關(guān)研究發(fā)現(xiàn)該研究的可重復(fù)性不穩(wěn)定,McDermott(1996)對DRM范式做了適當(dāng)變式,即讓被試先進(jìn)行學(xué)習(xí)或測試,然后分別在2天后進(jìn)行自由回憶測試,結(jié)果發(fā)現(xiàn)在學(xué)習(xí)后進(jìn)行測試的情況下,被試回憶出關(guān)鍵誘餌的可能性是未進(jìn)行測試情況下的2倍,因此,以自由回憶代替再認(rèn)作為最終測試任務(wù)將導(dǎo)致顯著的錯(cuò)誤記憶。McDermott(2006)還探討了不同測試次數(shù)對錯(cuò)誤記憶的影響,實(shí)驗(yàn)讓被試學(xué)完每份詞表后分別進(jìn)行0、1或3次的初始測試,最后進(jìn)行自由回憶測試。結(jié)果發(fā)現(xiàn),測試提高了正確回憶的可能性,但同時(shí)提高了錯(cuò)誤回憶某的可能性,進(jìn)行3次初始測試的被試對已學(xué)詞的回憶隨著測試次數(shù)的增加出現(xiàn)遺忘,但對關(guān)鍵誘餌的回憶則隨著測試次數(shù)的增加而增加。
4 測試效應(yīng)的有關(guān)理論及其發(fā)展
在某些條件下測試對學(xué)習(xí)既可能有積極的促進(jìn)作用,也可能產(chǎn)生消極影響,狹義的測試效應(yīng)主要指測試的積極效應(yīng)。關(guān)于測試的消極影響,如提取導(dǎo)致遺忘,錯(cuò)誤記憶等,已形成相應(yīng)的理論解釋。這里主要介紹對狹義層面上的測試效應(yīng)進(jìn)行解釋的五種理論的發(fā)展沿革:(1)信息額外呈現(xiàn)理論(additional exposure),(2)過度學(xué)習(xí)理論(over-learning),(3)提取努力理論(effortful retrieval),(4)必要難度理論(desirable difficulties),(5)遷移適當(dāng)加工理論(transfer-appropriate processing,簡稱TAP)。
4.1信息的額外呈現(xiàn)理論
Thompson等(1978)認(rèn)為,測試材料相當(dāng)于為學(xué)習(xí)者額外地呈現(xiàn)了相關(guān)信息,而正是這種額外的呈現(xiàn)導(dǎo)致了測試效應(yīng)。這一解釋主要與當(dāng)時(shí)研究測試效應(yīng)的實(shí)驗(yàn)操作有關(guān)。當(dāng)時(shí)的實(shí)驗(yàn)往往設(shè)計(jì)兩種學(xué)習(xí)條件,一種是讓被試先學(xué)習(xí)材料,一段時(shí)間后進(jìn)行測試;另一種是讓被試先學(xué)習(xí)材料,接著再進(jìn)行一次初始測試,最后再進(jìn)行與前一實(shí)驗(yàn)條件相同的測試。這種設(shè)計(jì)混淆了測試效應(yīng)與信息額外呈現(xiàn)的作用,因?yàn)榇藭r(shí)的測試效應(yīng)可能是由初始測試時(shí)材料的額外呈現(xiàn)或者額外的學(xué)習(xí)時(shí)間而促成的。后來的研究者通過簡單的實(shí)驗(yàn)操作分離了這一混淆效應(yīng):讓控制組被試在實(shí)驗(yàn)組進(jìn)行初始測試時(shí)再學(xué)材料,從而使兩組被試在材料上的學(xué)習(xí)時(shí)間等同。實(shí)際上這種設(shè)計(jì)使得控制組比實(shí)驗(yàn)組更多地接觸了材料(而不是等同),因?yàn)閷?shí)驗(yàn)組被試在進(jìn)行初始測試后未加以反饋,因此他們實(shí)際上只接觸了那些測試時(shí)能回憶出的內(nèi)容,而此時(shí)實(shí)驗(yàn)組仍然出現(xiàn)顯著的測試效應(yīng)。這表明除了在材料上的額外學(xué)習(xí)外,應(yīng)該還有其他因素導(dǎo)致測試效應(yīng)的產(chǎn)生。
4.2過度學(xué)習(xí)理論
Slamecka和Katsaiti(1988)認(rèn)為測試效應(yīng)只是反映了測試項(xiàng)目得到過度學(xué)習(xí),因此是由于提取使被試對部分材料的過度學(xué)習(xí),而不是提取過程本身促進(jìn)了后來的回憶。這一理論實(shí)際上與上述的信息額外呈現(xiàn)理論有相似之處,二者都認(rèn)為測試效應(yīng)的產(chǎn)生有賴于額外的或過度的編碼過程。這一解釋也遭到許多研究者的置疑。如,Wheeler等(2003)以及Roediger和Karpicke(2006)的研究都發(fā)現(xiàn),如果在重復(fù)學(xué)習(xí)或重復(fù)測試之后的短時(shí)間內(nèi)進(jìn)行測試(如5分鐘或10分鐘后),重復(fù)學(xué)習(xí)很明顯地導(dǎo)致了“過度學(xué)習(xí)”,但從延時(shí)測試(3天或1周后)來看,這種“過度學(xué)習(xí)”并不能促進(jìn)長時(shí)記憶,相反,測試導(dǎo)致了更好的長時(shí)記憶。因此,額外呈現(xiàn)或過度學(xué)習(xí)可以解釋各種回憶間隔下的主效應(yīng),但不能解釋它們之間的交互作用。Chan等(2006)的一項(xiàng)研究發(fā)現(xiàn),提取練習(xí)不僅能促進(jìn)對測試內(nèi)容本身的記憶,而且還在一定程度上促進(jìn)了未進(jìn)行測試但與測試內(nèi)容相關(guān)的內(nèi)容的記憶,而這一促進(jìn)作用卻未發(fā)生在提供了額外學(xué)習(xí)的被試身上。這種測試效應(yīng)用額外呈現(xiàn)或過度學(xué)習(xí)的觀點(diǎn)是無法解釋測試的,測試效應(yīng)的產(chǎn)生包含了更為復(fù)雜的內(nèi)部過程。
4.3提取努力理論
由于上述理論無法很好地解釋測試效應(yīng),研究者們從更深層次對這一問題展開探討:是否測試時(shí)的提取過程導(dǎo)致測試效應(yīng)?Jacoby的一系列研究探討了這一問題。Jacoby(1978)的一個(gè)實(shí)驗(yàn)中,被試在兩種條件下學(xué)習(xí),一是解決問題,一是記住答案,結(jié)果發(fā)現(xiàn)前者的學(xué)習(xí)水平好于后者,Jaeoby認(rèn)為這是由于前者需要個(gè)體付出提取努力。Jacoby等(2005)和lacoby等(2005)采用記憶新詞范式(memory-for-foils paradigm)考察了不同提取深度對記憶的影響,結(jié)果發(fā)現(xiàn)在大學(xué)生被試中,與淺層加工相比,深層加工之后進(jìn)行再認(rèn)測試提高了隨后測驗(yàn)中對新單詞的再認(rèn),首次測驗(yàn)的提取深度影響了隨后測驗(yàn)中對新單詞的再認(rèn)。Pashler等(2003)的研究發(fā)現(xiàn)增大初始測試的間隔(即增大提取所需努力)將導(dǎo)致更好的回憶成績,也支持了這一理論。
4.4必要難度理論
Bjork和Bjork(1992,1994,1999)在提取努力理論的基礎(chǔ)上進(jìn)一步提出必要難度理論來解釋測試效應(yīng)。Bjork區(qū)分了存儲(chǔ)力(storage strength)和提取力(retrieval strength)兩個(gè)概念的不同,前者指記憶痕跡的相對持久性,后者指記憶痕跡的即時(shí)可獲得性,類似于提取流暢性(retrieval fluency)的概念。必要難度理論認(rèn)為,提取力與存儲(chǔ)力的增長呈負(fù)相關(guān),即提取容易(高提取力)并不能促進(jìn)存儲(chǔ)力,而更為努力的提取卻能提高存儲(chǔ)力,使記憶保持更持久,能促進(jìn)學(xué)習(xí)的長期保持力。而Jacoby,Bjork和Kelly的研究發(fā)現(xiàn),學(xué)生往往根據(jù)當(dāng)前加工的流暢性(提取力)來衡量當(dāng)前學(xué)習(xí)水平,因此學(xué)習(xí)時(shí)往往傾向于選擇可促進(jìn)當(dāng)前加工流暢性的策略,如集中學(xué)習(xí),而實(shí)際上不流暢加工更有利于長時(shí)學(xué)習(xí),如分散學(xué)習(xí),延遲反饋或進(jìn)行自我測試等。
這一理論得到許多研究的支持。Bjork(1999),Koriat和Bjork(2005,2006)的研究讓被試在重復(fù)學(xué)習(xí)之后對回憶水平做判斷(JOL),發(fā)現(xiàn)以當(dāng)前加工的流暢性來監(jiān)測和指導(dǎo)學(xué)習(xí)容易使被試對自己的學(xué)習(xí)水平的判斷產(chǎn)生錯(cuò)覺,認(rèn)為在隨后的測試中可以表現(xiàn)得很好,且由于測試相對于重復(fù)學(xué)習(xí)需要一定努力,使學(xué)生可能不傾向于選擇自我測試。Roediger和KarDicke(2006)的研究發(fā)現(xiàn)重復(fù)測試相對于重復(fù)學(xué)習(xí)減緩了最初階段的學(xué)習(xí),但卻大大地提高了長時(shí)記憶保持,研究者認(rèn)為這時(shí)由于相對于“重復(fù)學(xué)習(xí)”而言,測試提供了“必要的難度”。
4.5遷移適當(dāng)加工理論
TAP理論也被用于解釋測試效應(yīng)。根據(jù)TAP理論,某種學(xué)習(xí)策略或編碼加工可能只能促進(jìn)某種測 試類型,而對另一種不同信息類型或加工類型的測試不起作用,甚至起反作用。如,Roediger和Karpicke(2006)的研究發(fā)現(xiàn)測試時(shí)的提取練習(xí)比重復(fù)學(xué)習(xí)中的額外編碼更能促進(jìn)記憶保持力,研究者認(rèn)為用TAP來解釋即為:測試使被試在學(xué)習(xí)時(shí)進(jìn)行提取加工,不斷地對促進(jìn)后來的提取所必需的相同技能進(jìn)行練習(xí)。Thomas和McDaniel(2007)的實(shí)驗(yàn)發(fā)現(xiàn)如果讓被試在學(xué)習(xí)時(shí)采用學(xué)習(xí)策略(對學(xué)科的核心概念進(jìn)行深入理解,并弄清各概念之間的相互關(guān)系等),而在最后測試時(shí)進(jìn)行選擇題測試(對各獨(dú)立知識點(diǎn)進(jìn)行再認(rèn)),則被試的測試成績相對較差,這是因?yàn)榧庸げ呗噪m然可能有利于長時(shí)記憶保持,但對于某些具體測試而言卻作用甚微。
但有些研究用TAP理論則無法解釋。Kang等(2007)的研究采用兩種測試形式(選擇題測試和簡答式測試)作為初始測試,考察被試在初始測試形式與最終測試形式相同和不同時(shí)的成績,結(jié)果發(fā)現(xiàn),相對于無測試組,兩種測試形式都產(chǎn)生測試效應(yīng),簡答式測試比選擇題測試更好地促進(jìn)了被試在最終測試(不論形式如何)上的成績。
綜觀上述有關(guān)測試效應(yīng)的理論我們可以明確,測試效應(yīng)不能被解釋為是學(xué)習(xí)材料的額外接觸,而測試中的提取過程,如精致化編碼,需要努力的或更深層次的編碼,以及更多的提取通道等應(yīng)是對測試效應(yīng)的更好的解釋。此外,雖然遷移適當(dāng)加工理論也能從一般意義上解釋測試效應(yīng),但它無法解釋一些研究結(jié)果。
5 測試效應(yīng)的研究展望
已有研究從實(shí)驗(yàn)材料(如,無關(guān)詞對或聯(lián)想詞對),測試任務(wù)的性質(zhì)(如自由回憶、配對聯(lián)想學(xué)習(xí)、再認(rèn)),各次學(xué)習(xí)或測試之間的時(shí)間間隔(集中或分散),積極的測試效應(yīng)及測試可能存在的消極影響等各角度對測試效應(yīng)進(jìn)行了探討,同時(shí)提出了相應(yīng)的理論解釋,并通過實(shí)證研究不斷對理論進(jìn)行驗(yàn)證更新,F(xiàn)有的研究使我們認(rèn)識到,測試不僅是一種衡量學(xué)習(xí)掌握程度的工具,它還是一種促進(jìn)學(xué)習(xí)的手段,在某種條件下它與“學(xué)習(xí)”(編碼)相比能更好地促進(jìn)記憶的長期保持,采用自我測試策略學(xué)習(xí)應(yīng)是一種高效率的學(xué)習(xí)方式。但要更深入地認(rèn)識測試效應(yīng),當(dāng)前的研究在一些問題上尚待進(jìn)一步的回答和解釋。
5.1測試效應(yīng)的發(fā)展研究
測試效應(yīng)是否具有發(fā)展特點(diǎn)?自我測試策略對不同年齡階段或不同成績水平個(gè)體是否有不同影響?已有研究大都以大學(xué)生為被試對測試效應(yīng)進(jìn)行探討,尚缺乏對測試效應(yīng)的年齡特點(diǎn)的研究,而只有弄清這些問題才能根據(jù)不同年齡特征指導(dǎo)教學(xué)實(shí)踐。Komell和Son(2006)的研究發(fā)現(xiàn),選擇進(jìn)行自我測試的成人被試在最終測試中的成績顯著高于選擇再次學(xué)習(xí)的被試,而在兒童組被試中卻未發(fā)現(xiàn)這一現(xiàn)象。這說明測試效應(yīng)可能存在某些發(fā)展特點(diǎn),或者說自我測試策略對不同年齡階段的或不同學(xué)習(xí)水平(如學(xué)優(yōu)生、學(xué)困生等)將可能產(chǎn)生不同的作用。
5.2具體的學(xué)習(xí)過程中的學(xué)習(xí)策略選擇
現(xiàn)有研究更為關(guān)注測試效應(yīng)本身,而對于個(gè)體在具體學(xué)習(xí)過程中是如何做出學(xué)習(xí)選擇的(反復(fù)學(xué)習(xí)或自我測試)研究較少,且已有觀點(diǎn)也不盡一致。如,Jacoby等(1994)認(rèn)為學(xué)生會(huì)因傾向于根據(jù)加工流暢性來衡量當(dāng)前學(xué)習(xí)水平而選擇可促進(jìn)當(dāng)前加工流暢性的策略,如集中學(xué)習(xí)或重復(fù)學(xué)習(xí)。但Komell和Son(2006)在他們的一項(xiàng)研究中卻發(fā)現(xiàn)大學(xué)生被試中的70%,兒童被試中的83%都選擇進(jìn)行測試?疾檫@一問題對指導(dǎo)學(xué)生掌握科學(xué)的學(xué)習(xí)策略有重要意義。
5.3測試效應(yīng)的內(nèi)在機(jī)制的研究
現(xiàn)有理論對測試效應(yīng)做了不同的解釋,雖然Bjork等的必要難度理論為較多研究者接受,但它仍然需要進(jìn)一步驗(yàn)證,如,它無法很好地解釋再認(rèn)任務(wù)中的測試效應(yīng)。因此,有待完善理論以更深入地理解測試效應(yīng)的機(jī)制。
5.4關(guān)于最優(yōu)化的自我測試策略
測試效應(yīng)的存在是確證的,但對于何種自我測試策略才是最優(yōu)化的問題尚有爭議,是擴(kuò)展式還是等間隔式?是否依不同個(gè)體而不同?不同的自我測試策略促進(jìn)學(xué)習(xí)的內(nèi)在因素是什么?對這些問題的回答才能真正使學(xué)生掌握有效的策略實(shí)現(xiàn)高效率學(xué)習(xí)。
相關(guān)熱詞搜索:概述 效應(yīng) 國外 國外關(guān)于測試效應(yīng)的研究概述 抽樣效應(yīng) 時(shí)間效應(yīng)
熱點(diǎn)文章閱讀