感恩親情 蒲公英文摘 > 感恩親情 >

國外關(guān)于測試效應(yīng)的研究概述心理學(xué)常見的166個(gè)效應(yīng)

發(fā)布時(shí)間:2020-03-03 來源: 感恩親情點(diǎn)擊：

　　摘要　測試效應(yīng)的研究表明，“學(xué)習(xí)”并非只發(fā)生在編碼階段，測試或提取練習(xí)除了可評估知識掌握程度之外，在某些情況下它比再次學(xué)習(xí)能更好地促進(jìn)長時(shí)記憶保持。文章從如下方面概述了國外關(guān)于測試效應(yīng)的研究：(1)在自由回憶、配對聯(lián)想學(xué)習(xí)、再認(rèn)和模擬教育情境等不同性質(zhì)的實(shí)驗(yàn)任務(wù)下測試對學(xué)習(xí)的積極作用；(2)測試可能導(dǎo)致的消極作用，介紹有關(guān)提取導(dǎo)致遺忘，測試的消極暗示效應(yīng)，測試與錯(cuò)誤記憶等方面的研究；(3)介紹信息額外呈現(xiàn)理論，過度學(xué)習(xí)理論，提取努力理論，必要難度理論，遷移適當(dāng)加工理論等測試效應(yīng)的有關(guān)理論及其發(fā)展沿革。最后，結(jié)合研究中的爭議及教學(xué)應(yīng)用做了思考，并指出有待進(jìn)一步研究的問題。
　　關(guān)鍵詞　測試效應(yīng)，消極效應(yīng)，提取，長時(shí)記憶。
　　分類號　B849；G442
　　
　　1　什么是測試效應(yīng)
　　
　　1.1測試效應(yīng)的概念
　　測試效應(yīng)(testing effect)指學(xué)習(xí)某一內(nèi)容時(shí)，進(jìn)行測試比額外學(xué)習(xí)能更好地提高后來對它的記憶保持水平，即便在測試無反饋時(shí)也是如此。理解這一概念應(yīng)先區(qū)分測試的間接作用和直接作用，測試的間接作用指測試可通過各種方式促進(jìn)學(xué)習(xí)，如，課堂測試可促使學(xué)生在一堂課中不斷地學(xué)習(xí)，測試還可使學(xué)生從測試結(jié)果中得到反饋，學(xué)習(xí)過程中的自我測試可引導(dǎo)學(xué)生下一步應(yīng)學(xué)什么等。而測試的直接作用指測試這一行為本身提高了學(xué)習(xí)和長時(shí)記憶，即測試效應(yīng)。
　　通過測試提高記憶保持水平并非新觀點(diǎn)，James(1890)在其《心理學(xué)原理》一書中就討論了測試的作用，“……”我們的記憶有一個(gè)奇怪的特性，即積極的重復(fù)比消極的重復(fù)能讓我們更好地記憶。我的意思是，當(dāng)我們幾乎學(xué)會(huì)了某一內(nèi)容時(shí)，與其再看一遍這些內(nèi)容，不如停下來試著回憶一下。如果我們能通過后一種方式回憶出一些內(nèi)容，那么在下一次我們應(yīng)該也能回憶出來；而如果是以前一種方式，我們很可能需要再學(xué)一次……”。這一現(xiàn)象雖然早已為認(rèn)知心理學(xué)家所關(guān)注，但一直以來并未有系統(tǒng)的研究。人們往往認(rèn)為測試只是衡量學(xué)生學(xué)習(xí)水平的一種評估工具，而只有通過學(xué)習(xí)或?qū)Σ牧系木幋a才是真正地“學(xué)習(xí)”。新近一些研究重新關(guān)注測試效應(yīng)，這些研究使我們進(jìn)一步認(rèn)識到測試不僅可用于評估知識掌握水平，還能使個(gè)體所掌握的知識結(jié)構(gòu)發(fā)生變化，極大地提高知識的記憶保持程度。例如，有關(guān)測試效應(yīng)的研究表明，學(xué)習(xí)某一內(nèi)容時(shí)，重學(xué)一遍可增強(qiáng)提取流暢性(retrieval fluency)，它使個(gè)體對自己的記憶水平更自信，從而在學(xué)習(xí)時(shí)傾向于選擇重學(xué)，而實(shí)際上重學(xué)只促進(jìn)了短期記憶水平，測試則導(dǎo)致了更好的長時(shí)記憶水平。因此，理解測試效應(yīng)，掌握科學(xué)的自我測試策略，可使學(xué)生改變錯(cuò)誤的或低效的學(xué)習(xí)觀念，在相同的甚或更少的時(shí)間(與重復(fù)學(xué)習(xí)相比)星取得更好的學(xué)習(xí)效果，實(shí)現(xiàn)高效率學(xué)習(xí)。
　　
　　1.2測試效應(yīng)的基本研究范式
　　研究測試效應(yīng)的最常見的實(shí)驗(yàn)設(shè)計(jì)是：學(xué)習(xí)材料→一次或多次初始測試(initial test)→衡量被試記憶保持程度的最終測試(final test)。實(shí)驗(yàn)一般設(shè)立一個(gè)實(shí)驗(yàn)組(進(jìn)行測試)和一個(gè)或兩個(gè)控制組，考查實(shí)驗(yàn)結(jié)果時(shí)將測試組的成績與控制組進(jìn)行對比�？刂平M一般有兩種：①學(xué)習(xí)材料→無初始測試→最終測試；②學(xué)習(xí)材料→再次學(xué)習(xí)→最終測試，該條件下控制組和測試組接觸材料的總的時(shí)間相同。
　　通過修改基本范式，研究者可以探討各種條件下的測試效應(yīng)，如學(xué)習(xí)的材料(無關(guān)詞對、聯(lián)想詞對、散文等)，初始和最終測試的形式(自由回憶、再認(rèn)、線索回憶等)，是否對測試提供反饋以及反饋的形式，學(xué)習(xí)階段和第一次測試的時(shí)間間隔，最終測試之前的記憶保持間隔(retention interval)等。
　　
　　1.3 Tulving的經(jīng)典研究
　　人們往往認(rèn)為學(xué)習(xí)只發(fā)生在學(xué)習(xí)(編碼)階段，而測試的作用僅是顯示個(gè)體在之前的學(xué)習(xí)階段學(xué)到了什么。Tulving(1967)用實(shí)驗(yàn)證明了學(xué)習(xí)不僅只發(fā)生在編碼階段，測試本身也是一種學(xué)習(xí)。TuNing讓被試在三種實(shí)驗(yàn)條件下學(xué)習(xí)包含36個(gè)單詞的詞表。一是標(biāo)準(zhǔn)學(xué)習(xí)條件：學(xué)詞表(study)，回憶(test)，再學(xué)，再回憶，即STST：一是重復(fù)學(xué)習(xí)，被試學(xué)習(xí)三次測試一次，即SSST；一是重復(fù)測試，被試學(xué)習(xí)一次測試三次，即STTT。三種學(xué)習(xí)條件下的學(xué)習(xí)次數(shù)共為24次，因此標(biāo)準(zhǔn)學(xué)習(xí)條件下分別為12次學(xué)習(xí)，12次測試，重復(fù)學(xué)習(xí)條件下為18次學(xué)習(xí)，6次測試，重復(fù)測試條件下為6次學(xué)習(xí)，18次測試。如果“學(xué)習(xí)”(對某一內(nèi)容的最終掌握)僅在學(xué)習(xí)或編碼時(shí)發(fā)生，那么SSST組的掌握水平應(yīng)比STST組來得更好，因?yàn)樗嗔?次學(xué)習(xí)，而STTT組由于學(xué)習(xí)的次數(shù)最少最終掌握水平理應(yīng)最差。但Tulving的實(shí)驗(yàn)發(fā)現(xiàn)三種學(xué)習(xí)條件下的被試在最終測試上的成績幾乎是相同的，STST組和SSST組都回憶了約20個(gè)單詞，STTT組回憶了約18.5個(gè)單詞。從某種意義上來說，一次測試可相當(dāng)于一次學(xué)習(xí)。
　　
　　2　不同實(shí)驗(yàn)條件下測試對學(xué)習(xí)的促進(jìn)作用
　　
　　Tulving(1967)的經(jīng)典研究探討了測試對自由回憶的促進(jìn)作用，之后的研究者陸續(xù)對配對聯(lián)想任務(wù)、再認(rèn)等其他回憶形式的測試效應(yīng)進(jìn)行了研究。此外，研究者還以散文、GRE單詞等為實(shí)驗(yàn)材料考察了真實(shí)教育情境中的測試效應(yīng)。
　　
　　2.1自由回憶中的測試效應(yīng)
　　Tulving(1967)的研究引發(fā)了大量的相關(guān)研究，但大多數(shù)研究都仿照Tulving的設(shè)計(jì)或僅改變一些變量。這些研究在方法上有一個(gè)共同之處，即學(xué)習(xí)時(shí)間和測試時(shí)間是均等的，且在學(xué)習(xí)階段呈現(xiàn)單詞的速度和最終測試的時(shí)間都很短，實(shí)驗(yàn)中的測試都采用自由回憶形式。如Tulving(1967)的研究中，學(xué)習(xí)階段36個(gè)單詞的呈現(xiàn)速度為1個(gè)／秒，在測試階段被試回憶這些單詞的時(shí)間也僅為36秒。在這種實(shí)驗(yàn)條件下，是否有可能因?yàn)闀r(shí)間過短而使得被試即便學(xué)會(huì)了36個(gè)單詞也無法在規(guī)定時(shí)間內(nèi)將其回憶出來?Roediger和Thorpe(1978)對自由回憶與回憶時(shí)間的關(guān)系的研究表明，過短的測試時(shí)間將大大低估被試所習(xí)得的知識量，從而可能低估了測試效應(yīng)，但研究者未在這一發(fā)現(xiàn)的基礎(chǔ)之上做進(jìn)一步的探索。為更準(zhǔn)確地考查被試的回憶量，Karpicke和Roediger(2007)模仿了Tulving的三種實(shí)驗(yàn)條件，即STST，SSST，STTT，但為避免對被試回憶水平的低估，以3秒1個(gè)的速率呈現(xiàn)單詞，這樣測試和學(xué)習(xí)的時(shí)間都增加到2分鐘，每種實(shí)驗(yàn)條件都進(jìn)行5次循環(huán)(如標(biāo)準(zhǔn)測試條件下為STST，STST，STST，STST，STST)。為考查三種實(shí)驗(yàn)條件對長時(shí)記憶的不同作用，研究者進(jìn)一步探討了一周后三種學(xué)習(xí)條件下被試的記憶保持水平。結(jié)果表明，STTT組在開始階段(第一次和第二次循環(huán)的最后一次測試)處于劣勢，但很快地趕上SSST組，兩種條件在后面的測試中差異很小。STST組被試在最后4次測試上的回憶水平都顯著地好于SSST和STTT。因此，總體而言該研究結(jié)果與Tulving(1967)的結(jié)果相符，三種實(shí)驗(yàn)條件下的學(xué)習(xí)曲線很相似，但該研究還發(fā)現(xiàn)了STST的測試成績與STTT和SSST的差異，研究者認(rèn)為這是由于在STST中，測試(T)之后伴隨學(xué)習(xí)(S)，這相當(dāng)于對回憶失敗內(nèi)容的反饋，在STST中這種反饋的機(jī)會(huì)多于其他兩種條件。此外，更重要的是，該研究考查了被試在1周后的記憶保持水平，發(fā)現(xiàn)SSST的回憶率顯著低于STST和STTT，后兩者無顯著差異，這證明了測試對于提高長時(shí)記憶保持的作用。
　　為更具體地考察多次測試與多次學(xué)習(xí)的效應(yīng)，研究者還考查了不同的重復(fù)測試與重復(fù)學(xué)習(xí)條件下的學(xué)習(xí)效果，以及測試次數(shù)對測試效應(yīng)的影響。
　　Thompson等(1978)的實(shí)驗(yàn)發(fā)現(xiàn)適當(dāng)?shù)摹皩W(xué)習(xí)一測試”方式將導(dǎo)致更好的學(xué)習(xí)效果。實(shí)驗(yàn)設(shè)計(jì)了三種條件，一為SSSS，詞表呈現(xiàn)4次；一為STTT，學(xué)一次，進(jìn)行三次自由回憶；一為STRTRTR(TR指再次學(xué)習(xí)回憶失敗的單詞后進(jìn)行自由回憶)，學(xué)一遍詞表后進(jìn)行回憶，再學(xué)時(shí)僅學(xué)習(xí)那些回憶失敗的單詞，然后再回憶所有單詞，如此重復(fù)三次，該設(shè)計(jì)實(shí)際上模擬學(xué)生在學(xué)習(xí)過程中可能存在的學(xué)習(xí)方式，即學(xué)生往往是先學(xué)習(xí)某一內(nèi)容，接著通過自我測試看看自己是否掌握，然后再學(xué)習(xí)那些未掌握的內(nèi)容，如此反復(fù)，直到完全掌握。最終測試分別在5分鐘或2天后進(jìn)行。結(jié)果發(fā)現(xiàn)，5分鐘后的測試中，三種實(shí)驗(yàn)條件下的回憶成績?yōu)镾TRTRTR>SSSS>STTT。但兩天后的回憶成績發(fā)生變化，STRTRTR>STTT>SSSS，SSSS組在前一次所能回憶出的單詞的基礎(chǔ)上遺忘率為56％，STRTRTR組被26％，而STTT組僅為13％。
　　受Thompson等的研究的啟發(fā)，Karpicke和Roediger(2007)在其研究的一個(gè)實(shí)驗(yàn)中讓被試在四種學(xué)習(xí)條件下學(xué)習(xí)，分別為STST，SSTT，STSnT(Sn指只學(xué)回憶失敗的詞)，STSnTn(Tn指只回憶之前無法回憶的詞)，結(jié)果發(fā)現(xiàn)，在一周后的測試中STSnTn組的回憶水平最差，因此是否進(jìn)行回憶測試是決定長時(shí)記憶保持水平的重要因素。Wheeler等(2003)的研究對比了重復(fù)學(xué)習(xí)和重復(fù)測試在即時(shí)和延時(shí)測試中的不同影響。實(shí)驗(yàn)擴(kuò)展了學(xué)習(xí)和測試的次數(shù)，被試在重復(fù)學(xué)習(xí)(SSSSS)和重復(fù)測試(STTTT)兩種條件下學(xué)習(xí)40個(gè)單詞，然后在5分鐘和1周后進(jìn)行自由回憶測試。結(jié)果發(fā)現(xiàn)，雖然在SSSSS條件下，每個(gè)學(xué)習(xí)階段被試都學(xué)習(xí)了所有的40個(gè)單詞，而在STTTT條件下，被試所接觸的僅是他們能回憶起的那些單詞，但SSSSS組被試僅在5分鐘后進(jìn)行的回憶測試中好于STTTT組，而在一周后的測試中結(jié)果完全相反，這強(qiáng)有力地證明了測試效應(yīng)顯著作用。Wheeler和Roediger(1992)的一項(xiàng)研究探討了多次測試的效果與單次測試效果的差異。實(shí)驗(yàn)讓被試聽一個(gè)包含60個(gè)具體物體名稱的故事，每一物體在故事中第一次出現(xiàn)時(shí)都在顯示屏上以圖片形式呈現(xiàn)，最終測試要求被試回憶圖片的名稱。呈現(xiàn)結(jié)束后，實(shí)驗(yàn)組1進(jìn)行一次7分鐘的回憶測試后離開，實(shí)驗(yàn)組2進(jìn)行了三次回憶測試后離開，控制組在呈現(xiàn)結(jié)束后離開實(shí)驗(yàn)室，要求所有被試一周后回來繼續(xù)實(shí)驗(yàn)。結(jié)果發(fā)現(xiàn)，從遺忘率來看，實(shí)驗(yàn)組2一周后遺忘率為13％，實(shí)驗(yàn)組1為27％，控制組為46％，重復(fù)測試促成最低的遺忘率。
　　
　　2.2配對聯(lián)想學(xué)習(xí)中的測試效應(yīng)
　　配對聯(lián)想學(xué)習(xí)往往以不同聯(lián)想度的詞對或“非詞一詞”(如，“BLSM一筆畫”)為任務(wù)，在測試效應(yīng)的有關(guān)研究中經(jīng)常使用，因?yàn)樗寡芯空呖梢院芊奖愕乜刂茖W(xué)習(xí)和測試之間的時(shí)間間隔，而且也很容易控制反饋。下面介紹Alan(1969)和Jacoby(1978)以配對聯(lián)想學(xué)習(xí)為任務(wù)探討測試效應(yīng)的兩個(gè)代表性研究，并著重介紹采用配對聯(lián)想學(xué)習(xí)任務(wù)進(jìn)行的集中與分散測試對記憶水平影響的有關(guān)研究。
　　2.2.1配對聯(lián)想測驗(yàn)中的測試效應(yīng)
　　Allen等(1969)讓兩組被試分別學(xué)習(xí)配對聯(lián)想詞表5次或10次，然后分無測試，一次測試，五次測試三種測試情況，一天后進(jìn)行最終測試(形式為horse-?)，結(jié)果發(fā)現(xiàn)學(xué)習(xí)10次的效果僅稍好于5次，但進(jìn)行一次測試后則使10次學(xué)習(xí)組的成績遠(yuǎn)高于5次學(xué)習(xí)組；學(xué)習(xí)5次測試1次的被試在最終測試中的成績相當(dāng)于學(xué)習(xí)10次無初始測試的被試，也即單次測試對長期記憶保持的效果相當(dāng)于5次學(xué)習(xí)。
　　Jacoby(1978)著名的殘?jiān)~補(bǔ)全實(shí)驗(yàn)也證明了配對聯(lián)想學(xué)習(xí)中的測試效應(yīng)，實(shí)驗(yàn)采用了2(重學(xué)、測試)×2(即時(shí)、延時(shí))的實(shí)驗(yàn)設(shè)計(jì)。讓被試先學(xué)習(xí)聯(lián)想詞對(如，foot-shoe)，再學(xué)時(shí)分兩種條件：一是重學(xué)完整詞對；一是給被試提供詞對左邊的單詞，要求將右邊的殘?jiān)~補(bǔ)全，如(foot-se)。這兩種條件又各分兩種情況，一是學(xué)習(xí)后立即進(jìn)行(即時(shí))，一是插入20個(gè)詞對(延遲)。最終測試的形式“foot-????”。結(jié)果表明，殘?jiān)~補(bǔ)全測試比重學(xué)完整詞導(dǎo)致了更好的記憶保持水平，延時(shí)測試的效果要好于即時(shí)測試，Jacoby認(rèn)為這是由于學(xué)習(xí)之后的即時(shí)測試減小了記憶提取過程中努力加工的程度，從而削弱了測試效應(yīng)。Jaeoby的這一實(shí)驗(yàn)往往被看作是研究生成效應(yīng)(generation effect)的先驅(qū)，生成效應(yīng)指學(xué)習(xí)某一材料時(shí)，生成相關(guān)知識比閱讀材料將導(dǎo)致更好的回憶或再認(rèn)水平)，而生成效應(yīng)從某種程度上來說是測試效應(yīng)的一種。
　　Jocoby的實(shí)驗(yàn)中殘?jiān)~補(bǔ)全測試導(dǎo)致了極高水平的回憶率(大于90％)，雖然Carrier和Pashler(1992)，Kuo和Hirshrnan(1996)使用標(biāo)準(zhǔn)的線索一回憶測驗(yàn)作為測試任務(wù)并未產(chǎn)生如此高水平的回憶成績，但總的來說都發(fā)現(xiàn)了測試對配對一聯(lián)想詞對的記憶保持的積極作用。Cull(2000)，Pashler等(2005)的研究還發(fā)現(xiàn)，對測試中未能回憶出的詞對給予反饋將增強(qiáng)測試效應(yīng)。
　　2.2.2配對聯(lián)想學(xué)習(xí)的集中與分散測試效應(yīng)
　　由于配對聯(lián)想學(xué)習(xí)任務(wù)易于控制學(xué)習(xí)與測試之間的時(shí)間間隔，便于研究者探討集中或分散測試對學(xué)習(xí)的不同影響，因此配對聯(lián)想學(xué)習(xí)任務(wù)成為研究集中或分散測試效應(yīng)的主要任務(wù)形式。
　　雖然早在19世紀(jì)初Ebbinghaus等就探討集中學(xué)習(xí)與分散學(xué)習(xí)的關(guān)系，但對提取是否也具有集中和分散效應(yīng)的研究則以Landauer和Bjork(1978)的研究為標(biāo)志。Landauer和Bjork(1978)通過兩個(gè) 實(shí)驗(yàn)比較了配對一聯(lián)想學(xué)習(xí)中，擴(kuò)展式測試與等間隔測試對學(xué)習(xí)的不同影響，實(shí)驗(yàn)1采用“名－姓”詞對，實(shí)驗(yàn)2采用“名字－人面”詞對。實(shí)驗(yàn)中的擴(kuò)展式測試的形式為1―5―9(數(shù)字代表學(xué)習(xí)某一詞對A-B后進(jìn)行測試之前插入的學(xué)習(xí)或測試的次數(shù))，等間隔測試的形式即為5―5―5，二者的平均間隔數(shù)相等，實(shí)驗(yàn)另外還設(shè)立了集中測試組，即學(xué)完之后連續(xù)測試，0-0-0；各條件下的測試都不提供反饋。結(jié)果表明，擴(kuò)展式測試組在最終的延時(shí)測試上的回憶成績好于等間隔測試組，而等間隔測試組的成績好于集中測試組。雖然集中測試使被試在學(xué)習(xí)的開始階段幾乎不發(fā)生錯(cuò)誤，但在最終測試上擴(kuò)展式測試和等間隔式測試的成績比集中測試更好，擴(kuò)展式測試組的成績略好于等間隔式測試。
　　Landauer和Bjork的研究引發(fā)了一系列相關(guān)研究，大多數(shù)研究都發(fā)現(xiàn)兩種分散測試形式在延時(shí)測試中的成績都好于集中測試，但對于擴(kuò)展式測試在促進(jìn)長時(shí)記憶上是否優(yōu)于等間隔測試的問題則存在較大的爭議。Balom等(2006)比較了擴(kuò)展性測試、等間隔測試和集中測試對三組被試(年輕成人、健康的年長成人、Alzheimer病的年長成人)的不同影響。被試學(xué)習(xí)材料(低關(guān)聯(lián)度詞對)后分三種實(shí)驗(yàn)條件進(jìn)行初始測試：集中測試(0-0-0)，等間隔測試(3-3-3)，擴(kuò)展式測試(1-3-5)，最后進(jìn)行最終測試。結(jié)果發(fā)現(xiàn)，在學(xué)習(xí)階段，三組被試在集中測試的情況下均表現(xiàn)了最好的水平，在擴(kuò)展式測試情況下其次，而在等間隔測試情況下表現(xiàn)最差。但在最終測試中，三組被試在等間隔測試和擴(kuò)展式測試情況下并無差異，但都好于集中測試情況下的成績。Carpenter和Delosh(2005)以“姓名－人面”配對為實(shí)驗(yàn)材料的研究也發(fā)現(xiàn)了類似的現(xiàn)象，但研究發(fā)現(xiàn)在最終測試上等間隔測試組的成績略好于擴(kuò)展性測試組。
　　Karpieke和Roediger(2007)讓被試學(xué)習(xí)“詞匯一釋義”類型的詞對，然后分別在三種測試形式下學(xué)習(xí)：集中測試(0-0-0)，等間隔測試(5-5-5)，擴(kuò)展式測試(1-5-9)，最后分別在10分鐘或2天后對被試進(jìn)行測試。結(jié)果發(fā)現(xiàn)，在兩種最終測試條件下，分散測試的成績都優(yōu)于集中測試。在10分鐘后的測試中，擴(kuò)展性測試組的成績略好于等間隔測試，但在48小時(shí)之后的測試中，等間隔測試組的回憶成績高于擴(kuò)展式測試組。這一研究表明，等間隔測試可能比擴(kuò)展式測試能更好地促進(jìn)長時(shí)記憶，研究者認(rèn)為初次提取嘗試的時(shí)間間隔是關(guān)鍵因素，即初次提取的間隔越長將導(dǎo)致提取的難度越大。這與Bjork(1992)的提取難度理論一致，該理論認(rèn)為提取時(shí)一定的難度將導(dǎo)致更好的記憶保持。Pashler等(2003)以配對聯(lián)想詞為材料的研究也表明，雖然隨著學(xué)習(xí)之后進(jìn)行首次測試的間隔時(shí)間的增大，被試在初次測試中的成績往往是呈下降趨勢的，但延長首次測試的時(shí)間間隔促進(jìn)了長時(shí)記憶。
　　
　　2.3再認(rèn)任務(wù)中的測試效應(yīng)
　　有關(guān)測試效應(yīng)的研究大都使用自由回憶或配對聯(lián)想學(xué)習(xí)任務(wù)，而較少采用再認(rèn)任務(wù)，這可能與采用再認(rèn)任務(wù)探討測試效應(yīng)時(shí)結(jié)論不盡一致有關(guān)。如，Roediger和McDermott(1995)，Hicks和Stams(2004)，以及Verde(2004)等的研究讓被試在學(xué)習(xí)之后進(jìn)行回憶測試，而最終測試為再認(rèn)測試，發(fā)現(xiàn)回憶測試提高了再認(rèn)測試的成績。但Jones和Roediger(1995)的研究采用類似的實(shí)驗(yàn)程序卻未發(fā)現(xiàn)測試效應(yīng)。
　　Chan和McDermott(2007)為澄清再認(rèn)任務(wù)中的測試效應(yīng)，借用了Sacoby(1991)的再認(rèn)的雙過程理論，Jacoby認(rèn)為再認(rèn)水平由有意識控制下的回憶過程(recollection)和自動(dòng)加工的熟悉性(familiarity)共同決定。Chan等假設(shè)，當(dāng)最終測試任務(wù)為回憶任務(wù)時(shí)總能出現(xiàn)測試效應(yīng)是因?yàn)榛貞洔y試對隨后的有意識回憶產(chǎn)生了促進(jìn)作用，而當(dāng)最終測試為再認(rèn)任務(wù)時(shí)，雖然測試也提高了再認(rèn)中的有意回憶成分，但這一作用被起更大作用的熟悉性所掩蔽。Chan等用三個(gè)實(shí)驗(yàn)探討了初始測試在有意識回憶和熟悉性上對最終測試的影響作用，結(jié)果發(fā)現(xiàn)，測試雖然未影響再認(rèn)擊中率，但它改變了做出再認(rèn)判斷的內(nèi)在過程，初始測試提高了再認(rèn)中的有意回憶成分，但不改變其中的熟悉性。Chan等的研究對于探討測試效應(yīng)的機(jī)制有重要啟示，如，有關(guān)自由回憶的測試效應(yīng)的研究表明測試促進(jìn)了長時(shí)記憶，而重學(xué)則促進(jìn)了短期內(nèi)的記憶水平，這一現(xiàn)象是否由測試促進(jìn)了有意回憶、重學(xué)增強(qiáng)了熟悉性所導(dǎo)致?也即，正是由于測試促進(jìn)了有意回憶并因而促進(jìn)了長時(shí)記憶，重學(xué)增強(qiáng)了熟悉性并因而僅促進(jìn)了短期內(nèi)的記憶水平?
　　
　　2.4對真實(shí)教育情境中的測試效應(yīng)的探討
　　關(guān)于測試效應(yīng)的研究大部分是通過實(shí)驗(yàn)室實(shí)驗(yàn)進(jìn)行的，為便于實(shí)驗(yàn)控制，實(shí)驗(yàn)材料多采用詞表或無關(guān)詞對，但真實(shí)教育情境中的學(xué)習(xí)材料與詞表或無關(guān)詞對畢竟是不同的，當(dāng)以教育實(shí)踐中的學(xué)習(xí)材料為實(shí)驗(yàn)材料時(shí)是否仍然產(chǎn)生測試效應(yīng)呢?現(xiàn)有的相關(guān)研究主要通過操縱材料和測試形式探討真實(shí)教育情境中的測試效應(yīng)。
　　2.4.1不同學(xué)習(xí)材料和測試形式的測試效應(yīng)
　　當(dāng)前以真實(shí)教育材料作為實(shí)驗(yàn)材料探討測試效應(yīng)的有代表性的研究主要有Carrier和Pashler(1992)年以外語詞匯為實(shí)驗(yàn)材料的研究，Karpicke和Roediger(2006)以GRE備考書中的材料作為實(shí)驗(yàn)材料的研究，以及Roediger和Karpicke(2006)以科學(xué)小品文為實(shí)驗(yàn)材料的研究等1221，這些研究總體而言都發(fā)現(xiàn)了顯著的測試效應(yīng)。下面以Roediger和Karpieke(2006)的研究為典型進(jìn)行介紹。
　　Roediger和Karpicke的研究中的第一個(gè)實(shí)驗(yàn)讓大學(xué)生被試在兩種實(shí)驗(yàn)條件下學(xué)習(xí)科學(xué)小品文，一組為重學(xué)組，即被試在首次學(xué)習(xí)之后重復(fù)學(xué)習(xí)整篇文章，另一組為自由回憶組，即在首次學(xué)習(xí)后要求被試盡可能地將其所能回憶起的文章內(nèi)容寫下，但不提供反饋。重學(xué)和自由回憶的時(shí)間都為7分鐘。最后考查各實(shí)驗(yàn)條件下的被試在5分鐘、3天、1周后的測試成績。結(jié)果發(fā)現(xiàn)，5分鐘后的測試中，重學(xué)組的回憶率稍好于測試組；但在2天后的測試中，測試組和重學(xué)組的回憶率分別為68％和54％，一周后兩組的回憶率分別為56％和42％，測試組明顯高于重學(xué)組。為進(jìn)一步探討重復(fù)學(xué)習(xí)和重復(fù)測試對記憶保持的影響，Roediger和Karpicke進(jìn)行了第二個(gè)實(shí)驗(yàn)。實(shí)驗(yàn)條件為SSSS、SSST、STTT。分別在5分鐘和1周后進(jìn)行最終測試。結(jié)果表明，在5分鐘后的測試中，回憶率與重復(fù)學(xué)習(xí)呈正相關(guān)，即SSSS組好于SSST組，而SSST組好于STTT組；在1周后的測試中，回憶率轉(zhuǎn)變?yōu)榕c測試次數(shù)呈正相關(guān)，即STTT組的回憶率要好于SSST組，SSST組好于SSSS組。
　　2.4.2不同測試形式之間的相互作用　　真實(shí)教育情境中充滿各種不同形式的測試，是否某種測試形式比其他的形式更能促進(jìn)記憶保持，或是否某一特定的測試形式只能對后來的測試中的相同形式起促進(jìn)作用?Duchastel(1981)的一個(gè)實(shí)驗(yàn)對不同測試形式的作用做了初步探討。實(shí)驗(yàn)將被試分三組，一組在學(xué)完之后進(jìn)行簡答式測試，一組進(jìn)行選擇題測試，另一組只繼續(xù)學(xué)習(xí)。兩周后進(jìn)行簡答式測試，結(jié)果發(fā)現(xiàn)進(jìn)行測試的兩組被試比繼續(xù)學(xué)習(xí)組被試表現(xiàn)了更好的記憶保持力，而簡答式測試組比選擇題測試組表現(xiàn)了更好的記憶保持水平。
　　Kang等(2007)的一個(gè)實(shí)驗(yàn)進(jìn)一步考查了簡答式測試和選擇題測試的測試效應(yīng)。實(shí)驗(yàn)讓被試先學(xué)習(xí)文章，實(shí)驗(yàn)組每學(xué)完一篇文章后進(jìn)行一次簡答式測試或選擇題測試，測試之后提供反饋；控制組被試讀完文章后接著閱讀一些選自文章的句子，它們與選擇題測試和簡答式測試中所涉及的內(nèi)容相同。三天后進(jìn)行測試，測試形式包括簡答式測試及選擇題測試。結(jié)果發(fā)現(xiàn)，初始測試為簡答式測試的被試在兩種測試形式中都表現(xiàn)出最好的記憶保持水平。Butler和Roediger(2007)，MeDaniel等(2007)采用類似的實(shí)驗(yàn)設(shè)計(jì)也報(bào)告了相似的結(jié)果。
　　
　　3　對測試可能存在的消極效應(yīng)的研究
　　
　　狹義的測試效應(yīng)往往指測試對學(xué)習(xí)的積極作用，但研究發(fā)現(xiàn)測試還可能對學(xué)習(xí)產(chǎn)生消極影響，當(dāng)前的相關(guān)研究主要集中在兩個(gè)方面：一是先前測試時(shí)的提取可能會(huì)干擾或削弱個(gè)體在后來測試時(shí)對材料的回憶；二是某些類型的測試會(huì)對個(gè)體掌握知識產(chǎn)生消極作用。
　　
　　3.1提取導(dǎo)致遺忘
　　有關(guān)提取導(dǎo)致遺忘的(Retrieval induced forgetting，RIF)研究揭示了之前的提取對后來回憶的抑制作用。Roediger(1978)早期的一個(gè)實(shí)驗(yàn)說明了回憶的抑制作用。實(shí)驗(yàn)材料為10個(gè)類別性詞表，每一類包括5個(gè)詞，實(shí)驗(yàn)有四種條件，分別為不提示類別名稱，提示3個(gè)、5個(gè)或7個(gè)類別名稱。最終測試要求被試回憶所有詞。結(jié)果發(fā)現(xiàn)，提示類別名稱組比無提示組的回憶成績更好，但當(dāng)要求被試在無提示的情況下回憶時(shí)，提示組的成績反而比無提示組差。研究者認(rèn)為這是由于提示組被試借助各類別線索進(jìn)行回憶，從而限制了在各類別間的儲(chǔ)存和提取，而類別名稱的提示越多，這種限制就越大。
　　Anderson等(1994)采用提取練習(xí)范式(retrieval practice paradigm)對RIF進(jìn)行了研究。實(shí)驗(yàn)包括三個(gè)階段：學(xué)習(xí)，提取練習(xí)和最終測試(類似于測試效應(yīng)的實(shí)驗(yàn)設(shè)計(jì))。學(xué)習(xí)階段，被試學(xué)習(xí)“類別名稱一所屬項(xiàng)目”形式的詞對，如“fruit-orange”；練習(xí)階段，形式為“fruit-o_____”，要求回憶缺失部分，但只對其中的部分項(xiàng)目進(jìn)行測試。最后測試形式為提供類別名稱，要求回憶出該類別下的所有項(xiàng)目。采用提取練習(xí)范式的實(shí)驗(yàn)結(jié)果都表明，學(xué)習(xí)階段得到提取練習(xí)的項(xiàng)目在最后測試中的回憶水平得到了明顯的提高(測試效應(yīng))，但未得到練習(xí)的另一部分項(xiàng)目的回憶水平卻受到抑制。
　　
　　3.2測試的消極暗示效應(yīng)
　　測試的消極暗示效應(yīng)(hegative suggestion effects)指由于測試時(shí)的提取行為強(qiáng)化了后來的提取過程，而如果個(gè)體在測試過程中出現(xiàn)錯(cuò)誤，則可能因此而習(xí)得錯(cuò)誤的信息。例如在選擇題或是非判斷題形式的測試中，學(xué)生有可能將錯(cuò)誤的選項(xiàng)看作是正確的，甚至即便學(xué)生在閱讀一個(gè)錯(cuò)誤的句子時(shí)知道它是錯(cuò)誤的，他們在將來也可能會(huì)把錯(cuò)誤的句子看作是正確的。早在20世紀(jì)八九十年代研究者就對這一現(xiàn)象做了探討。Toppino和Brochin(1989)讓學(xué)生完成是非判斷題，測試結(jié)束后，將之前出現(xiàn)過的錯(cuò)誤句和未出現(xiàn)過的與之相似的錯(cuò)誤句混在一起，要求被試判斷正誤，結(jié)果發(fā)現(xiàn)重復(fù)出現(xiàn)的句子比未出現(xiàn)過的新句子更容易被判斷為正確。Tippino和Luipersbeck(1993)以選擇題的錯(cuò)誤選項(xiàng)為材料也得到類似的結(jié)論。Brown等(1999)的實(shí)驗(yàn)在被試完成測驗(yàn)后呈現(xiàn)錯(cuò)誤信息，結(jié)果發(fā)現(xiàn)被試在隨后的“線索一回憶”和選擇題測驗(yàn)中都受到消極影響，而且即便研究者告知被試那些信息是錯(cuò)誤，仍然出現(xiàn)這種消極作用。
　　Roediger和Marsh(2005)以選擇題為實(shí)驗(yàn)材料，探討了是否測驗(yàn)的消極暗示效應(yīng)大于測驗(yàn)的積極效應(yīng)。實(shí)驗(yàn)的基本程序?yàn)椤伴喿x短文一選擇題測試一視覺空間推理任務(wù)(分心任務(wù))一線索回憶測試”。結(jié)果發(fā)現(xiàn)，選擇題測試(未提供反饋)對隨后的線索回憶任務(wù)有促進(jìn)作用，但也可能會(huì)使被試將錯(cuò)誤選項(xiàng)誤認(rèn)為是正確的(當(dāng)材料陌生時(shí)這種效應(yīng)更明顯)，而且選項(xiàng)越多，積極的測試效應(yīng)越小。增加干擾選項(xiàng)不僅降低了線索回憶的正確反應(yīng)率，還提高了被試在線索回憶中用干擾選項(xiàng)回答的概率[27]。 Butler等(2006)對選擇題測試中出現(xiàn)消極暗示效應(yīng)的原因進(jìn)行了探討，認(rèn)為被試在選擇題測試中的表現(xiàn)水平是決定選擇題測試起積極還是消極作用的關(guān)鍵因素，如果測驗(yàn)非常簡單，被試幾乎都能選擇正確答案，那么測驗(yàn)的干擾題項(xiàng)數(shù)就能起積極作用；而如果選擇題較難，被試容易出錯(cuò)，則易導(dǎo)致消極暗示效應(yīng)，并且隨選擇題干擾項(xiàng)的增加而增加。
　　此外，消極暗示效應(yīng)并不只限于選擇題或是非判斷題。Henkel(2004)讓被試觀看一些圖片并進(jìn)行想象，然后進(jìn)行一系列回憶測試，結(jié)果發(fā)現(xiàn)測試將使被試更有可能錯(cuò)誤地將之前所想象的圖判斷為是原來觀察過的圖，Henkel認(rèn)為“識記時(shí)的反復(fù)嘗試……可能為來源誤判提供了豐富的土壤”，包括將自認(rèn)為的、推測的或想象的內(nèi)容記作是確實(shí)出現(xiàn)過的，“個(gè)體為更好地記住某些信息而進(jìn)行提取練習(xí)的過程包含了多個(gè)不同的認(rèn)知過程，如提取最易提取的信息，搜索額外信息，對信息進(jìn)行評價(jià)等，每一過程都融合了個(gè)體的想象、修飾和重構(gòu)的過程。多次的重復(fù)提取可能同時(shí)增強(qiáng)了個(gè)體正確地或錯(cuò)誤地回憶起信息的信心，以及鮮明程度”。Meade和Roediger(2006)的實(shí)驗(yàn)研究也表明，被試在一次測驗(yàn)中錯(cuò)誤回憶的信息很可能在下一次測驗(yàn)中再次出現(xiàn)。
　　
　　3.3測試與錯(cuò)誤記憶
　　Roediger和McDermott的系列研究表明，測試將可能增強(qiáng)錯(cuò)誤記憶(false memory)。Roediger和McDermott(1995)采用DRaM(Deese-Roediger-McDermott)范式的研究發(fā)現(xiàn)在并無明顯誤導(dǎo)信息的情況下，測試也將導(dǎo)致錯(cuò)誤再認(rèn)。實(shí)驗(yàn)采用被試內(nèi)設(shè)計(jì)，被試學(xué)習(xí)16份詞表，每份詞包含15個(gè)語義關(guān)聯(lián)詞對(如，hill，valley)，每學(xué)完一份詞表后提示被試回憶詞表或解數(shù)學(xué)題，5分鐘后進(jìn)行再認(rèn)測試。結(jié)果表明，與學(xué)習(xí)后解數(shù)學(xué)題的情況相比，進(jìn)行初始測試既提高了對已學(xué)詞的擊中率，也提高了對關(guān)鍵誘餌(critical lure，如mountain)的虛驚率。且“記得－熟悉”(remember-know)判斷的結(jié)果表明測試還使被試更堅(jiān)信自己記得關(guān)鍵誘餌呈現(xiàn)時(shí)的具體信息。由于后來的相關(guān)研究發(fā)現(xiàn)該研究的可重復(fù)性不穩(wěn)定，McDermott(1996)對DRM范式做了適當(dāng)變式，即讓被試先進(jìn)行學(xué)習(xí)或測試，然后分別在2天后進(jìn)行自由回憶測試，結(jié)果發(fā)現(xiàn)在學(xué)習(xí)后進(jìn)行測試的情況下，被試回憶出關(guān)鍵誘餌的可能性是未進(jìn)行測試情況下的2倍，因此，以自由回憶代替再認(rèn)作為最終測試任務(wù)將導(dǎo)致顯著的錯(cuò)誤記憶。McDermott(2006)還探討了不同測試次數(shù)對錯(cuò)誤記憶的影響，實(shí)驗(yàn)讓被試學(xué)完每份詞表后分別進(jìn)行0、1或3次的初始測試，最后進(jìn)行自由回憶測試。結(jié)果發(fā)現(xiàn)，測試提高了正確回憶的可能性，但同時(shí)提高了錯(cuò)誤回憶某的可能性，進(jìn)行3次初始測試的被試對已學(xué)詞的回憶隨著測試次數(shù)的增加出現(xiàn)遺忘，但對關(guān)鍵誘餌的回憶則隨著測試次數(shù)的增加而增加。
　　
　　4　測試效應(yīng)的有關(guān)理論及其發(fā)展
　　
　　在某些條件下測試對學(xué)習(xí)既可能有積極的促進(jìn)作用，也可能產(chǎn)生消極影響，狹義的測試效應(yīng)主要指測試的積極效應(yīng)。關(guān)于測試的消極影響，如提取導(dǎo)致遺忘，錯(cuò)誤記憶等，已形成相應(yīng)的理論解釋。這里主要介紹對狹義層面上的測試效應(yīng)進(jìn)行解釋的五種理論的發(fā)展沿革：(1)信息額外呈現(xiàn)理論(additional exposure)，(2)過度學(xué)習(xí)理論(over-learning)，(3)提取努力理論(effortful retrieval)，(4)必要難度理論(desirable difficulties)，(5)遷移適當(dāng)加工理論(transfer-appropriate processing，簡稱TAP)。
　　
　　4.1信息的額外呈現(xiàn)理論
　　Thompson等(1978)認(rèn)為，測試材料相當(dāng)于為學(xué)習(xí)者額外地呈現(xiàn)了相關(guān)信息，而正是這種額外的呈現(xiàn)導(dǎo)致了測試效應(yīng)。這一解釋主要與當(dāng)時(shí)研究測試效應(yīng)的實(shí)驗(yàn)操作有關(guān)。當(dāng)時(shí)的實(shí)驗(yàn)往往設(shè)計(jì)兩種學(xué)習(xí)條件，一種是讓被試先學(xué)習(xí)材料，一段時(shí)間后進(jìn)行測試；另一種是讓被試先學(xué)習(xí)材料，接著再進(jìn)行一次初始測試，最后再進(jìn)行與前一實(shí)驗(yàn)條件相同的測試。這種設(shè)計(jì)混淆了測試效應(yīng)與信息額外呈現(xiàn)的作用，因?yàn)榇藭r(shí)的測試效應(yīng)可能是由初始測試時(shí)材料的額外呈現(xiàn)或者額外的學(xué)習(xí)時(shí)間而促成的。后來的研究者通過簡單的實(shí)驗(yàn)操作分離了這一混淆效應(yīng)：讓控制組被試在實(shí)驗(yàn)組進(jìn)行初始測試時(shí)再學(xué)材料，從而使兩組被試在材料上的學(xué)習(xí)時(shí)間等同。實(shí)際上這種設(shè)計(jì)使得控制組比實(shí)驗(yàn)組更多地接觸了材料(而不是等同)，因?yàn)閷?shí)驗(yàn)組被試在進(jìn)行初始測試后未加以反饋，因此他們實(shí)際上只接觸了那些測試時(shí)能回憶出的內(nèi)容，而此時(shí)實(shí)驗(yàn)組仍然出現(xiàn)顯著的測試效應(yīng)。這表明除了在材料上的額外學(xué)習(xí)外，應(yīng)該還有其他因素導(dǎo)致測試效應(yīng)的產(chǎn)生。
　　
　　4.2過度學(xué)習(xí)理論
　　Slamecka和Katsaiti(1988)認(rèn)為測試效應(yīng)只是反映了測試項(xiàng)目得到過度學(xué)習(xí)，因此是由于提取使被試對部分材料的過度學(xué)習(xí)，而不是提取過程本身促進(jìn)了后來的回憶。這一理論實(shí)際上與上述的信息額外呈現(xiàn)理論有相似之處，二者都認(rèn)為測試效應(yīng)的產(chǎn)生有賴于額外的或過度的編碼過程。這一解釋也遭到許多研究者的置疑。如，Wheeler等(2003)以及Roediger和Karpicke(2006)的研究都發(fā)現(xiàn)，如果在重復(fù)學(xué)習(xí)或重復(fù)測試之后的短時(shí)間內(nèi)進(jìn)行測試(如5分鐘或10分鐘后)，重復(fù)學(xué)習(xí)很明顯地導(dǎo)致了“過度學(xué)習(xí)”，但從延時(shí)測試(3天或1周后)來看，這種“過度學(xué)習(xí)”并不能促進(jìn)長時(shí)記憶，相反，測試導(dǎo)致了更好的長時(shí)記憶。因此，額外呈現(xiàn)或過度學(xué)習(xí)可以解釋各種回憶間隔下的主效應(yīng)，但不能解釋它們之間的交互作用。Chan等(2006)的一項(xiàng)研究發(fā)現(xiàn)，提取練習(xí)不僅能促進(jìn)對測試內(nèi)容本身的記憶，而且還在一定程度上促進(jìn)了未進(jìn)行測試但與測試內(nèi)容相關(guān)的內(nèi)容的記憶，而這一促進(jìn)作用卻未發(fā)生在提供了額外學(xué)習(xí)的被試身上。這種測試效應(yīng)用額外呈現(xiàn)或過度學(xué)習(xí)的觀點(diǎn)是無法解釋測試的，測試效應(yīng)的產(chǎn)生包含了更為復(fù)雜的內(nèi)部過程。
　　
　　4.3提取努力理論
　　由于上述理論無法很好地解釋測試效應(yīng)，研究者們從更深層次對這一問題展開探討：是否測試時(shí)的提取過程導(dǎo)致測試效應(yīng)?Jacoby的一系列研究探討了這一問題。Jacoby(1978)的一個(gè)實(shí)驗(yàn)中，被試在兩種條件下學(xué)習(xí)，一是解決問題，一是記住答案，結(jié)果發(fā)現(xiàn)前者的學(xué)習(xí)水平好于后者，Jaeoby認(rèn)為這是由于前者需要個(gè)體付出提取努力。Jacoby等(2005)和lacoby等(2005)采用記憶新詞范式(memory-for-foils paradigm)考察了不同提取深度對記憶的影響，結(jié)果發(fā)現(xiàn)在大學(xué)生被試中，與淺層加工相比，深層加工之后進(jìn)行再認(rèn)測試提高了隨后測驗(yàn)中對新單詞的再認(rèn)，首次測驗(yàn)的提取深度影響了隨后測驗(yàn)中對新單詞的再認(rèn)。Pashler等(2003)的研究發(fā)現(xiàn)增大初始測試的間隔(即增大提取所需努力)將導(dǎo)致更好的回憶成績，也支持了這一理論。
　　
　　4.4必要難度理論
　　Bjork和Bjork(1992，1994，1999)在提取努力理論的基礎(chǔ)上進(jìn)一步提出必要難度理論來解釋測試效應(yīng)。Bjork區(qū)分了存儲(chǔ)力(storage strength)和提取力(retrieval strength)兩個(gè)概念的不同，前者指記憶痕跡的相對持久性，后者指記憶痕跡的即時(shí)可獲得性，類似于提取流暢性(retrieval fluency)的概念。必要難度理論認(rèn)為，提取力與存儲(chǔ)力的增長呈負(fù)相關(guān)，即提取容易(高提取力)并不能促進(jìn)存儲(chǔ)力，而更為努力的提取卻能提高存儲(chǔ)力，使記憶保持更持久，能促進(jìn)學(xué)習(xí)的長期保持力。而Jacoby，Bjork和Kelly的研究發(fā)現(xiàn)，學(xué)生往往根據(jù)當(dāng)前加工的流暢性(提取力)來衡量當(dāng)前學(xué)習(xí)水平，因此學(xué)習(xí)時(shí)往往傾向于選擇可促進(jìn)當(dāng)前加工流暢性的策略，如集中學(xué)習(xí)，而實(shí)際上不流暢加工更有利于長時(shí)學(xué)習(xí)，如分散學(xué)習(xí)，延遲反饋或進(jìn)行自我測試等。
　　這一理論得到許多研究的支持。Bjork(1999)，Koriat和Bjork(2005，2006)的研究讓被試在重復(fù)學(xué)習(xí)之后對回憶水平做判斷(JOL)，發(fā)現(xiàn)以當(dāng)前加工的流暢性來監(jiān)測和指導(dǎo)學(xué)習(xí)容易使被試對自己的學(xué)習(xí)水平的判斷產(chǎn)生錯(cuò)覺，認(rèn)為在隨后的測試中可以表現(xiàn)得很好，且由于測試相對于重復(fù)學(xué)習(xí)需要一定努力，使學(xué)生可能不傾向于選擇自我測試。Roediger和KarDicke(2006)的研究發(fā)現(xiàn)重復(fù)測試相對于重復(fù)學(xué)習(xí)減緩了最初階段的學(xué)習(xí)，但卻大大地提高了長時(shí)記憶保持，研究者認(rèn)為這時(shí)由于相對于“重復(fù)學(xué)習(xí)”而言，測試提供了“必要的難度”。
　　
　　4.5遷移適當(dāng)加工理論
　　TAP理論也被用于解釋測試效應(yīng)。根據(jù)TAP理論，某種學(xué)習(xí)策略或編碼加工可能只能促進(jìn)某種測試類型，而對另一種不同信息類型或加工類型的測試不起作用，甚至起反作用。如，Roediger和Karpicke(2006)的研究發(fā)現(xiàn)測試時(shí)的提取練習(xí)比重復(fù)學(xué)習(xí)中的額外編碼更能促進(jìn)記憶保持力，研究者認(rèn)為用TAP來解釋即為：測試使被試在學(xué)習(xí)時(shí)進(jìn)行提取加工，不斷地對促進(jìn)后來的提取所必需的相同技能進(jìn)行練習(xí)。Thomas和McDaniel(2007)的實(shí)驗(yàn)發(fā)現(xiàn)如果讓被試在學(xué)習(xí)時(shí)采用學(xué)習(xí)策略(對學(xué)科的核心概念進(jìn)行深入理解，并弄清各概念之間的相互關(guān)系等)，而在最后測試時(shí)進(jìn)行選擇題測試(對各獨(dú)立知識點(diǎn)進(jìn)行再認(rèn))，則被試的測試成績相對較差，這是因?yàn)榧庸げ呗噪m然可能有利于長時(shí)記憶保持，但對于某些具體測試而言卻作用甚微。
　　但有些研究用TAP理論則無法解釋。Kang等(2007)的研究采用兩種測試形式(選擇題測試和簡答式測試)作為初始測試，考察被試在初始測試形式與最終測試形式相同和不同時(shí)的成績，結(jié)果發(fā)現(xiàn)，相對于無測試組，兩種測試形式都產(chǎn)生測試效應(yīng)，簡答式測試比選擇題測試更好地促進(jìn)了被試在最終測試(不論形式如何)上的成績。
　　綜觀上述有關(guān)測試效應(yīng)的理論我們可以明確，測試效應(yīng)不能被解釋為是學(xué)習(xí)材料的額外接觸，而測試中的提取過程，如精致化編碼，需要努力的或更深層次的編碼，以及更多的提取通道等應(yīng)是對測試效應(yīng)的更好的解釋。此外，雖然遷移適當(dāng)加工理論也能從一般意義上解釋測試效應(yīng)，但它無法解釋一些研究結(jié)果。
　　
　　5　測試效應(yīng)的研究展望
　　
　　已有研究從實(shí)驗(yàn)材料(如，無關(guān)詞對或聯(lián)想詞對)，測試任務(wù)的性質(zhì)(如自由回憶、配對聯(lián)想學(xué)習(xí)、再認(rèn))，各次學(xué)習(xí)或測試之間的時(shí)間間隔(集中或分散)，積極的測試效應(yīng)及測試可能存在的消極影響等各角度對測試效應(yīng)進(jìn)行了探討，同時(shí)提出了相應(yīng)的理論解釋，并通過實(shí)證研究不斷對理論進(jìn)行驗(yàn)證更新�，F(xiàn)有的研究使我們認(rèn)識到，測試不僅是一種衡量學(xué)習(xí)掌握程度的工具，它還是一種促進(jìn)學(xué)習(xí)的手段，在某種條件下它與“學(xué)習(xí)”(編碼)相比能更好地促進(jìn)記憶的長期保持，采用自我測試策略學(xué)習(xí)應(yīng)是一種高效率的學(xué)習(xí)方式。但要更深入地認(rèn)識測試效應(yīng)，當(dāng)前的研究在一些問題上尚待進(jìn)一步的回答和解釋。
　　
　　5.1測試效應(yīng)的發(fā)展研究
　　測試效應(yīng)是否具有發(fā)展特點(diǎn)?自我測試策略對不同年齡階段或不同成績水平個(gè)體是否有不同影響?已有研究大都以大學(xué)生為被試對測試效應(yīng)進(jìn)行探討，尚缺乏對測試效應(yīng)的年齡特點(diǎn)的研究，而只有弄清這些問題才能根據(jù)不同年齡特征指導(dǎo)教學(xué)實(shí)踐。Komell和Son(2006)的研究發(fā)現(xiàn)，選擇進(jìn)行自我測試的成人被試在最終測試中的成績顯著高于選擇再次學(xué)習(xí)的被試，而在兒童組被試中卻未發(fā)現(xiàn)這一現(xiàn)象。這說明測試效應(yīng)可能存在某些發(fā)展特點(diǎn)，或者說自我測試策略對不同年齡階段的或不同學(xué)習(xí)水平(如學(xué)優(yōu)生、學(xué)困生等)將可能產(chǎn)生不同的作用。
　　
　　5.2具體的學(xué)習(xí)過程中的學(xué)習(xí)策略選擇
　　現(xiàn)有研究更為關(guān)注測試效應(yīng)本身，而對于個(gè)體在具體學(xué)習(xí)過程中是如何做出學(xué)習(xí)選擇的(反復(fù)學(xué)習(xí)或自我測試)研究較少，且已有觀點(diǎn)也不盡一致。如，Jacoby等(1994)認(rèn)為學(xué)生會(huì)因傾向于根據(jù)加工流暢性來衡量當(dāng)前學(xué)習(xí)水平而選擇可促進(jìn)當(dāng)前加工流暢性的策略，如集中學(xué)習(xí)或重復(fù)學(xué)習(xí)。但Komell和Son(2006)在他們的一項(xiàng)研究中卻發(fā)現(xiàn)大學(xué)生被試中的70％，兒童被試中的83％都選擇進(jìn)行測試�？疾檫@一問題對指導(dǎo)學(xué)生掌握科學(xué)的學(xué)習(xí)策略有重要意義。
　　
　　5.3測試效應(yīng)的內(nèi)在機(jī)制的研究
　　現(xiàn)有理論對測試效應(yīng)做了不同的解釋，雖然Bjork等的必要難度理論為較多研究者接受，但它仍然需要進(jìn)一步驗(yàn)證，如，它無法很好地解釋再認(rèn)任務(wù)中的測試效應(yīng)。因此，有待完善理論以更深入地理解測試效應(yīng)的機(jī)制。
　　
　　5.4關(guān)于最優(yōu)化的自我測試策略
　　測試效應(yīng)的存在是確證的，但對于何種自我測試策略才是最優(yōu)化的問題尚有爭議，是擴(kuò)展式還是等間隔式?是否依不同個(gè)體而不同?不同的自我測試策略促進(jìn)學(xué)習(xí)的內(nèi)在因素是什么?對這些問題的回答才能真正使學(xué)生掌握有效的策略實(shí)現(xiàn)高效率學(xué)習(xí)。

相關(guān)熱詞搜索：概述效應(yīng) 國外國外關(guān)于測試效應(yīng)的研究概述抽樣效應(yīng) 時(shí)間效應(yīng)

熱點(diǎn)文章閱讀

版權(quán)所有 蒲公英文摘 www.zuancaijixie.com

91啦在线播放,特级一级全黄毛片免费,国产中文一区,亚洲国产一成人久久精品