[效度概化:預(yù)測效度元分析的30年成果述評] 概化效度
發(fā)布時間:2020-03-03 來源: 美文摘抄 點擊:
摘 要:效度概化是通過元分析技術(shù)對普遍化的預(yù)測效度的估計。元分析是研究效度概化問題的技術(shù),是對具有“預(yù)測因子一效標(biāo)”特征的相關(guān)數(shù)據(jù)進(jìn)行定量綜合的方法。效度概化促進(jìn)了預(yù)測因子與效標(biāo)之間關(guān)系的理論研究和應(yīng)用研究,是應(yīng)用心理學(xué)領(lǐng)域近30年(1977~2007)來最重要的進(jìn)展之一。30年來的效度概化研究表明,認(rèn)知能力測驗、知識和技能測驗、人格測驗、結(jié)構(gòu)化面試和評價中心技術(shù)等的預(yù)測效度具有魯棒性、對應(yīng)性和聯(lián)合增值性。
關(guān)鍵詞:效度概化;元分析;預(yù)測因子:預(yù)測效度
1 前言
預(yù)測因子和效標(biāo)之間的關(guān)系是應(yīng)用心理學(xué)的理論基礎(chǔ)。預(yù)測因子就是預(yù)測工作績效的個體特征和環(huán)境特征。效標(biāo)是工作績效的操作性評價標(biāo)準(zhǔn)。效度概化(validity generalization)是基于前人的研究數(shù)據(jù)對普遍化的預(yù)測效度的估計。效度概化關(guān)注的問題是個體或環(huán)境特征因素(預(yù)測因子)與工作績效(效標(biāo))之間的普遍化的、穩(wěn)定的關(guān)系強(qiáng)度。效度概化是元分析技術(shù)與心理測驗相結(jié)合的產(chǎn)物。美國教育學(xué)家Glass在綜述心理療法的效度時正式將定量綜合的方法命名為元分析(meta-analysis),并創(chuàng)造了效應(yīng)值(effect size)概念,普遍化的預(yù)測效度就是效應(yīng)值。在1977年Schmidt和Hunter在元分析的基礎(chǔ)上首先提出了效度概化概念,用元分析技術(shù)尋找效應(yīng)值的過程就是效度概化。在這30年間(1977~2007),Schmidt和Hunter始終是研究效度概化問題的技術(shù)和理論核心,他們的貢獻(xiàn)在于創(chuàng)立、發(fā)展和繁榮了元分析和效度概化研究。這30年是元分析和效度概化研究的黃金時期,在應(yīng)用心理學(xué)領(lǐng)域涌現(xiàn)了一大批研究效度概化的研究文獻(xiàn),僅由1977到2003年就有500多項效度概化研究。Rosenthal等在效度概化和元分析方面也有很大貢獻(xiàn)。
元分析是對同一主題下多個獨立研究結(jié)果進(jìn)行數(shù)量綜合,從而概括其總體效應(yīng)值的研究方法。Hunter等認(rèn)為,元分析不是僅對原始研究結(jié)果進(jìn)行數(shù)據(jù)平均處理的統(tǒng)計方法,而是一種研究范式。元分析包含一般研究的共同特征,例如,問題選擇、定義變量、確定虛無假設(shè)和備擇假設(shè)、抽樣、數(shù)據(jù)處理和結(jié)論。元分析的基本原理是把每個原始樣本的研究數(shù)據(jù)看作元分析研究的一個樣本事件,這些樣本事件組成一個新的樣本分布,依據(jù)概率原理和誤差校正原理可以求出相應(yīng)的集中趨勢和離中趨勢指標(biāo),其集中趨勢指標(biāo)就是效應(yīng)值。常見的效應(yīng)值有均數(shù)差、標(biāo)準(zhǔn)化均數(shù)差、相關(guān)系數(shù)等。針對平均數(shù)差異顯著性檢驗的元分析研究的效應(yīng)值是均數(shù)差或標(biāo)準(zhǔn)化均數(shù)差(d),而針對變量間相關(guān)的元分析研究的效應(yīng)值是效度系數(shù)(p)。與其他測量數(shù)據(jù)的元分析相比,Hunter-Schmidt元分析范式所處理的數(shù)據(jù)是具有“預(yù)測因子,效標(biāo)”特征的心理測驗數(shù)據(jù),更適宜研究心理測驗的結(jié)構(gòu)和效度。
在尋找預(yù)測因子與效標(biāo)之間的穩(wěn)定關(guān)系的30年里,效度概化對應(yīng)用心理學(xué)的理論、方法和實踐都有深厚影響。在理論上,效度概化研究促進(jìn)了心理學(xué)家對工作績效與其影響因素之間關(guān)系的研究,使得預(yù)測因子與效標(biāo)之間的真實關(guān)系更清晰了。在方法上,Hunter-Schmidt元分析范式被認(rèn)為是研究預(yù)測因子效度概化問題的最準(zhǔn)確和最流行的方法,元分析有助于整合矛盾復(fù)雜的研究數(shù)據(jù),可以校正效應(yīng)值的抽樣誤差、測量誤差和全距限制誤差。在實踐上,效度概化研究促進(jìn)了人力資源管理、心理咨詢、教學(xué)培訓(xùn)等領(lǐng)域的發(fā)展。效度概化研究澄清了一些人事決策的迷霧,提供了關(guān)于個體認(rèn)知能力、人格維度、工作知識、專業(yè)技能、管理風(fēng)格、面試和評價中心技術(shù)的預(yù)測效度的清晰數(shù)據(jù)。本文所列的文獻(xiàn)都是近30年來基于Htmter-Schmidt元分析范式的效度概化研究成果,這些研究成果內(nèi)容豐富,而且具有很高的實用價值和理論價值。
2 知識、能力與技能(KAS)測驗的效度概化研究
知識(knowledge)、能力(abilty)和技能(skill)是個體職業(yè)智能因素的三項核心內(nèi)容。知識包括個體所擁有專業(yè)、人文、科學(xué)和管理等方面的知識。技能包括崗位技能、組織管理技能等。能力主要包括一般認(rèn)知能力(general cognitive ability)和特殊能力。關(guān)于知識、能力與技能測驗的預(yù)測效度元分析研究很多,下面列舉主要的效度概化的研究成果。
預(yù)測因子既可以是測驗(如,結(jié)構(gòu)化面試),也可以是心理特征的維度結(jié)構(gòu)(如,一般認(rèn)知能力)。應(yīng)用心理學(xué)非常關(guān)注測驗,常把測驗成績作為決策依據(jù)。效度概化的目的是確認(rèn)預(yù)測因子和效標(biāo)之間的關(guān)系強(qiáng)度,代表著普遍化的預(yù)測因子與效標(biāo)之間的關(guān)系強(qiáng)度的數(shù)字指標(biāo)是效應(yīng)值(p)。一般說來,p在0.5以上表明預(yù)測因子和效標(biāo)之間的關(guān)系強(qiáng)度很強(qiáng),其預(yù)測效度很好;p在0.3-0.49之間表明預(yù)測因子與效標(biāo)之間的關(guān)系強(qiáng)度較強(qiáng),其預(yù)測效度較好;p在0.2-0.29之間表明預(yù)測因子與效標(biāo)之間的關(guān)系強(qiáng)度一般,其預(yù)測效度基本可以接受;p在0.19以下表明預(yù)測因子與效標(biāo)之間的關(guān)系強(qiáng)度較弱,其預(yù)測效度較差。效標(biāo)和預(yù)測因子之間的關(guān)系特征可以概括為魯棒性(robustness)、對應(yīng)性(correspondence)和聯(lián)合增值性(mcremem)。
魯棒性是指測驗的預(yù)測力具有跨情境的一致。總體上說,一般認(rèn)知能力測驗具有較強(qiáng)的魯棒性。一般認(rèn)知能力是接受、處理和發(fā)出概念信息的能力,主要包括推理判斷、言語理解、數(shù)量關(guān)系、空間能力、知覺速度等。一般認(rèn)知能力反映了人的基本認(rèn)知操作過程中的智慧功能水平。基本認(rèn)知操作是通過基本認(rèn)知加工方式(識別、分析、綜合、判斷、推理等)操作概念的基本表現(xiàn)形式(語詞、數(shù)字和圖形)的過程。智慧功能水平是指個體在單位時間內(nèi)所能加工的信息的質(zhì)量和數(shù)量。因為基本認(rèn)知操作貫穿于幾乎所有的工作之中,它是一個人的學(xué)習(xí)能力、適應(yīng)能力和工作潛力的基礎(chǔ),因此,正如表1所示,一般認(rèn)知能力測驗的預(yù)測效度是一致的,一般認(rèn)知能力測驗對幾乎所有工作都有很高的預(yù)測力,被廣泛接受的效應(yīng)值為0.51。認(rèn)知能力在心理學(xué)中的作用,就像碳在化學(xué)中的作用一樣,就像水在生物學(xué)中的作用一樣。
效標(biāo)和預(yù)測因子之間關(guān)系的對應(yīng)性是效標(biāo)和預(yù)測因子之間的關(guān)系強(qiáng)度因其他因素的影響而產(chǎn)生的變化或分離現(xiàn)象。對應(yīng)性在認(rèn)知能力測驗上的表現(xiàn)主要集中在兩個方面。一個方面是,在效標(biāo)和預(yù)測因子在難度上對應(yīng)一致時,預(yù)測效度增加。Murphv認(rèn)為認(rèn)知能力測驗在所有工作、所有績效和所有環(huán)境下的預(yù)測效度不是完全一樣的。如表1所示,認(rèn)知能力測驗對高難度工作的預(yù)測效度是0.58,而對低難度工作的預(yù)測效度只是0.26。另一個方面是,在效標(biāo)和預(yù)測因子在類別上對應(yīng)一致時,預(yù)測效度也增加。知識、技能和認(rèn)知能力測驗所測量的心理特點是不一樣的。知道是什么(即陳述性知識) 和怎樣做(即程序性知識),不一定會做(依賴于技能),會做不一定會做好(依賴于能力)。因此,工作樣本測驗與認(rèn)知能力測驗在不同情境下的預(yù)測效度是不一樣的。首先,與此認(rèn)知能力測驗相比,工作樣本測驗不適用于沒有經(jīng)驗者(如,新入職的大學(xué)生);其次,知識和技能測驗值會隨時間變化而變化,而認(rèn)知能力測驗是一個相對穩(wěn)定的預(yù)測因子。
效標(biāo)和預(yù)測因子之間關(guān)系的聯(lián)合增值性是指兩種或幾種有效測驗聯(lián)合使用時的預(yù)測效度會比單獨測驗時的預(yù)測效度高。知識和技能是問題解決、創(chuàng)造性思維和復(fù)雜工作的基礎(chǔ)。所以,工作知識測驗和工作樣本測驗的效度都不低。工作知識測驗、工作樣本測驗與認(rèn)知能力測驗聯(lián)合使用而得到的聯(lián)合效度分別是0.58~110.63,其增量效度很大,分別是0.07和1]0.12。Roth等的元分析結(jié)果顯示,認(rèn)知能力測驗和工作樣本測驗的預(yù)測效度分別為0.39~和0.33,而兩者的聯(lián)合效度是0.45,效度增量為0.06。
3 管理測驗的效度概化研究
管理測驗主要測試管理者的知識、技能和能力等,具體形式包括評價中心技術(shù)、管理能力和傾向測驗等。評價中心技術(shù)的核心包括無領(lǐng)導(dǎo)小組討論(1eaderless group discussion)、角色扮演(role-playing game)、文件筐測驗(in-basket test)、問題解決(problem solving exercises)等。許多大公司,如AT&T,通用電氣公司、國際商用機(jī)器公司、福特汽車公司等都采用了這項技術(shù),并建立了評價中心機(jī)構(gòu)來評價管理人員。雖然有許多個案證明評價中心技術(shù)有效,但自從有了元分析技術(shù),關(guān)于評價中心技術(shù)預(yù)測效度的“真值”才日漸清晰。
從效標(biāo)和預(yù)測因子的魯棒性關(guān)系來看,評價中心技術(shù)的預(yù)測效度具有穩(wěn)定性。Gaugler等的元分析研究發(fā)現(xiàn)評價中心技術(shù)的整體預(yù)測效度為0.45。Arthur等對34篇文章進(jìn)行元分析,確認(rèn)了評價中心技術(shù)(Ac)的三個重要維度和它們的預(yù)測效度,即,問題解決能力(0.39)、影響他人(0.38)和組織計劃(0.37)。Arthur為評價中心技術(shù)對工作績效的預(yù)測力來自于認(rèn)知能力和人際關(guān)系處理能力。情境判斷測驗(SJTs)是一種基于分析困難情境問題對策的測驗形式,可以測量人的決策能力和管理能力。Clevenger等的運(yùn)用元分析方法研究了102個項效度資料(10640個被試),結(jié)論是,情境判斷測驗對工作績效的預(yù)測效度為0.34。在Schmidt等的元分析研究中,評價中心技術(shù)的整體預(yù)測效度為0.37,若與一般認(rèn)知能力相結(jié)合的聯(lián)合效度為0.53,比一般認(rèn)知能力的預(yù)測效度增加了0.02(即增量效度);诙嗄甑娜瞬艤y評實踐,我們認(rèn)為,以無領(lǐng)導(dǎo)小組討論為代表的評價中心技術(shù)能很好地展現(xiàn)個體在認(rèn)知智力、情緒社會智力、人際協(xié)調(diào)、團(tuán)隊建設(shè)、指揮控制和個人影響力等方面的特征,能很好地預(yù)測個體的管理績效。
評價中心技術(shù)的預(yù)測效度存在明顯的對應(yīng)性。效標(biāo)的種類很多,但可以用兩個維度來描述,即任務(wù)績效維度(task performance)和周邊績效維度(contextual performance)。前者與產(chǎn)品、服務(wù)、質(zhì)量、效益和效率等相關(guān)聯(lián),后者與協(xié)作、支持、遵從等親社會行為相關(guān)聯(lián)。Schmitt等的元分析顯示,當(dāng)效標(biāo)為“成就(即,客觀的業(yè)績)”時,認(rèn)知能力測驗和評價中心測驗的預(yù)測效度分別為0.437和0.312;當(dāng)效標(biāo)為“職位變化(主要是周邊績效的結(jié)果)”時,認(rèn)知能力測驗和評價中心測驗的預(yù)測效度分別為0.282和0.412。也就是說,出現(xiàn)了預(yù)測效度分離的現(xiàn)象,這種現(xiàn)象是效標(biāo)和預(yù)測因子在類別上是否對應(yīng)的結(jié)果。若兩者對應(yīng)則預(yù)測效度高,否則就低。在Gaugler等的元分析研究中,發(fā)現(xiàn)評價中心技術(shù)的預(yù)測效度依賴于效標(biāo)類別和評價目的。具體地說,當(dāng)效標(biāo)類別不同時,評價中心技術(shù)的預(yù)測效度不同,例如,效標(biāo)為“工作績效評價”時的預(yù)測效度為0.36,效標(biāo)為“培訓(xùn)成績”時的預(yù)測效度為0.35,而效標(biāo)為“潛力評價”時的預(yù)測效度為0.53;另一方面,當(dāng)評價目的不同時,評價中心技術(shù)的預(yù)測效度也不同,評價目的為“提升”時的預(yù)測效度為0.30,評價目的為“用于早期鑒定”時的預(yù)測效度為0.46,評價目的為“研究”時的預(yù)測效度為0.48。
與任務(wù)績效和周邊績效相類似,Judge等提出了管理行為的兩個潛在構(gòu)念,一個是關(guān)注關(guān)系(providing consideration),另一個強(qiáng)化結(jié)構(gòu)(initiating structure)。用于測量管理者行為傾向的測驗包括領(lǐng)導(dǎo)行為描述問卷(the leadershipBehavior Description Questionnaire)等。多年來這些測驗的預(yù)測效度資料比較混亂。Judge等運(yùn)用元分析方法研究了163項有關(guān)“關(guān)注關(guān)系”的相關(guān)數(shù)據(jù)和159項有關(guān)“強(qiáng)化結(jié)構(gòu)”的相關(guān)數(shù)據(jù)。結(jié)果發(fā)現(xiàn),關(guān)注關(guān)系測驗對領(lǐng)導(dǎo)力的預(yù)測效度為0.48,強(qiáng)化結(jié)構(gòu)測驗對領(lǐng)導(dǎo)力的預(yù)測效度僅為0.29,而且,關(guān)注關(guān)系的領(lǐng)導(dǎo)與屬下滿足感、動機(jī)和領(lǐng)導(dǎo)影響力相關(guān),而強(qiáng)化結(jié)構(gòu)的領(lǐng)導(dǎo)與領(lǐng)導(dǎo)工作績效、團(tuán)體績效相關(guān)。變革式領(lǐng)導(dǎo)mational leadership)和交易式領(lǐng)導(dǎo)(transactional leadership)是近20年來興起的關(guān)于領(lǐng)導(dǎo)類型的研究課題。變革式領(lǐng)導(dǎo)是通過預(yù)期未來和設(shè)想愿景,來激發(fā)追隨者。交易式領(lǐng)導(dǎo)主要通過在獎酬上的交換來影響追隨者。交易式領(lǐng)導(dǎo)的行為模式包括三類,即例外,積極模式、例外,消極模式和相機(jī)獎懲模式。例外,積極模式的領(lǐng)導(dǎo)傾向于在屬下遇到困難之前積極指導(dǎo),例外,消極模式的領(lǐng)導(dǎo)傾向于在屬下遇到困難之后才采取行動。Judge等的元分析發(fā)現(xiàn),變革式領(lǐng)導(dǎo)和相機(jī)獎懲交易式領(lǐng)導(dǎo)都是有效的領(lǐng)導(dǎo)方式,它們對屬下績效的綜合預(yù)測效度為0.44和0.39。而例外,消極模式管理者和自由放任式管理者對屬下績效的綜合預(yù)測效度呈負(fù)相關(guān),分別是為-0.18和-0.37。IIies等的元分析發(fā)現(xiàn),交易式領(lǐng)導(dǎo)對屬下的組織公民行為的綜合預(yù)測效度為0.38,也驗證了相機(jī)獎懲是有效的領(lǐng)導(dǎo)方式的結(jié)論。
4 人格測驗的效度概化研究
Casio等在回顧人格測驗時認(rèn)為,在組織管理領(lǐng)域,1960~1979年是人格測驗“黑暗的日子”,這些日子里,缺乏令人信服的人格結(jié)構(gòu)理論,人們對人格測驗在人才選拔領(lǐng)域的價值充滿懷疑。20世紀(jì)80年代的兩項成就為這個領(lǐng)域帶來了“春風(fēng)”。一個是“大五”因素理論的確立――這是對以往人格要素的新概括;另一個是元分析――這是對以往研究方法的新突破。在人格研究領(lǐng)域,對“大五”理論的5個維度的認(rèn)識逐步趨向一致。“大五”理論的五個維度分別是外向性(extraversion)、宜人性 (agreeableness)、責(zé)任感(conscientiousness)、情緒性(neurotieism)和開放性(openness toexperience)。由于其普遍性和應(yīng)用價值,“大五”理論和元分析技術(shù)在心理學(xué)基礎(chǔ)學(xué)科和應(yīng)用學(xué)科中逐漸滲透,“開花”。
1990-2003年間就有16篇關(guān)于人格因素的效度概化研究,Barrick等評論說,這是應(yīng)用心理學(xué)或人力資源管理領(lǐng)域少有的現(xiàn)象。Barriek等運(yùn)用元分析技術(shù)概括了67項研究和12602名被試發(fā)現(xiàn),責(zé)任感能有效地預(yù)測所有職業(yè)群體的職務(wù)績效和所有效標(biāo)(0.22),責(zé)任感和開放性對個體成就特征的行為(如,受訓(xùn)成績)有高的預(yù)測力(0.22,0.25)、而責(zé)任感、外向性、宜人性等三個維度均與管理績效的“合作行為”(如,管理和警察的行為)維度相關(guān)(0.25,0.21,0.10)。Judge等對73個樣本和222個相關(guān)數(shù)據(jù)進(jìn)行元分析發(fā)現(xiàn),“大五”對領(lǐng)導(dǎo)行為的聯(lián)合預(yù)測效度(multiple correlation)為0.48,“大五”作為人格維度對領(lǐng)導(dǎo)行為具有較好的預(yù)測效度,Judge等的研究支持領(lǐng)導(dǎo)的特質(zhì)論觀點。“大五”與領(lǐng)導(dǎo)行為的總相關(guān)分別為:情緒性為-0.24,外向性為0.31,開放性為0.24,宜人性為0.08,責(zé)任感為0.28。外向性、責(zé)任感、開放性為顯著正相關(guān),而神經(jīng)質(zhì)為最大負(fù)相關(guān),宜人性的相關(guān)不明顯。
Judge等對65個研究進(jìn)行元分析發(fā)現(xiàn),大五與工作動機(jī)的聯(lián)合效度為0.49,“大五”對工作動機(jī)(包括目標(biāo)設(shè)置、期望和自我效能感)具有較好的預(yù)測效度。責(zé)任感和情緒性與工作動機(jī)之間有強(qiáng)相關(guān)。外向性和開放性是目標(biāo)設(shè)置、自我效能感的顯著正相關(guān),宜人性(-0.18)是目標(biāo)設(shè)置的顯著負(fù)相關(guān)?傮w上說,責(zé)任感測試具有較強(qiáng)的魯棒性,而其他因素的效度對應(yīng)性較強(qiáng)。責(zé)任感的預(yù)測力來自于它的激活作用和自我約束機(jī)制,責(zé)任感是個體的事業(yè)成就的動力源泉和調(diào)節(jié)動力取向的杠桿。在責(zé)任感維度上得分高的個體,在工作中更有責(zé)任心、更堅忍不拔,更容易取得成就,因而責(zé)任感對一般工作和領(lǐng)導(dǎo)工作都有顯著的預(yù)測力。外向性、開放性和情緒性對領(lǐng)導(dǎo)力有很好的預(yù)測力,但對一般任務(wù)績效的預(yù)測較低。宜人性是影響人際交往成敗的經(jīng)常性因素,也是影響目標(biāo)設(shè)置的經(jīng)常性因素,但宜人性對領(lǐng)導(dǎo)力和一般任務(wù)績效的預(yù)測較低。正是由于“大五”因素的這些特點,在人事選拔中個性測驗是可以接受的預(yù)測因子。關(guān)于大五因素預(yù)測效度的增值性,McDaniel等的元分析結(jié)果顯示,認(rèn)知能力測驗、情境判斷測驗和大五因素測驗的預(yù)測效度分別為0.25、0.20和0.16,認(rèn)知能力測驗和情境判斷測驗的聯(lián)合效度為0.28,情境判斷測驗和大五因素測驗的聯(lián)合效度為0.23,認(rèn)知能力測驗和大五因素測驗的聯(lián)合效度為0.29,認(rèn)知能力測驗、情境判斷測驗和大五因素測驗的三者的聯(lián)合效度為0.31。需要說明的是,McDaniel等的研究沒有依照Hunter-Schmidt元分析范式進(jìn)行全距限制誤差校正,所以,與同類研究相比,其效應(yīng)值偏低。
根據(jù)作者12年的人才選拔測評實踐來看,人格測驗的預(yù)測效度比一般認(rèn)知能力測驗的預(yù)測效度低;在競爭性人才選拔測評中,人格測驗的預(yù)測效度低;在非競爭性、自愿性的職業(yè)規(guī)劃性測評中,人格測驗的預(yù)測效度還可以接受。究其原因,我們認(rèn)為主要有兩點值得關(guān)注,一是人格測驗多是自陳量表,應(yīng)試者答題時容易受社會贊許性的影響,其結(jié)果自然不能反映真實情況;二是對人格概念的傳統(tǒng)理解值得商榷。我們認(rèn)為,作為一種自動化的認(rèn)知能力和情感社會智力的人格概念,比作為特質(zhì)的人格概念更有助于提高人格的預(yù)測效度。認(rèn)知能力和情感社會智力是個體在接受、處理和發(fā)出概念信息、自我信息和人際信息時的能力,是可以通過能力性測驗而非自陳量表來測量的。這些觀點需要將來的獨立樣本研究和元分析研究的檢驗。
5 結(jié)構(gòu)化面試的效度概化研究
面試是人才選拔和配置的重要方式。面試一般分為非結(jié)構(gòu)化面試和結(jié)構(gòu)化面試兩種。非結(jié)構(gòu)化面試是指評委在面試中沒有固定的問題、可以隨時提問和追問的面試法。結(jié)構(gòu)化面試是指對同一職位的應(yīng)試者按同一順序問同樣的問題,多位評委按同一標(biāo)準(zhǔn)評分的標(biāo)準(zhǔn)化和規(guī)范化的面試。關(guān)于面試預(yù)測效度的效度概化研究概括如表4。
表4顯示,關(guān)于結(jié)構(gòu)化面試的預(yù)測效度元分析結(jié)果大體一致,其預(yù)測效度的魯棒性較強(qiáng)。Wiersner等、McDaniel等、Marchese等、Schmidt等、Huffcutt等、Campion等七項元分析研究的結(jié)構(gòu)化面試的效應(yīng)值的均值為0.42,而且七項研究之間標(biāo)準(zhǔn)差很小;但非結(jié)構(gòu)化面試的效應(yīng)值不高。結(jié)構(gòu)是事物內(nèi)部各組成要素之間的相互關(guān)聯(lián)和相互作用的結(jié)合方式!敖Y(jié)構(gòu)”和“功能”常常相伴隨。標(biāo)準(zhǔn)化和系統(tǒng)化結(jié)構(gòu)的功能相對穩(wěn)定、有序,而雜亂無章的結(jié)構(gòu)的功能常常是復(fù)雜多變!敖Y(jié)構(gòu)化”了的面試是一種標(biāo)準(zhǔn)化和系統(tǒng)化的面試形式,其功能自然相對穩(wěn)定、有序和有效,其測驗信度和預(yù)測效度更好。結(jié)構(gòu)化面試是一項系統(tǒng)工程,影響其效度的因素包括工作分析的準(zhǔn)確性、測評要素的適當(dāng)性、測評題目的有效性、評分方法的科學(xué)性和實施過程的規(guī)范性等。Conway等針對160項預(yù)測效度的元分析結(jié)果顯示,面試的信度系數(shù)的分布區(qū)間為0.26~0.56,因而,結(jié)構(gòu)化面試的預(yù)測效度最大值為0.67,而非結(jié)構(gòu)化面試的預(yù)測效度最大值為0.34,非結(jié)構(gòu)化面試的預(yù)測效度低的主要原因是其重測信度和復(fù)本信度較低。
結(jié)構(gòu)效度分析顯示,結(jié)構(gòu)化面試比認(rèn)知能力測驗所測量的內(nèi)容更廣泛,結(jié)構(gòu)化面試所測量的內(nèi)容包括認(rèn)知能力、崗位知識、經(jīng)營管理理念、工作技能、行為風(fēng)格、個性成熟度、組織適應(yīng)性等因素。所以結(jié)構(gòu)化面試的增值效度很明顯。如,Schmidt等測得一般認(rèn)知能力測驗(0.51)和結(jié)構(gòu)化面試(0.51)并用時的預(yù)測效度能達(dá)到0.63,其增值效度為0.12。關(guān)于結(jié)構(gòu)化面試的整體效度研究已無懸念,研究者開始對不同類別的結(jié)構(gòu)化面試的預(yù)測效度進(jìn)行元分析研究。Taylor等關(guān)于情景性(主要問“假設(shè)性的”問題)結(jié)構(gòu)化面試(其對總體績效的預(yù)測效度為0.45)和行為性(主要問“過去曾經(jīng)發(fā)生的”問題)結(jié)構(gòu)化面試(其預(yù)測效度為0.56)的元分析就是一個預(yù)測因子對應(yīng)性研究的典范。概括地說,以嚴(yán)格的工作分析為基礎(chǔ)、以情景經(jīng)驗性問題為重點、以規(guī)范性評分方法為準(zhǔn)繩的結(jié)構(gòu)化面試的預(yù)測效度更高。
6 人才背景資料的效度概化研究
在人才選拔過程還會參考到人才的一些背景資料,如受教育年限、年齡等。關(guān)于這些信息的預(yù)測效度也有人實施了元分析研究。過去的成功常常伴隨著自身能力、美譽(yù)度、業(yè)績資料和個性成熟度的變化,這些因素有助于預(yù)測個人的未來成就。如表5 所示,普遍的結(jié)論是同事評價、背景調(diào)查和傳記資料對個體的工作績效有高的預(yù)測力,而筆跡、年齡等因素對工作績效沒有預(yù)測力。由此看來,“不唯學(xué)歷、不唯資歷和不唯年齡,重視能力和業(yè)績”的人才觀是正確的。
7 效標(biāo)為工作場所中的社會行為的效度概化研究
上述效度概化研究中的效標(biāo)主要是個體任務(wù)績效,從操作定義層面說,常用的效標(biāo)是上級對下級的個體綜合績效水平的評價。在組織管理環(huán)境中,任務(wù)績效很重要,同時作為周邊績效的主要指標(biāo)的社會行為(如侵犯行為、組織公民行為等)也很重要。近年來,關(guān)于社會行為的預(yù)測因子效度概化研究有了新突破。我們列舉兩個例子,一個是關(guān)于工作場所中的騷擾行為(workplace harassment),一個是關(guān)于工作場所中的侵犯行為(workplaceaggression)。工作場所中的騷擾行為被定義為在工作場所中有目的地傷害其他同事的行為,具體表現(xiàn)為威脅、沖突、欺負(fù)等。騷擾行為與侵犯行為沒有本質(zhì)區(qū)別。
在這兩組元分析研究中,負(fù)性情緒和特質(zhì)憤怒是個體特征,其余為環(huán)境或崗位特征,但這些因素都能預(yù)測工作中的侵犯或騷擾行為。這些元分析結(jié)果支持個體、環(huán)境和行為是相互影響、彼此聯(lián)系的觀點。社會行為取決于當(dāng)時環(huán)境和個體特征的性質(zhì)和相互作用。這兩組元分析結(jié)果顯示,那種認(rèn)為只要有超人的智力和經(jīng)驗的個體就能成功的觀念是錯誤的,在人才選拔過程中只重視智力、經(jīng)驗和性格等個體因素,而不重視環(huán)境和管理的觀點是片面的。
8 評價與展望
關(guān)于效度概化和元分析研究的意義,Murphv認(rèn)為效度概化是應(yīng)用心理學(xué)領(lǐng)域近30年來最重要的研究進(jìn)展之一。效度概化使我們清晰地認(rèn)識到預(yù)測因子的重要性和權(quán)變性。在元分析產(chǎn)生之前,基于小樣本研究的預(yù)測效度常常不是一個準(zhǔn)確的結(jié)果,而當(dāng)小樣本研究的設(shè)計不適當(dāng)時,其預(yù)測效度會出現(xiàn)更大的偏差。面對相互矛盾的效度數(shù)據(jù),研究者的解決方法有兩種,一種方法是重復(fù)實驗一一這可能產(chǎn)生新的矛盾數(shù)據(jù);另一種是主觀挑選自己“滿意”的數(shù)據(jù)――這可能低估或高估真實的預(yù)測效度。在元分析產(chǎn)生之后,研究者就可以有信心地采用由元分析得到的較準(zhǔn)確的總結(jié)性信息了。與單個原始樣本研究相比,元分析依據(jù)的信息量和信息條件更多,其結(jié)論的準(zhǔn)確性和可靠性更高。元分析可以避免模棱兩可的結(jié)論,可以避免沒有必要的重復(fù)實驗,也可以充分利用“爆炸式增長”的效度信息。
對元分析技術(shù)的再認(rèn)識有助于提高效度概化的質(zhì)量。學(xué)者們對于元分析技術(shù)的理論和計算方法的理解是有分歧的。對效度概化的批評主要集中在元分析技術(shù)上。元分析技術(shù)產(chǎn)生主觀性偏差和客觀性誤差的原因是多方面的。一方面,研究者對元分析方法的理解和認(rèn)識是一個過程,因而計算效應(yīng)值的方法也會有變化;另一方面,研究者在收集和處理研究材料也會有偏差!拔募閷蠁栴}(Filedrawer problem)”就是一個問題。有些元分析方法只關(guān)注已經(jīng)發(fā)表過的文章,不接受未發(fā)表的文章的信息資料,致使元分析結(jié)果出現(xiàn)出版物偏差(publication bias)。如關(guān)于工作樣本測驗的預(yù)測效度有兩個差別較大的效應(yīng)值,一個是0.54,另一個是0.378。兩者的差異在于Hunter用了許多未發(fā)表的數(shù)據(jù),而Schmitt所用的數(shù)據(jù)全部來自于Journal of Applied Psychology和PersonnelPsychology雜志。“蘋果和橘子問題(apple andoranges problem)”是第二個問題。有些研究者在收集元分析的原始信息時忽略了原始信息之間的區(qū)別,對不同質(zhì)的測量對象或數(shù)據(jù)進(jìn)行元分析研究會影響最終的分析結(jié)果,這就好像將蘋果和橘子放在一起來歸納蘋果的一般特點的做法一樣。解決“蘋果和橘子問題”的辦法就是在分門別類地處理已有數(shù)據(jù)上下功夫。第三個問題是我們命名的“藤蔓和樹問題”。藤蔓種類與藤蔓高度的相關(guān)依賴于藤蔓所攀附的樹。如果不考慮樹的特點,則藤蔓種類與高度的相關(guān)就不會準(zhǔn)確。此時,樹就是中介變量。在研究預(yù)測因子和效標(biāo)的關(guān)系時,若不考慮它們之間的中介變量則效應(yīng)值會有偏差。第四個問題是我們命名的“樹和樹林問題”。究竟有多少棵樹才算樹林呢?雖然這個數(shù)目不能太小,但確切的限制數(shù)目是模糊的。與此相類似,在進(jìn)行元分析時至少需要多少個原始數(shù)據(jù)呢?這個問題也沒有確切的答案,從經(jīng)驗上看,元分析一般至少需要20個原始樣本數(shù)據(jù)。以結(jié)構(gòu)化面試的元分析為例,Wiersner等元分析了150項個案],McDaniel等元分析了245項個梨、Marchese等元分析了31項個案、Schmidt等元分析了40項個案、Huffcutt等元分析了114項個案。
關(guān)于效度概化研究的未來發(fā)展,我們認(rèn)為有四種趨勢是值得關(guān)注的。一是細(xì)化或深化預(yù)測因子的效度概化研究會更流行。例如,針對不同類別或不同環(huán)境下的結(jié)構(gòu)化面試和評價中心技術(shù)的元分析研究可能是新方向,關(guān)于人才選拔諸多方法及其相互關(guān)系的效度概化研究依然是研究重點。二是針對新的預(yù)測因子的探索式元分析研究會有新發(fā)展。在Schmitt等的元分析中就沒有詳細(xì)的人格測驗元分析研究,而當(dāng)“大五”因素理論出現(xiàn)之后,關(guān)于“大五”因素的元分析研究如雨后春筍。舉一反三,我們可以預(yù)見,勝任特征、情緒智力、周邊績效和變革型領(lǐng)導(dǎo)等新概念將成為元分析研究的新陣地。三是關(guān)于效標(biāo)和預(yù)測因子間關(guān)系的理論研究可能要取得新進(jìn)展。例如,環(huán)境和個體特征交互作用,認(rèn)知和情緒智力對與不同績效的分離性預(yù)測等領(lǐng)域可能有突破性進(jìn)展。四是普通樣本研究和元分析相結(jié)合的研究傾向會更普遍。元分析對原始數(shù)據(jù)的加工深度和可控性是有限的。所以,我們的設(shè)想是,用元分析研究促進(jìn)普通樣本研究的創(chuàng)新,增進(jìn)原創(chuàng)研究的開展;用普通樣本研究拓展和補(bǔ)充元分析的定量綜合,激勵元分析研究的理論探索。
相關(guān)熱詞搜索:述評 年成 預(yù)測 效度概化:預(yù)測效度元分析的30年成果述評 效度概化的理論研究述評 人事測評效度概化研究述評
熱點文章閱讀