標(biāo)準(zhǔn)參照測驗有哪些 什么是服從測試
什么是標(biāo)準(zhǔn)參照測驗?什么是目標(biāo)參照測驗?標(biāo)準(zhǔn)參照測驗的基本思想,心理學(xué)常模參照測驗和標(biāo)準(zhǔn)參照的異同,標(biāo)準(zhǔn)參照測驗的介紹,常模參照性測驗和標(biāo)準(zhǔn)參照性測驗的區(qū)別。
本文導(dǎo)航
什么是服從測試
標(biāo)準(zhǔn)參照測驗又稱準(zhǔn)則參照測驗。一種精心編制的,在一定的行為領(lǐng)域上按照具體的行為標(biāo)準(zhǔn)水平對被試的測驗結(jié)果作出直接解釋的測驗。它為人們提供了有關(guān)被試是否達到某種行為標(biāo)準(zhǔn)水平或要求的信息,是一種與以經(jīng)典測驗理論為基礎(chǔ)的常模參照測驗相對的測驗類型。
參照目標(biāo)和目標(biāo)的區(qū)別
1、標(biāo)準(zhǔn)參照測驗(Criterion-Referenced Test)又稱準(zhǔn)則參照測驗。一種精心編制的,在一定的行為領(lǐng)域上按照具體的行為標(biāo)準(zhǔn)水平對被試的測驗結(jié)果作出直接解釋的測驗。
2、為人們提供了有關(guān)被試是否達到某種行為標(biāo)準(zhǔn)水平或要求的信息,是一種與以經(jīng)典測驗理論為基礎(chǔ)的常模參照測驗相對的測驗類型。至今尚無一個統(tǒng)一、公認(rèn)的定義,但就一般意義而言,戈萊賽1971年對于目標(biāo)參照測驗的描述與界定較為廣泛為人接受:所謂目標(biāo)參照測驗,是根據(jù)某一明確界定的內(nèi)容范圍而縝密編制的測驗,并且,被試在測驗中所得結(jié)果,也是根據(jù)某一明確界定的行為標(biāo)準(zhǔn)直接進行解釋的。
3、標(biāo)準(zhǔn)參照測驗的主要目的在于確定被試對某一知識或技能的掌握的真實狀況,因而其編制的基本原則為:(1)測量目標(biāo)必須明確和具體,并且在一測驗中不能包含過多的測量目標(biāo)。測量目標(biāo)模糊或過多,都不利于測驗結(jié)果精確描述被試的知識或能力的真實狀況。(2)測題必須與測量目標(biāo)之間具有較高的一致性。每一測驗題目的反應(yīng)必須能體現(xiàn)出所要測量的測量目標(biāo)上的得為表現(xiàn)。同時,測量同一目標(biāo)的測題數(shù)量既要足夠,又要具有較高的同質(zhì)性。但在測量不同目標(biāo)的測驗題目之間不要求有同質(zhì)性。
內(nèi)容參照測驗指的是
1.編制的基本原則。標(biāo)準(zhǔn)參照測驗的主要目的在于確定被試對某一知識或技能的掌握的真實狀況,因而其編制的基本原則為:(1)測量目標(biāo)必須明確和具體,并且在一測驗中不能包含過多的測量目標(biāo)。測量目標(biāo)模糊或過多,都不利于測驗結(jié)果精確描述被試的知識或能力的真實狀況。(2)測題必須與測量目標(biāo)之間具有較高的一致性。每一測驗題目的反應(yīng)必須能體現(xiàn)出所要測量的測量目標(biāo)上的得為表現(xiàn)。同時,測量同一目標(biāo)的測題數(shù)量既要足夠,又要具有較高的同質(zhì)性。但在測量不同目標(biāo)的測驗題目之間不要求有同質(zhì)性。2.項目分析參數(shù)。標(biāo)準(zhǔn)參照測驗同樣需要難度、區(qū)分度等參數(shù)進行項目分析,但是這些參數(shù)的含義已區(qū)別于常模參照測驗中難度、區(qū)分度的含義。難度已不能簡單地解釋成題目的難易程度或題目的通過率,而必須理解為測驗者對測驗內(nèi)容要求的高低,它通過測量目標(biāo)反映出來。測驗者對測驗內(nèi)容要求越高,測題的難度相應(yīng)地也越大,反之則越低。在題目分析的過程中常采用掌握組中的通過率及未掌握組中的通過率來表示,因而難度系數(shù)值大小的選擇既可遵循統(tǒng)一的標(biāo)準(zhǔn),又可反映被試對測量目標(biāo)掌握的程度。區(qū)分度反映的則是測題對區(qū)別掌握與未掌握兩類被試的能力,而非籠統(tǒng)地指對被試能力的鑒別程度。由于人們通常將被試的掌握或未掌握的原因歸咎于教學(xué)的因素,幫教學(xué)敏感性系數(shù)常被采用為項目區(qū)分度的一種指數(shù),并且人們提出了多種教學(xué)敏感性系數(shù)。常見的有D指數(shù)、B指數(shù)等。3.及格的標(biāo)準(zhǔn)水平。標(biāo)準(zhǔn)參照測驗的分?jǐn)?shù)解釋不依賴于測驗組的常模,而是根據(jù)測驗者編制通常在測驗實施之前就制訂的及格的標(biāo)準(zhǔn)水平,顯然,被試是否及格不依賴于同伴的測驗結(jié)果,完全依賴于其自身的行為表現(xiàn)結(jié)果。及格的標(biāo)準(zhǔn)水平是測驗分?jǐn)?shù)量表上的某個點,可以根據(jù)這一點在量表上的位置,將被試劃分成對測量內(nèi)容具有不同熟練掌握水平的不同類型。及格的標(biāo)準(zhǔn)水平是測驗結(jié)果解釋的直接依據(jù),如何制訂出合理的及格標(biāo)準(zhǔn)水平,是一個需要測驗編制者深思熟慮的問題。因為這種標(biāo)準(zhǔn)水平的確立包含了較多的人的主觀性成分。至目前為止,人們已紛紛提出了許多種確立及格的標(biāo)準(zhǔn)水平的方法。4.效度驗證。效度是衡量測驗有效性的重要指標(biāo),通常它指測驗對于它所欲測量的屬性能夠測到的程度。同樣,對于標(biāo)準(zhǔn)參照測驗而言,需要評定其內(nèi)容效度、效標(biāo)關(guān)聯(lián)效度以及結(jié)構(gòu)效度。但強調(diào)的側(cè)重點不同于以往。標(biāo)準(zhǔn)參照測驗更側(cè)重于對其內(nèi)容效度的要求。內(nèi)容效度指測驗內(nèi)容對所欲測量內(nèi)容的代表性程度,因而考察標(biāo)準(zhǔn)參照測驗的內(nèi)容效度主要從以下兩方面入手:測驗題目的正確性和測驗題目的代表性。測題的正確性是指測題正確地反映測量目標(biāo)所欲測量的知識、技能的程度,對它的檢查主要包括:測題的技術(shù)質(zhì)量和測題與測量目標(biāo)之間的一致性程度。對前者的要求相一致,人們較易掌握。而對測題與測量目標(biāo)之間一致性程度的評定則較困難,通常只能采用一些經(jīng)驗方法加以評判,有專家評判法和學(xué)生評判法兩大類方法。測題的代表性要求組成標(biāo)準(zhǔn)參照測驗的測題必須對測驗領(lǐng)域總體有一定的代表性,從而使測驗具有較高的內(nèi)容效度。為了保證測題的代表性,標(biāo)準(zhǔn)參照測驗編制中往往需要制訂雙向細(xì)目表;同時人們也提出了利用重復(fù)實驗方法,來檢查標(biāo)準(zhǔn)參照測驗中測題的代表性。除了確保標(biāo)準(zhǔn)參照測驗的內(nèi)容效度之外,還必須對標(biāo)準(zhǔn)參照測驗的效標(biāo)關(guān)聯(lián)效度和結(jié)構(gòu)效度加以驗證。因為內(nèi)容效并盡管非常重要,但它只是關(guān)心測驗內(nèi)容而不是測驗分?jǐn)?shù),它并不隨著被試組的不同或時間的變化而變化,而測驗分?jǐn)?shù)解釋的正確性卻隨著測驗情形的變化而變化,因而僅靠測驗的內(nèi)容效度并不能確保測驗的有效性。效標(biāo)關(guān)聯(lián)效度的驗證方法仍可沿用以往的常用方法,關(guān)鍵問題仍在于效標(biāo)的選擇及其效標(biāo)的正確性上。標(biāo)準(zhǔn)參照測驗中的結(jié)構(gòu)效度驗證是指從理論上證明測驗分?jǐn)?shù)解釋的合理性。由于標(biāo)準(zhǔn)參照測驗的內(nèi)容效度看上支似乎提供了足夠的效度證據(jù),同質(zhì)性的標(biāo)準(zhǔn)參照測驗分?jǐn)?shù)分布限制了用相關(guān)性進行結(jié)構(gòu)效度驗證的途徑,因而標(biāo)準(zhǔn)參照測驗理論中的結(jié)構(gòu)效度驗證的途徑,因而標(biāo)準(zhǔn)參照測驗理論中的結(jié)構(gòu)效度驗證的研究至今仍是一個較薄弱的領(lǐng)域,還未出現(xiàn)一種令大多數(shù)人能接受的有效的結(jié)構(gòu)效度驗證方法。漢布爾頓曾提出使用格特曼量圖分析和因素分析法進行結(jié)構(gòu)效度驗證的可能。作為結(jié)構(gòu)效度的一種具體類別,決策效度是指根據(jù)標(biāo)準(zhǔn)參照測驗分?jǐn)?shù)對被試所作出的掌握分類決策的正確性。其檢查過程就是收集掌握與未掌握分類決策正確性的證據(jù),可用正確分類或不正確分類的概率表示,但關(guān)鍵的問題在玩弄:其一,如何才能證明確立的分類標(biāo)準(zhǔn)是正確的;其二,怎樣才能知道被試的真實狀態(tài),即掌握還是未掌握??傮w上說來,標(biāo)準(zhǔn)測驗的效度驗證理論還未發(fā)展成熟和完善,有待于進一步的研究和拓廣、深化。5.信度估計。至目前為止,研究文獻中已提供了較多的標(biāo)準(zhǔn)測驗信度估計方法,這些方法與常模參照測驗中的信度估計方法完全不同。通常將標(biāo)準(zhǔn)參照測驗信度估計方法分為三大類:第一,決策一致性信度。標(biāo)準(zhǔn)參照測驗的目的之一在于票據(jù)標(biāo)準(zhǔn)水平,將被試劃分成不同的類型,如掌握與未掌握,這時可以用掌握分類決策的一致性指數(shù)表示標(biāo)準(zhǔn)參照測驗的信度。計算決策一致性信度的方法很多,既可以利用兩個平等形式的復(fù)本測驗或再測驗來估計,也可以不需要復(fù)測或再測,直接利用一次測驗結(jié)果估計決策一致性信度。通常采用PO及u表示決策一致性信度系數(shù),但對PO及u的估計有許多不同的方法,這一方面取決于測驗的條件,另一方面取決于對一致性信度精確性的要求。其中哈伊恩方法和薩伯考維克方法等尤為有用。第二、領(lǐng)域分?jǐn)?shù)估計的信度。標(biāo)準(zhǔn)參照測驗的另一重要目的在于測量學(xué)生對測驗內(nèi)容掌握的多少。一般說來,測題是從測量該內(nèi)容的所有題目中抽樣出來的,所以根據(jù)被試的測驗分?jǐn)?shù)推測其在整個內(nèi)容領(lǐng)域上的領(lǐng)域分?jǐn)?shù)(即真分?jǐn)?shù))的過程中,必然會涉及測驗分?jǐn)?shù)估計的可靠性程度,因而必須估計領(lǐng)域分?jǐn)?shù)估計的信度。這種信度的估計既可以采用測量的標(biāo)準(zhǔn)誤估計,如米爾曼和漢布爾頓、克龍巴赫等提出的估計方法,同時也可以采用概化系數(shù)ρX來表示。前者反映的是各個體領(lǐng)域分?jǐn)?shù)估計的可靠性,后者體現(xiàn)了總體上反映所有被試的領(lǐng)域分?jǐn)?shù)估計的可靠性。第三,誤差平方損失一致性系數(shù)。當(dāng)運用及格的標(biāo)準(zhǔn)水平對被試進行掌握分類時,處理分類誤差有兩種情況:第一種情況是,在作出分類決策時,不論被試的觀察分?jǐn)?shù)與標(biāo)準(zhǔn)水平的遠(yuǎn)近情況如何,一律將誤差視為具有同等嚴(yán)重性。在計算決策一致性信度時,就以這種方式處理誤差。第二種情況是,認(rèn)為對遠(yuǎn)離標(biāo)準(zhǔn)水平的被試作出錯誤分類的嚴(yán)重性比對靠近標(biāo)準(zhǔn)水平的被試作出錯誤分類的嚴(yán)重性要大。人們通常將這種描述分?jǐn)?shù)與標(biāo)準(zhǔn)水平的離差平方的信度系數(shù)稱作為誤差平方損失一致性系數(shù)。常見的估計方法有利文斯頓提出的K2(X,T)系數(shù)和布倫納與凱恩提出的M(C)系數(shù)。這兩種系數(shù)的估計均采用方差分析來實現(xiàn)。6.標(biāo)準(zhǔn)參照測驗的標(biāo)準(zhǔn)化。測驗的標(biāo)準(zhǔn)化是經(jīng)典測驗理論中方法體系的一個重要方面。對于標(biāo)準(zhǔn)參照測驗而言,同樣需要對它實現(xiàn)標(biāo)準(zhǔn)化,從而提高測驗分?jǐn)?shù)解釋的正確性。標(biāo)準(zhǔn)參照測驗的標(biāo)準(zhǔn)化同樣包括以下幾個方面:(1)測驗編制過程的標(biāo)準(zhǔn)化,即為測驗編制者提供統(tǒng)一的、精確界定的測量目標(biāo),測驗題目都是測量內(nèi)容的典型代表物,測題具有較高的技術(shù)質(zhì)量等等;(2)測驗實施的標(biāo)準(zhǔn)化,即為被試提供相同的指導(dǎo)語,測驗的外在物理條件相一致等等;(3)測驗評分的標(biāo)準(zhǔn)化,即評分應(yīng)有統(tǒng)一的評分標(biāo)準(zhǔn),排除評分者的主觀偏見;(4)測驗分?jǐn)?shù)解釋的標(biāo)準(zhǔn)化,即評判各被試成績水平的及格標(biāo)準(zhǔn)水平必須始終如一。
心理學(xué)分類一覽表
1、二者的目的不同。常模參照測驗是將被試與常模相比較,以評價被試在團體中的相對地位為目的;標(biāo)準(zhǔn)參照測驗將被試與一絕對標(biāo)準(zhǔn)相比較,以評價被試有無達到該標(biāo)準(zhǔn)為目的。
2、二者在項目分析中的區(qū)別。標(biāo)準(zhǔn)參照測驗的項目難度分析不太重要,區(qū)分度關(guān)心的是能將在其內(nèi)容范圍上的已掌握和未掌握者作出最大限度的區(qū)分;常模參照測驗對難度有一定要求,區(qū)分度主要目的是對心理品質(zhì)的區(qū)分。
3、二者在信效度問題上的差異。在常模參照測驗通常以相關(guān)系數(shù)作為信度指標(biāo),用測驗與效標(biāo)間的相關(guān)系數(shù)做為效標(biāo)關(guān)聯(lián)效度指標(biāo);標(biāo)準(zhǔn)參照測驗則用分類一致性信度和荷伊特信度,效度指標(biāo)常用“決策效度”。
4、應(yīng)用范圍的不同。標(biāo)準(zhǔn)參照測驗更多地用于各種資格考核和知識評估;而常模參照測驗可用于各種人格測驗、能力測驗、職業(yè)選拔等。
參考資料來源:
百度百科-標(biāo)準(zhǔn)參照測驗
百度百科-常模參照測驗
對測驗的具體區(qū)分度數(shù)值的解釋
標(biāo)準(zhǔn)參照測驗(Criterion-Referenced
Test)又稱準(zhǔn)則參照測驗。一種精心編制的,在一定的行為領(lǐng)域上按照具體的行為標(biāo)準(zhǔn)水平對被試的測驗結(jié)果作出直接解釋的測驗。它為人們提供了有關(guān)被試是否達到某種行為標(biāo)準(zhǔn)水平或要求的信息,是一種與以經(jīng)典測驗理論為基礎(chǔ)的常模參照測驗相對的測驗類型。
常模參照性評價
二者的目的不同。常模參照測驗是將被試與常模相比較,以評價被試在團體中的相對地位為目的;標(biāo)準(zhǔn)參照測驗將被試與一絕對標(biāo)準(zhǔn)相比較,以評價被試有無達到該標(biāo)準(zhǔn)為目的。
常模參照測驗是用常模來解釋個人測驗分?jǐn)?shù)的一種測驗,它是以團體的心理水平來衡量個體心理水平。常模參照測驗的主要目的在于將受測者的表現(xiàn)與該團體中其他受測者相比較,從而區(qū)分不同的受測者,確定每個受測者的心理水平在總體中的相對位置。
早期的教育測驗和智力測驗許多都屬于常模參照測驗。測驗項目要求具有適當(dāng)?shù)碾y度和一定的區(qū)分度,如智力測驗、能力傾向測驗等。常使用的常模參照表有百分等級量表、標(biāo)準(zhǔn)分?jǐn)?shù)(z)量表、T量表、比率智商量表、離差智商量表、標(biāo)準(zhǔn)九等。
定義
通過測試將被試個體的心理發(fā)展水平與某一特定群體的心理發(fā)展水平進行比較,確定被試心理發(fā)展水平在這一特定群體中的相對位置的測驗。
這類測驗的目的主要是在于衡量被測對象相對水平,應(yīng)用于以選拔為目的的大規(guī)模測驗中。因此,被測對象在這類測驗上所得的分?jǐn)?shù)單獨來解釋是毫無意義的,而必須將它放到被測對象所在的團體中,從而直接或間接地以被測對象在該團體中的相對等級或相對位置來評估其能力水平。
掃描二維碼推送至手機訪問。
版權(quán)聲明:本文由尚恩教育網(wǎng)發(fā)布,如需轉(zhuǎn)載請注明出處。