高等統(tǒng)計學(xué)考題人大精簡版
發(fā)布時間:2020-09-09 來源: 實習(xí)報告 點擊:
高等統(tǒng)計學(xué)考題人大精簡版 題 一、多項選擇題(每題 4 分,一共 20 分,每題要求:選擇正確答案,對選擇或未選答案進行簡要而清晰的原因解釋。將答案填寫在答題紙上,填寫在試題上無效。得分規(guī)則:選對得 并對答案解釋合理,得 4 分;沒有對未選答案解釋最多得 2 分;漏選得 1 分,選錯可參考得 解釋酌情給分;不選得 0 分)
1 .有關(guān)樣本的分布,以下陳述正確的是:ABC A. 如果樣本 X 1 ,…,X n 獨立同分布來自 Gamma 分布, ???niiXnX11在大樣本下有近似的正態(tài)分布; 【對。滿足中央極限定理條件】
B.如果樣本 X 1 ,…,X n 獨立同分布來自 N(2, ? ?), ???niiXnX11在大樣本情況下有精確分布 N( n / ,2? ?); 【對。獨立同分布正態(tài)隨機變量的均值仍是正態(tài)分布,方差值符合中央極限定理】
C.如果樣本 X 1 ,…,X n 獨立同分布來自 N(2, ? ?),即使樣本量不大, ???niiXnX11也服從正態(tài)分布; 【對。獨立同分布正態(tài)隨機變量的均值仍是正態(tài)分布】
D.如果樣本 X 1 ,…,X n 來自任意分布,在大樣本情況下,由 X 1 ,…,X n 組成的數(shù)據(jù)有近似的正態(tài)分布; 【錯。如果 X 1 ,…,X n 強相關(guān),則不成立;即使 i.i.d 情況下也不是任意的數(shù)據(jù)組成方式都是正態(tài)分布】
2 .有關(guān)檢驗的 p 值,下面說法正確的是:C
A. 一般為[0,0.1]之間的一個很小的概率; 【錯。p 值是計算得出的概率,取值 0-1 之間】
B. 接受備擇假設(shè)的最小顯著性水平; 【錯。接受備擇假設(shè)說法不準(zhǔn)確】
C. 如果 p 值小于顯著性水平,則拒絕零假設(shè);
【對。符合假設(shè)檢驗規(guī)則】
D. 樣本統(tǒng)計量的分布函數(shù)。
【錯。p 值根據(jù)檢驗統(tǒng)計量分布函數(shù)計算得出】
卷 (卷 3 )5.有關(guān)檢驗的 p 值,下面說法正確的是:CD A. 一般為[0,0.1]之間一個較小的概率; 【錯。檢驗結(jié)果不拒絕原假設(shè)的情況下,p 值較大】
B. 接受備擇假設(shè)的最小顯著性水平; 【錯。接受備擇假設(shè)說法不準(zhǔn)確】
C. 如果 p 值小于顯著性水平,則拒絕零假設(shè);
【對。符合假設(shè)檢驗規(guī)則】
D. 樣本統(tǒng)計量的尾概率。
【對?烧J(rèn)為 p 值是原假設(shè)為真時小于等于實際觀測結(jié)果的概率】
3 .請問以下哪些方法可以用來判斷數(shù)據(jù)可能背離正態(tài)分布:
A. Q-Q 圖上,如果數(shù)據(jù)和基線之間幾乎吻合; 【錯。正態(tài) qq 圖數(shù)據(jù)和基線之間幾乎吻合說明數(shù)據(jù)接近正態(tài)分布】
B. Kolmogrov-Smirnov 正態(tài)檢驗中的統(tǒng)計量所對應(yīng)的 p 值小于 0.05; 【對。ks 正態(tài)檢驗原假設(shè)是兩個數(shù)據(jù)分布一致或者數(shù)據(jù)符合正態(tài)分布,p 值小于 0.05拒絕原假設(shè)】
C.對數(shù)據(jù)直方圖做光滑后沒有發(fā)現(xiàn)數(shù)據(jù)有很大的發(fā)散趨勢; 【錯。發(fā)散趨勢不能決定分布形態(tài)】
D.2? 擬合優(yōu)度檢驗,統(tǒng)計量的值偏小。
【錯。2? 擬合優(yōu)度檢驗可以檢驗分布是否正態(tài),原假設(shè)為觀測服從給定概率值的多項分布,統(tǒng)計量的值偏小不拒絕原假設(shè)】
4 .若抽樣誤差為 5,總體標(biāo)準(zhǔn)差為 40,如果樣本量足夠大,正態(tài)分布的 0.975 分位數(shù)近似為 2,要估計總體均值的 95%的置信區(qū)間所需要的樣本量大概為:
A
156;B 256;C 356 ; d) 456. 因 ???−????√??~??(0,1),那么 2 =540/√?? ,求解 n=256
5 .關(guān)于假設(shè)檢驗,給定一組獨立同分布的隨機樣本,給定顯著性水平,如下理解正確的是:D
A.單邊檢驗拒絕,雙邊檢驗一定拒絕;【錯,】
B.雙邊檢驗接受,一定有一個單邊檢驗是拒絕的;【錯】
C.單邊檢驗拒絕,雙邊檢驗一定拒絕!惧e】
D.雙邊檢驗拒絕,一定有一個單邊檢驗是拒絕的;【對】
畫圖解釋
6 .某汽車生產(chǎn)廠家為增加某型號汽車的銷售量,采用促銷手段,促銷一個月后,分別收集了 8 個銷售點處促銷前一個月和促銷后一個月該車型的銷售輛,如果不考慮其他影響銷售量因素,僅通過觀察和分析這些樣本數(shù)據(jù),是否認(rèn)為這次促銷有助于提高汽車的銷售量。請將合適的可用于分析該類問題的檢驗過程選出來:C 銷售點代號:1 2 3 4 5 6
7
8 促銷前(輛): 90 83 105 97 110 78
55
123
促銷后(輛): 97 80 110 93 123 84
57
110
A. 兩樣本 Z 檢驗 B. 兩樣本 t 檢驗 C. 單一樣本 t 檢驗 D. 單一樣本 Z 檢驗 本問題是配對樣本之間的比較,小樣本,方差未知,采用單一樣本的 t 檢驗,其他都不符合。
7 .在參數(shù)估計中,要求通過樣本的統(tǒng)計量來估計總體參數(shù),評價統(tǒng)計量的標(biāo)準(zhǔn)之一是該統(tǒng)計量隨著樣本量的增大,它與它估計的總體參數(shù)越來越近,這種評價標(biāo)準(zhǔn)稱為:
A.無偏性
B.有效性
C. 一致性
D.充分性 無偏性指估計量的期望與總體參數(shù)相等 充分性指估計量包含了參數(shù)的全部信息 有效性指無偏估計量的方差達到 C-R 下界
8 .研究人員對有糖尿病的老鼠和正常老鼠血液中某種礦物質(zhì)的含量進行研究,經(jīng)驗表明有糖尿病的老鼠和正常老鼠血液中某種礦物質(zhì)的含量測量方差相等,測得如下試驗數(shù)據(jù):
糖尿病老鼠:9 只,樣本均值 64.26,樣本方差 1.40
正常老鼠:
7 只,樣本均值 75.66,樣本方差 1.32 在置信水平為 0.10 之下,有糖尿病的老鼠和正常老鼠血液中 Fe 的含量之差的置信區(qū)間為(t(0.95,14)=1.76):
A. [5.68,15.56] B. [8.02,19.47] C.[10.36,12.43] D.[6.53,16.32] 有 t =(??? − ???) − (?? ?? − ?? ?? )?? ?? √ 1??+1?? 其中 S ?? 2 =(?? − 1)?? ?? + (?? − 1)?? ???? + ?? − 2 代入計算[(75.66 − 64.26) ± 1.76 × √( 19+17 )((9−1)×1.4+(7−1)×1.329+7−2)]可得。
9 .置信水平為 α,下列說法正確的是(BD
), A 在置信水平一定的條件下,提高置信估計精度需要縮小樣本量; B 在置信水平一定的條件下,提高置信估計精度需要增加樣本量; C 在樣本量一定的條件下,提高置信估計精度,需要降低置信水平; D 在樣本量一定的條件下,提高置信估計精度,需要增大置信水平。
以置信區(qū)間X? ± Z(1 − α/2)??√??為例,增大 n 或者增大α可縮小區(qū)間長度。
10 .某調(diào)查公司接受委托滿意度調(diào)查,滿意度分?jǐn)?shù)在 0~20 之間,隨機抽取 36 名消費者,平均滿意分 12,標(biāo)準(zhǔn)差 3,在大樣本的假設(shè)下,根據(jù)調(diào)查結(jié)果對總體平均滿意情況的 95%的置信區(qū)間,結(jié)果是:B A. 9~15 分 B. 11~13 分 分 C. 12~14 分 D. 6~18 分 因為:
12 − ??3√36~??(0,1) 可得 11<μ<13
11 .一位社會學(xué)者隨機抽取 3000 個家庭,想研究文化程度的高低與離婚率的高低是否有關(guān),適合采用的檢驗方法應(yīng)是( D
)
A. 正態(tài)分布檢驗
B. t 分布檢驗
C. 2? 擬合優(yōu)度檢驗
D. 2? 獨立性度檢驗 正態(tài)分布檢驗:檢驗均值是否相等,不符合題目條件 t 分布檢驗:檢驗均值是否相等,不符合題目條件
卡方擬合優(yōu)度檢驗:檢驗兩種分布是否相同,不符合題目條件 卡方獨立性度檢驗:檢驗列聯(lián)表的行與列是否獨立,與題目吻合 12 .在假設(shè)檢驗中,備擇假設(shè)所表達的含義總是指()
A.參數(shù)是正確的 B.變量之間沒有關(guān)系 C.參數(shù)沒有發(fā)生變化 D.參數(shù)發(fā)生了變化
13 .在估計某一總體的均值時,隨機抽取了 n 個單元作樣本,用樣本均值作為估計量,在構(gòu)造置信區(qū)間時,發(fā)現(xiàn)置信區(qū)間太寬,有可能的原因是:BD A. 選擇的估計量有偏 B. 樣本量太小 C. 置信水平太大,應(yīng)從 0.10 降低到 0.05 D. 精度要求太高 以置信區(qū)間X? ± Z(1 − α/2)??√??為例,增大 n 或者增大α可縮小區(qū)間長度。
14 .指出下列的說法哪一個是正確的(BD
)
A 在置信水平一定的條件下,要提高可靠性,就應(yīng)該縮小樣本量; B 在置信水平一定的條件下,要提高可靠性,就應(yīng)該增大樣本量; C 在樣本量一定的條件下,要提高可靠性,就降低置信水平; D 在樣本量一定的條件下,要提高可靠性,就提高置信水平。
以置信區(qū)間 X ?±Z(1-α/2)σ/√n 為例,增大 n 或者增大α可縮小區(qū)間長度。
15 .在假設(shè)檢驗中,備擇假設(shè)所表達的含義總是指(?)
A.參數(shù)是正確的
B.變量之間沒有關(guān)系 C.參數(shù)沒有發(fā)生變化 D.參數(shù)發(fā)生了變化
16 .某汽車生產(chǎn)廠家為增加某型號汽車的銷售量,采用促銷手段,促銷一個月后,分別收集了 8 個銷售點處促銷前一個月和促銷后一個月該車型的銷售輛,如果不考慮其他影響銷售量因素,僅通過觀察和分析這些樣本數(shù)據(jù),是否認(rèn)為這次促銷有助于提高汽車的銷售量。請將合適的可用于分析該類問題的檢驗過程選出來:C 銷售點代號:1 2 3 4 5 6
7
8 促銷前(輛): 90 83 105 97 110 78
55
123
促銷后(輛): 97 80 110 93 123 84
57
110
A. 如果樣本X 1 ,…,X
n 獨立同分布來自 N(21 ,? ? ),Y 1 ,…,Y n 獨立同分布來自 N(22 ,? ? ), X Y ?在大樣本下有近似的正態(tài)分布,可以檢驗0 1 2: H ? ? ? ; B. 如果樣本X 1 ,…,X
n 獨立同分布來自N(21 ,? ? ),Y 1 ,…,Y n 獨立同分布來自N(22 ,? ? ),i iX Y ?在大樣本下有正態(tài)分布,可以檢驗0 1 2: H ? ? ? ;
C. 如果樣本 X 1 ,…,X
n 獨立同分布來自 N(21 ,? ? ),Y 1 ,…,Y n 獨立同分布來自 N(22 ,? ? ), X Y ?有 t 分布,可以檢驗0 1 2: H ? ? ? ; D. 如果樣本X 1 ,…,X
n 獨立同分布來自 N(21 ,? ? ),Y 1 ,…,Y n 獨立同分布來自 N(22 ,? ? ), X Y ?有2? 分布,可以檢驗0 1 2: H ? ? ? ; 本題為配對樣本均值比較問題,只有 C 符合檢驗該問題。
二、簡答題:(10 分×3=30 分)
1.假設(shè)檢驗的零假設(shè)和備擇假設(shè)的設(shè)立對于檢驗的結(jié)論影響不大,請問這樣的理解有問題嗎?請給出你的解釋。
答:有問題。首先,設(shè)立某種零假設(shè)即設(shè)定了檢驗統(tǒng)計量,代表著確定了零分布,即 p 值計算依據(jù);另外,零假設(shè)和備擇假設(shè)是不對稱的,通常將簡單的假設(shè)、需要被保護的假設(shè)作為零假設(shè)。
2. 解釋下面符號的區(qū)別:
2s , 2? 和2X? (提示:請按有放回和無放回抽樣分別敘述)
有放回 無放回 2s :樣本方差 1?? − 1∑(?? ?? − ???) 2????=1 1?? − 1∑(?? ?? − ???) 2????=1 2? :總體方差 1??∑(?? ?? − ??) 2????=1 1??∑(?? ?? − ??) 2????=1 2X? :樣本均值的方差 ?? 2?? ?? 2??(1 −?? − 1?? − 1 )
3.統(tǒng)計推斷與描述統(tǒng)計之間有哪些重要的區(qū)別? 描述統(tǒng)計是指對采集的數(shù)據(jù)進行登記、審核、整理、歸類,在此基礎(chǔ)上進一步計算出各種能反映總體數(shù)量特征的綜合指標(biāo),并用圖表的形式表示經(jīng)過歸納分析而得到的各種有用的統(tǒng)計信息。
推斷統(tǒng)計是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學(xué)方法,其內(nèi)容包括參數(shù)估計和假設(shè)檢驗兩大類。參數(shù)估計是利用樣本信息推斷總體特征,假設(shè)檢驗是利用樣本信息判斷對總體的假設(shè)是否成立。
4.解釋 p 值檢驗的基本原理。
P 值即概率,在原假設(shè)為真的前提下出現(xiàn)觀察樣本以及更極端情況的概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計學(xué)根據(jù)顯著性檢驗方法所得到的 P 值,一般以 P < 0.05 為顯著, P<0.01 為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小于 0.05 或 0.01。實際上,P 值不能賦予數(shù)據(jù)任何重要性,只能說明某事件發(fā)生的機率
5.【負(fù)責(zé)人:3.1】請說明 Gamma 分布與卡方分布之間有哪些區(qū)別與聯(lián)系? 參數(shù)為 1/2 和 1/2 的 Gamma 分布等于自由度為 1 的卡方分布,相同λ參數(shù)的獨立 Gamma 分布之和服從 Gamma 分布,因此自由度為 n 的卡方分布是α=n/2,和λ=1/2 的 Gamma 分布。即:
Ga( n2,12 ) = χ2 (??)
6.
求 Gamma 分布的矩估計; Gamma 分布的前兩階矩是 {μ 1 =????μ 2 =??(?? + 1)?? 2 解得 λ =μ 1μ 2 − μ 1 2
α =μ 1 2μ 2 − μ 1 2
由于σ ? 2 = μ 2 ? − μ 1 ? 2 ,矩估計方法是 {
???=???σ ? 2??? =???2σ ? 2
7.假設(shè)檢驗中的兩類錯誤之間有什么關(guān)系?能否同時減少兩類錯誤? 原假設(shè)是正確的卻拒絕了原假設(shè),所犯的錯誤成為第一類錯誤,犯第一類錯誤的概率即為α。原假設(shè)是錯誤的卻沒有拒絕原架設(shè),所犯的錯誤稱為第二類錯誤,犯第二類錯誤的概率即為β。
在固定樣本量 n 的情況下,要減小α必導(dǎo)致增大β。
在固定樣本量 n 的情況下,要減小β必導(dǎo)致增大α。
要使α、β都減小,需增大樣本量。
8.簡述損失函數(shù)和風(fēng)險函數(shù)的定義 在統(tǒng)計學(xué),損失函數(shù)是指一種將一個事件(在一個樣本空間中的一個元素)映射到一個表達與其事件相關(guān)的經(jīng)濟成本或機會成本的實數(shù)上的一種函數(shù)。更通俗地說,在統(tǒng)計學(xué)中損失函數(shù)是一種衡量損失和錯誤(這種損失與"錯誤地"估計有關(guān),如費用或者設(shè)備的損失)程度的函數(shù)。
風(fēng)險函數(shù)是損失函數(shù)的期望值,表示為:R(θ,d) = E[L(d,θ)]。
9.
解釋 t 分布和正態(tài)分布之間的差異; t 分布由一個標(biāo)準(zhǔn)正態(tài)分布與一個卡方分布構(gòu)成:
T =??√ ????⁄ 其中 X~N(0,1),Y~?? 2 ( ?? )
,T 服從自由度為 n 的 t 分布 t 分布相對正態(tài)分布低峰厚位。
當(dāng) n>30 時 t 分布近似于標(biāo)準(zhǔn)正態(tài)分布。
10.解釋假設(shè)檢驗和置信區(qū)間估計的區(qū)別。
參數(shù)估計是用統(tǒng)計量估計未知的參數(shù);如果參數(shù)已知(或假設(shè)已知),需要利用統(tǒng)計量檢驗已知的參數(shù)是否靠譜,此時為假設(shè)檢驗。
區(qū)間估計立足于大概率,通常以較大的把握程度(置信水平)1-α去保證總體參數(shù)的置信區(qū)間。而假設(shè)檢驗立足于小概率,通常是給定很小的顯著性水平α去檢驗對總體參數(shù)的先驗假設(shè)是否成立。
13.
中位數(shù)檢驗與均值 t 檢驗之間的區(qū)別與聯(lián)系; --中位數(shù)檢驗是非參數(shù)統(tǒng)計方法,t 檢驗是參數(shù)統(tǒng)計方法; --中位數(shù)檢驗適用于總體分布未知的情景,t 檢驗需要總體正態(tài)分布的假設(shè)前提 --兩者都使用了代表樣本中心位置的指標(biāo)。
14.
簡述置信區(qū)間估計和假設(shè)檢驗之間的關(guān)系。
--計算置信區(qū)間的樞軸量與假設(shè)檢驗的統(tǒng)計量是同一個量 --置信區(qū)間的置信水平(1-α)與假設(shè)檢驗的顯著性水平α是兩個相互對立事件的概率 --使用置信區(qū)間可以完成假設(shè)檢驗
三、計算題(25 分)
1 . Hardy-Weinberg 平衡問題中,父代有兩種基因 M 和 N,M 在種群中的分布為 b(1,p)現(xiàn)在測量到了子代基因分布為:
M MN N 總量 頻數(shù) 342 500 187 1029 a) 請根據(jù)這些數(shù)據(jù)求父代的 p 的極大似然估計;(10 分)
b) 請給出 p 的置信區(qū)間的求解公式,并解釋; (15 分)
解:
a) 根據(jù) Hardy-Weinberg 平衡定律,MM、MN、NN 出現(xiàn)的頻率分別是?? 2 、 2??(1 − ??) 、(1 − ??) 2 ,令 n 為總量,x1、x2、x3 代表三個單元的觀測數(shù)量,本案例是多項分布的參數(shù)推斷問題,似然函數(shù)是:
f(p) =??!?? 1 !?? 2 !?? 3 !(?? 2 ) ?? 1 (2??(1 − ??)) ?? 2 ((1 − ??) 2 ) ?? 3
對數(shù)似然是:
??(??) = log??! − ∑ log?? ?? !3??=1+ ?? 1 log?? 2 + ?? 2 log2??(1 − ??) + ?? 3 log(1 − ??) 2
= log??! − ∑ log?? ?? !3??=1+ (2?? 1 + ?? 2 )log?? + (?? 2 + 2?? 3 )log(1 − ??) + ?? 2 log2 對 p 求導(dǎo),令導(dǎo)數(shù)為 0,有
2?? 1 +?? 2??−?? 2 +2?? 31−??= 0 求解得到
p =2?? 1 +?? 22(?? 1 +?? 2 +?? 3 )
那么極大似然估計 ??? =2 × 342 + 5002 × 1029= 0.575 b) 根據(jù)中央極限定理 ??? − ??√ ??(1 − ??)??~??(0,1) 當(dāng) p 未知,n 非常大時,使用???估計 p,得到置信區(qū)間:
[??? − ??( ??2 )√ ???(1 − ???)??,??? + ??( ??2 )√ ???(1 − ???)??]
2 .用 possion( ? )分布參數(shù) ? 的極大似然估計的漸進分布求置信區(qū)間。
解:如果 X 服從參數(shù)為λ的 possion 分布,那么 P(X = x) =λ ?? ?? −λ?? ?? 聯(lián)合頻率函數(shù)是邊際頻率函數(shù)的乘積,那么對數(shù)似然是 l(λ) = ∑(?? ?? logλ − λ − log?? ??!)????=1 = ∑?? ??????=1logλ − ??λ − ∑log?? ?? !????=1 令一階導(dǎo)數(shù)為 0,得 ?? ′ (λ) =∑ ?? ????=1λ− ?? = 0 那么,極大似然估計是 ???= ???
求解置信區(qū)間,需要計算I(λ),令??(??|λ)表示參數(shù)為λ的 PMF,需要計算 I(λ) = −E[?? 2??λ 2log??(??|λ)] 已知 log??(??|??) = ??log?? − ?? − log??! 可得 ?? 2??λ 2log??(??|??) = −???? 2
那么 I(λ) =1??
因此,λ的近似100(1 − α)%置信區(qū)間為 ???± ??(??/2) √?????
3 . X 1 , X 2 , … ,X n
是從兩點分布 Bernoulli(1,p)中抽取出來的獨立同分布樣本:
。1).求 (1-p) 2 的極大似然估計(10 分)。
(2)(1)中的估計量是無偏估計嗎?如果是有偏的,請給出(1-p) 2 的一個無偏估計(15分)
解:(1)似然函數(shù)為:
p(?? 1 ,?? 2 …?? ?? ) = ?? ∑?? ??????=1(1 − ??) ??−∑?? ??????=1 對數(shù)似然函數(shù)為:
logp(?? 1 ,?? 2 …?? ?? ) = ∑?? ??????=1log?? + (?? − ∑?? ??????=1)log(1 − ??) 求導(dǎo)并令導(dǎo)數(shù)為 0,得到 ∑ ?? ??????=1??−?? − ∑ ?? ??????=11 − ??= 0 化簡,得 ??? =∑ ?? ??????=1??= ??? 那么(1-p)2 的極大似然估計為:(1 − ???) 2
。2)已知有 ????? 2 = Var??? + (?????) 2
E(1 − ???) 2 = E(1 − 2??? + ??? 2 ) = 1 − 2E??? + ????? 2
= 1 − 2p +??(1 − ??)??+ ?? 2
因此,(1)中估計量不是無偏估計。
因為有:(1-p) 2 =1-p-p(1-p)。
已知 S 2 是 p(1-p)的無偏估計,???是 p 的無偏估計,那么(1-p) 2 的無偏估計為 1 − ??? − ?? 2
4. nX X ,...,1是從正態(tài)分布 ) , (2? ? N )中抽取的獨立隨機變量,請回答
1)計算????????22?SE ,S 2 是樣本方差;(10 分)
2)請在所有的形式為 aX 1 +bX 2 的估計量中,找到 ? 2 的最小方差無偏估計;(10 分)
解:(1)由于 (?? − 1)?? 2?? 2~?? 2 (?? − 1) 所以 E(?? − 1)?? 2?? 2= ?? − 1 解得 E?? 2?? 2= 1 (2)由題 E(aX 1 + bX 2 ) = 2μ 則 aμ + bμ = 2μ a + b = 2 要使Var(aX 1 + bX 2 )方差最小,帶入b = 2 − a,有
Var(aX 1 + (2 − a)X 2 ) = ?? 2 ???????? 1 + (2 − ??) 2 ???????? 2 = (2?? 2 − 4?? + 4)?? 2
求(2?? 2 − 4?? + 4)的極小值,令導(dǎo)數(shù)為 0,得到 4a-4=0,則 a=1 那么,當(dāng) a=1 是有最小方差無偏估計 X 1 +X 2
四、 論述題:(25 分)
1. 研究者想了解某種電子設(shè)備產(chǎn)品在一年的各個季節(jié)里被購買的情況是否存在不同。如果用銷售量來解釋這一問題,對這一問題可能提出的最簡單的零假設(shè)可能是什么?在這一假設(shè)之下,研究者調(diào)查了有關(guān)這種產(chǎn)品過去 3 年的銷售量 2070 萬臺。
表 1 某種電子設(shè)備產(chǎn)品在過去 3 年中的銷售量 季節(jié) O (萬)
E O i -E i
(O i -E i ) 2
ii iEE O2) ( ? 春季
495 517.5 -22.5 506.25 0.98 夏季
503 517.5 -14.5 210.25 0.41 秋季
491 517.5 -26.5 702.25 1.36 冬季 581 517.5 63.5 4032.25 7.79 總計
2070 2070 0 5451 10.54 1.解釋表頭字母的含義; O
表示第 i 個季節(jié)實際銷售觀測數(shù) E
表示如果假定各季節(jié)銷售無差異時的銷售期望數(shù) O i -E i
觀測與期望的差值 (O i -E i ) 2
偏差平方 (O i -E i ) 2 / E i
偏差平方與期望數(shù)的比值 2.請將上面的表格填寫完整。
3.如果 81 . 7 ) 95 . 0 , 3 (2? ? ,請給出你的推斷過程和據(jù)此可能的結(jié)論。
由于 10.54 大于 7.81,卡方擬合優(yōu)度檢驗統(tǒng)計量落在拒絕域中,則拒絕原假設(shè),電子設(shè)備產(chǎn)品在一年的各個季節(jié)里被購買的情況存在不同。
2. 研究者想了解某地區(qū)的醫(yī)院出院人數(shù)(DISC)和床位量(BEDN),調(diào)查了 21 家醫(yī)院數(shù)據(jù),分為甲級(I)和乙級(II)兩類如下:
等級 I I I I I II II II II II II II II II II II II II II II II DISC
91 240 255 233 315 200 266 120 228 362 414 518 389 535 273 440 431 534 426 505 322
BEDN
62 64 67 69 70 73 81 91 96 100 100 103 110 127 111 116 120 122 130 137 142 1.如果我們感興趣的問題是醫(yī)院出院人數(shù)小于 400 的比例估計,請給出通過抽取樣本研究這一問題的統(tǒng)計推斷問題和估計量; 2.如果假定 p 來自先驗分布 beta(a,,b),請先根據(jù)甲級醫(yī)院估計出 a 和 b , 再給出對乙級醫(yī)院 p 的后驗估計計算公式和計算結(jié)果; 3.如果將床位量按(0,70],(71,110]以及(110,150] 分為大,中,小,請給出用來判斷床位數(shù)和出院人數(shù)關(guān)系的統(tǒng)計模型和解答。
解:
(1)用 X 表示出院人數(shù)是否小于 400 的隨機變量,則 X~b(1,p) 其中:p=Pr(X<400) 則: ??? =∑ ?? ??????=1?? (2)因為:后驗∝先驗•似然,則 p 的后驗 ∝ (p ??−1 (1 − ??) ??−1 )(?? ∑?? ?? (1 − ??) ??−∑?? ?? ) ∝ p ??+∑?? ?? −1 (1 − ??) ??+??−∑?? ?? −1
那么 p~beta(a + ∑?? ??????=1,b + n − ∑?? ??????=1) 其中,n 為樣本量。根據(jù) beta 分布的期望得到后驗估計 ??? =a + ∑ ?? ??????=1a + b + n (3)構(gòu)造列聯(lián)表:
床位量/出院人數(shù) 小于 400 大于 400 總計 小 1134 0 1134 中 1565 932 2497 大 595 2871 3466 總計 3294 3803 7097 使用卡方獨立性檢驗,H0:床位數(shù)與出院人數(shù)獨立,H1:床位數(shù)與出院人數(shù)相關(guān) 1)R 語言 R 語言中使用 chisq.test()函數(shù)數(shù)對列聯(lián)表的行變量和列變量進行卡方獨立性檢驗,執(zhí)行:
>chisq.test(data.frame(c(1134, 1565, 595), c(0, 932, 2871))) 輸出 X-squared = 2766.8,df=2,p-value < 2.2e-16
所以拒絕原假設(shè),床位數(shù)與出院人數(shù)不獨立。
2)直接計算:
卡方統(tǒng)計量:χ 2 = ∑ ∑(??− ?? .?? ?? .?? ??⁄ ) 2?? .?? ?? .????⁄2??=13??=1 代入計算得 2766.8,自由度為 2,給出的 p 值小于 0.01,所以拒絕原假設(shè)。
4. 研究者想了解某種產(chǎn)品在四家商場中購買是否存在不同。如果用銷售量來解釋這一問題,對這一問題可能提出的最簡單的零假設(shè)可能是什么?在這一假設(shè)之下,研究者調(diào)查了有關(guān)這種產(chǎn)品過去 2 年的銷售量 196 萬臺。
表 1 某種產(chǎn)品在過去 2 年中的銷售量 商場 O (萬)
E O i -E i
(O i -E i ) 2
ii iEE O2) ( ? A
98
B
67
C
13
D 18
總計
196
1.解釋表頭字母的含義; 2.請將上面的表格填寫完整。
3.如果 81 . 7 ) 95 . 0 , 3 (2? ? ,請給出你的推斷過程和據(jù)此可能的結(jié)論。
同第一題
5. 某種感冒沖劑規(guī)定每包重量為 12 克,超重或過輕都是嚴(yán)重問題。質(zhì)檢員抽取 25 包沖劑稱重檢驗,得到平均每包的重量為 11.85 克,標(biāo)準(zhǔn)差 6 . 0 ? s 克。假定產(chǎn)品重量服從正態(tài)分布( 05 . 0 ? ? )。( 96 . 12??z , 71 . 12??t )
(1)
感冒沖劑的每包重量是否符合標(biāo)準(zhǔn)要求?(寫出詳細的檢驗過程)
。2)
檢驗結(jié)論能否證明感冒沖劑的每包重量符合標(biāo)準(zhǔn)要求?為什么? (3)
上述檢驗結(jié)論可能犯哪一類錯誤?說明這一錯誤的實際含義。
。4)
根據(jù)上述檢驗計算出的 223 . 0 ? P ,解釋這個 P 值的具體含義。
(1)解:
H0:μ=12 H1:μ≠12 t =??? − ????√??⁄=11.85 − 120.6√25⁄= −1.25 ∵ |??| = 1.25 < ?? ?? 2⁄= 1.71
故不拒絕原假設(shè),認(rèn)為符合標(biāo)準(zhǔn)
(2) 不能,假設(shè)檢驗只是得出符合標(biāo)準(zhǔn)的概率較大,沒有大概率表明原假設(shè)錯誤,不能拒絕原假設(shè)但并不能認(rèn)為原假設(shè)一定正確。
(3) 上述檢驗結(jié)論犯了第 II 類錯誤,原假設(shè)錯誤,由于樣本落入接受域中而錯誤的接受原假設(shè),這個樣本提供的證據(jù)還不足以證明產(chǎn)品不符合每包 12g 的要求因此接受了符合要求的原假設(shè)。
(4) 原假設(shè)成立的概率是 p,由于 p=0.223>0.05,所以認(rèn)為差別由抽樣誤差引起,不能拒絕原假設(shè)。
相關(guān)熱詞搜索:統(tǒng)計學(xué) 考題 精簡版
熱點文章閱讀