數(shù)理統(tǒng)計(jì)中假設(shè)檢驗(yàn)問(wèn)題的理解與思考
掃描二維碼
隨時(shí)隨地手機(jī)看文章
1、統(tǒng)計(jì)假設(shè)檢驗(yàn)問(wèn)題 ? ? “假設(shè)檢驗(yàn)”,從字面上上理解就是先“假設(shè)”,后“檢驗(yàn)”的過(guò)程,“檢驗(yàn)”的對(duì)象當(dāng)然 是之前的假設(shè)本身,有些情況下為了區(qū)分與其它學(xué)科的“假設(shè)”,研究統(tǒng) 計(jì)的人就 用“統(tǒng)計(jì)假設(shè)”來(lái)描述統(tǒng)計(jì)上的假設(shè)問(wèn)題,既然我們研究統(tǒng)計(jì),跟其它行業(yè)的人們打 交道就較少了,所以我們有時(shí)候就會(huì)簡(jiǎn)稱“統(tǒng)計(jì)假設(shè)”為“假 設(shè)”了。
說(shuō)了半天,那,到底什么是“假設(shè)”呢?其實(shí),在統(tǒng)計(jì)學(xué)中,“假設(shè)”目前主要有兩 種,至少我沒(méi)有碰見(jiàn)其它“假設(shè)”類型。(這里突出“兩種”,也是一種研究問(wèn) 題的 方法學(xué),在研究某個(gè)問(wèn)題的時(shí)候,能夠精確講問(wèn)題分類,是一種必要的素質(zhì))。一 種是參數(shù)的假設(shè),另一種是非參數(shù)的假設(shè),后者好像概括了所有“不 是第一種假 設(shè)”的情況,其實(shí)不然,在實(shí)際研究中,人們把隨機(jī)變量分布的假設(shè)稱為非參數(shù)的 假設(shè)。為什么把分布的假設(shè)稱為非參數(shù)的假設(shè)呢?一方面是因 為它確實(shí)不是參數(shù) 的假設(shè),另一方面,其它類型的除了參數(shù)和分布的假設(shè)外,我們想不到其它東西的 假設(shè)了,至少我沒(méi)有想到,也許真的存在,只是我還沒(méi) 有遇到,沒(méi)有學(xué)習(xí)過(guò)而已。
? ? 什么是參數(shù)的假設(shè)呢?實(shí)際就是對(duì)隨機(jī)變量分布中未知參數(shù)的假設(shè)。參數(shù)如果已 知,我們沒(méi)有必要假設(shè)了呀!還有一個(gè)前提就是我們已知隨機(jī)變量的分布類型。所 謂 分布,就是知道分布函數(shù)的類型,已知分布函數(shù)的前提下,我們便知道了概率 分布列(離散的),密度函數(shù)(連續(xù)情況)。還有未知參數(shù)的問(wèn)題,我們可以 舉 一個(gè)例子,比如某個(gè)隨機(jī)變量服從正太分布,大家都立馬想到正太分布的密度函 數(shù),這個(gè)函數(shù)中有兩個(gè)參數(shù)確定后,這個(gè)函數(shù)就可以來(lái)實(shí)際計(jì)算了,如果 我們不 知到其中一個(gè),或者都不知道參數(shù)的值,那么我們就說(shuō)它是未知參數(shù)了。其實(shí)未知 參數(shù)不是定義的,未知參數(shù)一般不會(huì)給出定義,是因?yàn)樗苋菀诐M 足所有人的思 維邏輯。我們對(duì)某個(gè)參數(shù)作出假設(shè),這就是參數(shù)的假設(shè)了。
? ? 什么是非參數(shù)的假設(shè)呢?大家在看書的時(shí)候,會(huì)看到書里大部分寫的是“非參數(shù)假 設(shè)”,只是少個(gè)“的”而已,但是這種缺省就很容易導(dǎo)致不在一個(gè)思維邏輯上的人 們 產(chǎn)生迷惑,當(dāng)然也正是很多學(xué)科中存在這樣或者那樣的迷惑才嚇退一些人來(lái)保證少 部分人掌握這些迷惑背后的東西,不信你想想什么EM啊,什么 SIFT,什么支撐向 量機(jī)(SVM)呀,多么讓人迷惑的東西啊。當(dāng)然,你知道了缺省的存在,或者迷糊 背后美妙的結(jié)論,就沒(méi)什么可怕的了。前面也說(shuō) 過(guò)了,就是隨機(jī)變量分布的假 設(shè),我們稱為非參數(shù)的假設(shè)。比如我們研究世界人民的身高的分布情況,我們現(xiàn)在 不知道身高這個(gè)數(shù)字特征定義的隨機(jī)變量服 從什么分布,我們就可以假設(shè)他是某 個(gè)分布,這個(gè)就是非參數(shù)的假設(shè)問(wèn)題了。
檢驗(yàn)?zāi)兀渴裁词菣z驗(yàn)?前面給出了假設(shè),對(duì)假設(shè)進(jìn)行判斷的過(guò)程就叫檢驗(yàn)了。我們 怎么檢驗(yàn)?zāi)??是要組織構(gòu)造一個(gè)檢驗(yàn)規(guī)則的,然后根據(jù)這個(gè)規(guī)則來(lái)檢驗(yàn)之前的假 設(shè),這樣在邏輯上大家都說(shuō)的過(guò)去。
2、檢驗(yàn)規(guī)則構(gòu)造的思考 ? ? 我們從犯錯(cuò)誤的角度來(lái)構(gòu)造檢驗(yàn)規(guī)則。如果你看書,也許或者很有可能,書里面并 沒(méi)有解釋,他在做什么,而是給出邏輯推理過(guò)程后,給出你他們的動(dòng)機(jī)。不過(guò)現(xiàn)在 你不用擔(dān)心了,我已經(jīng)告訴你我的動(dòng)機(jī)了。當(dāng)然我這樣做也可能違背了提出“假設(shè) 檢驗(yàn)”問(wèn)題的人的原始意愿,但是這起碼是一種理解問(wèn)題的方式,盡管他 可能有所 偏差。(一切皆有可能,基于這個(gè)原理,我會(huì)在講述過(guò)程中說(shuō)明某些屬于小概率事 件的事情)。?
? ? 為了有理論依據(jù),數(shù)學(xué)上給出一些符號(hào)來(lái)標(biāo)記,文字上給出一些定義用來(lái)說(shuō)明問(wèn)題。首先H_0 這個(gè)數(shù)學(xué)符號(hào)用來(lái)表示“原”假設(shè),H_1這個(gè)符號(hào)用來(lái)表示“備擇”假設(shè),可以理解為“準(zhǔn)備選擇的”假設(shè),至于為什么這樣理解,其實(shí)等我們熟悉了這套理論之 后,我們就會(huì)明白往往拒絕H_0這個(gè)結(jié)論更具有說(shuō)服力(這是基于小概率原理的),不過(guò)如果大家沒(méi)多少概念,也沒(méi)有關(guān)系,后面我會(huì)試圖一點(diǎn)點(diǎn)的 解釋清楚,力圖讓你豁然開(kāi)朗,當(dāng)然你沒(méi)有耐心看下去,我也沒(méi)有能力讓你理解這一且的。
? ? 我們可用的數(shù)據(jù)只有樣本,或許還有一些已知的參數(shù),那我們應(yīng)該努力使用這些已知的東西來(lái)構(gòu)造檢驗(yàn)準(zhǔn)則。記住這一點(diǎn)!
? ? 為了弄出檢驗(yàn)準(zhǔn)則,我們先從結(jié)果考慮。不管作出什么選擇,我們的總會(huì)有出現(xiàn)錯(cuò)誤的可能,幸運(yùn)的是我們只會(huì)犯兩個(gè)錯(cuò)誤,一個(gè)錯(cuò)誤是H_0實(shí)際上是正確的,我 們根據(jù)我們的檢驗(yàn)規(guī)則,判斷H_0是錯(cuò)誤的了,這種錯(cuò)誤我們稱他為第一類錯(cuò)誤,統(tǒng)計(jì)中,我們稱“判斷H_0正確”為“接受H_0”,相反為 “拒絕H_0”, 第一類錯(cuò)誤也就可以說(shuō)成拒絕真值的錯(cuò)誤了,為了高深一點(diǎn),大家會(huì)說(shuō),這個(gè)叫“拒真”。另一種錯(cuò)誤,就是第二類錯(cuò)誤,就是“在H_0錯(cuò)誤的情況下,根據(jù)判決 規(guī)則判斷H_0正確”,這種錯(cuò)誤也可以叫“取偽”。
? ? 那我們是根據(jù)樣本觀測(cè)值給出判斷的吧,我們就必須把樣本觀測(cè)值搞成兩個(gè)集合,我們做實(shí)驗(yàn)后,樣本觀測(cè)值屬于了某個(gè)集合,我們作出相應(yīng)的判斷,即接受或拒絕 H_0,我們?cè)倨鹨粋€(gè)名字,就是包含可以用來(lái)拒絕H_0的那個(gè)樣本觀測(cè)值的所在的集合,我們稱之為“拒絕域”。既然有了拒絕域,相應(yīng)的我們?cè)?給另一個(gè)可以用來(lái)接受H_0的樣本觀測(cè)值的集合叫做“接受域”,這樣理解非常符合邏輯。其實(shí)我敘述接受域和拒絕域的過(guò)程,就是構(gòu)造檢驗(yàn)規(guī)則的 一種邏輯想法,為什么說(shuō)這種想法是邏輯的呢?因?yàn)槲抑挥袠颖居^測(cè)值可以使用的情況下(某些情況可能知道更多),我很自然的想到使用樣本觀測(cè)值 來(lái)檢驗(yàn)假設(shè),我既然有兩個(gè)選擇(接受和拒絕H_0),那么我就把樣本觀測(cè)值的所有可能結(jié)果(有些書也稱他為樣本空間,當(dāng)然樣本空間的理解是正 確的,我只是沒(méi)怎么用)分成兩個(gè)集合,一個(gè)稱之為拒絕域(我們記為W),一個(gè)稱之為接受域(記為!W),相應(yīng)的,當(dāng)樣本觀測(cè)值落在拒絕域中的 時(shí)候,我們拒絕H_0,相反接受H_0 。知道了這些,前面我們提到的“拒真”就可以表示出它的概率形式了。P((X_1,X_2,...,X_n) in W | H_0實(shí)際為真) = alpha,表示的是實(shí)際H_0為真的條件下,樣本觀測(cè)值落在了拒絕域中的概率,用alpha來(lái)表示它的結(jié)果,自然我們會(huì)想,如果我們的H_0是真 的,那么樣本觀測(cè)值就應(yīng)該很難落在拒絕域中,也就是說(shuō)在假設(shè)為真時(shí),“我們的樣本觀測(cè)值落在拒絕域中”這個(gè)事件是一個(gè)小概率事件,一般我們認(rèn) 為發(fā)生概率比較小的事件為小概率事件,這里“小”的度量根據(jù)實(shí)際問(wèn)題來(lái)定,根據(jù)小概率事件原理,即小概率事件在一次事件中認(rèn)為不會(huì)發(fā)生,如果 發(fā)生了,我們就認(rèn)為這不是小概率事件了,往往這句話的前半句更容易接受一點(diǎn),我們很難說(shuō)一個(gè)發(fā)生的事件不是小概率事件,這也就是為什么我們更 愿意得到拒絕H_0的原因。這個(gè)原理看起來(lái)有太大人為思想了,我們還是承認(rèn)他,就是在沒(méi)有完美解決方案的情況下,退而求其次的結(jié)果呀。
? ? 那到底如何給出我們談?wù)摰倪@個(gè)“拒絕域”呢?這個(gè)一般根據(jù)具體情況而定,不過(guò)套路還是差不多的,一般都會(huì)用統(tǒng)計(jì)量的某些規(guī)則來(lái)給出拒絕域。
? ? 需要說(shuō)明一下的是,很多情況下,我們也希望取偽概率要盡可能小,但是我們很難都照顧到,所以我們又找了個(gè)簡(jiǎn)單的做,就是只考慮拒真概率盡可能小,
? ?首先給出一個(gè)小概率值alpha(比如取0.05),來(lái)限定拒真概率以便給出拒絕域。這里數(shù)學(xué)家給了一個(gè)名字,叫顯著性水平,alpha值越小,顯 著性水平就越低,說(shuō)明的是小概率發(fā)生的概率就越低。對(duì)于參數(shù)的建設(shè)檢驗(yàn)問(wèn)題,我們要構(gòu)造一個(gè)估計(jì)這個(gè)參數(shù)的統(tǒng)計(jì)量。然后我們?cè)贖_0為真的前 提下,找到這個(gè)統(tǒng)計(jì)量的分布。 找到分布就成功了一大步了。下一步也很關(guān)鍵,這一步是根據(jù)原假設(shè)H_0的形式進(jìn)行的,這一步我們用例子說(shuō)明,這一步完成了,任務(wù)基本上完成了。
? ?例子,有一堆鉛筆要出廠啊,根據(jù)經(jīng)驗(yàn),該廠的鉛筆長(zhǎng)度滿足正態(tài)分布,方差已知為sigma^2,假設(shè)某個(gè)組織給了一個(gè)標(biāo)準(zhǔn),說(shuō)鉛筆的長(zhǎng)度的期望為 u_0才能合格。
? ? ? ?那我們就設(shè)H_0: u = u_0, H_1:u!=u_0。 我們找一個(gè)估計(jì)u的統(tǒng)計(jì)量,就用樣本均值了,由于CSDN我編輯不了X的上面畫個(gè)橫線,我就用Y表示樣本均值了。樣本容量為n,那么(Y- u)sqrt(n)/(sigma)就服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)了,在H_0為真的條件下,就是說(shuō)u=u_0的條件下,T=(Y- u_0)sqrt(n)/(sigma)就是一個(gè)統(tǒng)計(jì)量了,這個(gè)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布。我們就是要根據(jù)這個(gè)統(tǒng)計(jì)量來(lái)尋找拒絕域。觀察T這 個(gè)統(tǒng)計(jì)量,當(dāng)樣本均值Y與u_0接近的越近,我們就更容易接受H_0,也就是說(shuō)當(dāng)樣本均值遠(yuǎn)離u_0的時(shí)候,在總體數(shù)學(xué)期望為u_0的條件 下,發(fā)生這個(gè)的概率比較小,也是為了限定這個(gè)小的程度,我們給定一個(gè)數(shù)值,比如我們前面提到的alpha=0.05,這個(gè)可以在不同的場(chǎng)合 下給出不同的值,這里我只是隨便給出的一個(gè)值而已。拒真的概率為 P(|T|>u_x) = alpha, 根據(jù)標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)性質(zhì),u_x = u_{alpha/2}。根據(jù)|T|>u_x這個(gè)不等式,我們就可以來(lái)限制拒絕域了。W = {(x_1,...x_n) | |T|>u_x}。后面做判斷就水到渠成了。
?3、總結(jié)一下? ?本文中主要討論的是參數(shù)的假設(shè)檢驗(yàn)問(wèn)題。 ?在統(tǒng)計(jì)中,假設(shè)檢驗(yàn)的關(guān)鍵問(wèn)題是如何構(gòu)造統(tǒng)計(jì)量。 然后是如何思考選定拒絕域。 多多訓(xùn)練之后,我們就自然明白這個(gè)過(guò)程了。所以還是要研究一些實(shí)際問(wèn)題,來(lái)獲得理解。