數(shù)理統(tǒng)計(jì)中假設(shè)檢驗(yàn)問(wèn)題的理解與思考

時(shí)間：2019-07-08 11:44:01

關(guān)鍵字：數(shù)學(xué) 統(tǒng)計(jì)學(xué)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]我不是試圖用通俗的語(yǔ)言來(lái)解釋清楚什么是假設(shè)檢驗(yàn)，如何去實(shí)踐。做到能用理論化的語(yǔ)言來(lái)描述和理解問(wèn)題是科研工作者應(yīng)該掌握的能力。其實(shí)這個(gè)不難，只要把基本問(wèn)題吃透了，就可以在基本問(wèn)題上繼續(xù)問(wèn)題。本文中

我不是試圖用通俗的語(yǔ)言來(lái)解釋清楚什么是假設(shè)檢驗(yàn)，如何去實(shí)踐。做到能用理論化的語(yǔ)言來(lái)描述和理解問(wèn)題是科研工作者應(yīng)該掌握的能力。其實(shí)這個(gè)不難，只要把基本問(wèn)題吃透了，就可以在基本問(wèn)題上繼續(xù)問(wèn)題。本文中主要解釋的是什么是假設(shè)檢驗(yàn)，一些相關(guān)的概念的理解，以及如何構(gòu)造檢驗(yàn)規(guī)則，構(gòu)造拒絕域。
1、統(tǒng)計(jì)假設(shè)檢驗(yàn)問(wèn)題 ? ? “假設(shè)檢驗(yàn)”，從字面上上理解就是先“假設(shè)”，后“檢驗(yàn)”的過(guò)程，“檢驗(yàn)”的對(duì)象當(dāng)然是之前的假設(shè)本身，有些情況下為了區(qū)分與其它學(xué)科的“假設(shè)”，研究統(tǒng) 計(jì)的人就用“統(tǒng)計(jì)假設(shè)”來(lái)描述統(tǒng)計(jì)上的假設(shè)問(wèn)題，既然我們研究統(tǒng)計(jì)，跟其它行業(yè)的人們打交道就較少了，所以我們有時(shí)候就會(huì)簡(jiǎn)稱(chēng)“統(tǒng)計(jì)假設(shè)”為“假設(shè)”了。
說(shuō)了半天，那，到底什么是“假設(shè)”呢？其實(shí)，在統(tǒng)計(jì)學(xué)中，“假設(shè)”目前主要有兩種，至少我沒(méi)有碰見(jiàn)其它“假設(shè)”類(lèi)型。（這里突出“兩種”，也是一種研究問(wèn) 題的方法學(xué)，在研究某個(gè)問(wèn)題的時(shí)候，能夠精確講問(wèn)題分類(lèi)，是一種必要的素質(zhì)）。一種是參數(shù)的假設(shè)，另一種是非參數(shù)的假設(shè)，后者好像概括了所有“不是第一種假設(shè)”的情況，其實(shí)不然，在實(shí)際研究中，人們把隨機(jī)變量分布的假設(shè)稱(chēng)為非參數(shù)的假設(shè)。為什么把分布的假設(shè)稱(chēng)為非參數(shù)的假設(shè)呢？一方面是因為它確實(shí)不是參數(shù) 的假設(shè)，另一方面，其它類(lèi)型的除了參數(shù)和分布的假設(shè)外，我們想不到其它東西的假設(shè)了，至少我沒(méi)有想到，也許真的存在，只是我還沒(méi) 有遇到，沒(méi)有學(xué)習(xí)過(guò)而已。
? ? 什么是參數(shù)的假設(shè)呢？實(shí)際就是對(duì)隨機(jī)變量分布中未知參數(shù)的假設(shè)。參數(shù)如果已知，我們沒(méi)有必要假設(shè)了呀！還有一個(gè)前提就是我們已知隨機(jī)變量的分布類(lèi)型。所謂分布，就是知道分布函數(shù)的類(lèi)型，已知分布函數(shù)的前提下，我們便知道了概率分布列（離散的），密度函數(shù)（連續(xù)情況）。還有未知參數(shù)的問(wèn)題，我們可以舉一個(gè)例子，比如某個(gè)隨機(jī)變量服從正太分布，大家都立馬想到正太分布的密度函數(shù)，這個(gè)函數(shù)中有兩個(gè)參數(shù)確定后，這個(gè)函數(shù)就可以來(lái)實(shí)際計(jì)算了，如果我們不知到其中一個(gè)，或者都不知道參數(shù)的值，那么我們就說(shuō)它是未知參數(shù)了。其實(shí)未知參數(shù)不是定義的，未知參數(shù)一般不會(huì)給出定義，是因?yàn)樗苋菀诐M 足所有人的思維邏輯。我們對(duì)某個(gè)參數(shù)作出假設(shè)，這就是參數(shù)的假設(shè)了。
? ? 什么是非參數(shù)的假設(shè)呢？大家在看書(shū)的時(shí)候，會(huì)看到書(shū)里大部分寫(xiě)的是“非參數(shù)假設(shè)”，只是少個(gè)“的”而已，但是這種缺省就很容易導(dǎo)致不在一個(gè)思維邏輯上的人們產(chǎn)生迷惑，當(dāng)然也正是很多學(xué)科中存在這樣或者那樣的迷惑才嚇退一些人來(lái)保證少部分人掌握這些迷惑背后的東西，不信你想想什么EM啊，什么 SIFT，什么支撐向量機(jī)（SVM）呀，多么讓人迷惑的東西啊。當(dāng)然，你知道了缺省的存在，或者迷糊背后美妙的結(jié)論，就沒(méi)什么可怕的了。前面也說(shuō) 過(guò)了，就是隨機(jī)變量分布的假設(shè)，我們稱(chēng)為非參數(shù)的假設(shè)。比如我們研究世界人民的身高的分布情況，我們現(xiàn)在不知道身高這個(gè)數(shù)字特征定義的隨機(jī)變量服從什么分布，我們就可以假設(shè)他是某個(gè)分布，這個(gè)就是非參數(shù)的假設(shè)問(wèn)題了。
檢驗(yàn)?zāi)?？什么是檢驗(yàn)？前面給出了假設(shè)，對(duì)假設(shè)進(jìn)行判斷的過(guò)程就叫檢驗(yàn)了。我們怎么檢驗(yàn)?zāi)兀渴且M織構(gòu)造一個(gè)檢驗(yàn)規(guī)則的，然后根據(jù)這個(gè)規(guī)則來(lái)檢驗(yàn)之前的假設(shè)，這樣在邏輯上大家都說(shuō)的過(guò)去。
2、檢驗(yàn)規(guī)則構(gòu)造的思考 ? ? 我們從犯錯(cuò)誤的角度來(lái)構(gòu)造檢驗(yàn)規(guī)則。如果你看書(shū)，也許或者很有可能，書(shū)里面并沒(méi)有解釋?zhuān)谧鍪裁?，而是給出邏輯推理過(guò)程后，給出你他們的動(dòng)機(jī)。不過(guò)現(xiàn)在你不用擔(dān)心了，我已經(jīng)告訴你我的動(dòng)機(jī)了。當(dāng)然我這樣做也可能違背了提出“假設(shè) 檢驗(yàn)”問(wèn)題的人的原始意愿，但是這起碼是一種理解問(wèn)題的方式，盡管他可能有所偏差。（一切皆有可能，基于這個(gè)原理，我會(huì)在講述過(guò)程中說(shuō)明某些屬于小概率事件的事情）。?
? ? 為了有理論依據(jù)，數(shù)學(xué)上給出一些符號(hào)來(lái)標(biāo)記，文字上給出一些定義用來(lái)說(shuō)明問(wèn)題。首先H_0 這個(gè)數(shù)學(xué)符號(hào)用來(lái)表示“原”假設(shè)，H_1這個(gè)符號(hào)用來(lái)表示“備擇”假設(shè)，可以理解為“準(zhǔn)備選擇的”假設(shè)，至于為什么這樣理解，其實(shí)等我們熟悉了這套理論之后，我們就會(huì)明白往往拒絕H_0這個(gè)結(jié)論更具有說(shuō)服力（這是基于小概率原理的），不過(guò)如果大家沒(méi)多少概念，也沒(méi)有關(guān)系，后面我會(huì)試圖一點(diǎn)點(diǎn)的解釋清楚，力圖讓你豁然開(kāi)朗，當(dāng)然你沒(méi)有耐心看下去，我也沒(méi)有能力讓你理解這一且的。
? ? 我們可用的數(shù)據(jù)只有樣本，或許還有一些已知的參數(shù)，那我們應(yīng)該努力使用這些已知的東西來(lái)構(gòu)造檢驗(yàn)準(zhǔn)則。記住這一點(diǎn)！
? ? 為了弄出檢驗(yàn)準(zhǔn)則，我們先從結(jié)果考慮。不管作出什么選擇，我們的總會(huì)有出現(xiàn)錯(cuò)誤的可能，幸運(yùn)的是我們只會(huì)犯兩個(gè)錯(cuò)誤，一個(gè)錯(cuò)誤是H_0實(shí)際上是正確的，我們根據(jù)我們的檢驗(yàn)規(guī)則，判斷H_0是錯(cuò)誤的了，這種錯(cuò)誤我們稱(chēng)他為第一類(lèi)錯(cuò)誤，統(tǒng)計(jì)中，我們稱(chēng)“判斷H_0正確”為“接受H_0”，相反為 “拒絕H_0”，第一類(lèi)錯(cuò)誤也就可以說(shuō)成拒絕真值的錯(cuò)誤了，為了高深一點(diǎn)，大家會(huì)說(shuō)，這個(gè)叫“拒真”。另一種錯(cuò)誤，就是第二類(lèi)錯(cuò)誤，就是“在H_0錯(cuò)誤的情況下，根據(jù)判決規(guī)則判斷H_0正確”，這種錯(cuò)誤也可以叫“取偽”。
? ? 那我們是根據(jù)樣本觀測(cè)值給出判斷的吧，我們就必須把樣本觀測(cè)值搞成兩個(gè)集合，我們做實(shí)驗(yàn)后，樣本觀測(cè)值屬于了某個(gè)集合，我們作出相應(yīng)的判斷，即接受或拒絕 H_0，我們?cè)倨鹨粋€(gè)名字，就是包含可以用來(lái)拒絕H_0的那個(gè)樣本觀測(cè)值的所在的集合，我們稱(chēng)之為“拒絕域”。既然有了拒絕域，相應(yīng)的我們?cè)?給另一個(gè)可以用來(lái)接受H_0的樣本觀測(cè)值的集合叫做“接受域”，這樣理解非常符合邏輯。其實(shí)我敘述接受域和拒絕域的過(guò)程，就是構(gòu)造檢驗(yàn)規(guī)則的一種邏輯想法，為什么說(shuō)這種想法是邏輯的呢？因?yàn)槲抑挥袠颖居^測(cè)值可以使用的情況下（某些情況可能知道更多），我很自然的想到使用樣本觀測(cè)值來(lái)檢驗(yàn)假設(shè)，我既然有兩個(gè)選擇（接受和拒絕H_0），那么我就把樣本觀測(cè)值的所有可能結(jié)果（有些書(shū)也稱(chēng)他為樣本空間，當(dāng)然樣本空間的理解是正確的，我只是沒(méi)怎么用）分成兩個(gè)集合，一個(gè)稱(chēng)之為拒絕域（我們記為W），一個(gè)稱(chēng)之為接受域（記為!W），相應(yīng)的，當(dāng)樣本觀測(cè)值落在拒絕域中的時(shí)候，我們拒絕H_0，相反接受H_0 。知道了這些，前面我們提到的“拒真”就可以表示出它的概率形式了。P((X_1,X_2,...,X_n) in W | H_0實(shí)際為真) = alpha，表示的是實(shí)際H_0為真的條件下，樣本觀測(cè)值落在了拒絕域中的概率，用alpha來(lái)表示它的結(jié)果，自然我們會(huì)想，如果我們的H_0是真的，那么樣本觀測(cè)值就應(yīng)該很難落在拒絕域中，也就是說(shuō)在假設(shè)為真時(shí)，“我們的樣本觀測(cè)值落在拒絕域中”這個(gè)事件是一個(gè)小概率事件，一般我們認(rèn) 為發(fā)生概率比較小的事件為小概率事件，這里“小”的度量根據(jù)實(shí)際問(wèn)題來(lái)定，根據(jù)小概率事件原理，即小概率事件在一次事件中認(rèn)為不會(huì)發(fā)生，如果發(fā)生了，我們就認(rèn)為這不是小概率事件了，往往這句話的前半句更容易接受一點(diǎn)，我們很難說(shuō)一個(gè)發(fā)生的事件不是小概率事件，這也就是為什么我們更愿意得到拒絕H_0的原因。這個(gè)原理看起來(lái)有太大人為思想了，我們還是承認(rèn)他，就是在沒(méi)有完美解決方案的情況下，退而求其次的結(jié)果呀。
? ? 那到底如何給出我們談?wù)摰倪@個(gè)“拒絕域”呢？這個(gè)一般根據(jù)具體情況而定，不過(guò)套路還是差不多的，一般都會(huì)用統(tǒng)計(jì)量的某些規(guī)則來(lái)給出拒絕域。
? ? 需要說(shuō)明一下的是，很多情況下，我們也希望取偽概率要盡可能小，但是我們很難都照顧到，所以我們又找了個(gè)簡(jiǎn)單的做，就是只考慮拒真概率盡可能小，
? ?首先給出一個(gè)小概率值alpha（比如取0.05），來(lái)限定拒真概率以便給出拒絕域。這里數(shù)學(xué)家給了一個(gè)名字，叫顯著性水平，alpha值越小，顯著性水平就越低，說(shuō)明的是小概率發(fā)生的概率就越低。對(duì)于參數(shù)的建設(shè)檢驗(yàn)問(wèn)題，我們要構(gòu)造一個(gè)估計(jì)這個(gè)參數(shù)的統(tǒng)計(jì)量。然后我們?cè)贖_0為真的前提下，找到這個(gè)統(tǒng)計(jì)量的分布。找到分布就成功了一大步了。下一步也很關(guān)鍵，這一步是根據(jù)原假設(shè)H_0的形式進(jìn)行的，這一步我們用例子說(shuō)明，這一步完成了，任務(wù)基本上完成了。

? ?例子，有一堆鉛筆要出廠啊，根據(jù)經(jīng)驗(yàn)，該廠的鉛筆長(zhǎng)度滿足正態(tài)分布，方差已知為sigma^2，假設(shè)某個(gè)組織給了一個(gè)標(biāo)準(zhǔn)，說(shuō)鉛筆的長(zhǎng)度的期望為 u_0才能合格。

? ? ? ?那我們就設(shè)H_0: u = u_0， H_1:u!=u_0。我們找一個(gè)估計(jì)u的統(tǒng)計(jì)量，就用樣本均值了，由于CSDN我編輯不了X的上面畫(huà)個(gè)橫線，我就用Y表示樣本均值了。樣本容量為n，那么(Y- u)sqrt(n)/(sigma)就服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)了，在H_0為真的條件下，就是說(shuō)u=u_0的條件下，T=(Y- u_0)sqrt(n)/(sigma)就是一個(gè)統(tǒng)計(jì)量了，這個(gè)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布。我們就是要根據(jù)這個(gè)統(tǒng)計(jì)量來(lái)尋找拒絕域。觀察T這個(gè)統(tǒng)計(jì)量，當(dāng)樣本均值Y與u_0接近的越近，我們就更容易接受H_0，也就是說(shuō)當(dāng)樣本均值遠(yuǎn)離u_0的時(shí)候，在總體數(shù)學(xué)期望為u_0的條件下，發(fā)生這個(gè)的概率比較小，也是為了限定這個(gè)小的程度，我們給定一個(gè)數(shù)值，比如我們前面提到的alpha=0.05，這個(gè)可以在不同的場(chǎng)合下給出不同的值，這里我只是隨便給出的一個(gè)值而已。拒真的概率為 P(|T|>u_x) = alpha, 根據(jù)標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)性質(zhì)，u_x = u_{alpha/2}。根據(jù)|T|>u_x這個(gè)不等式，我們就可以來(lái)限制拒絕域了。W = {(x_1,...x_n) | |T|>u_x}。后面做判斷就水到渠成了。

?3、總結(jié)一下
? ?本文中主要討論的是參數(shù)的假設(shè)檢驗(yàn)問(wèn)題。 ?在統(tǒng)計(jì)中，假設(shè)檢驗(yàn)的關(guān)鍵問(wèn)題是如何構(gòu)造統(tǒng)計(jì)量。然后是如何思考選定拒絕域。多多訓(xùn)練之后，我們就自然明白這個(gè)過(guò)程了。所以還是要研究一些實(shí)際問(wèn)題，來(lái)獲得理解。