在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

<menu id="6qfwx"><li id="6qfwx"></li></menu>
    1. <menu id="6qfwx"><dl id="6qfwx"></dl></menu>

      <label id="6qfwx"><ol id="6qfwx"></ol></label><menu id="6qfwx"></menu><object id="6qfwx"><strike id="6qfwx"><noscript id="6qfwx"></noscript></strike></object>
        1. <center id="6qfwx"><dl id="6qfwx"></dl></center>

            博客專欄

            EEPW首頁 > 博客 > 一文讀懂因果推斷的起源

            一文讀懂因果推斷的起源

            發(fā)布人:數(shù)據(jù)派THU 時(shí)間:2020-09-29 來源:工程師 發(fā)布文章

            來源:翻譯教學(xué)與研究

            編者按:斯特勞森曾說,邏輯不是先驗(yàn)的,它與語言密不可分。這就是說,人類認(rèn)知世界的工具——如數(shù)學(xué)推理,邏輯推理,理性,都是語言的產(chǎn)物。這意味著說,人類認(rèn)知世界的能力是有局限性的,就像伽達(dá)默爾所說,語言就像是黑屋子中的手電筒,光柱照到哪里,我們就看到哪里。這是這篇文章讓我聯(lián)想到的東西。如果您對(duì)語言哲學(xué)感興趣的話,這篇文章值得一讀。

            ——翻譯教學(xué)與研究

            北京大學(xué)數(shù)學(xué)科學(xué)學(xué)院耿直教授開設(shè)的《普通統(tǒng)計(jì)學(xué)》課程是本學(xué)期的通識(shí)核心課程之一。

            今天為大家?guī)淼氖枪⒅苯淌谒扑]的文章。該文章出自朱迪亞·珀?duì)栔稙槭裁矗宏P(guān)于因果關(guān)系的新科學(xué)》(中信出版集團(tuán)股份有限公司 2019.7.1)中第二章選段,介紹了關(guān)于因果推斷的起源。

            因果推斷的起源

            朱迪亞·珀?duì)?/strong>

            但它(地球)仍在動(dòng)。

            ——出自伽利略(1564—1642)

            弗朗西斯·高爾頓爵士在皇家學(xué)院展示他的“高爾頓板”(Galton board)或稱“梅花機(jī)”(quincunx)。

            他將這種類似彈珠臺(tái)的儀器看作對(duì)基因特性(如身高)遺傳的類比。彈球會(huì)堆積成一個(gè)上邊緣為鐘形曲線的圖案,該曲線與人類身高的分布曲線非常相似。那么,為什么人類一代傳一代,其身高分布并沒有像彈球那樣散開?這一難題引領(lǐng)他走向了“向均值回歸”(regression to the mean)現(xiàn)象的發(fā)現(xiàn)。(資料來源:由達(dá)科塔·哈爾繪制。)

            近兩個(gè)世紀(jì)以來,英國科學(xué)界最經(jīng)久不衰的儀式之一便是在倫敦的英國皇家學(xué)院舉辦的“周五晚間演講”。

            19世紀(jì),很多重****現(xiàn)都是在這個(gè)會(huì)場上由演講者首次對(duì)外宣布的:1839年,邁克爾·法拉第發(fā)表了他的攝影原理;1897年,約瑟夫·湯姆遜提出了電子理論;1904年,詹姆斯·杜瓦公布了氫液化理論。

            每場演講會(huì)都是一次盛典,毫不夸張地說,演講會(huì)就是把科學(xué)當(dāng)作舞臺(tái),而臺(tái)下的觀眾則是精心打扮(男人必須身著禮服,佩戴黑領(lǐng)帶)的英國社會(huì)上層精英。到了指定的時(shí)間,鐘聲敲響,人們將迎接晚會(huì)的發(fā)言人步入禮堂。依照傳統(tǒng),發(fā)言人會(huì)省去自我介紹或開場白,直接開始演講。實(shí)驗(yàn)和現(xiàn)場演示都是這一壯觀場面的重要組成部分。

            1877年2月9日那天晚上的演講者是弗朗西斯·高爾頓,英國皇家學(xué)院院士,他是查爾斯·達(dá)爾文的大表弟,著名的非洲探險(xiǎn)家、指紋學(xué)創(chuàng)始人,維多利亞時(shí)期紳士科學(xué)家的典范。高爾頓演講的題目是“典型的遺傳規(guī)律”。當(dāng)晚,他的實(shí)驗(yàn)儀器是一種奇怪的裝置,他稱之為“梅花機(jī)”,現(xiàn)在該裝置常被稱為“高爾頓板”。一個(gè)名為Plinko的類似游戲常出現(xiàn)在電視節(jié)目《價(jià)格猜猜看》中。高爾頓板由一塊木板和其上按三角形陣列排布的大頭針或釘子組成,操作者可以通過頂部的開口塞入小金屬球。金屬球會(huì)像彈球那樣從上往下逐層彈跳下來,最后落進(jìn)底部的一排插槽中(見章首插圖)。對(duì)單個(gè)金屬球來說,向左或向右彈落看上去完全是隨機(jī)的。

            然而,如果你往高爾頓板里倒入很多小球,一個(gè)驚人的規(guī)律就出現(xiàn)了:在底部堆積的小球的上邊緣總是會(huì)形成一個(gè)近似鐘形的曲線。在最接近中心的插槽中,小球會(huì)堆得高高的,插槽中的球數(shù)從中間向兩側(cè)遞減,直至為零。

            這種規(guī)律性的圖形模式有一個(gè)數(shù)學(xué)解釋:單個(gè)球下落的整個(gè)路徑就像一系列獨(dú)立的硬幣拋擲的結(jié)果一樣。小球每撞上一根大頭針,其或者彈向左邊,或者彈向右邊,表面上看,它的選擇似乎是完全隨機(jī)的。而所有結(jié)果之和,即往右彈落的次數(shù)與往左彈落的次數(shù)之差,則確定了小球最終會(huì)落于哪個(gè)插槽。根據(jù)1810年由皮埃爾–西蒙·拉普拉斯證明的中心極限定理[1],任何此類隨機(jī)過程,即多次硬幣拋擲之總效,都會(huì)導(dǎo)向相同的概率分布,這種概率分布被稱為正態(tài)分布(或鐘形曲線)[2]。高爾頓板只是拉普拉斯中心極限定理的一個(gè)直觀演示。

            中心極限定理確實(shí)是19世紀(jì)的數(shù)學(xué)奇跡。試想一下:雖然單個(gè)球的路徑是不可預(yù)測的,但1000個(gè)球的路徑的可預(yù)測性則非常高,這對(duì)《價(jià)格猜猜看》的制片人來說是一個(gè)很實(shí)用的事實(shí)。他們可以據(jù)此準(zhǔn)確估算出在較長一段時(shí)間內(nèi)參賽者在Plinko游戲中贏得的獎(jiǎng)金數(shù)量。此外,盡管人類事物充斥著不確定因素,但同樣的規(guī)律仍然讓保險(xiǎn)公司獲利豐厚。

            皇家學(xué)院中穿著考究的觀眾一定想知道這一切與遺傳規(guī)律到底有什么關(guān)系,因?yàn)檫@是發(fā)言人約定的演講主題。為了說明二者的聯(lián)系,高爾頓向觀眾展示了他所收集的關(guān)于法國軍隊(duì)新兵身高的數(shù)據(jù)。這些數(shù)據(jù)也遵循正態(tài)分布:多數(shù)人是中等身材,特別高或特別矮的人很少。事實(shí)上,無論我們談?wù)摰氖?000名新兵的身高還是高爾頓板上的1000個(gè)小球的路徑,相對(duì)應(yīng)的插槽和身高類別中的數(shù)字幾乎總是相同的。

            因此,對(duì)高爾頓來說,梅花機(jī)就是一種關(guān)于身高遺傳的模型,甚至可能也是關(guān)于許多其他遺傳特征的模型。這是一個(gè)因果模型。簡單來說,高爾頓相信,就像人類會(huì)遺傳他們上一代的身高一樣,金屬小球也會(huì)“遺傳”它們?cè)诿坊C(jī)中的位置。

            但是,如果我們暫且接受這個(gè)模式,就會(huì)出現(xiàn)一個(gè)難題,這也是高爾頓當(dāng)晚的主題。鐘形曲線的寬度取決于放置在釘板頂部和底部之間釘子的行數(shù)。假設(shè)我們將行數(shù)加倍,我們就構(gòu)建了一個(gè)能夠表示兩代遺傳的模型,其中上半部分代表第一代,下半部分代表第二代。此時(shí)你就會(huì)發(fā)現(xiàn),第二代比第一代出現(xiàn)了更多的變異情況,而在隨后的幾代中,鐘形曲線會(huì)變得越來越寬。

            然而,人類身高的真實(shí)狀況并未出現(xiàn)此種趨勢。事實(shí)上,隨著時(shí)間的推移,人類身高分布的寬度保持了相對(duì)的恒定。一個(gè)世紀(jì)前沒有身高9英尺[3]的人類,現(xiàn)在依然沒有。那么,是什么因素解釋了這種總體基因遺傳的穩(wěn)定性呢?自1869年高爾頓的《世襲的天才》(Hereditary Genius)出版以來,他已為這一謎題苦苦思索了八年。

            正如書名所表明的,高爾頓真正感興趣的不是彈珠游戲或人的身高,而是人類的智力。作為孕育了多位科學(xué)天才的大家族的成員之一,高爾頓自然樂意證明天賦在家族中代代相傳。他在這本書中著手做的正是這項(xiàng)研究。他煞費(fèi)苦心地編纂了605名英國“名門之秀”上溯4個(gè)世紀(jì)的家譜。但他發(fā)現(xiàn),這些名門之秀的兒子和父親并沒有那么優(yōu)秀,其祖父母和孫輩也并非都是卓越人才。

            如今我們可以很容易地找到高爾頓研究方法中的缺陷。歸根結(jié)底,卓越的定義究竟是什么?有沒有這種可能,即名門望族的成員獲得成功只是因?yàn)樗麄冋莆盏奶貦?quán)而不是因?yàn)槠浔旧淼牟拍埽勘M管高爾頓意識(shí)到了這種可能的解釋,但他初心不改,反而以更大的決心徒勞地尋求一個(gè)的遺傳學(xué)解釋。

            不過,高爾頓在此過程中還是有所發(fā)現(xiàn)的,特別是當(dāng)他開始關(guān)注類似身高這樣的遺傳特征的時(shí)候。與“卓越”相比,身高特征更易測量,跟遺傳的關(guān)聯(lián)也更強(qiáng)。高個(gè)子男性的兒子往往身高也比普通人高——但很可能不如他們的父輩高;矮個(gè)子男性的兒子往往身高比一般人矮——但很可能不如他們的父輩矮。一開始,高爾頓稱這種現(xiàn)象為“復(fù)歸”(reversion),后又改稱為“向均值回歸”(regression toward mediocrity)[4]。我們可以在許多其他的情境中觀察到這種現(xiàn)象。如果讓學(xué)生參加基于同樣復(fù)習(xí)資料的兩次不同的標(biāo)準(zhǔn)化測試,那么,第一次測試得分較高的學(xué)生在第二次測試中的得分通常仍然高于均值,但沒有第一次那么高。這種向均值回歸的現(xiàn)象普遍存在于生活、教育和商業(yè)領(lǐng)域的方方面面。比如,棒球賽中的“年度新秀”(第一賽季表現(xiàn)異常出色的球員)經(jīng)常會(huì)遭遇“新秀墻”,即在次年的比賽中陷入表現(xiàn)欠佳的低谷。

            當(dāng)然,高爾頓并不知道這些,他認(rèn)為他偶然發(fā)現(xiàn)的是一條遺傳規(guī)律,而不是統(tǒng)計(jì)規(guī)律。他認(rèn)為,向均值回歸的背后一定存在某個(gè)因。在皇家學(xué)院的講座中,他說明了自己的觀點(diǎn)。他向聽眾展示了兩層的梅花機(jī)裝置(見圖2.1)。

            1601374662483738.jpg

            圖2.1高爾頓板

            圖2.1 高爾頓板,弗朗西斯·高爾頓用以類比人類的身高遺傳規(guī)律。(a)將許多小球扔進(jìn)彈球儀器,隨機(jī)向下彈跳的小球堆積成鐘形曲線。(b)高爾頓指出,經(jīng)過A和B兩個(gè)通道,通過兩層的高爾頓板(用以模擬兩代人)下落的小球所堆積成的鐘形曲線會(huì)變得更寬。(c)為了抵消這種曲線變寬的趨勢,他安裝了斜槽,以使“第二代”小球回到中心。斜槽是高爾頓對(duì)“向均值回歸”這一現(xiàn)象的因果解釋(資料來源:弗朗西斯·高爾頓《自然遺傳》,1889)

            經(jīng)過第一組釘子陣列后,小球會(huì)通過一個(gè)斜槽向板子的中心集中,之后再通過第二組釘子陣列。高爾頓借助這一成功的演示,展示出斜槽的設(shè)置恰好抵消了正態(tài)分布的擴(kuò)散趨勢。這一次,鐘形曲線在代代傳遞中保持了恒定的寬度。

            因此,高爾頓推測,向均值回歸是一個(gè)物理過程,一種自然方式,用以確保身高(或智力)的分布在代代相傳中保持恒定。高爾頓告訴觀眾:“復(fù)歸過程符合遺傳變異的一般規(guī)律?!彼麑⑦@一過程與胡克定律進(jìn)行了比較,后者描述的是彈簧恢復(fù)到穩(wěn)態(tài)長度的趨勢。

            請(qǐng)記住這個(gè)日子。1877年,高爾頓致力于尋求一個(gè)因果解釋,并認(rèn)為向均值回歸是一個(gè)因果過程,就像物理定律一樣。他錯(cuò)了,但他的錯(cuò)誤絕非個(gè)例。時(shí)至今日,許多人仍在繼續(xù)犯著同樣的錯(cuò)誤。例如,棒球?qū)<铱偸窃噲D尋找球員遭遇新秀墻的因果解釋。他們會(huì)抱怨,“他變得過度自信了”,或者“其他球員搞清楚了他的弱點(diǎn)”。他們也許是對(duì)的,但新秀墻實(shí)際上并不需要一個(gè)因果解釋,這種現(xiàn)象單憑概率規(guī)則就足以解釋了。

            現(xiàn)代統(tǒng)計(jì)學(xué)的解釋很簡單。正如丹尼爾·卡尼曼在他的著作《思考,快與慢》中總結(jié)的:“成功=天賦+運(yùn)氣,巨大的成功=更多的天賦+更多的運(yùn)氣。”一個(gè)贏得年度最佳新秀獎(jiǎng)的球員可能的確比一般人更有才華,但他(更)可能也有很多的運(yùn)氣。在下個(gè)賽季,他可能就沒有那么幸運(yùn)了,他的平均擊球率也會(huì)因此下降。

            到1889年,高爾頓已想通了這一點(diǎn)。在此過程中,他在統(tǒng)計(jì)學(xué)脫離因果關(guān)系的路上邁出了第一大步。這既讓人失望,也令人著迷。他的推理過程是微妙而晦澀的,但值得我們付出努力去理解。這是作為新生學(xué)科的統(tǒng)計(jì)學(xué)發(fā)出的第一聲啼哭。

            高爾頓開始收集各種“人體測量”方面的統(tǒng)計(jì)數(shù)據(jù):身高、前臂長度、頭部長度、頭部寬度等。他注意到,譬如當(dāng)他根據(jù)前臂長度計(jì)算身高時(shí),同樣的向均值回歸的現(xiàn)象又出現(xiàn)了:高個(gè)子男性通常有長度大于均值的前臂,但又不會(huì)像他的身高那樣遠(yuǎn)高于均值。顯然,身高不是前臂長度的因,反之亦然。如果存在一個(gè)原因的話,那么應(yīng)該說二者都是由基因遺傳決定的。高爾頓開始使用一個(gè)新的詞來描述這種關(guān)系:身高和前臂長度是“共同相關(guān)的”(co-related)。之后,他又將這個(gè)詞簡化為一個(gè)更普通的英語單詞——“相關(guān)的”(correlated)。

            后來,他又意識(shí)到一個(gè)更令人吃驚的事實(shí):在進(jìn)行代際比較時(shí),向均值回歸的時(shí)間順序可以逆轉(zhuǎn)。也就是說,子輩的父輩的遺傳特征情況也會(huì)回歸到均值。即兒子的身高若高于均值,則其父親的身高很可能也高于均值,但往往父親要比兒子矮(見圖2.2)。在意識(shí)到這一點(diǎn)時(shí),高爾頓不得不放棄了尋找向均值回歸的因果解釋的任何想法,因?yàn)樽虞叺纳砀唢@然不可能是父輩身高的因。

            1601374711297723.jpg

            圖2.2散點(diǎn)圖

            圖2.2 散點(diǎn)圖顯示了有關(guān)身高的數(shù)據(jù)集,每個(gè)點(diǎn)代表的是父親的身高(x軸)和他兒子的身高(y軸)的組合。虛線與橢圓的主軸重合,而實(shí)線(我們稱其為回歸線)連接了橢圓最右邊和最左邊的點(diǎn)。二者之間的差異就是向均值回歸的體現(xiàn)。例如,橢圓中的黑色星號(hào)顯示,父輩身高為72英寸,則其子輩平均身高為71英寸,即圖中垂直框中所有數(shù)據(jù)點(diǎn)的平均值為71英寸。水平框和白色星號(hào)顯示的是在非因果方向(時(shí)間逆轉(zhuǎn)方向)存在同樣的身高損失現(xiàn)象(資料來源:馬雅·哈雷爾繪圖,克里斯托弗·布歇供稿)

            這種認(rèn)識(shí)乍聽起來可能自相矛盾。你可能要問:“等等!你是說,高個(gè)子的父親通常有相較他們自己而言較矮的兒子,并且同時(shí),高個(gè)子的兒子通常有相較他們自己而言較矮的父親——這兩種說法怎么可能同時(shí)為真?兒子怎么可能既比父親高,又比父親矮?”

            答案是,我們談?wù)摰牟⒉皇莻€(gè)體的父親和個(gè)體的兒子,而是父輩和子輩兩個(gè)總體。我們從身高6英尺的父輩總體開始算起。因?yàn)樗麄兊纳砀吒哂诰?,所以他們兒子的身高將出現(xiàn)向均值回歸的現(xiàn)象,我們姑且假設(shè)他們兒子的平均身高為5英尺11英寸。然而,由父輩身高為6英尺的父子組合構(gòu)成的總體有別于由子輩身高為5英尺11英寸的父子組合構(gòu)成的總體。第一組中,所有的父親都是6英尺高。但第二組中,父親身高超過6英尺的較少,大部分身高不到6英尺,他們的平均身高要低于5英尺11英寸,再次顯示了向均值回歸的趨勢。

            另一種解釋向均值回歸的方法是使用所謂的散點(diǎn)圖(見圖2.2)。每對(duì)父子組合都由一個(gè)點(diǎn)來表示,其中x坐標(biāo)表示的是父親的身高,y坐標(biāo)表示的是兒子的身高。因而,父親和兒子的身高均為5英尺9英寸(或69英寸)的組合可以由點(diǎn)(69,69)來表示,如圖2.2所示,其位于散點(diǎn)圖的中心。身高6英尺(或72英寸)的父親和身高5英尺11英寸(或71英寸)的兒子的組合,則可以用點(diǎn)(72,71)表示,位于散點(diǎn)圖的東北角。請(qǐng)注意,散點(diǎn)圖的形狀大致呈橢圓形,這一點(diǎn)對(duì)于高爾頓分析以及揭示兩個(gè)變量的鐘形分布特征而言至關(guān)重要。

            如圖2.2所示,父輩身高為72英寸的父子組合的點(diǎn)位于以72為中心的垂直框(或稱“垂直切片”)內(nèi);子輩身高為71英寸的父子組合的點(diǎn)位于以71為中心的水平框(或稱“水平切片”)內(nèi)。通過觀察可見,它們是兩個(gè)不同的總體。如果只關(guān)注第一個(gè)總體,即父輩身高為72英寸的父子組合,我們可以問的問題是:其中子輩的平均身高是多少?這等于是在問垂直框的中心位置,通過觀察可知其中心大約是71。如果只關(guān)注第二個(gè)總體,即子輩身高為71英寸的父子,我們可以問的問題是:其中父輩的平均身高是多少?這等于是在問水平框的中心位置,通過觀察可知其中心大約是70.3。

            我們可以更進(jìn)一步考慮以同樣的步驟分析每一個(gè)垂直框。這就相當(dāng)于在問:對(duì)于身高為x的父輩,其子輩身高(y)的最佳預(yù)測是多少?或者,我們也可以取每個(gè)水平框,問它的中心在哪里,即對(duì)于身高為y的子輩,其父輩身高(x)的最佳“預(yù)測”(或倒推)是多少?

            通過思考這個(gè)問題,高爾頓無意間發(fā)現(xiàn)了一個(gè)重要事實(shí):預(yù)測總是落在一條直線上,他稱這條直線為回歸線,它比橢圓的主軸(或?qū)ΨQ軸)的斜率?。ㄒ妶D2.3)。事實(shí)上,這樣的直線有兩條,我們選擇哪條線作為回歸線取決于我們要預(yù)測哪個(gè)變量而將哪個(gè)變量作為證據(jù)。你可以根據(jù)父親的身高預(yù)測兒子的身高,或者根據(jù)兒子的身高“預(yù)測”父親的身高,這兩種情況是完全對(duì)稱的。這再次表明,對(duì)于向均值回歸這一現(xiàn)象,因和果是沒有區(qū)別的。

            1601374761107044.jpg

            圖2.3 高爾頓回歸直線

            圖中橫軸顯示的是子輩身高及偏差值,縱軸顯示了“中親”(mid-parents)[5]的身高及偏差值。如果你知道父親的身高,則直線OM將為你提供其兒子身高的最佳預(yù)測;如果你知道兒子的身高,則直線ON將為你提供其父親身高的最佳預(yù)測。這兩條直線都不同于散點(diǎn)圖中的主軸(對(duì)稱軸)(資料來源:弗朗西斯·高爾頓,《大不列顛和愛爾蘭人類學(xué)學(xué)院學(xué)報(bào)》,1886,第246–263頁,插圖X)

            在已知一個(gè)變量的值的情況下,回歸斜率能讓你預(yù)測另一個(gè)變量的值。在高爾頓的父子身高問題中,0.5的回歸斜率意味著父親的身高每增加1英寸,相應(yīng)地,兒子的平均身高就增加0.5英寸,反之亦然。回歸斜率為1表示兩個(gè)變量呈完全相關(guān),這意味著父親每增高1英寸,這一變化都能完全地傳遞給兒子,使其平均身高增加1英寸?;貧w斜率不可能大于1,否則高個(gè)子父親的兒子其身高會(huì)進(jìn)一步高于平均值,矮個(gè)子父親的兒子其身高會(huì)進(jìn)一步低于平均值,這將使得身高分布隨時(shí)間的推移而變寬。這樣一來,幾代后可能就會(huì)出現(xiàn)身高9英尺的人和身高2英尺的人了,而這與現(xiàn)實(shí)并不相符。因此,只要身高分布在世代相傳中保持不變,回歸線的斜率就不能大于1。

            即使我們將兩個(gè)不同類別的量關(guān)聯(lián)起來,如身高和智力,回歸定律依然適用。如果你在散點(diǎn)圖中繪制這兩個(gè)變量的數(shù)據(jù)點(diǎn),并對(duì)坐標(biāo)系進(jìn)行適當(dāng)?shù)目s放,則關(guān)于兩個(gè)變量之間關(guān)系的最佳擬合線的斜率總是具有相同的屬性:只有當(dāng)一個(gè)量可以準(zhǔn)確地預(yù)測另一個(gè)量時(shí),斜率才等于1;而若預(yù)測結(jié)果幾乎等同于隨機(jī)猜測,則斜率等于0。無論你是根據(jù)Y預(yù)測X,還是根據(jù)X預(yù)測Y,斜率(在對(duì)坐標(biāo)系進(jìn)行了適當(dāng)縮放之后)都是相同的。換言之,斜率完全不涉及因果信息。一個(gè)變量可能是另一變量的因,或者它們都是第三個(gè)變量的果,而對(duì)于預(yù)測目標(biāo)變量的值這一目的而言,這些并不重要。

            高爾頓提出的相關(guān)性概念首次在不依賴于人的判斷或解釋的前提下以客觀度量說明了兩個(gè)變量是如何關(guān)聯(lián)的。這兩個(gè)變量可以是身高、智力或者收入,它們可以是因果的、相互獨(dú)立的或反因果的關(guān)系。相關(guān)性總是能夠反映出兩個(gè)變量間相互可預(yù)測的程度。高爾頓的弟子卡爾·皮爾遜后來推導(dǎo)出了一個(gè)(經(jīng)過適當(dāng)調(diào)整的)回歸線斜率公式,并稱之為“相關(guān)系數(shù)”。時(shí)至今日,當(dāng)我們想了解一個(gè)數(shù)據(jù)集中兩個(gè)不同變量的關(guān)聯(lián)有多強(qiáng)時(shí),相關(guān)系數(shù)依然是全世界統(tǒng)計(jì)學(xué)家計(jì)算的第一個(gè)數(shù)值。找到這樣一種通用的方式來描述隨機(jī)變量之間的關(guān)系,高爾頓和皮爾遜一定曾為此激動(dòng)不已。尤其是皮爾遜,在他的眼中,與相關(guān)系數(shù)這種在數(shù)學(xué)上清晰且精確的概念相比,那些關(guān)于因果的模糊而陳舊的概念似乎已經(jīng)完全過時(shí)而喪失科學(xué)性了。


            注釋:

            [1] 中心極限定理是概率論的“無冕之王”,高爾頓曾盛贊它所蘊(yùn)涵的宇宙秩序之美妙無可比擬,可見其對(duì)人類認(rèn)知的影響是多么深遠(yuǎn)?!g者注

            [2] 也稱作“高斯分布”,是高斯在研究誤差理論時(shí)首次明確提出的,其密度函數(shù)曲線關(guān)于均值對(duì)稱,中間高兩邊低。中心極限定理揭示了在一定的條件下為何正態(tài)分布是普遍存在的。——譯者注

            [3] 1英尺≈30.48厘米?!幷咦?/p>

            [4] 回歸“regression”一詞在英語中還有退化、退步、衰退、倒退的意思?!g者注

            [5] 女性的身高一般低于男性,因此高爾頓利用計(jì)算出的男女平均身高之比(1.08)將女性的身高乘以1.08換算成男性身高。高爾頓據(jù)此定義了“中親”(mid-parents)身高=1/2(父親的身高+1.08×母親的身高),用來計(jì)算父輩的身高。本書為了講述方便,將之簡化為父子身高?!g者注

            編輯:于騰凱

            校對(duì):洪舒越

            *博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

            dc相關(guān)文章:dc是什么


            fpga相關(guān)文章:fpga是什么




            關(guān)鍵詞:

            相關(guān)推薦

            技術(shù)專區(qū)

            關(guān)閉