第三,統計改變了生活。講幾個我們身邊的統計學故事。
第一個故事:文學家王蒙先生的統計悟性。有一天,王蒙先生在北戴河海濱遇到一個騙人的游戲,一個經營游戲者放四種顏色的玻璃球在口袋里,每種顏色的球都是五個,讓人從口袋里摸出十個球,并規(guī)定了摸出不同球的比例下的不同獎懲辦法。王蒙先生發(fā)現,十有八九摸出來的球得不到獎?;丶液螅趺删桶凑者@種玩法用撲克牌或是麻將做過實驗,同樣得獎的概率是小概率。王蒙先生不懂統計、不懂數學,他就寫了一篇小文,認為命運是數學的公式和規(guī)律,數學就是上帝,就是主——總想得到好運不是完全不可能,只是機會極少、概率極低。所以,在生活中,我們可以少一點怨天尤人,少一點憤憤不平。從這篇文章中可以看出王蒙先生深刻的思想內涵和人生悟性。“三個代表”提出的“最廣大人民群眾”,在統計學中是眾數的思想。我們都是蕓蕓眾生中的一員,應用平和的態(tài)度、平靜的心情對待生活、對待人生。
第二個故事:有了統計學,世上沒有破譯不了的密碼。密碼也是有規(guī)律的,只是和正常的文字排列規(guī)律不同,沒有規(guī)律的密碼是鬼畫符,不僅敵人看不懂,自己人也看不懂,起不到傳輸信息的作用。統計學可以尋找出密碼的規(guī)律,將其破譯。最古老的密碼是公元前五世紀使用的置換密碼,其規(guī)律是:每一個字母由它后面的第三個或第K個字母來替代,如何確定K值就是破譯的關鍵。這時需要用到概率統計原理。經過研究大量的文獻索引,統計學家得出來英文字母出現頻率表,例如A出現的頻率是0.0856,B是0.0139,而出現頻率最多的是E,為0.1304,這樣我們把它可以作為一個總體或是訓練樣本。當接到這樣一個密文:wklvyhulilrughubrxjdyhphdwwkhphhwlqjlqpbrilifh。密文中出現頻率最大的字母是h。我們就假定h就是e,那么可得出K=3,于是經過調整得到相應的有明確意義的明文就是:thisverifiorderyougavemeatthemeetinginmyoffice。這句話沒有特別明確的含義,可能是暗語,但已經像一句話了。這就是因為英文字母出現頻率表是從大量的文獻中得出的,有統計規(guī)律性。而密文字數太少,規(guī)律性可能有偏差。根據上下文的含義和當時的背景,可以做一些小的估計,就有可能得到較為準確的意思。現在的科學技術使密碼變異更加復雜,破譯的難度很大,但間諜中有一句名言:世界上沒有破譯不了的密碼,只是時間問題,因為有了統計學。統計學、代數學為我們破譯密碼提供了良好的工具。
第三個故事:曹雪芹懂統計么?《紅樓夢》第六十三回寶玉過生日,晚上請來了林黛玉、史湘云、薛寶釵、李紈、探春、薛寶琴等在怡紅院玩擲骰子抽簽的游戲。大家圍成一團,按照搖出骰子的點數數到誰,誰就從簽筒里抽出一根簽,按照簽上的要求或罰做詩、或罰喝酒。我們感興趣的是四個骰子出現的點數分布。假設這四顆骰子均為沒有出老千的骰子,經計算其分布,如無限次數的扔硬幣,正反面概率為1/2,那么扔一個骰子每個面出現的概率就是1/6,同時扔四個就要算一算了。人民大學袁衛(wèi)教授把它算出來了,有四個參數:點數、理論頻數、頻率(概率)、實際頻數(賈寶玉和眾美女實際扔的次數)。賈寶玉和眾美女實際扔的次數一共扔了八次,分別是五點一次、六點一次、八點一次、十六點一次、十八點一次、十九點兩次、二十點一次。這些點數所相應對的概率都非常小,有六次結果是小于0.05的小概率。小概率在一次實驗中幾乎是不可能發(fā)生的,而曹雪芹先生竟搖了八次,就有六次結果是小概率。特別是晴雯和香菱分別搖出了0.0031、0.0077的小概率,相當于雨點打在香頭上。這該做何解釋呢?曹雪芹在寫這一回時,實際上事先確定了搖骰子的幾位人物,并為這些人物設定了骰子及詩詞作為與此人命運的寫照。如果曹雪芹有一點概率統計的知識,他就會合理安排人物的順序和給出合理的點數,就不會發(fā)生小概率了。所以,我們分析的結果是曹雪芹不懂統計。因為在曹雪芹的時代,西方的概率統計剛剛產生。
已有0人發(fā)表了評論