最近中文2019字幕第二页,艳妇乳肉豪妇荡乳,中日韩高清无专码区2021,中文字幕乱码无码人妻系列蜜桃,曰本极品少妇videossexhd

朱利平:統(tǒng)計(jì)與大數(shù)據(jù)(3)

摘要:信息爆炸的時(shí)代,產(chǎn)生了比以往任何時(shí)代都要多的海量數(shù)據(jù)。對(duì)大數(shù)據(jù)信息的應(yīng)用和獲取,已經(jīng)成為當(dāng)下最重要的技能之一。那么,我們應(yīng)該如何認(rèn)識(shí)統(tǒng)計(jì),認(rèn)識(shí)大數(shù)據(jù)?當(dāng)前有哪些數(shù)據(jù)類(lèi)型?我們又該如何分析不同的數(shù)據(jù),并從中提取有用信息?來(lái)自浙江大學(xué)高分子科學(xué)與工程學(xué)系的朱利平教授將結(jié)合生動(dòng)的案例,為您一一解答。

二、如何分析數(shù)據(jù)并從中提取有用信息

怎么分析數(shù)據(jù)?不同的數(shù)據(jù),我們有不同的分析方法。我盡可能用一些圖形來(lái)表達(dá)。

圖片6

比如上圖,一個(gè)自動(dòng)售貨機(jī)有五種飲料,分別是Coke Classic、Diet Coke、Pepsi、Sprite。這臺(tái)自動(dòng)售貨機(jī)一共有五款飲料,這五款飲料一共賣(mài)了50罐。這個(gè)例子我們?nèi)シ治鏊臅r(shí)候,常常會(huì)把它匯總,這個(gè)數(shù)據(jù)是一個(gè)名義變量。

圖片7

Coke賣(mài)了多少瓶,Diet Coke賣(mài)了多少瓶,Pepsi賣(mài)了多少瓶,Sprite賣(mài)了多少個(gè),總共賣(mài)了多少瓶,這是第一組最簡(jiǎn)單的分析。

圖片8

然后,你可能會(huì)統(tǒng)計(jì)一下每種賣(mài)出的飲料占賣(mài)出的總數(shù)的百分比,這是很容易算的。

圖片9

但是,我們看到更多的是圖形表達(dá),用柱狀圖展示每一種飲料賣(mài)了多少瓶,可能小學(xué)二年級(jí)就要開(kāi)始畫(huà)這個(gè)圖了。

<p>圖片10</p>

你還可以畫(huà)一個(gè)餅圖。你發(fā)揮自己的想象,想畫(huà)什么圖就畫(huà)什么圖。絕大部分時(shí)候,我們都是用圖形來(lái)表達(dá)我們所看到的一些數(shù)字。因?yàn)閳D形給大家看起來(lái)最直觀(guān)。大家在匯報(bào)某項(xiàng)工作時(shí),也可以盡可能地用圖形去表達(dá),因?yàn)閳D形去表達(dá)能夠讓你的上司在第一時(shí)間就知道你大概想表達(dá)的意思。你說(shuō)了很長(zhǎng)的話(huà),不如畫(huà)一個(gè)圖管用。所以,我們用得最多的還是各種各樣的圖形。

圖片11

有些數(shù)據(jù)是連續(xù)的,比如一門(mén)課旁聽(tīng)的情況,我們可以統(tǒng)計(jì)旁聽(tīng)了10天到14天的有多少人,15天到19天的有多少人,20天到24天的有多少人,這是個(gè)連續(xù)數(shù)據(jù)。一個(gè)連續(xù)的數(shù)據(jù),我們可以把它分段以后再統(tǒng)計(jì)出來(lái)??偣灿?0個(gè)人,其中有4個(gè)人旁聽(tīng)了10到14天,這個(gè)數(shù)據(jù)也會(huì)是常用的數(shù)據(jù)。為什么會(huì)是一個(gè)常用的數(shù)據(jù)呢?比如統(tǒng)計(jì)局就可以用這種統(tǒng)計(jì)方法去調(diào)查一下,有多少人的年收入在1000塊錢(qián)以下,有多少人的收入會(huì)在1001到2000元之間,有多少人收入在2001到3000元之間。這是按區(qū)間去分的,你的收入也會(huì)是一個(gè)連續(xù)的變量。

圖片12

數(shù)據(jù)分好區(qū)間之后,我們也可以把它做成各式各樣的表格。但是這個(gè)柱狀圖與之前飲料銷(xiāo)售情況的柱狀圖有區(qū)別。飲料銷(xiāo)售情況的柱狀圖中,Coke Classic、Diet Coke、Pepsi、Sprite的柱狀是分開(kāi)畫(huà)的,但是對(duì)連續(xù)的數(shù)據(jù)而言,我們常常會(huì)把它畫(huà)得連在一起。連在一起畫(huà),是表達(dá)數(shù)據(jù)本身類(lèi)型不同。連在一起與不連在一起所表達(dá)的含義也是不一樣的。

圖片13

大家看這個(gè)圖,這叫直方圖。左上角這個(gè)圖形左邊的“尾巴”很長(zhǎng),右上角的圖形右邊的“尾巴”很長(zhǎng),右下角的圖形右邊的“尾巴”是又瘦又長(zhǎng)。我們最常用的,可能是右下角這個(gè)圖形的,我們叫做數(shù)據(jù)有很大偏差。左下角這個(gè)圖形是指數(shù)據(jù)看起來(lái)比較對(duì)稱(chēng)。數(shù)據(jù)看起來(lái)比較對(duì)稱(chēng),是什么時(shí)候你會(huì)需要呢?我自己在高校工作,你的卷子出得好不好,如果考試的人足夠多,考80分的人應(yīng)該占大部分,考90分以上的人比較少,不及格的也不太多。也就是說(shuō),這個(gè)數(shù)據(jù)本身靠近正態(tài),那么這是大家認(rèn)為出得比較好的卷子。但現(xiàn)實(shí)中基本碰不到完全對(duì)稱(chēng)的情況。我們碰到的絕大多數(shù)圖形都是右下角這種圖形,這種圖形特別有用。有一本書(shū)叫《長(zhǎng)尾理論》,長(zhǎng)尾理論指的就是圖標(biāo)上那個(gè)“尾巴”拖得很長(zhǎng)的時(shí)候,如何在“尾巴”上賺錢(qián)。比如谷歌廣告,谷歌打廣告跟很多公司打廣告不一樣,他很少會(huì)去找一些特別大的公司打廣告,而是會(huì)找來(lái)一些小公司打廣告,那些公司都不太有名,但是他從每個(gè)公司下面賺少一點(diǎn)錢(qián),最后合起賺一大筆錢(qián)。

責(zé)任編輯:葉其英校對(duì):楊雪最后修改:
0

精選專(zhuān)題

領(lǐng)航新時(shí)代

精選文章

精選視頻

精選圖片

微信公眾平臺(tái):搜索“宣講家”或掃描下面的二維碼:
宣講家微信公眾平臺(tái)
您也可以通過(guò)點(diǎn)擊圖標(biāo)來(lái)訪(fǎng)問(wèn)官方微博或下載手機(jī)客戶(hù)端:
微博
微博
客戶(hù)端
客戶(hù)端