你想用3000多個樣本折射幾億用戶的行為,這事荒不荒唐就不用說了
在美國,數(shù)據(jù)分析形成了一條完整的產(chǎn)業(yè)鏈,不少大學還設立了相關(guān)的碩士學位,而在中國,這種傳道也正如燎原之火。在去年,一名叫王煜全的天使投資人曾經(jīng)和涂子沛同臺演講,和涂子沛一樣,他也是數(shù)據(jù)的忠實信徒,“自己現(xiàn)在會投的創(chuàng)業(yè)者,必須有數(shù)據(jù)分析技術(shù),否則免談”。
在王煜全看來,在傳統(tǒng)的社會學研究中,“大樣本、實時監(jiān)測、連續(xù)監(jiān)測”往往是不可兼得的條件,而大數(shù)據(jù)打破了這個迷思。
“我們都知道央視索福瑞是做電視收視率調(diào)查的,大家知道多少個樣本嗎?3000多個。你想用3000多個樣本折射幾億用戶的行為,這事荒不荒唐就不用說了。”他在一次演講中這樣說道,“web2.0改變了這個現(xiàn)狀,不管在Facebook、Twitter、新浪微博、微信上,我們能夠隨時獲得全樣本的實時的連續(xù)數(shù)據(jù),這個時候我們對用戶行為的理解就有可能達到空前的深度。比如在沒有社交網(wǎng)絡的時候,某位名人一直說自己是加州理工畢業(yè)的,大家相信了很久,等有社交網(wǎng)絡你再看他的好友圈,一定有若干個西太平洋而沒有加州理工的,你猜他是哪畢業(yè)的?”
而在《大數(shù)據(jù)時代》一書中,維克托·邁爾-舍恩伯格曾提出過另一個重要論點,相比于因果關(guān)系,相關(guān)關(guān)系也許能夠幫助我們更好地了解這個世界,換言之,在大數(shù)據(jù)時代,知道“是什么”或許比知道“為什么”更重要。一個經(jīng)典案例是,沃爾瑪?shù)难芯咳藛T通過數(shù)據(jù)挖掘,發(fā)現(xiàn)四成左右的年輕爸爸在購買嬰兒尿布時會順手買點啤酒犒勞自己,便對這兩種商品進行捆綁銷售,結(jié)果銷售量雙雙增加。
“大數(shù)據(jù)最要命的是什么?就是任何數(shù)據(jù)我都能匯總起來,分析你,比你還了解你自己。”王煜全曾這樣解讀大數(shù)據(jù)的價值。
涂子沛則記得,去年10月,時任中央政治局委員、廣東省委書記汪洋曾給省財政廳的全體干部推薦過《大數(shù)據(jù)》。汪洋講到馬云曾經(jīng)對他說,現(xiàn)在數(shù)據(jù)就是競爭力:“你想不到全中國比基尼賣得最好的是哪幾個省,一般人認為肯定是廣東、海南島。”
馬云隨即告訴汪洋,從淘寶數(shù)據(jù)上看,其實賣得最好的是新疆和內(nèi)蒙古。他這樣解釋這種反常的相關(guān)性:估計每一個男人,都要給他的夫人、情人和對象一個美好的憧憬,“有一天我?guī)闳ハ潞?rdquo;。
“當然這是他的一種解釋,但是能反映什么呢,就是這些數(shù)據(jù)和你想象的不是一個概念。如果商家掌握了這個東西,其實你比基尼廣告的重點不要放在廣東做,你放到新疆、內(nèi)蒙去做啊,這效果可能就不大一樣了。”汪洋給出了自己的解讀。
在中國,大數(shù)據(jù)會一步步改變我們的生活
這一次回國,曾工作過多年的廣東仍然是涂子沛的必到之處。這兩天,除了與馬蔚華見面,他還與中信銀行的幾名管理者做了深入的溝通,讓他感到明顯不同的是,金融“精英們”已不再把大數(shù)據(jù)當做新奇的概念,反而開始有了某種“深深的憂慮”。
困擾金融巨頭的假想敵正是掌握著大量數(shù)據(jù)的互聯(lián)網(wǎng)企業(yè)。曾經(jīng)兩次去阿里巴巴交流的涂子沛告訴記者,阿里金融正在試圖通過大數(shù)據(jù)技術(shù)解決“小微企業(yè)融資難”的問題。“所有貸款都是通過信用貸款,不像銀行那樣需要房產(chǎn)或其他抵押品,也不需要走訪約談。因為他們會對客戶的所有行為數(shù)據(jù)進行挖掘分析,再決定是否放貸。”
“依靠大數(shù)據(jù)技術(shù),IT企業(yè)也可以變成銀行,很難想象吧?”涂子沛笑著說,“在中國,大數(shù)據(jù)會一步步改變我們的生活。”
事實上,越來越多基于大數(shù)據(jù)技術(shù)產(chǎn)生的創(chuàng)意正在實實在在地進入中國人的生活。有媒體曾經(jīng)報道過支付寶的數(shù)據(jù)科學家們每天的工作:他們會把客戶分成50個族群進行研究,其中有一個群體叫做都市輕熟男,還有一個群體叫千金美少女,而這些類型的劃分依據(jù)就是用戶在淘寶、天貓、支付寶和聚劃算中的付費行為數(shù)據(jù)。在能識別用戶之后,一個微妙的變化是,在寫商品推薦文字的時候,不再是過去那樣千篇一律地使用“親”作為開頭了。
類似的變化涂子沛也曾親身感受過。有一回在國內(nèi)演講,他住在白天鵝賓館,賓館的信息部主任告訴他,這家賓館的信息部有收集用水量的習慣。有一年,原本平穩(wěn)的用水量突然出現(xiàn)了大幅波動,工作人員經(jīng)過分析排查發(fā)現(xiàn),花壇下有個水管漏水很久,“是數(shù)據(jù)讓他們發(fā)現(xiàn)了問題”。
這一回,又一個與大數(shù)據(jù)有關(guān)的故事讓他眼前一亮。在華東師范大學,一名女生因為減肥,5月份的飯卡消費較少,沒想到竟然收到一條系統(tǒng)短信:“同學你好,發(fā)現(xiàn)你上個月餐飲消費較少,不知是否有經(jīng)濟困難?如有困難,可電話、短信或郵件我。如無困難,也請回復一下,以便下月不再重復問詢。”
原來,這個消息來自學校的困難生預警系統(tǒng),而這套系統(tǒng)正是基于學生飯卡消費的數(shù)據(jù)建成。涂子沛第一時間轉(zhuǎn)發(fā)評論了這條微博:“華東師大用數(shù)據(jù)表達愛和關(guān)懷。”
在一次演講中,涂子沛曾這樣說道:“今天,數(shù)據(jù)已經(jīng)無處不在,我們的衣食住行、喜怒哀愁、吃喝玩樂都以數(shù)據(jù)的形式存在。通過數(shù)據(jù)、網(wǎng)絡和軟件,我們用數(shù)據(jù)來記錄這個世界,再通過研究數(shù)據(jù)去發(fā)現(xiàn)這個世界。”
“大數(shù)據(jù)無處不在?”記者在電話里問涂子沛。
“我想是的,哦,你猜我一抬頭看見了什么?”正在白云機場準備趕赴下一個演講地點的涂子沛告訴記者,出現(xiàn)在他眼前的是一塊IBM的大幅廣告,上面寫著這樣一行字——
大數(shù)據(jù)時代:用智慧的分析洞察,構(gòu)建智慧的地球。
已有0人發(fā)表了評論