現(xiàn)在,越來越多的科學(xué)新發(fā)現(xiàn)和商機都依賴于對全面完整的數(shù)據(jù)的收集和利用,而過去形成的思維觀念和行為模式是獲得新科學(xué)發(fā)現(xiàn)和商機的阻礙因素。因此,決策人的思維和行為模式有必要重塑,這將對社會產(chǎn)生深遠的影響。
大數(shù)據(jù)帶來思維變革,也就是說不是過多地去關(guān)注因果關(guān)系,而是關(guān)注相關(guān)關(guān)系。極端地說法就是,只要知道是什么就夠了,沒必要去問那么多為什么。在大數(shù)據(jù)時代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己發(fā)聲。從操作方式開始,大數(shù)據(jù)改變了人類探索世界的方法,這是大數(shù)據(jù)帶來思維變革。
大數(shù)據(jù)帶來了商業(yè)變革,那就是數(shù)據(jù)化,一切皆可以量化。量化一切,這是數(shù)據(jù)化的核心。當(dāng)文字、方位、聲音等都變?yōu)閿?shù)據(jù)的時候,數(shù)據(jù)就會有很多很多。大數(shù)據(jù)帶來的商業(yè)變革很有價值,它是取得不盡、用之不竭的。可以把大數(shù)據(jù)比作是金礦,可以進行數(shù)據(jù)再利用。數(shù)據(jù)我用了,我還可以給你用,不像衣服,我自己穿了,別人就不能穿。
大數(shù)據(jù)帶來了管理的變革,是責(zé)任與自由并舉的信息管理。根據(jù)人們對隱私的不同態(tài)度,可以把人大致分為三類:有的人對隱私不隱私無所謂,對此不甚在意;有的人是隱私的實用主義者,你給他好處,他就出賣他的信息;還有一種人有隱私的潔癖,什么隱私都不想讓人知道,一切都要處于保密狀態(tài)。
大數(shù)據(jù)帶來了管理的變革,大數(shù)據(jù)開發(fā)的根本目的是以數(shù)據(jù)分析為基礎(chǔ),幫助人們做出更明智的決策,優(yōu)化企業(yè)和社會運轉(zhuǎn)。所以有人評論說,大數(shù)據(jù)是一場管理的革命,大數(shù)據(jù)時代的決策不能僅憑經(jīng)驗,而要靠“數(shù)說”,也就是“按數(shù)據(jù)說話”。
因此,大數(shù)據(jù)想要真正發(fā)揮作用,還要改善我們的管理模式,需要管理方式、架構(gòu)與大數(shù)據(jù)技術(shù)、工具相適配。
另外,我們還有一道很難邁過的坎,就是科學(xué)范式的轉(zhuǎn)換。隨著大數(shù)據(jù)的出現(xiàn),研究領(lǐng)域產(chǎn)生了一種被稱為數(shù)據(jù)密集型科學(xué)的新型研究范式,這個范式以數(shù)據(jù)為中心來實施科學(xué)研究,新的科學(xué)發(fā)現(xiàn)依賴于對海量數(shù)據(jù)的收集和分析處理。
我介紹下科學(xué)范式,第一范式主要以觀察和實驗為主;第二種范式偏重理論總結(jié)和理性概括;第三種范式是以模擬為主的計算;第四種范式是以數(shù)據(jù)為中心和驅(qū)動的,是基于對海量數(shù)據(jù)的處理和分析來發(fā)現(xiàn)新的知識。當(dāng)然,科學(xué)范式并不是以其中一種代替另外一種,而是共同構(gòu)成了現(xiàn)代科學(xué)方法的統(tǒng)一體。
大數(shù)據(jù)有哪些特征呢?一種說法認為,大數(shù)據(jù)具有4V特點。1、Volume(大量);2、Variety(多樣);3、Velocity(高速);4、Value(價值)。
1、Volume(大量)
數(shù)據(jù)計量的基本單位是Byte,按順序給出所有單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB,它們按照進率1024(2的十次方)來計算,比如1ZB=1024EB。
根據(jù)IDC監(jiān)測,全球在2010年正式進入ZB時代,全球數(shù)據(jù)量大約每兩年翻一番,這意味著人類在最近兩年產(chǎn)生的數(shù)據(jù)量相當(dāng)于之前產(chǎn)生的全部數(shù)據(jù)量。預(yù)計到2020年,全球?qū)⒖偣矒碛?5ZB的數(shù)據(jù)量,相較于2010年,數(shù)據(jù)量將增長近30倍。
阿里集團透露,在阿里數(shù)據(jù)平臺事業(yè)部的服務(wù)器上,攢下了超過100PB已處理過的數(shù)據(jù),等于104857600個GB,相當(dāng)于4萬個西雅圖中央圖書館,580億本藏書。阿里巴巴之所以能夠殺到美國去,與它的數(shù)據(jù)量超大有很大的關(guān)系。
現(xiàn)在,數(shù)據(jù)存儲器的體量越來越小,容量越來越大,價格卻越來越便宜。十年前,一個移動硬盤,大概是20G容量,比手機還大,但是今天我用的這個小U盤,容量是35G,價格也低了好多?,F(xiàn)在,六百美元你就可以買到一個硬盤,它可以儲存下這個世界所有的音樂。
有一家單位讓我給幾個年輕人作輔導(dǎo),說想知道對方家里的家底如何,其實你可以利用大數(shù)據(jù),問問他有多少數(shù)據(jù)資產(chǎn),大概就能知道他家里條件好壞。家里條件好的,那小孩從小各種照片,各種錄像,那肯定家庭條件不錯。有些孩子找對象,想知道對方家里的經(jīng)濟條件,但又不好意思直接問,我給你出個主意,你可以問問他家的大數(shù)據(jù)有多少。
世界現(xiàn)有的92%的數(shù)據(jù)恰恰就是在過去兩年中產(chǎn)生的,數(shù)據(jù)在呈幾何級數(shù)地增長。大數(shù)據(jù)時代,數(shù)據(jù)爆炸性增長,各種社交網(wǎng)絡(luò),移動網(wǎng)絡(luò)和各種智能終端,各種各樣的設(shè)備都產(chǎn)生很多的大數(shù)據(jù)。所以大數(shù)據(jù)的特點是數(shù)據(jù)量特別的大,這是第一個特點。
2、Variety(多樣)
第二個特點是多元、多樣。U盤、光盤、打印機、電腦都產(chǎn)生了很多數(shù)據(jù),并且這些數(shù)據(jù)的格式還不一樣,數(shù)據(jù)源也是各種各樣的,谷歌、Twitter、Facebook產(chǎn)生很多的數(shù)據(jù)。
3、Velocity(高速)
第三個特征是速度,增長速度特別快,處理速度也要求更快。
以存儲1PB的數(shù)據(jù)為例,即使帶寬(網(wǎng)速)能達到1G/s,且電腦的容量足夠且24小時運行,要將1PB的數(shù)據(jù)存入電腦也需要12天。大數(shù)據(jù)通過云計算,可以實現(xiàn)將12天才能存儲完畢的數(shù)據(jù)在20分鐘之內(nèi)完成。
4、Value(價值)
大數(shù)據(jù)能做一個預(yù)言家。谷歌和推特都曾用大數(shù)據(jù),提前7天到一個月,在2009年準確預(yù)測當(dāng)年的流感趨勢。
什么是大數(shù)據(jù)?我們回過頭來看一看,巨大的數(shù)據(jù)量,體量大,數(shù)據(jù)類型多,商業(yè)價值高,處理速度快,這是關(guān)于大數(shù)據(jù)的基本概念和特征。
已有0人發(fā)表了評論