隨著傳統(tǒng)產(chǎn)業(yè)的轉(zhuǎn)型升級(jí),由信息技術(shù)革命帶動(dòng)的、以高新技術(shù)產(chǎn)業(yè)為龍頭的、包括利用計(jì)算機(jī)和互聯(lián)網(wǎng)等現(xiàn)代信息技術(shù)進(jìn)行交易的各類商務(wù)活動(dòng)日益活躍,為傳統(tǒng)產(chǎn)業(yè)打破發(fā)展瓶頸找到了突破口,并產(chǎn)生了大量多維度、高頻率、可追蹤的交易數(shù)據(jù),為客觀認(rèn)識(shí)現(xiàn)實(shí)世界提供了豐富的資源,也對(duì)傳統(tǒng)的統(tǒng)計(jì)分析框架提出了挑戰(zhàn)。數(shù)據(jù)作為國(guó)家的基礎(chǔ)性戰(zhàn)略性資源,正發(fā)揮著引領(lǐng)全局、覆蓋全面、貫穿始終的獨(dú)特作用,引導(dǎo)著技術(shù)、物質(zhì)、資金、人才、服務(wù)等資源各盡其用,在此背景下,需要完善統(tǒng)計(jì)體系,以及時(shí)反映經(jīng)濟(jì)運(yùn)行狀態(tài),使決策部門的政策制定有據(jù)可依,助推我國(guó)經(jīng)濟(jì)健康發(fā)展。
“互聯(lián)網(wǎng)+”下的數(shù)據(jù)新特征
國(guó)家現(xiàn)有統(tǒng)計(jì)制度主要通過(guò)分層、多階段、概率比例抽樣的方法獲取調(diào)查樣本,各有關(guān)部門以聯(lián)網(wǎng)直報(bào)方式向國(guó)家統(tǒng)計(jì)局獨(dú)立自行報(bào)送相關(guān)數(shù)據(jù),通過(guò)進(jìn)一步整合得到頻率和指標(biāo)較為固定的結(jié)構(gòu)化數(shù)據(jù)。伴隨著社會(huì)媒體、移動(dòng)終端和傳感設(shè)備等新工具的普及應(yīng)用,包括文檔、圖片、音頻、視頻等在內(nèi)的非結(jié)構(gòu)化數(shù)據(jù)大量涌現(xiàn),進(jìn)一步拓寬了統(tǒng)計(jì)分析的數(shù)據(jù)廣度及深度。具體來(lái)說(shuō),日益豐富的海量數(shù)據(jù)呈現(xiàn)如下特征:第一,由低頻數(shù)據(jù)轉(zhuǎn)向高頻數(shù)據(jù)?;ヂ?lián)網(wǎng)特別是移動(dòng)互聯(lián)網(wǎng)的發(fā)展,網(wǎng)民數(shù)量和聯(lián)網(wǎng)設(shè)備快速增長(zhǎng),加快了信息化向社會(huì)經(jīng)濟(jì)各方面的滲透,促進(jìn)數(shù)據(jù)在不同機(jī)構(gòu)及個(gè)體之間加速流動(dòng),提高了數(shù)據(jù)的時(shí)效性,并使數(shù)據(jù)量級(jí)不斷翻新,大數(shù)據(jù)來(lái)勢(shì)兇猛;第二,由低緯數(shù)據(jù)轉(zhuǎn)向高緯數(shù)據(jù)。隨著獲取、存儲(chǔ)、管理、分析等數(shù)據(jù)處理能力的提升,可獲得的數(shù)據(jù)維度不斷多樣化,并且同一主題在不同業(yè)務(wù)中的表現(xiàn)相互印證,為大數(shù)據(jù)征信提供便利;第三,數(shù)據(jù)的可追蹤性增強(qiáng)。傳統(tǒng)數(shù)據(jù)大多采用抽樣調(diào)查法獲取,代表性不足,數(shù)據(jù)頻率低,操作周期長(zhǎng),而互聯(lián)網(wǎng)為我們高頻率追蹤個(gè)人行為提供了可能,便于根據(jù)用戶特征進(jìn)行組合分類,通過(guò)用戶畫(huà)像實(shí)現(xiàn)服務(wù)創(chuàng)新、精準(zhǔn)營(yíng)銷及供應(yīng)鏈優(yōu)化等;第四,由結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)向非結(jié)構(gòu)化數(shù)據(jù)?;ヂ?lián)網(wǎng)的發(fā)展加速了數(shù)據(jù)的非結(jié)構(gòu)化趨勢(shì),綜合使用傳統(tǒng)調(diào)查方法和文本挖掘、爬蟲(chóng)等新技術(shù)獲取異源甚至異構(gòu)數(shù)據(jù),為多角度驗(yàn)證數(shù)據(jù)的全面性和可信性提供便利,同時(shí)也對(duì)數(shù)據(jù)處理能力提出更高要求;第五,數(shù)據(jù)由高價(jià)值密度轉(zhuǎn)向低價(jià)值密度。數(shù)據(jù)體量越大,數(shù)據(jù)噪音也越大,導(dǎo)致數(shù)據(jù)價(jià)值密度降低,增加數(shù)據(jù)的處理難度,但對(duì)其進(jìn)行深度挖掘可能得到的價(jià)值也更大。
2011年,英國(guó)《自然》雜志曾出版??赋?,倘若能更有效地組織和使用大數(shù)據(jù),人類將得到更多機(jī)會(huì)發(fā)揮科學(xué)技術(shù)對(duì)社會(huì)發(fā)展的巨大推動(dòng)作用。面對(duì)“互聯(lián)網(wǎng)+”下的數(shù)據(jù)新特征,我們需要不斷提高數(shù)據(jù)的收集、存儲(chǔ)、分析等能力,使用大數(shù)據(jù)、云計(jì)算等新技術(shù)手段進(jìn)行深度挖掘,充分發(fā)揮互聯(lián)網(wǎng)下的數(shù)據(jù)優(yōu)勢(shì),實(shí)現(xiàn)數(shù)據(jù)由大規(guī)模到高價(jià)值的轉(zhuǎn)變。
已有0人發(fā)表了評(píng)論