隨著傳統(tǒng)產業(yè)的轉型升級,由信息技術革命帶動的、以高新技術產業(yè)為龍頭的、包括利用計算機和互聯(lián)網等現(xiàn)代信息技術進行交易的各類商務活動日益活躍,為傳統(tǒng)產業(yè)打破發(fā)展瓶頸找到了突破口,并產生了大量多維度、高頻率、可追蹤的交易數(shù)據(jù),為客觀認識現(xiàn)實世界提供了豐富的資源,也對傳統(tǒng)的統(tǒng)計分析框架提出了挑戰(zhàn)。數(shù)據(jù)作為國家的基礎性戰(zhàn)略性資源,正發(fā)揮著引領全局、覆蓋全面、貫穿始終的獨特作用,引導著技術、物質、資金、人才、服務等資源各盡其用,在此背景下,需要完善統(tǒng)計體系,以及時反映經濟運行狀態(tài),使決策部門的政策制定有據(jù)可依,助推我國經濟健康發(fā)展。
“互聯(lián)網+”下的數(shù)據(jù)新特征
國家現(xiàn)有統(tǒng)計制度主要通過分層、多階段、概率比例抽樣的方法獲取調查樣本,各有關部門以聯(lián)網直報方式向國家統(tǒng)計局獨立自行報送相關數(shù)據(jù),通過進一步整合得到頻率和指標較為固定的結構化數(shù)據(jù)。伴隨著社會媒體、移動終端和傳感設備等新工具的普及應用,包括文檔、圖片、音頻、視頻等在內的非結構化數(shù)據(jù)大量涌現(xiàn),進一步拓寬了統(tǒng)計分析的數(shù)據(jù)廣度及深度。具體來說,日益豐富的海量數(shù)據(jù)呈現(xiàn)如下特征:第一,由低頻數(shù)據(jù)轉向高頻數(shù)據(jù)。互聯(lián)網特別是移動互聯(lián)網的發(fā)展,網民數(shù)量和聯(lián)網設備快速增長,加快了信息化向社會經濟各方面的滲透,促進數(shù)據(jù)在不同機構及個體之間加速流動,提高了數(shù)據(jù)的時效性,并使數(shù)據(jù)量級不斷翻新,大數(shù)據(jù)來勢兇猛;第二,由低緯數(shù)據(jù)轉向高緯數(shù)據(jù)。隨著獲取、存儲、管理、分析等數(shù)據(jù)處理能力的提升,可獲得的數(shù)據(jù)維度不斷多樣化,并且同一主題在不同業(yè)務中的表現(xiàn)相互印證,為大數(shù)據(jù)征信提供便利;第三,數(shù)據(jù)的可追蹤性增強。傳統(tǒng)數(shù)據(jù)大多采用抽樣調查法獲取,代表性不足,數(shù)據(jù)頻率低,操作周期長,而互聯(lián)網為我們高頻率追蹤個人行為提供了可能,便于根據(jù)用戶特征進行組合分類,通過用戶畫像實現(xiàn)服務創(chuàng)新、精準營銷及供應鏈優(yōu)化等;第四,由結構化數(shù)據(jù)轉向非結構化數(shù)據(jù)?;ヂ?lián)網的發(fā)展加速了數(shù)據(jù)的非結構化趨勢,綜合使用傳統(tǒng)調查方法和文本挖掘、爬蟲等新技術獲取異源甚至異構數(shù)據(jù),為多角度驗證數(shù)據(jù)的全面性和可信性提供便利,同時也對數(shù)據(jù)處理能力提出更高要求;第五,數(shù)據(jù)由高價值密度轉向低價值密度。數(shù)據(jù)體量越大,數(shù)據(jù)噪音也越大,導致數(shù)據(jù)價值密度降低,增加數(shù)據(jù)的處理難度,但對其進行深度挖掘可能得到的價值也更大。
2011年,英國《自然》雜志曾出版??赋?,倘若能更有效地組織和使用大數(shù)據(jù),人類將得到更多機會發(fā)揮科學技術對社會發(fā)展的巨大推動作用。面對“互聯(lián)網+”下的數(shù)據(jù)新特征,我們需要不斷提高數(shù)據(jù)的收集、存儲、分析等能力,使用大數(shù)據(jù)、云計算等新技術手段進行深度挖掘,充分發(fā)揮互聯(lián)網下的數(shù)據(jù)優(yōu)勢,實現(xiàn)數(shù)據(jù)由大規(guī)模到高價值的轉變。
已有0人發(fā)表了評論