國內(nèi)大數(shù)據(jù)高端人才培養(yǎng)的分布情況是,北上廣及以貴州、四川為代表的西南地區(qū)人才培養(yǎng)基地比較多,其中北京最多,上海和廣東也有零星分布。北上廣除了是人才培養(yǎng)機構(gòu)的聚集地,同樣也是人才需求量最高的地區(qū)。這一點很容易理解,因為經(jīng)濟發(fā)達,必然就有需求、有供給,培養(yǎng)出的人才可以直接在當?shù)毓ぷ鳌7从^西南地區(qū),以有大數(shù)據(jù)基地的貴州為代表,相關(guān)人才的需求量其實很少,它培養(yǎng)的人才都供給到北上廣等經(jīng)濟比較發(fā)達的沿海地區(qū)了。
最后我們總結(jié)一下通過上面羅列的一系列數(shù)據(jù)得出的結(jié)論,要修煉成大數(shù)據(jù)高端人才,要講究“四板斧”,即需具備四種能力。
第一個是計算機技能,沒有計算機技能,做數(shù)據(jù)分析可能會非常辛苦。比如計算機技能包括數(shù)據(jù)庫技能,好多非結(jié)構(gòu)化數(shù)據(jù)都是轉(zhuǎn)化成結(jié)構(gòu)化數(shù)據(jù)去做的,所以一定要在數(shù)據(jù)庫管理使用的技術(shù)上下功夫。還有,比如說Hadoop和MapReduce,都是架構(gòu)在Linux/Unix環(huán)境下的,這個操作系統(tǒng)還需要運用一些腳本語言。另外,你還要掌握大數(shù)據(jù)分析的框架,至少要做到熟悉了解。
第二個是編程技能,要做大數(shù)據(jù)分析或成為大數(shù)據(jù)高端人才,編程技能是必不可少的,比如今天我分享給大家的這個內(nèi)容,其實就是用我們編程自動提取出來的信息整理得出的結(jié)論,不論對錯與否,它至少是客觀的。當很多信息沒有現(xiàn)成的東西去分析的時候,你就必須去做開發(fā)編程。需要精通的工具有我們上面說到過的JAVA、C++,做統(tǒng)計的話用SAS、Python和R?,F(xiàn)在還有新的框架Spark等,都需要你去熟悉了解。
第三個也是最核心的技能,就是大數(shù)據(jù)挖掘和統(tǒng)計建模分析的技能。很多學(xué)計算機的朋友問我,要開一家做大數(shù)據(jù)醫(yī)療的公司要怎么做。這一塊的技能很難掌握,需要聚類、關(guān)聯(lián)、分類等。分類很關(guān)鍵,人腦一直在不斷分類,比如你來或者不來聽我的講座,你的腦子里面不斷地在做類似的決策。你說的每一句話,每一個字都可能是分類的結(jié)果,包括我們下棋,你走哪一步,同樣也是分類的結(jié)果。還有聚類,聚類就是本來沒有類別,人為的劃分類別,比如把人類分成男和女。如果你要跟數(shù)據(jù)打交道,多多少少應(yīng)當具備這方面的技能。在此基礎(chǔ)上,你還能對算法進行改進,如果沒有改進,那你也只是停留在用一用的層面,想要自創(chuàng)門派或提高工作效率的話,難度還是比較大的。
最后一個是業(yè)務(wù)和管理技能。沒有業(yè)務(wù),空有一身本事也是白搭,所以必須要找一個途徑去實現(xiàn)你的價值。我們發(fā)現(xiàn)有很多計算機技術(shù)好,統(tǒng)計模型、大數(shù)據(jù)挖掘、機器學(xué)習(xí)都學(xué)得非常好的人,在實際工作中卻發(fā)揮不出什么作用,逐漸被邊緣化,甚至沒干幾年就被開除了,這是為什么呢?這就是太過于鉆研技術(shù),沒有業(yè)務(wù)技能的后果。如果連業(yè)務(wù)流程都不熟悉,要怎么去做分析呢?沒有業(yè)務(wù)能力,公司里每一項業(yè)務(wù)的數(shù)據(jù)流流向,數(shù)據(jù)來了以后數(shù)據(jù)口徑,就無法得出正確的結(jié)論。
綜上所述,必須同時具備四大要素,才能成為一個真正的大數(shù)據(jù)高端人才。
當今時代正是大數(shù)據(jù)產(chǎn)業(yè)蓬勃發(fā)展的好時機。對于大數(shù)據(jù)高端人才的培養(yǎng),國外有先例,國內(nèi)有需求。具備以上四項能力中某一項或幾項能力的人應(yīng)當珍惜這份幸運,抓住這次機會,根據(jù)自身的特點進一步完善自己各方面的技能,朝著適合自己的方向去努力,有朝一日一定能修煉成才。
今天就跟大家分享這么多,謝謝大家。
(根據(jù)宣講家網(wǎng)報告整理編輯,
未經(jīng)許可,不得印刷、出版,違者追究法律責(zé)任)
已有0人發(fā)表了評論