最近中文2019字幕第二页,艳妇乳肉豪妇荡乳,中日韩高清无专码区2021,中文字幕乱码无码人妻系列蜜桃,曰本极品少妇videossexhd

阮敬:大數(shù)據(jù)高端人才是怎樣煉成的(6)

摘要:在大數(shù)據(jù)產(chǎn)業(yè)日趨火熱的今天,相關(guān)高端人才稀缺成為了阻礙其進(jìn)一步發(fā)展的重大因素。對(duì)于大數(shù)據(jù)高端人才的培養(yǎng),國外有先例,國內(nèi)有需求。首都經(jīng)濟(jì)貿(mào)易大學(xué)研究生院副院長(zhǎng)阮敬認(rèn)為,在培養(yǎng)大數(shù)據(jù)高端人才方面,我們應(yīng)適當(dāng)借鑒國外已有的較為成熟的培養(yǎng)途徑,力爭(zhēng)培養(yǎng)出既具備專業(yè)技能又能適應(yīng)市場(chǎng)需求的人才。

我們來看一下大數(shù)據(jù)到底怎么練,需要練些什么。我們把各個(gè)“門派”、各個(gè)專業(yè)方向的授課內(nèi)容都通過網(wǎng)絡(luò)搜集,整理了出來。國外網(wǎng)站上的信息資源豐富且開放,可以查到很多詳細(xì)內(nèi)容,包括授課老師的簡(jiǎn)歷,甚至他們?cè)?jīng)做過的一些具體事情。

1

這是一個(gè)無像圖形,由結(jié)點(diǎn)、路徑或邊組成,結(jié)點(diǎn)是我們提取出來的主要文本信息。圖形中的點(diǎn)越大,字體越大,說明其代表的信息越重要;兩點(diǎn)間相連的線段越粗越醒目,說明它們之間的聯(lián)系越緊密。如此一來各項(xiàng)信息的重要性及相關(guān)性都能一目了然。這是數(shù)據(jù)科學(xué)設(shè)置的一個(gè)課程,說白了就是你需要“修煉”的內(nèi)容。課程是學(xué)習(xí)的必要途徑,不管是在網(wǎng)上學(xué)還是到學(xué)校學(xué),又或者你來聽講座,都繞不開它,光坐在家里空想肯定不行啊!

我們看圖上的machine和learn兩個(gè)詞,它們之間的線段很粗,組合起來叫machine learning,即“機(jī)器學(xué)習(xí)”。這需要主觀提煉,如果因?yàn)椴皇煜だ斫獬?ldquo;學(xué)習(xí)機(jī)器”就偏了,我們講座的目的之一就是幫大家厘清它們之間的相關(guān)關(guān)系。大數(shù)據(jù)的很多要點(diǎn)在于相關(guān)分析,包括變量和研究對(duì)象之間的關(guān)系等,這也是現(xiàn)在很多數(shù)據(jù)分析的誤區(qū)。你可能知道兩者之間存在關(guān)系,但具體誰影響了誰,哪個(gè)是原因哪個(gè)是結(jié)果,不一定能搞清楚。我要說明的是,現(xiàn)在網(wǎng)絡(luò)上的許多諸如一張圖告訴你什么或者大數(shù)據(jù)告訴你什么之類的內(nèi)容,基本上都犯了一個(gè)邏輯錯(cuò)誤,那就是大部分大數(shù)據(jù)分析都只局限在分析數(shù)據(jù)之間的關(guān)聯(lián)性,而要了解因果性,還得靠其他技術(shù)去實(shí)現(xiàn)。

圖形中羅列的機(jī)器學(xué)習(xí)、可視化、信息系統(tǒng)、計(jì)算機(jī)模式識(shí)別等詞匯,都是計(jì)算機(jī)中常見的字眼,通過它們我們就可以大體了解到具體的學(xué)習(xí)方向和內(nèi)容,從而有針對(duì)性地去下功夫?qū)W習(xí)。以此類推,其他學(xué)習(xí)方向的課程也可以通過這種形式來表現(xiàn)。以數(shù)據(jù)科學(xué)碩士為例,我們可以按照剛才的圖形把關(guān)鍵詞提煉出來,再通過觀察這些關(guān)鍵詞跟其他詞之間的關(guān)聯(lián)性的強(qiáng)弱,按從小到大的順序組合并排序,這個(gè)過程需要具有專業(yè)經(jīng)驗(yàn)的主觀判斷的幫助,排列之后我們就得到了課程的具體內(nèi)容。需要注意的是,有的課程比較冷門,可能無法從圖形中提煉出來,另外,國外好多課程的名稱取得比較隨意,不同課程名稱對(duì)應(yīng)的也許是相同的內(nèi)容。

數(shù)據(jù)科學(xué)碩士有好多門必修課,就是必須具備的能力,包括機(jī)器學(xué)習(xí)、WEB數(shù)據(jù)挖掘、數(shù)據(jù)管理、統(tǒng)計(jì)分析、分析程序設(shè)計(jì)、系統(tǒng)設(shè)計(jì)等。除了必修課以外還有選修課,就是你還需要具備的其他技能。而機(jī)器學(xué)習(xí)這門課程,在必修和選修中都有提到,這是因?yàn)檎n程設(shè)置會(huì)因?yàn)閷W(xué)校的不同而有所差異,但總的來說,幾乎所有的課程都跟計(jì)算機(jī)、統(tǒng)計(jì)、數(shù)據(jù)有關(guān),那這些肯定就是我們“修煉”的重點(diǎn)。

數(shù)學(xué)是學(xué)習(xí)大數(shù)據(jù)技術(shù)的選修課。學(xué)習(xí)大數(shù)據(jù)最好有一定的數(shù)學(xué)基礎(chǔ),如果沒有基礎(chǔ),學(xué)習(xí)起來會(huì)比較困難,但也不是一個(gè)無法逾越的障礙。大數(shù)據(jù)時(shí)代,人們都是用工具去梳理數(shù)據(jù)的,現(xiàn)在的數(shù)據(jù)量巨大,不借助工具根本不可能梳理得過來。那么,都要用到哪些工具呢?最常見的是EXCEL;其次,還有一個(gè)叫SAS的商業(yè)軟件,是世界五百強(qiáng)企業(yè)的產(chǎn)品,美國《財(cái)富》雜志評(píng)選推薦的;再有,必須要了解的兩款開源軟件:R語言和Python。R目前是一款免費(fèi)軟件,搞統(tǒng)計(jì)的人如果不會(huì)R語言那是不可想象的。有一句話說得好,R的出現(xiàn)使搞統(tǒng)計(jì)的人終于可以使用計(jì)算機(jī)了,Python的出現(xiàn)使用計(jì)算機(jī)的人終于可以搞統(tǒng)計(jì)了。以上列舉的幾個(gè)工具必須要非常熟悉,因?yàn)楹芏鄬W(xué)校都不會(huì)開工具課,它默認(rèn)你已經(jīng)掌握了。除此以外還有Hadoop,它是大數(shù)據(jù)處理的架構(gòu),現(xiàn)在不是很主流了,但對(duì)理解課程來說還是必須的。

責(zé)任編輯:楊雪校對(duì):葉其英最后修改:
0

精選專題

領(lǐng)航新時(shí)代

精選文章

精選視頻

精選圖片

微信公眾平臺(tái):搜索“宣講家”或掃描下面的二維碼:
宣講家微信公眾平臺(tái)
您也可以通過點(diǎn)擊圖標(biāo)來訪問官方微博或下載手機(jī)客戶端:
微博
微博
客戶端
客戶端