圖形中羅列的機(jī)器學(xué)習(xí)、可視化、信息系統(tǒng)、計(jì)算機(jī)模式識(shí)別等詞匯,都是計(jì)算機(jī)中常見的字眼,通過它們我們就可以大體了解到具體的學(xué)習(xí)方向和內(nèi)容,從而有針對(duì)性地去下功夫?qū)W習(xí)。以此類推,其他學(xué)習(xí)方向的課程也可以通過這種形式來表現(xiàn)。以數(shù)據(jù)科學(xué)碩士為例,我們可以按照剛才的圖形把關(guān)鍵詞提煉出來,再通過觀察這些關(guān)鍵詞跟其他詞之間的關(guān)聯(lián)性的強(qiáng)弱,按從小到大的順序組合并排序,這個(gè)過程需要具有專業(yè)經(jīng)驗(yàn)的主觀判斷的幫助,排列之后我們就得到了課程的具體內(nèi)容。需要注意的是,有的課程比較冷門,可能無法從圖形中提煉出來,另外,國外好多課程的名稱取得比較隨意,不同課程名稱對(duì)應(yīng)的也許是相同的內(nèi)容。
數(shù)據(jù)科學(xué)碩士有好多門必修課,就是必須具備的能力,包括機(jī)器學(xué)習(xí)、WEB數(shù)據(jù)挖掘、數(shù)據(jù)管理、統(tǒng)計(jì)分析、分析程序設(shè)計(jì)、系統(tǒng)設(shè)計(jì)等。除了必修課以外還有選修課,就是你還需要具備的其他技能。而機(jī)器學(xué)習(xí)這門課程,在必修和選修中都有提到,這是因?yàn)檎n程設(shè)置會(huì)因?yàn)閷W(xué)校的不同而有所差異,但總的來說,幾乎所有的課程都跟計(jì)算機(jī)、統(tǒng)計(jì)、數(shù)據(jù)有關(guān),那這些肯定就是我們“修煉”的重點(diǎn)。
數(shù)學(xué)是學(xué)習(xí)大數(shù)據(jù)技術(shù)的選修課。學(xué)習(xí)大數(shù)據(jù)最好有一定的數(shù)學(xué)基礎(chǔ),如果沒有基礎(chǔ),學(xué)習(xí)起來會(huì)比較困難,但也不是一個(gè)無法逾越的障礙。大數(shù)據(jù)時(shí)代,人們都是用工具去梳理數(shù)據(jù)的,現(xiàn)在的數(shù)據(jù)量巨大,不借助工具根本不可能梳理得過來。那么,都要用到哪些工具呢?最常見的是EXCEL;其次,還有一個(gè)叫SAS的商業(yè)軟件,是世界五百強(qiáng)企業(yè)的產(chǎn)品,美國《財(cái)富》雜志評(píng)選推薦的;再有,必須要了解的兩款開源軟件:R語言和Python。R目前是一款免費(fèi)軟件,搞統(tǒng)計(jì)的人如果不會(huì)R語言那是不可想象的。有一句話說得好,R的出現(xiàn)使搞統(tǒng)計(jì)的人終于可以使用計(jì)算機(jī)了,Python的出現(xiàn)使用計(jì)算機(jī)的人終于可以搞統(tǒng)計(jì)了。以上列舉的幾個(gè)工具必須要非常熟悉,因?yàn)楹芏鄬W(xué)校都不會(huì)開工具課,它默認(rèn)你已經(jīng)掌握了。除此以外還有Hadoop,它是大數(shù)據(jù)處理的架構(gòu),現(xiàn)在不是很主流了,但對(duì)理解課程來說還是必須的。
已有0人發(fā)表了評(píng)論