阮敬 首都經(jīng)濟(jì)貿(mào)易大學(xué)研究生院副院長(zhǎng)
我們來(lái)看一下大數(shù)據(jù)到底怎么練,需要練些什么。我們把各個(gè)“門(mén)派”、各個(gè)專(zhuān)業(yè)方向的授課內(nèi)容都通過(guò)網(wǎng)絡(luò)搜集,整理了出來(lái)。國(guó)外網(wǎng)站上的信息資源豐富且開(kāi)放,可以查到很多詳細(xì)內(nèi)容,包括授課老師的簡(jiǎn)歷,甚至他們?cè)?jīng)做過(guò)的一些具體事情。
這是一個(gè)無(wú)像圖形,由結(jié)點(diǎn)、路徑或邊組成,結(jié)點(diǎn)是我們提取出來(lái)的主要文本信息。圖形中的點(diǎn)越大,字體越大,說(shuō)明其代表的信息越重要;兩點(diǎn)間相連的線段越粗越醒目,說(shuō)明它們之間的聯(lián)系越緊密。如此一來(lái)各項(xiàng)信息的重要性及相關(guān)性都能一目了然。這是數(shù)據(jù)科學(xué)設(shè)置的一個(gè)課程,說(shuō)白了就是你需要“修煉”的內(nèi)容。課程是學(xué)習(xí)的必要途徑,不管是在網(wǎng)上學(xué)還是到學(xué)校學(xué),又或者你來(lái)聽(tīng)講座,都繞不開(kāi)它,光坐在家里空想肯定不行??!
我們看圖上的machine和learn兩個(gè)詞,它們之間的線段很粗,組合起來(lái)叫machine learning,即“機(jī)器學(xué)習(xí)”。這需要主觀提煉,如果因?yàn)椴皇煜だ斫獬?ldquo;學(xué)習(xí)機(jī)器”就偏了,我們講座的目的之一就是幫大家厘清它們之間的相關(guān)關(guān)系。大數(shù)據(jù)的很多要點(diǎn)在于相關(guān)分析,包括變量和研究對(duì)象之間的關(guān)系等,這也是現(xiàn)在很多數(shù)據(jù)分析的誤區(qū)。你可能知道兩者之間存在關(guān)系,但具體誰(shuí)影響了誰(shuí),哪個(gè)是原因哪個(gè)是結(jié)果,不一定能搞清楚。我要說(shuō)明的是,現(xiàn)在網(wǎng)絡(luò)上的許多諸如一張圖告訴你什么或者大數(shù)據(jù)告訴你什么之類(lèi)的內(nèi)容,基本上都犯了一個(gè)邏輯錯(cuò)誤,那就是大部分大數(shù)據(jù)分析都只局限在分析數(shù)據(jù)之間的關(guān)聯(lián)性,而要了解因果性,還得靠其他技術(shù)去實(shí)現(xiàn)。
已有0人發(fā)表了評(píng)論