DeepSeek開(kāi)源惠四方

最近中文2019字幕第二页,艳妇乳肉豪妇荡乳,中日韩高清无专码区2021,中文字幕乱码无码人妻系列蜜桃,曰本极品少妇videossexhd

DeepSeek開(kāi)源惠四方

受到熱烈歡迎

業(yè)界紛紛部署

近期,中國(guó)杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司推出AI語(yǔ)言大模型DeepSeek,受到用戶(hù)熱烈歡迎。2025年1月20日,DeepSeek-R1發(fā)布上線,7天內(nèi)用戶(hù)超過(guò)1億。ChatGPT從發(fā)布到達(dá)到相同的用戶(hù)規(guī)模用時(shí)兩個(gè)月。

GitHub是全球最大的代碼托管網(wǎng)站,GitHub的星數(shù)即GitHub平臺(tái)項(xiàng)目頁(yè)面上的Star按鈕被用戶(hù)主動(dòng)點(diǎn)擊的次數(shù),代表受歡迎程度和社區(qū)認(rèn)可度。目前,DeepSeek的GitHub星數(shù)已超越了同類(lèi)大模型的GitHub星數(shù)。

值得一提的是,DeepSeek贏得一批國(guó)際知名企業(yè)特別是全球人工智能企業(yè)的青睞。微軟率先宣布將DeepSeek-R1模型添加到云平臺(tái)Azure AI Foundry,開(kāi)發(fā)者可用于構(gòu)建基于云的應(yīng)用程序和服務(wù)。之后,亞馬遜云科技、英偉達(dá)、超微半島等公司宣布在其AI服務(wù)平臺(tái)上部署DeepSeek-R1模型。

實(shí)現(xiàn)技術(shù)突破

走出發(fā)展新路

DeepSeek受到贊譽(yù)和認(rèn)可,但也有輿論認(rèn)為,與ChatGPT實(shí)現(xiàn)從“0到1”的突破不同,DeepSeek只是實(shí)現(xiàn)了從“1到N”的擴(kuò)展。

對(duì)此,筆者并不認(rèn)同,因?yàn)檫@種看法不符合人工智能研究的特點(diǎn)及創(chuàng)新發(fā)展的歷史軌跡。人工智能創(chuàng)新不同于物理學(xué)等基礎(chǔ)理論研究。物理學(xué)中的牛頓定律和愛(ài)因斯坦發(fā)現(xiàn)的相對(duì)論是從“0到1”的突破,但人工智能是一個(gè)沒(méi)有嚴(yán)格定義的研究領(lǐng)域,并不存在“智能”和“不智能”之間“0”和“1”的界限,只有智能化水平不斷提高的創(chuàng)新發(fā)展過(guò)程。

筆者認(rèn)為,DeepSeek推出的V3和R1模型既是技術(shù)上的重大突破,也是發(fā)展模式上的重大創(chuàng)新,是人工智能發(fā)展史上重大事件,可以與OpenAI發(fā)布ChatGPT3.5相提并論。DeepSeek以高效率、低成本的推理模型和開(kāi)源的商業(yè)模式走出一條發(fā)展人工智能的新路。  

堅(jiān)持歷史視角

準(zhǔn)確看待價(jià)值

準(zhǔn)確認(rèn)識(shí)DeepSeek的價(jià)值和貢獻(xiàn),必須堅(jiān)持歷史視角,將其放在人工智能創(chuàng)新發(fā)展的歷程中來(lái)看待。

1943年,美國(guó)科學(xué)家麥卡洛克和皮茨提出神經(jīng)元計(jì)算模型,開(kāi)創(chuàng)了神經(jīng)網(wǎng)絡(luò)研究的先河,開(kāi)啟人工智能創(chuàng)新發(fā)展的漫長(zhǎng)探索歷程。本世紀(jì)第二個(gè)十年,基于神經(jīng)網(wǎng)絡(luò)模型的第三波人工智能浪潮涌起并接連迎來(lái)多個(gè)里程碑式事件。

2012年,在ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽上,辛頓等人創(chuàng)建的AlexNet卷積神經(jīng)網(wǎng)絡(luò)模型大放異彩。這被看作第三波人工智能浪潮的起點(diǎn)。在此4年之后,DeepMind研制的AlphaGo圍棋程序戰(zhàn)勝世界冠軍,引起了全世界的矚目。

2017年,谷歌的幾名專(zhuān)家提出Transformer模型,提出自注意力機(jī)制,成為深度學(xué)習(xí)的主流模型。  

2018年,DeepMind發(fā)布了AlphaFold,在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)中展示出驚人的能力,開(kāi)辟了AI for Science(人工智能驅(qū)動(dòng)科技創(chuàng)新)的新方向。

2022年,OpenAI發(fā)布ChatGPT3.5,引領(lǐng)了以大語(yǔ)言模型(LLM)為標(biāo)志的生成式人工智能新浪潮。

近日,DeepSeek上線,成為上述重大事件之后,第三波人工智能創(chuàng)新發(fā)展浪潮的又一重大事件。

采用創(chuàng)新算法

提升運(yùn)行效率

DeepSeek廣受歡迎,是因?yàn)樵谀P退惴ê拖到y(tǒng)軟件層次都有重大創(chuàng)新。那么這些重大創(chuàng)新具體體現(xiàn)在哪些方面呢?

算法創(chuàng)新是DeepSeek的重要貢獻(xiàn)之一。DeepSeek大模型采用新的混合專(zhuān)家架構(gòu)(MoE),每一層有256個(gè)路由“專(zhuān)家”和1個(gè)共享“專(zhuān)家”。在每次前向傳播過(guò)程中,只激活一小部分“專(zhuān)家”來(lái)進(jìn)行計(jì)算。雖然DeepSeek-V3是一個(gè)671B參數(shù)的大模型,但模型的任何函數(shù)調(diào)用和傳遞只使用約37B參數(shù),使其訓(xùn)練成本大為降低。

在算法層面,DeepSeek還有一個(gè)降低成本的重大創(chuàng)新,即低秩注意力機(jī)制(也稱(chēng)為多頭潛在注意力機(jī)制)。這一發(fā)明對(duì)巨大的注意力機(jī)制矩陣進(jìn)行了壓縮,減少參與運(yùn)算的參數(shù)數(shù)量,大大降低了顯存占用,由此提升了模型運(yùn)行效率。

減少推理成本

降低開(kāi)發(fā)門(mén)檻

在推理層面的創(chuàng)新是DeepSeek另一個(gè)重大貢獻(xiàn)。OpenAI發(fā)布的o1推理模型是閉源的,其他企業(yè)無(wú)法了解OpenAI是如何基于預(yù)訓(xùn)練模型構(gòu)建推理模型的。通過(guò)開(kāi)源方式,DeepSeek揭示了實(shí)現(xiàn)低成本推理的奧秘,為發(fā)展推理模型開(kāi)辟了一條新路。DeepSeek揭示了一個(gè)事實(shí),即推理模型的開(kāi)發(fā)比想象中更為簡(jiǎn)單,門(mén)檻實(shí)際上并不是那么高,各行各業(yè)均可以做。

傳統(tǒng)的強(qiáng)化學(xué)習(xí)需要大量標(biāo)注數(shù)據(jù),成本很高。DeepSeek另辟蹊徑,以全自動(dòng)的強(qiáng)化學(xué)習(xí)取代監(jiān)督微調(diào)和基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí),用機(jī)器直接推測(cè)的方式來(lái)預(yù)測(cè)分?jǐn)?shù),顯著提高了強(qiáng)化學(xué)習(xí)的效率。

DeepSeek通過(guò)工程創(chuàng)新和優(yōu)化,降低了推理成本,打破了人工智能領(lǐng)域長(zhǎng)期以來(lái)對(duì)高算力的迷信,對(duì)人工智能產(chǎn)業(yè)的發(fā)展具有重大意義。

便捷本地部署

促進(jìn)技術(shù)應(yīng)用

DeepSeek在模型算法和工程優(yōu)化方面所進(jìn)行的系統(tǒng)級(jí)創(chuàng)新,為在受限資源下探索通用人工智能開(kāi)辟了新路。傳統(tǒng)大模型遵循的是一條“由通到專(zhuān)”的人工智能發(fā)展思路,與之相反,DeepSeek追求的是“由專(zhuān)到通”的人工智能發(fā)展路徑,通過(guò)引領(lǐng)人工智能技術(shù)生態(tài)的形成,邁向全社會(huì)分享的通用人工智能之路。

雖然以O(shè)penAI為代表的生成式人工智能紅紅火火,但多數(shù)企業(yè)不敢將自己的數(shù)據(jù)交給私有AI平臺(tái)生成自己的垂直模型,因?yàn)閾?dān)心提交的數(shù)據(jù)會(huì)泄露自己的技術(shù)機(jī)密。這可能是導(dǎo)致人工智能在很多行業(yè)難以落地和應(yīng)用的重要原因之一。

DeepSeek的出現(xiàn)化解了上述難題。人工智能領(lǐng)域的研究者可以將DeepSeek提供的小而精的模型下載到本地,即使斷網(wǎng)也可以“蒸餾”出高效率的垂直模型,從而增強(qiáng)當(dāng)?shù)厝斯ぶ悄軇?chuàng)新發(fā)展的能力。

人工智能不同于資本密集型和經(jīng)驗(yàn)積累型的集成電路產(chǎn)業(yè),不僅要“燒錢(qián)”,而且要“燒腦”,本質(zhì)上是比拼人的智力的新興產(chǎn)業(yè)。因此,人工智能產(chǎn)業(yè)具有明顯的不對(duì)稱(chēng)性,一個(gè)具有100多個(gè)聰明頭腦的小企業(yè)完全可以與市值上萬(wàn)億美元的龍頭企業(yè)展開(kāi)有力競(jìng)爭(zhēng)。

突破規(guī)模法則

引發(fā)行業(yè)思考

規(guī)模法則是指人工智能模型在推理階段(而非訓(xùn)練階段)通過(guò)增加計(jì)算資源即算力來(lái)提升性能。在AI領(lǐng)域,規(guī)模法則被認(rèn)為是“公理”,俗稱(chēng)“大力出奇跡”,OpenAI等龍頭企業(yè)和美國(guó)的AI投資界將其當(dāng)成制勝法寶。但是,規(guī)模法則不是像牛頓定律一樣經(jīng)過(guò)無(wú)數(shù)次驗(yàn)證的科學(xué)定律,而是OpenAI等公司近幾年研制大模型的經(jīng)驗(yàn)歸納。規(guī)模法則從科學(xué)研究的角度看,屬于對(duì)技術(shù)發(fā)展趨勢(shì)的猜想,從投資的角度看,屬于對(duì)某種技術(shù)路線的押注,包含難以克服的局限性。

人工智能是對(duì)未來(lái)技術(shù)的探索,探索路徑存在多種可能。人工智能本身也存在多元化的目標(biāo),探索的道路上有很多高山需要去攀登,攀登一座高山的路徑也不止一條。把一條道路或猜想當(dāng)成科學(xué)“公理”本身就不是科學(xué)的態(tài)度。

規(guī)模法則的倡導(dǎo)者,常以“強(qiáng)化學(xué)習(xí)之父”理查德·薩頓的文章《苦澀的教訓(xùn)》作為追求高算力的依據(jù):“研究人員曾一次又一次試圖通過(guò)精巧的工程設(shè)計(jì)來(lái)提升性能,但最終都敗給了簡(jiǎn)單粗暴的‘加大算力’方案,歷史證明,通用方法總是在AI領(lǐng)域勝出。”

最近兩年,薩頓本人對(duì)規(guī)模法則做了深刻反思。他指出,雖然規(guī)模法則在提升模型性能方面確實(shí)有效,但它并不是解決所有問(wèn)題的萬(wàn)能鑰匙。AI系統(tǒng)不僅需要具備強(qiáng)大的計(jì)算能力,還需要具備持續(xù)學(xué)習(xí)、適應(yīng)環(huán)境、理解復(fù)雜情境等能力,而這些往往難以通過(guò)簡(jiǎn)單地增加算力來(lái)實(shí)現(xiàn)。

圖靈獎(jiǎng)得主楊立昆和OpenAI前首席科學(xué)家伊利亞·蘇茨克維等人甚至直言,規(guī)模法則已觸及天花板。

DeepSeek的出現(xiàn),促使全球AI界嚴(yán)肅地思考這一技術(shù)發(fā)展路線問(wèn)題:是繼續(xù)燒錢(qián)豪賭,還是另辟蹊徑,在算法優(yōu)化上下更多功夫?

DeepSeek的成功在一定程度上表明“小力也能出奇跡”“算法和模型架構(gòu)優(yōu)化也能出奇跡”。隨著時(shí)間的推移,AI擴(kuò)展方法也在發(fā)生變化:最初是模型規(guī)模,后來(lái)是數(shù)據(jù)集大小和數(shù)據(jù)質(zhì)量,目前是推理時(shí)間和合成數(shù)據(jù)。

算力不容忽視

走好綠色之路

DeepSeek-R1是推理模型,從某種意義上說(shuō),它把業(yè)界對(duì)人工智能的關(guān)注重點(diǎn)從規(guī)模法則轉(zhuǎn)移到推理計(jì)算上。

如果就此斷言規(guī)模法則已經(jīng)走到盡頭,也是沒(méi)有根據(jù)的。與人腦的神經(jīng)連接復(fù)雜性相比,現(xiàn)在的人工神經(jīng)網(wǎng)絡(luò)至少還有上百倍的差距,繼續(xù)擴(kuò)大神經(jīng)網(wǎng)絡(luò)的規(guī)模和增加訓(xùn)練的數(shù)據(jù)量是非常必要的,但能否取得與投入相稱(chēng)的回報(bào),還要看今后的實(shí)際效果。  

DeepSeek的成功并沒(méi)有否定算力在人工智能發(fā)展中的關(guān)鍵作用。實(shí)際上,由于用于推理的設(shè)備大幅多于訓(xùn)練設(shè)備,所以推理所需要的算力將來(lái)會(huì)成為主要需求。通過(guò)算法優(yōu)化提高模型的效率十分重要,算力是解決人工智能問(wèn)題的必要條件,不容忽視,而走節(jié)省算力的綠色發(fā)展之路是我們的必然選擇。

(作者李國(guó)杰為中國(guó)工程院院士,長(zhǎng)期從事計(jì)算機(jī)體系結(jié)構(gòu)、并行算法、人工智能等研究,獲首屆何梁何利基金科技進(jìn)步獎(jiǎng),主持取得的科研成果獲國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)等。本文由尹振茂根據(jù)作者表述整理)

責(zé)任編輯:王梓辰校對(duì):張弛最后修改:
0

精選專(zhuān)題

領(lǐng)航新時(shí)代

精選文章

精選視頻

精選圖片

微信公眾平臺(tái):搜索“宣講家”或掃描下面的二維碼:
宣講家微信公眾平臺(tái)
您也可以通過(guò)點(diǎn)擊圖標(biāo)來(lái)訪問(wèn)官方微博或下載手機(jī)客戶(hù)端:
微博
微博
客戶(hù)端
客戶(hù)端
京公網(wǎng)安備京公網(wǎng)安備 11010102001556號(hào)