高速公路上,無人駕駛駛?cè)氍F(xiàn)實(shí),沒有司機(jī)的出租車正搭載乘客,以“頂格”時(shí)速駛向機(jī)場;
手術(shù)室里,腹腔鏡中纖毫畢現(xiàn),醫(yī)生正用醫(yī)療機(jī)械臂為遠(yuǎn)在新疆的患者實(shí)施腫瘤切除手術(shù);
制造車間內(nèi),“鋼鐵巨象”翩然起舞,120余臺焊接、抓取、組裝和搬運(yùn)機(jī)器人正圍繞16條智能生產(chǎn)線各顯神通;
……
這些,只是數(shù)字化時(shí)代的北京城市一隅。在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,“智力”已如水、電、網(wǎng)一樣流向日常生活,一步步實(shí)現(xiàn)著人們對新質(zhì)生產(chǎn)力構(gòu)造的活躍社會的渴望。
數(shù)字賦能千行百業(yè),離不開“產(chǎn)業(yè)大腦”的支持。這“大腦”,就是人工智能的底座——大模型。
海淀區(qū)成府路150號。一棟看似普通的紅磚建筑里,集結(jié)了幾乎北京最頂尖的人工智能領(lǐng)域人才。這里,就是北京智源人工智能研究院所在地。也正是這棟樓里,誕生了我國首個(gè)大模型——“悟道”,這家研究院由此沖破西方國家的壟斷,推動(dòng)我國人工智能發(fā)展行至深處。
時(shí)不我待,構(gòu)筑人工智能生態(tài)“護(hù)城河”
2020年5月,美國著名人工智能公司Open AI發(fā)布一款名為“GPT-3”的語義大模型,一時(shí)掀起行業(yè)巨浪——通過海量數(shù)據(jù)學(xué)習(xí),人工智能首次出現(xiàn)了類似人類的邏輯推理能力。
中國的科研工作者在為GPT-3沸騰的同時(shí),也產(chǎn)生了極大的心理落差——彼時(shí),我國人工智能領(lǐng)域在各個(gè)方面并不占優(yōu)。
《中國新一代人工智能發(fā)展報(bào)告2019》顯示,當(dāng)時(shí),雖然我國人工智能領(lǐng)域論文數(shù)量全球居首,但引文影響力指標(biāo)卻相對落后;人才擁有量雖僅次于美國,但高水平人才卻不到美國的五分之一。即使是在全國人工智能高地的北京,大模型方向的研究也幾乎是空白。
更嚴(yán)峻的是,一旦被裹挾進(jìn)入西方構(gòu)建的人工智能生態(tài)圈,那么所有與之相關(guān)的產(chǎn)業(yè)鏈躍遷,都有可能被掣肘。如同手機(jī)上的應(yīng)用軟件,如果沒有強(qiáng)大的系統(tǒng)支撐,開發(fā)得再多、再好也用不了。“必須聚焦攻關(guān)自主可控的底座大模型,構(gòu)建起自己的人工智能生態(tài)‘護(hù)城河’。”清華大學(xué)自然語言處理實(shí)驗(yàn)室主任孫茂松說。
孫茂松和同事們四處尋求合作者,卻發(fā)現(xiàn)這項(xiàng)壁壘極高的研究,高校做不了,企業(yè)又不愿意做。雖是春暖花開的5月,他們卻猶如淋了一身冷水。
高校通常以“項(xiàng)目制”牽頭科研,大多以“年”為論證周期。但人工智能領(lǐng)域的科技創(chuàng)新瞬息萬變,必須全力追趕。顯然,這種科研機(jī)制與“大模型”的研發(fā)訓(xùn)練并不適配。
困擾企業(yè)的,則是投入產(chǎn)出比問題。大模型好似“空中樓閣”,需要算法、算力、數(shù)據(jù)的海量資金支持。況且,依據(jù)“摩爾定律”,投入的昂貴設(shè)備每18個(gè)月就會貶值一半,成果卻遙遙無期。這讓不少企業(yè)望而卻步。
躊躇之際,孫茂松、劉知遠(yuǎn)、黃民烈等幾位科學(xué)家不約而同地將目光投向了離清華只有幾百米遠(yuǎn)的一所新型研發(fā)機(jī)構(gòu)——北京智源人工智能研究院(以下簡稱“智源研究院”)。
這家新型研發(fā)機(jī)構(gòu),新在哪里?
成立于2018年11月的智源研究院,肩負(fù)著人工智能前沿探索使命,從主體、人才使用到成果轉(zhuǎn)化,解決的是創(chuàng)新研發(fā)中生產(chǎn)要素錯(cuò)配、失配、低配造成的堵點(diǎn)、痛點(diǎn)、難點(diǎn)。
“作為科技部和北京市政府支持下成立的民辦非營利性研究機(jī)構(gòu),智源實(shí)行理事會領(lǐng)導(dǎo)下的院長負(fù)責(zé)制。這就決定了它可以不設(shè)考核和階段性目標(biāo),鼓勵(lì)科學(xué)家自主決策,去破解那些顛覆性技術(shù)和前沿技術(shù)難題。”智源研究院理事長黃鐵軍舉了一個(gè)生動(dòng)的例子,“重大的國家級科研項(xiàng)目,用兩三年時(shí)間研究立項(xiàng)并不鮮見。但在智源,只要論證科學(xué)嚴(yán)謹(jǐn),兩小時(shí)通過由業(yè)內(nèi)頂級專家組成的‘院務(wù)會’、即刻撥付數(shù)百萬元研發(fā)資金,都是常態(tài)。”
制度集成、創(chuàng)新賦能,這是“時(shí)間不等人”的膽識??茖W(xué)家們與智源研究院一拍即合。
以技術(shù)為信仰,勇闖大模型研發(fā)“無人區(qū)”
2020年11月,智源研究院以北京市籌集的1000P算力支持為起點(diǎn),決心背水一戰(zhàn)。
沒有作業(yè)可以抄,沒有經(jīng)驗(yàn)可以循,有的是以技術(shù)為信仰的一腔熱情和錨定國家重大戰(zhàn)略需求的不懈努力。智源研究院將參與者整合為3個(gè)小組,深入中文大模型研發(fā)“無人區(qū)”——一個(gè)個(gè)高風(fēng)險(xiǎn)、非共識、顛覆性的研究領(lǐng)域。
以文源團(tuán)隊(duì)負(fù)責(zé)的超大規(guī)模預(yù)訓(xùn)練語言模型為例。他們遇到的第一個(gè)困難,就是怎么阻止大模型“詞不達(dá)意”和“答非所問”。原來,當(dāng)時(shí)全球通用大模型數(shù)據(jù)訓(xùn)練集里,中文語料僅占1.3%。團(tuán)隊(duì)搜索得來的50TB原始數(shù)據(jù),主要源自電商、社交、搜索等渠道,存在大量的數(shù)據(jù)偏見。高質(zhì)量中文數(shù)據(jù),一度成為稀缺品。
中文語義深?yuàn)W又靈活多變,給大模型“投喂”的語料質(zhì)量,對運(yùn)行效果影響極大。團(tuán)隊(duì)決心秉持細(xì)節(jié)上的“技術(shù)潔癖”,構(gòu)建高質(zhì)量數(shù)據(jù)集,讓大模型高效、經(jīng)濟(jì)地運(yùn)行。團(tuán)隊(duì)負(fù)責(zé)人劉知遠(yuǎn)與黃民烈所帶的8名博士生,全被派去做數(shù)據(jù)標(biāo)注與“清洗”。
他們夜以繼日地比對、推敲著每行編碼,以確保數(shù)據(jù)的完整、全面、合法且唯一。其間,團(tuán)隊(duì)沒有發(fā)表過一篇學(xué)術(shù)論文。這樣做,無論是對教師還是對學(xué)生,都是極大的冒險(xiǎn)。“如果一無所獲,我們在學(xué)校的學(xué)術(shù)考核將被認(rèn)定為不合格。”黃民烈說,“這是拿著大家的職業(yè)生涯去做賭注。幸運(yùn)的是,我們的方向找對了!”
最終,團(tuán)隊(duì)將原始數(shù)據(jù)壓縮至2.6TB,中文大模型有了第一個(gè)高質(zhì)量數(shù)據(jù)集。
從高端芯片到深度學(xué)習(xí)框架,從算力、算法到數(shù)據(jù)……智源研究院集中優(yōu)勢資源,奮力攻關(guān)。2021年3月,“悟道1.0”問世。3個(gè)月后,“悟道2.0”亮相,參數(shù)規(guī)模是GPT-3的10倍。
“悟道”,驟然改變了世界人工智能領(lǐng)域一家獨(dú)大的發(fā)展格局。正是從這時(shí)起,智源研究院被全球人工智能領(lǐng)域三巨頭之一的微軟公司視為主要競爭對手。與此同時(shí),國家加快布局人工智能產(chǎn)業(yè),并將其寫入“十四五”規(guī)劃。
以人工智能為引擎,高質(zhì)量發(fā)展的底色更加鮮明。智源研究院的不懈探索,仿佛解開了中文大模型的研發(fā)密碼。隨即,猶如百舸爭流,科技企業(yè)紛紛跟進(jìn),創(chuàng)新火花競相迸發(fā)。截至2024年3月,國內(nèi)大模型數(shù)量超243個(gè)。我國的大模型發(fā)展,已經(jīng)形成了一條壁壘極高的技術(shù)“護(hù)城河”,得以涵養(yǎng)整個(gè)產(chǎn)業(yè)生態(tài)。
理想與使命合一,形成人才“強(qiáng)磁場”
“群星閃耀”,有人用這樣的詞,形容智源研究院的人才生態(tài)。
眾所周知,人工智能作為前沿科技,離不開人才驅(qū)動(dòng)。近年來,智源研究院已經(jīng)遴選并支持以“智源研究員”和“智源青年科學(xué)家”為主體的94名智源學(xué)者,其中近一半為38歲以下的青年學(xué)者。他們的學(xué)術(shù)背景橫跨高校、科研單位及企業(yè)研究機(jī)構(gòu),形成了代表我國人工智能領(lǐng)先科研水平的“北京隊(duì)”。
人們不免疑惑:作為一家民辦非營利研究機(jī)構(gòu),智源研究院既沒有“帽子”,待遇也無法與頭部企業(yè)對標(biāo),緣何吸引這樣一批頂級人才?
“在這里,既是在做自己想做的事,也是在做國家和社會需要的事。當(dāng)理想與使命合一,就會迸發(fā)最強(qiáng)驅(qū)動(dòng)力。”智源研究院副院長林詠華用親身經(jīng)歷給出了答案。
近兩年,國內(nèi)人工智能領(lǐng)域已進(jìn)入“百模大戰(zhàn)”階段。為避免無序競爭,智源研究院將目光轉(zhuǎn)向營造更健康的大模型生態(tài)圈。
2023年,林詠華決心以“科學(xué)度量大模型評測基準(zhǔn)”為研究方向,申報(bào)科技部重點(diǎn)課題。作為人工智能領(lǐng)域的開創(chuàng)者之一,林詠華覺得一切本該水到渠成。當(dāng)她興沖沖地去領(lǐng)申報(bào)材料時(shí),卻被告知不符合初選資格——沒有正高級職稱。
只能盡快申請職稱。但了解政策后,林詠華又遇波折——由于研究的領(lǐng)域太過前沿,自己根本沒有符合的職稱序列可以申報(bào),更找不到合適的專家來評審。
了解情況后,黃鐵軍找到她:“只要有好的想法,智源會創(chuàng)造一切條件幫助科研人員實(shí)現(xiàn)。”不問出身、不看論文,只看是否取得標(biāo)桿性成就、有沒有成為標(biāo)桿的潛力——從誕生之日起,智源研究院的選人、用人機(jī)制,就一直向?qū)W術(shù)實(shí)力和科研潛力傾斜。
2023年3月,黃鐵軍找到北京市人力資源和社會保障局尋求幫助。“職稱評聘工作的改革方向,必須與國家發(fā)展戰(zhàn)略同心同向。”市人社局答復(fù)。
僅僅一個(gè)月后,《北京市高層次、急需緊缺、特殊特藝人才高級職稱考核認(rèn)定辦法》出臺。通過“一事一議”“一人一策”“隨時(shí)隨刻”評審、“3+1”實(shí)名舉薦,很快,林詠華獲得了正高級職稱。她也成為受益于此辦法的第一人。
同年,林詠華承接的國家科技部重點(diǎn)課題正式立項(xiàng)。這個(gè)課題,也讓智源研究院完成了從“運(yùn)動(dòng)員”到“裁判員”的角色轉(zhuǎn)變。
“這在別處是難以想象的。它給我們的動(dòng)力,不是優(yōu)渥的待遇能給予的。”林詠華如是說。
林詠華的經(jīng)歷,只是智源研究院眾多科研人員的一個(gè)縮影。“智源是以公共利益為導(dǎo)向的研究機(jī)構(gòu),注定無法提供最具競爭力的薪酬”,智源研究院院長王仲遠(yuǎn)說,“但這也是一種篩選同行者的良性機(jī)制。”3個(gè)月前,他剛從業(yè)界一家頭部公司離職,降薪90%來到這里。
從“實(shí)驗(yàn)室”走向“應(yīng)用場”,賦能千行百業(yè)
作為開源系統(tǒng),“悟道”大模型已被下載2000余萬次。每次下載,都有可能是對某條生產(chǎn)線、某個(gè)企業(yè)甚至某個(gè)產(chǎn)業(yè)的一次數(shù)字賦能。“這也是智源的一個(gè)重要使命,讓科技創(chuàng)新成果不斷從‘實(shí)驗(yàn)室’走向‘應(yīng)用場’。”黃鐵軍說。
功成不必在我。不僅是開源大模型,在科研過程中生發(fā)成熟項(xiàng)目,智源研究院在助推成果轉(zhuǎn)化時(shí),同樣不遺余力。
算法工程師趙撼宇,一畢業(yè)就來到了智源研究院。他的一項(xiàng)專利技術(shù),在“悟道”與OPPO手機(jī)小布語音助手的合作項(xiàng)目中,發(fā)揮了關(guān)鍵作用。“在成果落地的那刻,我感到自己的價(jià)值得到了認(rèn)可。”趙撼宇說。
同許多手機(jī)廠商一樣,OPPO小布以往依據(jù)的是互聯(lián)網(wǎng)數(shù)據(jù),有數(shù)以億計(jì)的問題難以回答,非常影響用戶體驗(yàn)。但如果自建語料庫,周期長、人工數(shù)據(jù)標(biāo)注成本高,企業(yè)難以承受。他們找到智源研究院學(xué)術(shù)副院長唐杰尋求幫助,唐杰將“悟道”大模型中趙撼宇負(fù)責(zé)研發(fā)的“生成式回答系統(tǒng)”推薦給了企業(yè)。
2023年年底,OPPO小布接入“悟道”,一紙專利,使手機(jī)語音助手的單條回答建設(shè)成本降低了99%,徹底解決了一個(gè)行業(yè)的共通性問題。
“科研工作者雖然有極強(qiáng)的創(chuàng)新能力,但成熟項(xiàng)目的轉(zhuǎn)化落地并不盡如人意。”智源科研運(yùn)營部經(jīng)理趙小帆說,“企業(yè)如何選址、怎樣融資和申請政府引導(dǎo)基金、去哪里組建工程技術(shù)團(tuán)隊(duì)等問題,智源都會手把手地幫助他們落地。”
曾任賽迪集團(tuán)總裁的孫會峰,在我國加入世貿(mào)組織談判過程中,隨團(tuán)調(diào)研了大量中國企業(yè)。他發(fā)現(xiàn),大部分企業(yè)70%的時(shí)間都花在了了解產(chǎn)業(yè)鏈、合作伙伴、競爭對手和各地產(chǎn)業(yè)政策上,在企業(yè)研發(fā)上投入的精力顯得力不從心。
當(dāng)接觸到“悟道”大模型時(shí),孫會峰豁然開朗:“借助智源的產(chǎn)業(yè)知識計(jì)算引擎,能俯瞰整個(gè)生態(tài),為企業(yè)打開‘上帝視角’,觀察趨勢。”抱著這樣的想法,他決心自己創(chuàng)業(yè)。
來到智源研究院,孫會峰感覺收獲更多。2021年,借助智源研究院天使輪投資1000萬元,孫會峰成立了北京上奇數(shù)字科技有限公司(以下簡稱“上奇數(shù)科”)。幾個(gè)月后,智源研究院又幫他暢通了國家專利局的專利綠色通道,以往1年半時(shí)間才能獲得的專利授權(quán),現(xiàn)在4個(gè)月就拿到了,這讓上奇數(shù)科得以在激烈的人工智能“卡位賽中”占得先機(jī)。
不僅如此。當(dāng)孫會峰為如何優(yōu)化產(chǎn)業(yè)鏈精度而苦惱時(shí),智源研究院又為他推薦了算法工程師史業(yè)民。“一次調(diào)教,產(chǎn)業(yè)圖譜的精度便從70%上升至98%。”孫會峰說。現(xiàn)在,上奇數(shù)科的產(chǎn)業(yè)知識圖譜“上奇產(chǎn)業(yè)通”兩秒就能實(shí)時(shí)生成包括100余條產(chǎn)業(yè)鏈、5000萬家企業(yè)在內(nèi)的40余類產(chǎn)業(yè)數(shù)據(jù)集。
好風(fēng)憑借力。
成立僅3年,上奇數(shù)科迅速成長為國家級專精特新企業(yè),估值達(dá)10億元。
注重“從0到1”的原始創(chuàng)新,也注重“從1到N”的產(chǎn)業(yè)轉(zhuǎn)化,通過產(chǎn)學(xué)研用緊密合作,智源研究院至今已孵化了“月之暗面”“深言科技”等近百家企業(yè),其中10余家已成為“獨(dú)角獸”。
有這樣一組數(shù)據(jù),令人振奮:作為數(shù)字經(jīng)濟(jì)發(fā)展的重要驅(qū)動(dòng)引擎,2023年,北京人工智能產(chǎn)業(yè)的核心產(chǎn)值突破2500億元,輻射產(chǎn)值規(guī)模已超萬億元!
又是一個(gè)草長鶯飛的季節(jié)。前不久閉幕的中關(guān)村論壇上,智源研究院等16家機(jī)構(gòu)發(fā)起并成立了中關(guān)村人工智能聯(lián)盟。一群銘記國家使命的科學(xué)工作者,錨定國家重大戰(zhàn)略需求和北京數(shù)字經(jīng)濟(jì)標(biāo)桿城市建設(shè),正在向科學(xué)技術(shù)的更深處進(jìn)軍……
已有0人發(fā)表了評論