發(fā)力語(yǔ)料建設(shè) 讓人工智能健康成長(zhǎng)

最近中文2019字幕第二页,艳妇乳肉豪妇荡乳,中日韩高清无专码区2021,中文字幕乱码无码人妻系列蜜桃,曰本极品少妇videossexhd

發(fā)力語(yǔ)料建設(shè) 讓人工智能健康成長(zhǎng)

日前,在2024世界人工智能大會(huì)上,一場(chǎng)關(guān)于人工智能語(yǔ)料的論壇在上海首次舉辦。一年前,2023世界人工智能大會(huì)上,上海人工智能實(shí)驗(yàn)室、人民網(wǎng)、國(guó)家氣象中心等單位聯(lián)合發(fā)起的中國(guó)第一個(gè)大模型語(yǔ)料數(shù)據(jù)聯(lián)盟正式成立。人工智能大模型取決于三大要素:算力、算法、語(yǔ)料。中國(guó)是世界上數(shù)字化應(yīng)用場(chǎng)景最豐富的國(guó)家,各種場(chǎng)景提供了極為豐富的語(yǔ)料。中國(guó)是語(yǔ)料大國(guó),但各種語(yǔ)料仍存在參差不齊的情況,需進(jìn)一步加以規(guī)范。通過人工智能大模型,特定的輸入往往會(huì)生成特定的輸出,存在“種瓜得瓜,種豆得豆”的規(guī)律。從輸入端著手,強(qiáng)化語(yǔ)料建設(shè),可以推動(dòng)人工智能健康成長(zhǎng)。

在人工智能發(fā)展中,語(yǔ)料具有“賦能”和“教化”的雙重功能,前者通過全方位的知識(shí)轉(zhuǎn)移和訓(xùn)練,使得人工智能博聞強(qiáng)識(shí),融會(huì)貫通,進(jìn)而技藝超群;后者通過多維度的情感嵌入和價(jià)值對(duì)齊,讓人工智能“通情達(dá)理”,并且“善解人意”。例如,伴隨我國(guó)老齡化程度的加深,具有健康護(hù)理功能的養(yǎng)老護(hù)理機(jī)器人開始走進(jìn)人們的生活。越來越多的老年人希望在享受各種專業(yè)化養(yǎng)老服務(wù)的同時(shí),也能感受到親人照料般的溫暖。這就需要發(fā)揮語(yǔ)料的教化作用,結(jié)合特定的激勵(lì)算法,讓機(jī)器人以和藹可親的姿態(tài)、體貼入微的服務(wù),響應(yīng)并滿足老年人的養(yǎng)老需求。由此可見,在人工智能相關(guān)技術(shù)快速密集突破的過程中,要達(dá)到“強(qiáng)健其體魄、文明其精神”的目的,語(yǔ)料建設(shè)是關(guān)鍵,需要著重做好拓源、提質(zhì)、鑄魂三項(xiàng)工作。

首先是拓源。對(duì)于語(yǔ)料,人工智能大模型有異乎尋常的“好胃口”,當(dāng)前存在語(yǔ)料資源的較低水平供給與大模型高強(qiáng)度訓(xùn)練需求之間的矛盾。語(yǔ)料建設(shè)是一項(xiàng)復(fù)雜的系統(tǒng)工程,具有多源、高維、異構(gòu)、跨界、超限等典型特征,需要廣泛動(dòng)員和組織政府部門、行業(yè)組織、企業(yè)等各方力量,建立語(yǔ)料建設(shè)的統(tǒng)一戰(zhàn)線。全國(guó)各地紛紛行動(dòng),2023年,上海人工智能實(shí)驗(yàn)室宣布聯(lián)合語(yǔ)料數(shù)據(jù)聯(lián)盟成員單位,共同開源發(fā)布“書生·萬(wàn)卷”1.0多模態(tài)預(yù)訓(xùn)練語(yǔ)料。深圳數(shù)交所則聯(lián)合近50家單位成立“開放算料聯(lián)盟”,多家A股公司加盟。這在一定程度上緩解了語(yǔ)料資源供給不足的問題。未來仍然需要加快拓展來源渠道,將沉淀在行業(yè)壁壘間、藏身于隱秘空間里的各種語(yǔ)料資源發(fā)掘出來,為人工智能大模型的迭代升級(jí)提供動(dòng)力。

其次是提質(zhì)。語(yǔ)料涉及海量的數(shù)據(jù)、文本、圖片、語(yǔ)音、視頻等資源,既有“原材料”,也有“半成品”,要讓大模型能夠“吃”得下去,要靠數(shù)據(jù)庫(kù)技術(shù)解決“消化”問題。大模型不僅要吃得飽,還要吃得好,面向行業(yè)應(yīng)用的專業(yè)數(shù)據(jù)庫(kù)可以給AI大模型“開小灶”。

最后是鑄魂。語(yǔ)料對(duì)于人工智能的“思維方式”和“行為模式”具有潛移默化的影響。在語(yǔ)料建設(shè)中,既要開放包容,博采世界各國(guó)文化之所長(zhǎng);也要汲取中華優(yōu)秀傳統(tǒng)文化的精髓,為大模型準(zhǔn)備“中餐”。中文語(yǔ)料尤其是中式價(jià)值觀語(yǔ)料的缺位,輕則會(huì)影響面向國(guó)內(nèi)特定應(yīng)用場(chǎng)景的垂類大模型開發(fā)進(jìn)程,重則可能失去以我國(guó)的文化與價(jià)值觀賦能人工智能發(fā)展的機(jī)會(huì)。對(duì)此,應(yīng)未雨綢繆,加快高質(zhì)量中文語(yǔ)料資源建設(shè)的提速擴(kuò)容,并將中國(guó)特色社會(huì)主義文化的價(jià)值取向融入其中。讓功能日益強(qiáng)大的人工智能成為言端行正、德才兼?zhèn)涞?ldquo;好孩子”。

(作者:陳強(qiáng),系同濟(jì)大學(xué)經(jīng)濟(jì)與管理學(xué)院教授、上海市習(xí)近平新時(shí)代中國(guó)特色社會(huì)主義思想研究中心研究員)

責(zé)任編輯:王梓辰校對(duì):張弛最后修改:
0

精選專題

領(lǐng)航新時(shí)代

精選文章

精選視頻

精選圖片

微信公眾平臺(tái):搜索“宣講家”或掃描下面的二維碼:
宣講家微信公眾平臺(tái)
您也可以通過點(diǎn)擊圖標(biāo)來訪問官方微博或下載手機(jī)客戶端:
微博
微博
客戶端
客戶端
京公網(wǎng)安備京公網(wǎng)安備 11010102001556號(hào)