田溯寧:
下面有請(qǐng)王小川給我們演講,他帶領(lǐng)的公司剛剛在納斯達(dá)克上市,我們給他一個(gè)祝賀。
2017-12-04 13:25:48
搜狗首席執(zhí)行官前搜狐首席技術(shù)官 王小川:
大家好,今天我給大家的題目是嚴(yán)格按照今天大連接時(shí)代來(lái)做的,所以是大連接跟人工智能之間的關(guān)系。
還是介紹一下我?guī)?lái)的一個(gè)同聲傳譯系統(tǒng),去年在烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)上就首秀,這是第二次,那上一次的時(shí)候還只是給了字幕,這次可以切到同聲傳譯機(jī)的頻道3和頻道4,就是能夠直接聽(tīng)到用美國(guó)男聲和美國(guó)女聲的播報(bào),頻道5是一個(gè)彩蛋,是用我英文的聲音發(fā)音的,非常難聽(tīng)。
說(shuō)到連接,我們傳統(tǒng)的定義是連接人和人、人和信息、人和交易,包括現(xiàn)在的連接服務(wù)和設(shè)備。那么在大連接時(shí)代,這樣一個(gè)連接已經(jīng)非常的充分,下一步會(huì)往什么地方走呢?開(kāi)始需要用到人工智能一些技術(shù),人工智能我們可以分三個(gè)維度來(lái)看它的功能,一個(gè)是識(shí)別,一個(gè)是生成,一個(gè)是決策,這三個(gè)模式能夠?qū)Υ筮B接時(shí)代重新的賦能。
搜狗在做人工智能的時(shí)候,我們是以語(yǔ)言為核心,那么從狹義的人工智能到廣義的人工智能語(yǔ)言是中間的交界點(diǎn),語(yǔ)言本人既具有簡(jiǎn)單的處理的可能性,同時(shí)也是對(duì)于通用人工智能時(shí)代的推理和知識(shí)的載體,所以用語(yǔ)言本身可以承載我們的感知、聽(tīng)覺(jué)和視覺(jué),把聲音轉(zhuǎn)成文字,把視覺(jué)轉(zhuǎn)成文字。
在展廳里面這次搜狗帶了一個(gè)唇語(yǔ)識(shí)別機(jī)器,不用聲音,就只看你嘴唇的運(yùn)動(dòng)就可以知道你在說(shuō)什么。從文字本身能建立很好的對(duì)話(huà)、翻譯和問(wèn)答的能力,通過(guò)這種能力,是給大連接時(shí)代提供新的機(jī)會(huì)。
所以看到在連接人和人的可能性當(dāng)中,騰訊做了很多的工作,但是我們看到今天這樣一個(gè)連接,還是基于中文的交流,那如果我們跟西方人進(jìn)行交流的時(shí)候,光連接就不夠了,所以這時(shí)候就開(kāi)始有翻譯的系統(tǒng),因此人工智能對(duì)連接人和人能夠產(chǎn)生幫助,左邊我打勾和右面打勾是指的連接和人工智能上新的匹配。
這里面看到輸入法我們有自動(dòng)的輸入的翻譯功能了,那么這里面做了兩個(gè)展示,圖比較小,上面是當(dāng)你敲文字的時(shí)候,當(dāng)你點(diǎn)一個(gè)鍵就能轉(zhuǎn)化成英文發(fā)送,下面可以用語(yǔ)音,說(shuō)中文的時(shí)候輸入的內(nèi)容就已經(jīng)轉(zhuǎn)成英文,我們一些需要跟國(guó)外打交道的朋友已經(jīng)在用這樣的功能,就是當(dāng)你有兩個(gè)點(diǎn)擊的時(shí)候就能夠輸入中文獲得英文的答案。
2017-12-04 13:27:11
王小川:
那么第二件事情是連接人和信息,今天我們也是,當(dāng)我們連接信息的時(shí)候搜索引擎承擔(dān)了很重要的作用,我們得到中文的內(nèi)容,但是通過(guò)人工智能的翻譯功能和問(wèn)答功能,能夠使得連接到更加全面和有用的信息,所以看到在翻譯功能,今天提供的英文頻道,你可以用中文詞去搜索,能夠獲得全球的英文內(nèi)容,并且自動(dòng)翻譯成中文讓你閱讀,就相當(dāng)于傳統(tǒng)的搜索引擎,我們這個(gè)信息獲取能力就變的強(qiáng)很多,尤其是對(duì)于中國(guó)人。
這里面翻譯APP由于時(shí)間關(guān)系就不做后面的展示,其實(shí)大家可以用到我們APP的時(shí)候不僅能夠做很好的中英文的翻譯,甚至可以用圖像方式拍一個(gè)菜單拍一個(gè)路標(biāo),就能夠?qū)崟r(shí)圖像增強(qiáng)變成中文的字母。
連接信息的時(shí)候,以前搜索引擎的顆粒度是提供一篇文章給你,輸入一個(gè)關(guān)健詞得到一篇文章,但隨著人工智能增強(qiáng),今天一個(gè)前沿的技術(shù)叫做“閱讀理解”,也就是機(jī)器不僅能夠讀一篇文章,能夠理解這個(gè)文章當(dāng)中在說(shuō)什么,當(dāng)你提問(wèn)題的時(shí)候直接給你一個(gè)答案。
我們?nèi)ツ臧l(fā)布了一個(gè)汪仔機(jī)器,本身并沒(méi)有數(shù)據(jù)庫(kù),但能回答問(wèn)題,就把整個(gè)互聯(lián)網(wǎng)當(dāng)做它的數(shù)據(jù)的來(lái)源,提供這樣直接的問(wèn)答的能力,這也是我們認(rèn)為搜索的下一代在連接信息的時(shí)候AI帶來(lái)的一個(gè)新的幫助。
這里面會(huì)給大家演示一下我們這樣一個(gè)變遷,從原來(lái)的拼音輸入走向了語(yǔ)言、手勢(shì)、表情的輸入,也有一個(gè)唇語(yǔ)識(shí)別,在這里時(shí)間關(guān)系不給大家做展開(kāi)了,另外給大家聽(tīng)一段聲音叫“風(fēng)格遷移”,就是在語(yǔ)音圖像里面不僅做識(shí)別,而且是機(jī)器能生成你自己個(gè)性化的聲音,甚至做聲音風(fēng)格的遷移,這里面展示的是我們的技術(shù),是用我的音色去唱一首歌,這首歌在網(wǎng)上有現(xiàn)成的,能夠把我的音色遷移進(jìn)去。就是用我的聲音用了14分鐘進(jìn)行了特征的提取,把它遷移到一首歌去,可以用我的聲音唱歌、講相聲。
最后提到一個(gè)連接服務(wù),這個(gè)服務(wù)我們有購(gòu)物服務(wù),更多還有一些智能的服務(wù),比如說(shuō)醫(yī)療服務(wù)或者是法律服務(wù),在這個(gè)時(shí)候今天中國(guó)的醫(yī)生和律師的總的數(shù)量是不夠多的,所以光靠連接這些醫(yī)生或者連接這些律師,不能夠滿(mǎn)足用戶(hù)的需求,在這個(gè)時(shí)候AI在里面產(chǎn)生的作用就是能夠部分的去取代這樣一些醫(yī)生或者律師,對(duì)于他們之前提供服務(wù)進(jìn)行更多樣本的學(xué)習(xí),然后使得人機(jī)能夠做對(duì)話(huà),對(duì)于通用的這樣一些問(wèn)答的問(wèn)題在醫(yī)療里面的簡(jiǎn)單健康問(wèn)題,或者是在法律里面關(guān)于離婚的問(wèn)題、財(cái)產(chǎn)的問(wèn)題或者是交通事故的問(wèn)題,能夠做機(jī)器的回答。
這里面可以看到我們發(fā)布了搜狗明醫(yī)和搜狗大律師,基于搜索引擎看到有很多用戶(hù)在搜索上去問(wèn)相關(guān)的問(wèn)題,我們就能夠不僅可以提供網(wǎng)頁(yè),而且基于更專(zhuān)業(yè)的歷史的醫(yī)案、法律的判案或者更多文獻(xiàn)進(jìn)行主動(dòng)的學(xué)習(xí)提供交互的方式,能夠使得服務(wù)不僅是連接,能夠提到提升,這是我給大家分享的我今天講的連接與AI之間的關(guān)系,搜狗的使命就是讓表達(dá)和獲取信息更簡(jiǎn)單,謝謝。
2017-12-04 13:30:32
已有0人發(fā)表了評(píng)論