田溯寧:
下面有請王小川給我們演講,他帶領(lǐng)的公司剛剛在納斯達(dá)克上市,我們給他一個(gè)祝賀。
2017-12-04 13:25:48
搜狗首席執(zhí)行官前搜狐首席技術(shù)官 王小川:
大家好,今天我給大家的題目是嚴(yán)格按照今天大連接時(shí)代來做的,所以是大連接跟人工智能之間的關(guān)系。
還是介紹一下我?guī)淼囊粋€(gè)同聲傳譯系統(tǒng),去年在烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)上就首秀,這是第二次,那上一次的時(shí)候還只是給了字幕,這次可以切到同聲傳譯機(jī)的頻道3和頻道4,就是能夠直接聽到用美國男聲和美國女聲的播報(bào),頻道5是一個(gè)彩蛋,是用我英文的聲音發(fā)音的,非常難聽。
說到連接,我們傳統(tǒng)的定義是連接人和人、人和信息、人和交易,包括現(xiàn)在的連接服務(wù)和設(shè)備。那么在大連接時(shí)代,這樣一個(gè)連接已經(jīng)非常的充分,下一步會(huì)往什么地方走呢?開始需要用到人工智能一些技術(shù),人工智能我們可以分三個(gè)維度來看它的功能,一個(gè)是識(shí)別,一個(gè)是生成,一個(gè)是決策,這三個(gè)模式能夠?qū)Υ筮B接時(shí)代重新的賦能。
搜狗在做人工智能的時(shí)候,我們是以語言為核心,那么從狹義的人工智能到廣義的人工智能語言是中間的交界點(diǎn),語言本人既具有簡單的處理的可能性,同時(shí)也是對于通用人工智能時(shí)代的推理和知識(shí)的載體,所以用語言本身可以承載我們的感知、聽覺和視覺,把聲音轉(zhuǎn)成文字,把視覺轉(zhuǎn)成文字。
在展廳里面這次搜狗帶了一個(gè)唇語識(shí)別機(jī)器,不用聲音,就只看你嘴唇的運(yùn)動(dòng)就可以知道你在說什么。從文字本身能建立很好的對話、翻譯和問答的能力,通過這種能力,是給大連接時(shí)代提供新的機(jī)會(huì)。
所以看到在連接人和人的可能性當(dāng)中,騰訊做了很多的工作,但是我們看到今天這樣一個(gè)連接,還是基于中文的交流,那如果我們跟西方人進(jìn)行交流的時(shí)候,光連接就不夠了,所以這時(shí)候就開始有翻譯的系統(tǒng),因此人工智能對連接人和人能夠產(chǎn)生幫助,左邊我打勾和右面打勾是指的連接和人工智能上新的匹配。
這里面看到輸入法我們有自動(dòng)的輸入的翻譯功能了,那么這里面做了兩個(gè)展示,圖比較小,上面是當(dāng)你敲文字的時(shí)候,當(dāng)你點(diǎn)一個(gè)鍵就能轉(zhuǎn)化成英文發(fā)送,下面可以用語音,說中文的時(shí)候輸入的內(nèi)容就已經(jīng)轉(zhuǎn)成英文,我們一些需要跟國外打交道的朋友已經(jīng)在用這樣的功能,就是當(dāng)你有兩個(gè)點(diǎn)擊的時(shí)候就能夠輸入中文獲得英文的答案。
2017-12-04 13:27:11
王小川:
那么第二件事情是連接人和信息,今天我們也是,當(dāng)我們連接信息的時(shí)候搜索引擎承擔(dān)了很重要的作用,我們得到中文的內(nèi)容,但是通過人工智能的翻譯功能和問答功能,能夠使得連接到更加全面和有用的信息,所以看到在翻譯功能,今天提供的英文頻道,你可以用中文詞去搜索,能夠獲得全球的英文內(nèi)容,并且自動(dòng)翻譯成中文讓你閱讀,就相當(dāng)于傳統(tǒng)的搜索引擎,我們這個(gè)信息獲取能力就變的強(qiáng)很多,尤其是對于中國人。
這里面翻譯APP由于時(shí)間關(guān)系就不做后面的展示,其實(shí)大家可以用到我們APP的時(shí)候不僅能夠做很好的中英文的翻譯,甚至可以用圖像方式拍一個(gè)菜單拍一個(gè)路標(biāo),就能夠?qū)崟r(shí)圖像增強(qiáng)變成中文的字母。
連接信息的時(shí)候,以前搜索引擎的顆粒度是提供一篇文章給你,輸入一個(gè)關(guān)健詞得到一篇文章,但隨著人工智能增強(qiáng),今天一個(gè)前沿的技術(shù)叫做“閱讀理解”,也就是機(jī)器不僅能夠讀一篇文章,能夠理解這個(gè)文章當(dāng)中在說什么,當(dāng)你提問題的時(shí)候直接給你一個(gè)答案。
我們?nèi)ツ臧l(fā)布了一個(gè)汪仔機(jī)器,本身并沒有數(shù)據(jù)庫,但能回答問題,就把整個(gè)互聯(lián)網(wǎng)當(dāng)做它的數(shù)據(jù)的來源,提供這樣直接的問答的能力,這也是我們認(rèn)為搜索的下一代在連接信息的時(shí)候AI帶來的一個(gè)新的幫助。
這里面會(huì)給大家演示一下我們這樣一個(gè)變遷,從原來的拼音輸入走向了語言、手勢、表情的輸入,也有一個(gè)唇語識(shí)別,在這里時(shí)間關(guān)系不給大家做展開了,另外給大家聽一段聲音叫“風(fēng)格遷移”,就是在語音圖像里面不僅做識(shí)別,而且是機(jī)器能生成你自己個(gè)性化的聲音,甚至做聲音風(fēng)格的遷移,這里面展示的是我們的技術(shù),是用我的音色去唱一首歌,這首歌在網(wǎng)上有現(xiàn)成的,能夠把我的音色遷移進(jìn)去。就是用我的聲音用了14分鐘進(jìn)行了特征的提取,把它遷移到一首歌去,可以用我的聲音唱歌、講相聲。
最后提到一個(gè)連接服務(wù),這個(gè)服務(wù)我們有購物服務(wù),更多還有一些智能的服務(wù),比如說醫(yī)療服務(wù)或者是法律服務(wù),在這個(gè)時(shí)候今天中國的醫(yī)生和律師的總的數(shù)量是不夠多的,所以光靠連接這些醫(yī)生或者連接這些律師,不能夠滿足用戶的需求,在這個(gè)時(shí)候AI在里面產(chǎn)生的作用就是能夠部分的去取代這樣一些醫(yī)生或者律師,對于他們之前提供服務(wù)進(jìn)行更多樣本的學(xué)習(xí),然后使得人機(jī)能夠做對話,對于通用的這樣一些問答的問題在醫(yī)療里面的簡單健康問題,或者是在法律里面關(guān)于離婚的問題、財(cái)產(chǎn)的問題或者是交通事故的問題,能夠做機(jī)器的回答。
這里面可以看到我們發(fā)布了搜狗明醫(yī)和搜狗大律師,基于搜索引擎看到有很多用戶在搜索上去問相關(guān)的問題,我們就能夠不僅可以提供網(wǎng)頁,而且基于更專業(yè)的歷史的醫(yī)案、法律的判案或者更多文獻(xiàn)進(jìn)行主動(dòng)的學(xué)習(xí)提供交互的方式,能夠使得服務(wù)不僅是連接,能夠提到提升,這是我給大家分享的我今天講的連接與AI之間的關(guān)系,搜狗的使命就是讓表達(dá)和獲取信息更簡單,謝謝。
2017-12-04 13:30:32
已有0人發(fā)表了評論