域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)
近日,在百度機(jī)器翻譯技術(shù)開(kāi)放日上,百度技術(shù)委員會(huì)聯(lián)席主席、自然語(yǔ)言處理部技術(shù)負(fù)責(zé)人吳華博士表示,基于領(lǐng)先的人工智能、神經(jīng)網(wǎng)絡(luò)以及自然語(yǔ)言處理技術(shù),百度早在1年多以前就率先發(fā)布了世界上首個(gè)互聯(lián)網(wǎng)NMT系統(tǒng),引領(lǐng)機(jī)器翻譯進(jìn)入神經(jīng)網(wǎng)絡(luò)翻譯時(shí)代。
近兩年,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(Neural Machine Translation, NMT)技術(shù)異軍突起,取得了翻譯質(zhì)量的大幅躍升。隨著其翻譯準(zhǔn)確度的提升,在文化全球化的時(shí)代背景推動(dòng)下,高度成熟的翻譯技術(shù)或?qū)㈤_(kāi)啟第二次全球化的浪潮。
而究竟是否達(dá)成推動(dòng),那么我們就需要來(lái)觀察一下,到底NMT技術(shù)發(fā)展到了何種階段,應(yīng)用到了何種階段,以及當(dāng)前的全球化時(shí)代背景又是怎樣?
一,NMT神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng)到底是什么
1)機(jī)器翻譯的前4個(gè)階段
1947年計(jì)算機(jī)誕生以來(lái),學(xué)界就開(kāi)始嘗試?yán)糜?jì)算機(jī)進(jìn)行機(jī)器翻譯,而從1947年到1991年這期間,機(jī)器翻譯并沒(méi)有太大的進(jìn)展,原因在于整個(gè)學(xué)界是讓機(jī)器在模擬人類(lèi)翻譯的過(guò)程,這也和計(jì)算機(jī)發(fā)展歷史的必然性有關(guān),這一階段沒(méi)有數(shù)據(jù),更沒(méi)有互聯(lián)網(wǎng),因此只能停留于算法迭代階段止步不前。
此后隨著互聯(lián)網(wǎng)的發(fā)展,各種在線大數(shù)據(jù)的增加,1991年基于數(shù)據(jù)的統(tǒng)計(jì)機(jī)器翻譯,讓機(jī)器翻譯的準(zhǔn)確度大幅度提升。
2)NMT成當(dāng)前主流
隨著深度學(xué)習(xí)的崛起,其被廣泛應(yīng)用到了各個(gè)數(shù)據(jù)挖掘領(lǐng)域,其運(yùn)行原理是讓機(jī)器自動(dòng)從更大規(guī)模的語(yǔ)言資料中學(xué)習(xí)規(guī)則,而非直接利用給定規(guī)則。2014年學(xué)界也開(kāi)始提出將深度學(xué)習(xí)應(yīng)用于機(jī)器翻譯,創(chuàng)造出神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)系統(tǒng)。
神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)從2014年9月提出,到百度2015年5月上線首個(gè)互聯(lián)網(wǎng)NMT系統(tǒng),只用了短短8個(gè)月時(shí)間。2015年百度翻譯正式上線NMT系統(tǒng),成為世界范圍內(nèi)第一個(gè)真正實(shí)用的NMT系統(tǒng)。而谷歌在2016年9月才發(fā)布第一款NMT翻譯系統(tǒng),比百度晚了整整兩年。
二,NMT翻譯已有大量應(yīng)用
各大巨頭開(kāi)始緊盯NMT翻譯技術(shù),則正是說(shuō)明了隨著機(jī)器翻譯準(zhǔn)確率的大幅度上升,機(jī)器翻譯將有廣闊的商業(yè)前景,擺脫此前只存在于大學(xué)實(shí)驗(yàn)室的研究狀態(tài)。
而百度,谷歌等公司早就開(kāi)啟了實(shí)際的應(yīng)用,以百度為例,目前的百度翻譯支持全球28種語(yǔ)言互譯,756個(gè)翻譯方向,每日響應(yīng)過(guò)億次的翻譯請(qǐng)求,而這一切的原因在于實(shí)際應(yīng)用。
1)應(yīng)用于學(xué)習(xí)
很多中學(xué)生以及大學(xué)生都會(huì)通過(guò)百度網(wǎng)頁(yè)翻譯、APP對(duì)不懂的詞匯進(jìn)行翻譯學(xué)習(xí),對(duì)于生詞,不僅能查到讀音、用法,還能看到具體的使用場(chǎng)景和權(quán)威例句。對(duì)于不認(rèn)識(shí)的物體,結(jié)合圖像識(shí)別進(jìn)行實(shí)物翻譯,給出多種語(yǔ)言的描述,幫助記憶。
2)應(yīng)用于境外游
百度翻譯最具備商業(yè)化的使用場(chǎng)景,依然在境外游市場(chǎng),結(jié)合百度其他人工智能技術(shù),百度翻譯目前應(yīng)用在如下場(chǎng)景。
首先是圖片技術(shù)+翻譯,當(dāng)用戶(hù)無(wú)法識(shí)別建筑物上的標(biāo)志時(shí),通過(guò)拍照就可以讓百度翻譯為其進(jìn)行精準(zhǔn)的翻譯。而當(dāng)用戶(hù)在國(guó)外點(diǎn)餐時(shí),通過(guò)百度翻譯拍照識(shí)別同樣很重要。
其次是語(yǔ)音識(shí)別技術(shù)+翻譯,百度翻譯中有個(gè)“對(duì)話翻譯”功能,可以讓用戶(hù)和國(guó)外用戶(hù)直接實(shí)時(shí)對(duì)話,一旦用戶(hù)說(shuō)完一個(gè)語(yǔ)言,機(jī)器就會(huì)馬上翻譯成另一種語(yǔ)言并語(yǔ)音讀出,實(shí)現(xiàn)無(wú)障礙交流。
3)中國(guó)企業(yè)的全球化賦能
百度翻譯還開(kāi)放了API接口,助力廣大企業(yè)國(guó)際化。目前已有超過(guò)2萬(wàn)個(gè)第三方應(yīng)用接入。華為、OPPO、中興、三星等手機(jī)廠商,金山詞霸、靈格斯詞霸、敦煌網(wǎng)等眾多產(chǎn)均接入了百度翻譯API。世界知識(shí)產(chǎn)權(quán)組織(WIPO)也將百度翻譯API集成到官網(wǎng),供用戶(hù)將專(zhuān)利信息翻譯成不同語(yǔ)種查詢(xún)。對(duì)于這些企業(yè)的國(guó)際化來(lái)說(shuō),百度翻譯有著極其重要的作用。
而未來(lái)隨著一帶一路戰(zhàn)略的推進(jìn),我國(guó)還將繼續(xù)鼓勵(lì)更多的企業(yè)進(jìn)行全球化,而翻譯技術(shù)將在未來(lái)起到不可或缺的作用。
三,文化全球化時(shí)代,NMT翻譯技術(shù)或?qū)㈤_(kāi)啟第二次全球化浪潮
此前一輪的全球化浪潮主要在于工業(yè)的驅(qū)動(dòng),分工的經(jīng)濟(jì)帶來(lái)了全球經(jīng)濟(jì)旺盛的增長(zhǎng),但隨著基礎(chǔ)設(shè)施建立的完成,滿(mǎn)足了溫飽階段之后,文化需求開(kāi)始增長(zhǎng),各國(guó)之間的文化交流也越來(lái)越密切。
在娛樂(lè)領(lǐng)域,我們看到近期火爆國(guó)內(nèi)電影市場(chǎng)電影包括《神奇動(dòng)物在哪里》、《佩小姐的奇幻城堡》、《你的名字》等等,均來(lái)自國(guó)外。此外,像各種英劇、美劇、韓劇、二次元?jiǎng)勇捕际蔷W(wǎng)民們非常樂(lè)于觀看的節(jié)目,有著極高的受眾。大量觀看影片的網(wǎng)民們,其實(shí)早就習(xí)慣了那些充滿(mǎn)英語(yǔ)、韓語(yǔ)、日語(yǔ)的世界,通過(guò)大量的觀影,網(wǎng)民們?cè)缇拖藢?duì)其他國(guó)家在文化上的陌生與隔閡感。
與此同時(shí)在新聞?lì)I(lǐng)域,今年英國(guó)脫歐事件、法國(guó)恐襲事件、美國(guó)川普當(dāng)選事件、韓國(guó)樸槿惠閨蜜事件、也在國(guó)內(nèi)各大新聞客戶(hù)端持續(xù)發(fā)酵,成為網(wǎng)民們熱議的焦點(diǎn),熱度一點(diǎn)都不遜色于國(guó)內(nèi)事件。
所以,現(xiàn)在不僅僅是經(jīng)濟(jì)的全球化,而是一個(gè)文化正在全球化的時(shí)代,國(guó)內(nèi)用戶(hù)有著與國(guó)外用戶(hù)交流的渴望,他們也開(kāi)始越來(lái)越關(guān)心國(guó)外的文化娛樂(lè)、以及新聞事件,并且也越來(lái)越希望自己能夠在第一時(shí)間獲得國(guó)外大事件的信息,甚至是第一時(shí)間參與到對(duì)方的交流中。
但語(yǔ)言問(wèn)題卻是繞不過(guò)去的障礙因素,而現(xiàn)在基于NMT的翻譯技術(shù)則讓機(jī)器翻譯上升到了一個(gè)全新的臺(tái)階,無(wú)論是百度,還是谷歌都在發(fā)力NMT翻譯技術(shù),這對(duì)于全球化的交流來(lái)說(shuō)是一件好事。
基于文化逐漸融合的現(xiàn)狀,彼此交流的渴望,未來(lái)也一定會(huì)出現(xiàn)各個(gè)跨國(guó)的,滿(mǎn)足各種需求的網(wǎng)站或者APP,例如可以有一個(gè)韓劇迷的網(wǎng)站或者APP,同時(shí)容納中韓兩國(guó)國(guó)民,可以由美劇的網(wǎng)站或者APP同時(shí)容納中美兩國(guó)的國(guó)民。本國(guó)民眾都只需要輸入自己國(guó)家的語(yǔ)言,而通過(guò)翻譯技術(shù),在對(duì)方國(guó)家呈現(xiàn)出對(duì)方國(guó)家的語(yǔ)言,這一試想并非不可能,基于互聯(lián)網(wǎng)的NMT技術(shù)發(fā)展,這樣的一天或許就在不久后到來(lái)。
結(jié)語(yǔ):
隨著互聯(lián)網(wǎng)的來(lái)臨、大數(shù)據(jù)的爆發(fā),機(jī)器翻譯技術(shù)也迎來(lái)了自身的春天。而同時(shí)隨著文化的全球化時(shí)代的到來(lái),機(jī)器翻譯將會(huì)在其中扮演一股不小的力量。
NMT機(jī)器翻譯作為當(dāng)前最主流最有效的技術(shù),或?qū)㈤_(kāi)啟下一次的全球化浪潮。
作者微信公眾號(hào):首席發(fā)言者(shouxifayanzhe)
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!