1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

智能音箱迎來升級戰(zhàn),語音識別成為其破局的關(guān)鍵

 2018-08-18 13:52  來源:A5專欄  我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

文/陳劍鋒

戶主回到家,室內(nèi)燈就自動開啟,室溫調(diào)至適宜溫度;

同時類似siri的小管家,還會貼心告訴你該要添置哪些家用了,步驟也不勞你費心,只要下個命令,siri就會去線上下單;

當你出門在外,你的汽車能完美實現(xiàn)自動駕駛,根本不用操心路況和認路問題。

以為這樣就玩了嗎?精彩的還在后頭——

如果在行駛的過程中你抑制不住心中的欲火開始..啪...啪...,這就算了,如果你還把玩著方向盤,siri是絕對不樂意了,還會勸你把管好你的幾幾。

你一定以為這是我幻想出的場景,其實不然,這是日前剛上映的外國科幻驚悚片《升級》中的場景。不過它或許在不久之后會映射入我們的真實生活場景當中。

智能音箱市場表面上形勢一片大好

在目前全球范圍內(nèi)掀起的人工智能浪潮中,智能音箱作為全新的人機交互體驗最佳的入口,成為了世界科技巨頭們打開AI大門必爭的突破口。目前智能音箱市場仍舊以亞馬遜Alexa為領(lǐng)先,其次是谷歌,而蘋果Siri和微軟Cortana仍處于苦苦追趕之勢。據(jù)【TechWeb】8月7日消息,亞馬遜憑借著這波熱潮,在全球售出了超過5000萬臺Alexa智能音箱,并希望憑借這個機會將自家產(chǎn)品與智能音箱進行整合。

再回到國內(nèi),隨著BAT的不斷加持和其它實力毫不遜色的互聯(lián)網(wǎng)獨角獸的全力布局,國內(nèi)智能音箱市場同樣迎來了前所未有的迅猛發(fā)展。根據(jù)Canalys的最新統(tǒng)計數(shù)據(jù)顯示,在2018年第二季度的全球智能音箱市場份額占比當中,中國智能音箱表現(xiàn)非常強勢,其中可以看到谷歌第一、亞馬遜第二,天貓精靈第三、小米第四。

值得一提的是,小米作為后殺人互聯(lián)網(wǎng)的手機制造商,憑借著“高性價比”和“爆款”的模式迅速突破層層防線入主眾多領(lǐng)域建立起強大的小米生態(tài)體系,智能音箱就是其中輝煌的一筆。

小米從去年到現(xiàn)在扎努了整個市場的12.2%份額,我們看到小愛同學憑借一個非常低的價格,在國內(nèi)市場頗受歡迎。與其他廠商不同的是,小米將智能音箱的門檻放得很低,而且打通了小米手機的語音助手,利用深度學習算法,做到不錯的表現(xiàn)效果。而在剛過去的15日,雷軍就宣布小愛同學的每月活躍設(shè)備數(shù)量超過3000萬,這也是小米IPO以來聽到的最好的消息。

由此可見,無論是在國外、還是在國內(nèi),智能音箱市場似乎整體看起來表現(xiàn)的都還不錯,形勢一片大好。但事實真的是這樣嗎?

智能語音的可控性值得擔憂

世界巨頭都在爭奪智能音箱通往AI的這個超級入口,但并不代表這個入口就已經(jīng)足夠的成熟,只是巨頭們不想錯過這個最佳的入口而已。事實上智能音箱只是一個載體,核心在于搭載的智能語音交互系統(tǒng)(即語音識別),而語音識別作為研究AI的重要基礎(chǔ),在語意的理解能力和識別的精準度的技術(shù)上是無法達到爐火純青的地步的,尤其是在搭載智能音箱之后的語音的控制上面值得擔憂。

盡管在考慮到全球語音市場的競爭格局之后,據(jù)外媒最新消息,亞馬遜Alexa和微軟的Cortana兩大語音助手正式聯(lián)姻。但也許仍然無法達到其預想中的完美形態(tài),譬如就無法播放部分在線音樂服務(wù)等。

這還不是最關(guān)鍵,最關(guān)鍵的是你無法掌握語音的可控性,簡單的來說,也就是你根本不知道什么時候就會無意間喚醒siri,更不知到從何時起你的談話被偷聽了,當快遞小哥突然給你送來一個包裹你卻還一臉懵逼。

據(jù)筆者在雷鋒網(wǎng)獲悉,在國外發(fā)生一件奇葩的新聞,亞馬遜Echo協(xié)助警方避免了一起謀殺案。國外一名男子在與女友發(fā)生爭吵時,男子拿槍指著女友質(zhì)問她:“你給警長打電話了?”而在旁邊的谷歌 Home 聽到了“給警長打電話”的命令,所以也就按命令執(zhí)行了。最后特警隊抵達事件所在地,安全的制止了事件的進一步發(fā)生。

這看起來還算是一件很好的事情,至少Echo可以幫你解決突發(fā)的危險和狀況。不過接下來的案例就不得不讓你生無可戀、甚至驚悚。

據(jù)說,國外一家洋娃娃公司在電視上播放了一則玩偶之家的廣告,該地區(qū)竟然數(shù)個家庭的亞馬遜Echo在聽到廣告后自動開始在網(wǎng)上訂購玩偶之家。這還不算,在國內(nèi)浙江大學電氣工程學院智能系統(tǒng)安全實驗室甚至曾成功對亞馬遜的音箱 Echo發(fā)起了“海豚攻擊”,通過利用麥克風的硬件漏洞,成功“黑”進智能設(shè)備的語音助手系統(tǒng),通過發(fā)出人耳無法聽到的超聲波語音,讓語音助手執(zhí)行他們所下達的指令,比如讓 Echo 在亞馬遜上買個東西。

而更加驚悚的是,MWR InfoSecurity 的研究人員發(fā)現(xiàn),老款亞馬遜 Echo 智能音箱中存在一個安全漏洞,黑客可以將 Echo 音箱變成竊聽器,而又不影響它的整體功效。原理是研究人員通過制作的一個插頭把 Echo 連上了筆記本電腦和 SD 讀卡器。然后利用調(diào)試工具破解了 Echo 的系統(tǒng),寫進去了一個專用的引導程序。而這臺 Echo 所有聽到的音頻流都會自動轉(zhuǎn)發(fā)到他的遠程服務(wù)器上,關(guān)鍵的是這臺智能音箱的其他功能看上去竟然一切正常。

也就是如果一旦智能音箱被不法的黑客入侵,用戶的大量數(shù)據(jù)和隱私安全將受到大量的威脅。

口語仍舊是語音識別很難突破的壁壘

再回到語意識別的精準度上,雖然如今全球在AI技術(shù)上不斷的突破,語音識別的精準度和理解能力上也達到堪稱完美的地步,諸如曾經(jīng)有媒體報道,谷歌Google Assistant將在2018年底將支持超過30種語言;除此之外,高通已經(jīng)開發(fā)出了一款能夠識別單詞和短語的語音識別設(shè)備,準確率高達95%。

不過如果這用在中文測試上,或許會顯得很Low了。眾所周知,中國在經(jīng)過幾千年的文化更替,其文字早已變得難以捉摸,尤其是演變出濃厚的各種地方特色語言早已超過了30種,就連中國人都不一定能夠聽得懂、更不用說毫無生機的機器語音識別了。

譬如,在一項研究中,就有人通過Alexa測試識別一些非本土口語的語種,結(jié)果顯示不準確率可達30%。而面對以西班牙語和漢語作為第一語言的人說英文,不管是Google Home還是亞馬遜 Echo,其識別率都是低的嚇人。

寫道最后

總而言之,語音識別在目前看來依然還存在眾多技術(shù)在短時間仍舊無法突破的壁壘。巨頭們大量的搶占智能音箱市場,只是因為它作為通往臥室鏈接AI最佳的解決方案。在巨頭們搶占了這個入口的同時,并不代表他就掌握了AI的超級入口,仍舊需要在語音識別的技術(shù)提升、創(chuàng)新上面不斷的研究和突破。

否則,即使你先搶占了智能音箱這個超級入口,但在智能音箱不斷迎來升級戰(zhàn)的過程中,你依然會很容易被后來者輕而易舉的超越和取代,畢竟AI作為技術(shù)創(chuàng)新極強的領(lǐng)域,只有不斷的技術(shù)創(chuàng)新和迭代升級,才有可能安穩(wěn)的渡過這場升級戰(zhàn),至于說能不能夠成為行業(yè)的標桿,至少得先活下來吧!

【陳劍鋒,科技自媒體人,長期關(guān)注AI和IoT等前沿科技,微信公眾號:劍鋒撩科技(cjftmt)】

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標簽
智能音箱

相關(guān)文章

  • 庫克已納投名狀:蘋果AI沒得選,只能選百度

    蘋果16弄了兩個版本,一個是專門給中國人用的,準備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型

  • AI加速時代的“進度條”,我們撥動了百分之幾?

    “技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切,都開始變得陌生?!庇嬎銠C之父約翰·馮·諾依曼曾這樣說到。

    標簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭的一句話。

    標簽:
    ai智能
  • “創(chuàng)造市場”與“算法進化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據(jù)主導地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進行排位先后、優(yōu)

    標簽:
    ai智能
  • 智能體進化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款AIAgent真的實現(xiàn)了流程全自動化AIAgent構(gòu)建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應用門檻實在智能重磅發(fā)布實

  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經(jīng)創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內(nèi)大模型

    標簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標簽:
    數(shù)字人
  • 來到IPO關(guān)口,地平線離“三分天下”還有多遠?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機器人大會引領(lǐng)產(chǎn)業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍圖

    8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知