近日,彭博蘋果記者Mark Gurman爆料稱,蘋果公司正在開發(fā)新的Siri體驗,未來將不再用“Hey Siri”/“嘿Siri”來觸發(fā)調(diào)用語音助手,而是將喚醒詞精簡為“Siri”,預(yù)計2023年某個時候或2024年正式推出。同時蘋果公司正在努力將Siri整合到第三方服務(wù)和應(yīng)用程序中,為用戶提供更多的語境和幫助。
該消息一放出便迅速被各大媒體關(guān)注報道,相關(guān)話題沖上多個社交平臺熱搜,引發(fā)科技大V及網(wǎng)友熱烈討論。不少科技博主表示,蘋果把Hey Siri改為Siri看似變動很少,但實則是技術(shù)的重大升級,這對人機語音交互系統(tǒng)的精準(zhǔn)度的要求非常之高。即便如此,全球科技公司均以此為目標(biāo)不遺余力的創(chuàng)新發(fā)展,期待突破。但如今,市面主流的語音助手喚醒詞仍普遍以四音節(jié)為主,如“Hey Google”、“小愛同學(xué)”、“小藝小藝”等。唯有國民智能科技品牌小度,于今年完成技術(shù)突破,成為全球首個實現(xiàn)全域面喚醒交互的科技企業(yè)。
那么,實現(xiàn)“免喚醒+指令”為何這么難?
除了科技博主們提到的“語音交互系統(tǒng)的精準(zhǔn)度”,誤喚醒也是實現(xiàn)這一技術(shù)的一大壁壘。二字詞較之于四字詞,音節(jié)更少,故同音詞、近音詞更多,誤喚醒風(fēng)險大大增加;另外,在喚醒并輸入指令后,智能設(shè)備響應(yīng)時間的快慢是影響用戶體驗的關(guān)鍵因素。如何實現(xiàn)語音助手在需要時靈敏反饋,在不需要時隱入日常,也是擺在所有科技企業(yè)面前的難題。
對于此,小度CTO朱凱華介紹稱小度使用了全球首創(chuàng)的全域免喚醒交互技術(shù),該技術(shù)依賴于靈敏的雙字喚醒引擎,同時結(jié)合深度學(xué)習(xí)的多模態(tài)的人機知性度判斷。在任何復(fù)雜環(huán)境中用戶只需要說“小度”再加上任意一句話就可以下達指令,如“小度來首歌”,“小度看電影”等。該技術(shù)完全告別了傳統(tǒng)的喚醒模式,大大提升了語音交互的便捷性,也讓用戶體驗再次升級。
自小度提前比蘋果推出“超大屏”平板以來,這是中國科技公司對國外龍頭企業(yè)的又一次超越。“十四五”以來,科技自立自強的發(fā)展支撐作用愈發(fā)明顯??梢钥吹礁嘀袊萍脊驹谏罡夹g(shù),布局未來,爭取在人工智能領(lǐng)域?qū)崿F(xiàn)趕超,告別關(guān)鍵技術(shù)“卡脖子”。同時,希望更多如小度一樣的中國科技企業(yè)不斷圍繞創(chuàng)新大力研發(fā)突破,讓世界看見中國AI力量!
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!