市民呼入到某市12345熱線,坐席接聽后邀請第三方部門進行三方通話。
與以往不同的是,坐席、所屬部門聽到市民的聲音是變聲的。
在通話中,感覺是一位聲音甜美的“妙音娘子”,
實則,在通話背后的是一位鏗鏘有力的中年男士。
現(xiàn)實生活中,人們 追求個性,也注重隱私 。
在人工智能技術(shù)加持下,智能交互將不僅需要滿足多場景下的交互需求,客戶體驗也迎來了革新,能幫助用戶展現(xiàn)自己的“多面人格”的同時,保障用戶的隱私權(quán)利。
在音頻處理領(lǐng)域,“變聲”是一個相對常見的功能,語音消息的變聲不難,但是在類似12345熱線中實時變聲,卻是個大挑戰(zhàn)。要保證在用戶無感的超低延時下對人聲進行特殊處理,怎么辦呢?
變聲的原理,是通過改變?nèi)寺暤囊粽{(diào)、音色,使輸出聲音在感官上與原始聲音不同。通過提取原聲語音中的內(nèi)容信息,包括原聲的節(jié)奏和情感,再結(jié)合特定人的音色進行轉(zhuǎn)換結(jié)合,復(fù)刻模仿特定人的聲音。這種基于音色與內(nèi)容分離的聲音轉(zhuǎn)換技術(shù),實現(xiàn)了聲音的cosplay,對用戶本身的音色沒有任何限制。
遠傳科技推出了MVGateWay變聲技術(shù),是智能語音方面新的突破,語音變聲不僅能實現(xiàn)說話人音色的逼真轉(zhuǎn)換,而且還能將說話人的語速、停頓等韻律、情感、言語方式在所指定的人物角*真體現(xiàn)出來,在不同人的聲音中切換自如實現(xiàn)自然的變聲效果。
▼ 可實現(xiàn)以下功能 ▼
?音色個性化定制:根據(jù)客戶場景,靈活定制各類變聲音色,如大叔變蘿莉;大叔變“妙音娘子”;
?多場景變聲服務(wù):針對變聲需求,提供語音實時變聲、非實時變聲,靈活滿足不同場景
?高性能服務(wù)保障:提供300路坐席并發(fā)的服務(wù)支撐
?穩(wěn)定技術(shù)接口:滿足多種產(chǎn)品端接入需求,提供穩(wěn)定技術(shù)接口,可靈活定制
遠傳科技的MVGateWay變聲技術(shù)不僅可以對通話中聲音的變聲處理和控制,完成對呼叫的控制和對媒體的控制,還兼容遠傳自研的全媒體智能交互平臺U-IPCC系統(tǒng),并作為一個補充模塊加入到IPCC 7.0系統(tǒng)中,實現(xiàn)啟動變聲控制、停止變聲控制、呼叫控制、媒體控制等功能。在專業(yè)客服、聲音美化、虛擬IP、電商直播等領(lǐng)域有著豐富的應(yīng)用空間。滿足客戶多種應(yīng)用場景下實現(xiàn)語音“變聲”,讓交互體驗更加豐富。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!