隨著我國人工智能、虛擬現(xiàn)實技術(shù)水平的不斷提高,數(shù)字人產(chǎn)業(yè)得以繁榮發(fā)展,尤其自2021年以來,“元宇宙”概念火遍大江南北,帶動了數(shù)字人在應(yīng)用層上的多元化態(tài)勢越發(fā)顯著。
目前數(shù)字人在企業(yè)級的應(yīng)用有媒體內(nèi)容播報、金融內(nèi)容服務(wù)、直播帶貨等多種場景,在消費級的化身有虛擬偶像、虛擬主播等。時至今日,數(shù)字人的應(yīng)用價值逐漸凸顯,其市場價值也隨之被持續(xù)抬高。
IDC報告顯示,中國AI數(shù)字人市場規(guī)模呈現(xiàn)高速增長趨勢,預(yù)計到2026年將達102.4億元人民幣?;谌绱藰酚^的市場前景,國內(nèi)百度、華為等有相關(guān)技術(shù)背景的大廠已經(jīng)開始摩拳擦掌深入布局。
百度:擴充B、C兩端場景
互聯(lián)網(wǎng)紅利觸頂,國內(nèi)大廠們都在著急忙慌地開拓新的發(fā)展方向,而元宇宙的走紅正好讓百度看到數(shù)字經(jīng)濟的商業(yè)模式和成功路徑,激發(fā)了百度業(yè)務(wù)延伸的新頭緒。此后,對于數(shù)字人領(lǐng)域,不論在用戶端還是產(chǎn)業(yè)端,百度都會積極參與。
在用戶端,盡可能將數(shù)字人關(guān)聯(lián)到用戶高頻場景,更好地服務(wù)用戶生活、娛樂等需求。百度在數(shù)字人的形象和功能方面不斷進行完善,致力于通過數(shù)字人和多元應(yīng)用場景融合的方式,為用戶創(chuàng)造價值,提供個性化的體驗。
比如在百度APP上線數(shù)字人龔俊和度曉曉,以語音交互的方式滿足用戶在購物、學(xué)習(xí)、出游等多個場景下的搜索需求;開放數(shù)字人平臺曦靈,用戶可以根據(jù)需求參與內(nèi)容創(chuàng)作,“捏”自己專屬的數(shù)字人。
值得一提的是,據(jù)2022年第一季度財報顯示,百度APP平均月活用戶已達到6.32億,日登陸用戶數(shù)達到83%。百度APP作為國內(nèi)首屈一指的搜索平臺,其龐大的用戶基數(shù)和豐富的應(yīng)用場景賦予了數(shù)字人更為廣泛的想象空間。
在產(chǎn)業(yè)端,打通數(shù)字人生產(chǎn)全鏈路的AI能力,滿足企業(yè)對數(shù)字人的定制化需求。目前,百度數(shù)字人落地應(yīng)用小有規(guī)模,經(jīng)由曦靈平臺打造的數(shù)字人已經(jīng)應(yīng)用在金融、文旅、互娛等多個領(lǐng)域。比如為浦發(fā)銀行打造的“數(shù)字員工”小浦、首位文博虛擬宣推官文夭夭。
可以預(yù)料到,在數(shù)字化轉(zhuǎn)型大勢以及元宇宙浪潮之下,B端客戶對數(shù)字人的需求有望大幅增長。一方面企業(yè)可以通過應(yīng)用數(shù)字人在營銷、服務(wù)等方面實現(xiàn)降本增效;另一方面可以借由數(shù)字人塑造元宇宙中的企業(yè)形象,提前布局,助力企業(yè)后續(xù)在元宇宙中占據(jù)一席之地。這么一看,數(shù)字人在產(chǎn)業(yè)端的發(fā)展前景相當(dāng)樂觀。
為了達成“讓每個人、每個企業(yè)在元宇宙里擁有一個分身、一個代表形象”的愿景,百度正在極力促成B、C兩端齊頭快跑,試圖推動更多數(shù)字人被應(yīng)用于商業(yè)落地場景。不難猜想,在之后百度勢必會穩(wěn)抓元宇宙的風(fēng)勢,在數(shù)字人應(yīng)用落地的創(chuàng)新之路上繼續(xù)又穩(wěn)又快地走下去。
華為:做好行業(yè)數(shù)字人底座
今年很明顯感覺到,華為下了決心要大舉挺進B端市場,深挖B端業(yè)務(wù)價值。在此大風(fēng)向下,華為在數(shù)字人B端領(lǐng)域的排兵布陣也迅速提上日程。
此前,數(shù)字人產(chǎn)業(yè)鏈割裂現(xiàn)象相對嚴(yán)重,關(guān)于數(shù)字人制作、內(nèi)容生產(chǎn)、服務(wù)等都分散在不同主體身上,各節(jié)點上的企業(yè)難以高效協(xié)作,這也導(dǎo)致了數(shù)字人的交付效率較為低下。
而針對此類痛點,華為則形成了一套解決竅門,即是秉承著華為云“技術(shù)即服務(wù)”的原則,更加專注于通過技術(shù)開放來滿足行業(yè)伙伴和開發(fā)者對數(shù)字人的需求。
在2022年6月15日,華為云在合作伙伴暨開發(fā)者大會推出數(shù)字內(nèi)容生產(chǎn)線MetaStudio,以及全新版的數(shù)字人“云笙”,滿足了各行業(yè)對數(shù)字內(nèi)容生產(chǎn)、協(xié)同、融合以及應(yīng)用的廣泛需求。
正如華為云CEO張平安所說,其目標(biāo)是為客戶提供全流程、場景化的數(shù)字人開發(fā)和應(yīng)用支持,使數(shù)字人進入千行百業(yè)。通過利用華為云的強大技術(shù)能力降低數(shù)字人的門檻,盡力幫助各行業(yè)在數(shù)字人領(lǐng)域中扎穩(wěn)腳步,看得出來,華為更樂于成為各行各業(yè)制作生產(chǎn)數(shù)字人的底座。
這其中的深層原因并不難理解。一來,有很多行業(yè)渴望與虛擬空間建立新觸點,數(shù)字人無疑是與虛擬空間最為直接的連接橋梁,只不過因為成本、制作難度等種種原因,大家在數(shù)字人的發(fā)展上一直小步前進。華為現(xiàn)在想要做的是幫助各行業(yè)減輕涉足數(shù)字人的負(fù)擔(dān),激發(fā)它們的需求,反哺自己成長。
二來,據(jù)公開數(shù)據(jù)顯示,目前華為云伙伴數(shù)量已超過38000家,開發(fā)者數(shù)量超過302萬,伙伴在華為云市場上架的應(yīng)用數(shù)量已達7400多個。華為云現(xiàn)已積累了大量的企業(yè)級客戶,未來可以順?biāo)浦蹖?shù)字人服務(wù)推向有需求的企業(yè)端,更加高效地實現(xiàn)其數(shù)字人服務(wù)的商業(yè)價值。
綜上來看,當(dāng)前AI數(shù)字人整體市場還未成熟,百度、華為等賽道上的玩家大多是在內(nèi)容、場景等方面進行差異化的探索,且基本都是在已有客戶群體或者用戶群體的領(lǐng)域依托自身技術(shù)進行深耕。表面上看,大家都在自我發(fā)展,相互之間并未有明顯的競爭沖突,但實際上在數(shù)字人技術(shù)方面,你追我趕的氣氛已經(jīng)逐漸變得緊張。
關(guān)乎AI實力的較量
數(shù)字人本身就是眾多AI技術(shù)的合集,因此往后關(guān)于數(shù)字人的競爭本質(zhì)上還是大廠之間AI實力的切磋。
IDC報告指出,當(dāng)前數(shù)字人大多處于L1-L3階段,可執(zhí)行簡單決策和操作,其應(yīng)用場景大多是平面展示、視頻錄播、實時互動。未來數(shù)字人將實現(xiàn)L4-L5水平,完全實現(xiàn)智能化交互,在某些領(lǐng)域逐步代替真人服務(wù),或成為個性化虛擬助手。
需要了解的是一個關(guān)鍵點是,AI能力領(lǐng)先的廠商可以更快實現(xiàn)L4-L5級水平,這也就意味著,AI能力較強的廠商在數(shù)字人方面上可以形成先手優(yōu)勢,拉開與其他競爭對手的距離。
對于華為來說,數(shù)字人是其長期以來在AI領(lǐng)域持續(xù)技術(shù)投入與引領(lǐng)創(chuàng)新的代表應(yīng)用,因而在數(shù)字人技術(shù)研發(fā)、升級等方面,華為都投入了相當(dāng)大的精力和高關(guān)注度。
目前,華為已形成AI全棧解決方案,原生關(guān)鍵技術(shù)等優(yōu)勢,實力可謂強勁。比如針對數(shù)字人直播,華為云MetaStudio通過普通攝像頭對人體動作的捕捉準(zhǔn)確度可提升至90%;在多元語音提取上,數(shù)字人口型準(zhǔn)確度達到95%以上。
只不過,百度在AI深耕多年,技術(shù)明顯比很多大廠見長。以百度智能云曦靈數(shù)字人平臺為例,在語音識別能力上,其語音識別準(zhǔn)確率達到98%,另外配合百度首創(chuàng)的音節(jié)并行技術(shù),其數(shù)字人口型合成準(zhǔn)確率達98.5%。
事實也確如所說,如今百度已經(jīng)憑借著AI底層技術(shù)的強大優(yōu)勢站上了行業(yè)的領(lǐng)先位置。IDC報告顯示,在中國AI數(shù)字人市場2022年評估中,百度智能云成為了第一梯隊的領(lǐng)軍者。
可以確定的是,在國內(nèi)不少大廠的努力下,AI行業(yè)的進化逐漸突破大眾的想象,與數(shù)字人的融合也越發(fā)緊密,而在AI技術(shù)持續(xù)變革的時代,企業(yè)進行技術(shù)升級的深度將對數(shù)字人發(fā)展的高度產(chǎn)生重大影響。所以,各大數(shù)字人廠商們未來或許更需要高度關(guān)注的是底層AI技術(shù)的深度升級層面。
數(shù)字人還差一大步
毫無疑問,在元宇宙概念的加持下,數(shù)字人賽道愈加火熱,行業(yè)整體也步入了“快車道”。但不能忽視的是,數(shù)字人目前在現(xiàn)實中還存在有許多的發(fā)展瓶頸。
其一,制作成本高,并不利于普及。百度副總裁吳甜曾點到,要打造一個高精度、高保真的非特異型虛擬人,動輒就需要百萬甚至上千萬的資金投入,特異型虛擬人則需要花費更多,且制作周期比較長。
正是定制化開發(fā)成本打不下來,在滿足產(chǎn)業(yè)端的高頻需求、升級需求時,既耗錢又耗時間,不斷抬高了企業(yè)的使用成本,也因此勸退了很多有意打造自有數(shù)字人的企業(yè)或者開發(fā)者,這也讓數(shù)字人距離普及應(yīng)用的目標(biāo)越來越遙遠。
其二,技術(shù)還沒完全到位,體驗較為粗糙。目前的數(shù)字人大多數(shù)都局限于2D展示,且在智能化形象生成、情感化表達、智能化交互等方面還存在“違和感”、“肢體和語音不協(xié)調(diào)”、“動作僵硬”等現(xiàn)象,比較缺乏足夠吸引開發(fā)者關(guān)注以及用戶興趣的體驗感。
雖說百度和華為能夠利用自身在技術(shù)上的優(yōu)勢,對行業(yè)存在的許多發(fā)展瓶頸點進行改善,但是要實現(xiàn)數(shù)字人的普及,需要深入更多的用戶場景、與更多具體的行業(yè)應(yīng)用深度結(jié)合,而這些得靠著許許多多的行業(yè)、企業(yè)以及開發(fā)者共同推進,而不是某一家企業(yè)或某一個行業(yè)的單打獨斗。
概而言之,在數(shù)字人時代緩緩走來的檔口,意圖成為長期主義者的百度和華為當(dāng)下任務(wù)還是在內(nèi)容、場景上精耕細(xì)作,努力練就與各行各業(yè)共生共贏的技術(shù)和本領(lǐng)。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!