6月30日,[AI實(shí)驗(yàn)室]第四期在上海舉辦,來自Face++與UCloud、Video++、思必馳的4位嘉賓帶來了關(guān)于AI技術(shù)以及行業(yè)應(yīng)用的演講,詳解AI技術(shù)如何開啟智能時代。
如何利用公有云快速落地AI應(yīng)用
(圖:UCloud AI專家宋翔)
“AI是重資源、重消耗的技術(shù),智能時代需要AI快速與行業(yè)結(jié)合,并快速實(shí)現(xiàn)AI應(yīng)用的迭代。”UCloud AI專家宋翔表示。
AI落地過程中,需要考慮的問題:
一.什么場景需要AI賦能?
二.如何快速、低投入的驗(yàn)證AI技術(shù)?
三.如何快速展開AI應(yīng)用業(yè)務(wù)?
一.如何高效實(shí)現(xiàn)AI應(yīng)用迭代?
AI落地的挑戰(zhàn):
建立的AI框架時常會遇到硬件迭代、算法更新以及算法兼容性等問題,并且還需要考慮整個系統(tǒng)的彈性和容災(zāi)能力,保證業(yè)務(wù)的穩(wěn)定。
AI落地技術(shù)挑戰(zhàn)的解決思路
首先,要做到環(huán)境分離和分布式化。環(huán)境分離可以分為三層,最上層是AI相關(guān)的軟件層,中間是硬件,包括GPU的硬件,底層是存儲數(shù)據(jù)。通過容器將分層封裝,使得上下期間沒有強(qiáng)耦合性,提升整個平臺的擴(kuò)展性。
如何利用公有云快速落地AI運(yùn)用?
公有云支持AI應(yīng)用落地,主要考慮兩方面:一是基于公有云平臺計算的資源,包括計算、網(wǎng)絡(luò)、多機(jī)房、跨地域;二是基礎(chǔ)的架構(gòu),包括云主機(jī)、容器、負(fù)載均衡等基礎(chǔ)組建。最后搭建一個PaaS服務(wù)平臺,包括訓(xùn)練平臺和在線服務(wù)平臺。
AI助力行業(yè)智能
(圖:Face++人工智能開放平臺行業(yè)產(chǎn)品負(fù)責(zé)人胡浩)
計算機(jī)視覺在手機(jī)行業(yè)的落地:
Face++人工智能開放平臺行業(yè)產(chǎn)品負(fù)責(zé)人胡浩認(rèn)為,手機(jī)行業(yè)主要解決安全和娛樂兩個痛點(diǎn)。從安全的角度來說,人臉解鎖相較指紋、虹膜,具有速度快、非接觸、抗干擾的特點(diǎn),從而更安全。娛樂的角度來說,人臉識別技術(shù)在手機(jī)上有非常多可以應(yīng)用的地方,比如美顏、摳圖、打光、視線估計、手勢、人體骨骼關(guān)鍵點(diǎn)、3D結(jié)構(gòu)光等,可服務(wù)于手機(jī)上各種有趣的應(yīng)用,更好的進(jìn)行人機(jī)互動。
計算機(jī)視覺在其它行業(yè)的落地:
除手機(jī)之外,CV在汽車、教育、營銷、制造業(yè)都有很大的想象空間。汽車就是做DMS,駕駛員是否疲勞,車內(nèi)是否有遺留活物;教育行業(yè)做打卡、教學(xué)評估;營銷方面通過人的行為分析,找到精準(zhǔn)用戶以及利用人臉技術(shù)策劃線上活動;制造業(yè)可做異常檢測,如正規(guī)的流程是否完整,有沒有漏缺等。
技術(shù)落地的思路
一項(xiàng)新技術(shù)落地有三個階段:第一是技術(shù)驅(qū)動,由技術(shù)去找場景;第二考慮現(xiàn)狀是什么,即場景驅(qū)動;第三是商業(yè)驅(qū)動,看技術(shù)到底能給行業(yè)創(chuàng)造多大的價值。如果這三個步驟都能夠說通,即是一項(xiàng)技術(shù)在一個行業(yè)真正的落地,并且有持續(xù)的發(fā)展,當(dāng)落地之后才能夠收集到更多實(shí)驗(yàn)室里面模擬不出來的數(shù)據(jù),算法才能夠在剩下的所有環(huán)節(jié)替代人工,實(shí)現(xiàn)真正的人工智能。
人工智能在消費(fèi)級視頻中的應(yīng)用
(圖:極鏈科技Video++ AI中心運(yùn)營總監(jiān)魏傳勇)
上海極鏈網(wǎng)絡(luò)科技有限公司Video++ AI中心運(yùn)營總監(jiān)魏傳勇介紹,中國超過5億的互聯(lián)網(wǎng)視頻用戶,占總互聯(lián)網(wǎng)用戶比重超過了70%,平均每天花超過120分鐘在互聯(lián)網(wǎng)視頻上,包括長視頻、短視頻、直播視頻等,這就是消費(fèi)級視頻。
如何利用AI技術(shù)讓視頻更有趣,更有價值?
Video++在運(yùn)用AI技術(shù)賦能視頻的過程中,不斷讓視頻變得更有趣、更有價值,我們通過對非結(jié)構(gòu)化的視頻數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理,實(shí)現(xiàn)人臉、場景、物體、品牌等內(nèi)容的動態(tài)追蹤識別,進(jìn)而將視頻解構(gòu)成為更有價值的場景活動單元,再將其應(yīng)用到如廣告、電商、互娛等各種商業(yè)化場景中去。
技術(shù)落地消費(fèi)級視頻的挑戰(zhàn)
由于視頻辨識環(huán)境問題,辨識目標(biāo)遮擋情況、屏幕占比、運(yùn)動狀態(tài)都會使視頻內(nèi)容的辨識難度大大增加,而Video++獨(dú)創(chuàng)的全序列采樣識別,在準(zhǔn)確率與抓取率上都具有革新性提升,最大化地去除了軌跡流中的抽樣與識別噪聲,以實(shí)現(xiàn)視頻動態(tài)內(nèi)容更精準(zhǔn)的識別。
商業(yè)化落地的應(yīng)用
Video++的ASMP系統(tǒng)就是AI技術(shù)成功落地并實(shí)現(xiàn)大批量商用的產(chǎn)品之一。立足AI技術(shù)對視頻內(nèi)容的識別,將非結(jié)構(gòu)化的視頻內(nèi)容經(jīng)由AI處理后,產(chǎn)出與廣告主需求匹配的視頻場景單元。此時,廣告主結(jié)合自身的品牌特性進(jìn)行投放,會取得更好的效果,經(jīng)測算這種投放效果的ROI可以提升50%以上。
智能語音交互在企業(yè)中的應(yīng)用
(思必馳北京研發(fā)院產(chǎn)品經(jīng)理劉博)
思必馳北京研發(fā)院產(chǎn)品經(jīng)理劉博就語音交互技術(shù)在企業(yè)中的應(yīng)用做了相關(guān)分享。他認(rèn)為,目前市面上很火的智能音箱、智能機(jī)器人等產(chǎn)品的核心是對話機(jī)器人,常見的對話機(jī)器人形態(tài)主要分為三大類,分別是個人助理、聊天機(jī)器人以及智能設(shè)備。
個人助理如siri,可以設(shè)定鬧鐘日程、查詢天氣等;聊天機(jī)器人,比如小冰,可以講笑話、閑聊;智能設(shè)備,比如天貓精靈、車蘿卜、小米電視等,通過對話來實(shí)現(xiàn)導(dǎo)航、聽音樂、講故事等功能。
劉博稱,以上幾類對話機(jī)器人背后的對話技術(shù)主要有任務(wù)型對話、基于知識圖譜的對話、基于問答對的對話,以及生成式對話。
但以上幾種人機(jī)對話中都存在一個問題,那就是用戶在提問中占主導(dǎo)地位,機(jī)器往往處于被動狀態(tài),等待用戶提問后,再試圖理解用戶意圖,只有在發(fā)現(xiàn)某些必須的參數(shù)信息缺失后,機(jī)器才會主動向用戶發(fā)問。這類對話關(guān)系中,人是主動方,機(jī)器是被動方,適用于人主動且有明確訴求的場景。但這種對話系統(tǒng)會有一個缺陷,就是如果用戶想不起來話題或者具體提問方式時,會覺得交互體驗(yàn)很不佳。
基于此問題,思必馳將推出了一種新的對話技術(shù)。劉博表示,在新的對話關(guān)系中,機(jī)器將成為主動方,而人則成為被機(jī)器引導(dǎo)完成對話的一方,這款基于新型對話技術(shù)的新產(chǎn)品將用于企業(yè)服務(wù)中。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!