時至今日,你也很難估量2011年——微博上一個黃金時期,社科院農(nóng)村發(fā)展研究所教授于建嶸先生發(fā)起的“隨手拍照解救乞討兒”活動產(chǎn)生的社會影響力。盡管轟轟烈烈的“人人拍照挽救拐賣兒童”因陷入某種狂熱而遭到質(zhì)疑,但公眾對這一事件的憤恨,對離散家庭的憐憫,依舊持續(xù)產(chǎn)生了在其他事件上并不常見的共情效應(yīng)——為數(shù)不多的社會題材院線電影,甚至有《失孤》和《親愛的》兩部與此相關(guān)。
不過現(xiàn)實是,由于查找與辨認(rèn)兒童唯有靠肉眼并不擅長的照片對比,準(zhǔn)確率和效率上都非常有限,仍未從根本上改善這一社會悲劇。也因此,幾乎每年兩會都有人大代表提出與走失兒童相關(guān)議案,譬如去年就有代表建議:兒童出生時由政府免費采集DNA,且所有孩子上戶口時必須核對DNA信息。然而經(jīng)濟(jì)學(xué)常識是,美好愿景與“社會成本”之間存在鴻溝,通過DNA比對需要巨大的技術(shù)成本。
一年之后,今年提出議案的換成了科技大佬李彥宏。3月3日,李彥宏在全國政協(xié)十二屆五次會議提案:利用已經(jīng)成熟的人工智能和大數(shù)據(jù)技術(shù),幫助解決走失兒童問題。
事實上,當(dāng)人工智能普遍被產(chǎn)業(yè)界視作未來社會下一代基礎(chǔ)設(shè)施,與之相關(guān)的提案當(dāng)然不只李彥宏一份,復(fù)星集團(tuán)董事長郭廣昌也提案,希望更多醫(yī)療健康行業(yè)與人工智能技術(shù)相結(jié)合——而讓李彥宏和郭廣昌興奮的是,就在3月5日上午,第十二屆全國人民代表大會第五次會議在人民大會堂開幕,“人工智能”首次被寫入全國政府工作報告。
當(dāng)然,說回李彥宏的這份提案。其實多年來,輿論強大的共情作用讓不少科技企業(yè)都試圖改善這一現(xiàn)象:譬如兩年前頗為火爆的兒童智能穿戴設(shè)備,但遺憾的是,后來由于輻射高,續(xù)航差,GPS 誤差高等原因,被寄予厚望的可穿戴逐漸淪為一時玩物;此外微博也曾推出過“LBS地域情景化網(wǎng)格系統(tǒng)”,利用用戶位置信息有所作為。
與上述從“邊緣性”突圍的方式不同,李彥宏祭出的手段是過去一年多次提及的人工智能,在他看來,“近年來人工智能和大數(shù)據(jù)技術(shù)不斷完善,應(yīng)用日趨成熟,有望進(jìn)一步促進(jìn)兒童走失案件的偵破。一方面,人臉識別能夠提升圖像偵查效率,盡早鎖定失蹤兒童或涉案人員。另一方面,人臉識別能夠?qū)崿F(xiàn)海量人臉數(shù)據(jù)的跨年齡比對,幫助偵破兒童走失積案。”
于是問題的關(guān)鍵轉(zhuǎn)向在公眾一端熟悉又陌生的詞匯:人臉識別。今天不妨從技術(shù)視角,分析一下李彥宏這一提案的理論基礎(chǔ)。畢竟,相較于DNA,“人臉”是大眾更熟悉且成本低得多的識別對象。
人類思維VS機(jī)器思維
進(jìn)化心理學(xué)告訴我們:由于祖先族群內(nèi)原始的協(xié)作需求——以及識別“異己者”和“不合作者”的本能,人類大腦從上百萬年前就演化出了識別人臉的能力。而也正由于這上百萬年“時間差”造成的演化沉淀,識別他人面孔歸屬于大腦應(yīng)激反應(yīng)的所謂快系統(tǒng),或者說直覺——不過,機(jī)器世界里從來沒有“直覺”二字,有的只是算法和數(shù)據(jù)。
這亦是人臉識別技術(shù)難度所在。不同于一般圖像識別,人類臉部結(jié)構(gòu)存在極大相似性;且表情易變(人類究竟有多少種表情?我還沒看到特別權(quán)威的數(shù)字,但至少比“表情包”豐富得多);另外,不同的觀察角度,光照條件,遮蓋物(口罩,墨鏡,頭發(fā),胡須等等)都會增加機(jī)器識別難度;更何況喪心病狂的人類居然還通過整容和P圖等行為擾亂機(jī)器判斷……
不過即便如此,當(dāng)如今人工智能已發(fā)展到“只要人類正常情況下1秒就能做的事,它幾乎也能做到”的地步,人臉識別的技術(shù)進(jìn)步也令人欣喜。
顧名思義,作為一種集成了機(jī)器學(xué)習(xí),模型理論,專家系統(tǒng),視頻圖像等多種技術(shù)的綜合實現(xiàn)方式,人臉識別可以實現(xiàn)人臉檢測,對比以及查找。而這一輪人臉識別精準(zhǔn)性的提升,無疑受益于在海量數(shù)據(jù)加持下的深度學(xué)習(xí)(作為一次算法革命,深度學(xué)習(xí)以一種簡練的網(wǎng)絡(luò)模型解決了過往印象中極為復(fù)雜的思維體系):換句話說,為了在“茫茫人臉”中認(rèn)出特定面孔,機(jī)器需要先自己“記住”上億張人臉。
這就得說到機(jī)器思維的底層邏輯。與人類思維試圖將整個世界簡化和抽象理解不同(大腦帶寬有限,人類對因果關(guān)系和“貼標(biāo)簽”的熱衷皆因于此),機(jī)器思維走在了奧卡姆剃刀原則的反面——人工智能不會將世界簡化,而是從復(fù)雜信息中以自己的方式進(jìn)行篩選。
舉個例子,在那期被廣泛熱議的《最強大腦》人機(jī)大戰(zhàn)中,人工智能與世界記憶大師王峰通過分析照片中出現(xiàn)的幼年人臉,識別出現(xiàn)場20年后的成年人,人工智能贏了,但要知道,截止這場比賽前,百度已動用大概200萬人次,近2億張照片作為訓(xùn)練樣本數(shù)據(jù),通過提取人臉中相對穩(wěn)定和細(xì)微的特征,完成年齡跨度較大的人像高精度比對。
從“競賽”角度,人類與機(jī)器并不在同一起跑線,但也就在那次節(jié)目上,初為人母的章子怡女士感慨道:“我們有很多的失蹤兒童,他成長了之后可能連父母都認(rèn)不出來他的樣子,但小度可以幫我們辨別出來,所以小度要為人類作出更多貢獻(xiàn)。”
不知道李彥宏的兩會提案,是否與此有關(guān)。
人臉識別技術(shù)路徑
在我看來,已頗為成熟的人臉識別技術(shù),倒不失為一次理解機(jī)器思維的好機(jī)會。
事實上,人臉識別的實現(xiàn)大體可分為四步。第一步當(dāng)然是人臉檢測:根據(jù)眼睛,眉毛,嘴巴,鼻子等器官特征和相互幾何位置關(guān)系檢測人臉。第二步則是人臉圖像預(yù)處理:如前所述,原始圖像由于受各種條件的限制和干擾,很多時候無法直接使用,必須在早期階段對其進(jìn)行灰度校正,噪聲過濾等圖像預(yù)處理。進(jìn)一步剖析的話,這種預(yù)處理主要包括人臉對準(zhǔn)(得到人臉位置端正的人臉圖像),圖像增強(改善圖像質(zhì)量,在視覺上更清晰,且讓圖像更利于計算機(jī)的處理與識別)以及歸一化(取得尺寸一致,灰度取值范圍相同的標(biāo)準(zhǔn)化人臉圖像)等工作。
人臉識別的第三步就是臉圖像特征提取——這一步是針對人臉某些特征進(jìn)行的,也是對人臉進(jìn)行特征建模的過程。最后一步,即是輸出結(jié)果的匹配與識別:將待識別的人臉特征與已得到的人臉特征模板進(jìn)行比較,根據(jù)相似程度對人臉的身份信息進(jìn)行判斷。
以上是適用于所有識別用途的理論路徑,但李彥宏在提案中涉及的場景則更為復(fù)雜:“可能孩子是在很小的時候走失的,但他再進(jìn)入公眾視線可能已經(jīng)上小學(xué)了——比如辦學(xué)生證的時候需要拍照片,這種情況下通過人工智能的比對,就有可能比以前更加高效的幫助有關(guān)部門和家庭找到走失兒童。”
就像章子怡冀望的那樣,對比走失兒童是“跨年齡人臉識別”技術(shù)最具社會價值的實現(xiàn)場景。但在影響人臉識別率的所有因素上,時間往往是最難對抗的部分,原因之一是跨年齡識別中類內(nèi)變化通常會大于類間變化;另外,跨年齡訓(xùn)練數(shù)據(jù)難尋,若沒有海量數(shù)據(jù),深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)便很難學(xué)習(xí)到跨年齡的類內(nèi)和類間變化。不過百度也提出了解決方案:針對第一點,他們選擇用度量學(xué)習(xí)的方法,通過學(xué)習(xí)一個非線性投影函數(shù),把圖像空間投影到特征空間中,在這個特征空間里跨年齡的同一個人的兩張人臉距離會比不同人的相似年齡的兩張人臉的距離要??;而針對第二點,考慮到跨年齡人臉的稀缺性,通過一個用大規(guī)模人臉數(shù)據(jù)訓(xùn)練好的模型作為底座,然后用跨年齡數(shù)據(jù)對他做更新。而將上述兩點結(jié)合,通過端到端的訓(xùn)練,即可以大幅提升跨年齡識別的識別率。
這也正是李彥宏此次提案的理論基礎(chǔ)。
培育共識
事實上,在準(zhǔn)備兩會提案時,李彥宏已非常確信技術(shù)本身的成熟度。但要知道,讓技術(shù)落地從來都是檢驗技術(shù)的唯一標(biāo)準(zhǔn)。其實人臉識別已廣泛應(yīng)用于諸多領(lǐng)域,最直接的例子是,早在提案前,百度人臉識別就已經(jīng)用于尋人平臺上,平臺現(xiàn)對接民政部全國救助尋親網(wǎng)中近3萬條走失人口信息。
不過,歷史經(jīng)驗是:讓社會系統(tǒng)向更美好的方向演進(jìn),技術(shù)之外,還需要某種合力。通過人工智能尋找走失兒童亦不例外,它需要與相關(guān)部門相互嵌合,根據(jù)場景不斷調(diào)優(yōu)。也因為此,李彥宏在提案中的具體建議包括:建立適用于搜尋走失兒童的人臉識別模型;建立覆蓋全國的走失兒童數(shù)據(jù)庫;將人臉識別技術(shù)與治安和交通監(jiān)控系統(tǒng)相結(jié)合等。
在我看來,即便提案延緩落地,也不失為一次在整個社會范疇孕育共識的機(jī)會,要知道,人工智能會成為未來服務(wù)公共事務(wù)的重要方式,但來自政府的頂層支持也是讓作為社會基礎(chǔ)設(shè)施的人工智能盡早落地的途徑。
如今,人工智能仿佛一個植入系統(tǒng),已經(jīng)改變了購物,金融,媒體,交通,外賣等生活各個日常片段,并期待自己如百年前的電力系統(tǒng)一般為人類延伸出更多的可能。所以你完全可以想象如下場景:《失孤》和《親愛的》中的父母不再通過持續(xù)多年的滿城尋覓,而是到公安機(jī)關(guān)錄入孩子照片,機(jī)器通過數(shù)據(jù)庫對比,尋找到匹配對象,以更能燃起希望的方式,讓故事以相對完滿的結(jié)局收場。
李北辰/文(知名科技自媒體,致力于用文字優(yōu)雅的文章,為您提供談資與見識;微信公號:李北辰)
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!