7月26日,由中國人工智能學(xué)會(huì)主辦、新浪新聞聯(lián)合浙江大學(xué)承辦的2020全球人工智能技術(shù)大會(huì)(2020GAITC)“AI時(shí)代下的新媒體與社交娛樂”專題論壇拉開帷幕,新浪集團(tuán)首席信息官、新浪AI媒體研究院院長王巍,浙江大學(xué)特聘教授、悉尼科技大學(xué)教授、百度研究院訪問教授楊易共同擔(dān)任論壇主席。
清華大學(xué)大學(xué)新聞與傳播學(xué)院學(xué)術(shù)委員會(huì)主任、教授金兼斌在本次專題論壇上,與來自業(yè)界、學(xué)術(shù)界的嘉賓們分享了《人工智能助力虛假科學(xué)信息的監(jiān)測》。
圖注:清華大學(xué)大學(xué)新聞與傳播學(xué)院學(xué)術(shù)委員會(huì)主任、教授金兼斌作主題演講。
金兼斌認(rèn)為,社會(huì)化媒體時(shí)代,虛假科學(xué)信息的治理,必須充分依靠對(duì)分散在社會(huì)各個(gè)平臺(tái)上的民智的整合,而人工智能則是實(shí)現(xiàn)這種有效整合的關(guān)鍵。
關(guān)于應(yīng)對(duì)虛假科學(xué)信息,利用人工智能技術(shù)進(jìn)行更好的監(jiān)測,他提到,基于虛假科學(xué)信息的語言特征、內(nèi)容特征和對(duì)象特征,“表示學(xué)習(xí)”、“知識(shí)圖譜”、“信息挖掘”是三種有針對(duì)性的解決思路。
以下為金兼斌演講實(shí)錄,內(nèi)容經(jīng)編輯略有刪減:
各位嘉賓好,首先非常榮幸受新浪新聞和浙江大學(xué)的邀請(qǐng)來參加這一論壇。剛才聽前面幾位專家分享的時(shí)候,頗感心有戚戚。諸多內(nèi)容和觀點(diǎn),嘉賓之間并未事先溝通過,但卻遙相呼應(yīng)。
今天我將主要談?wù)勌摷倏茖W(xué)信息的監(jiān)測問題。借用剛才Amy Bruckman女士的話,知識(shí)本質(zhì)上是一種共識(shí)的社會(huì)建構(gòu)。尼采有類似的表述,即世界上沒有所謂的事實(shí),只有解讀。
在日常的內(nèi)容消費(fèi)中,很多時(shí)候我們面臨這樣的場景:有一定共同認(rèn)可的事實(shí)基礎(chǔ)的現(xiàn)象或事件,不同人對(duì)事件的性質(zhì)以及可能的社會(huì)后果,可以有截然不同的解讀和判斷。諸多人與人之間、群體與群體之間、國家與國家之間的矛盾、爭執(zhí)乃至交惡、撕裂,由此而生。
7月24號(hào),也就是兩天前,《科學(xué)》雜志上發(fā)表了一篇中科院武漢病毒研究所研究員石正麗回答《科學(xué)》的18問專訪的文章,文章題目以“特朗普欠我們一個(gè)道歉”這一來自石正麗的引語開始。提問者對(duì)所提18個(gè)問題做了精心的準(zhǔn)備,涉及到武漢病毒所和此次新冠疫情之間有無關(guān)聯(lián)的大量專業(yè)問答,雖然字里行間不乏春秋筆法,但總體上問答雙方都十分克制,只講事實(shí),沒有任何情緒化的表達(dá)。這是很難得的。因?yàn)樵谌藗內(nèi)粘K姷拇罅可婕翱茖W(xué)事實(shí)的各種網(wǎng)上內(nèi)容表述中,“后真相”時(shí)代觀點(diǎn)先行、事實(shí)成為“任人打扮的小姑娘”,已經(jīng)是見怪不怪的現(xiàn)象。這正是我今天給大家分享的這個(gè)主題的時(shí)代和信息傳播環(huán)境之大背景。
今天,科學(xué)已經(jīng)成為我們當(dāng)代社會(huì)文明中的亮麗底色。另一方面,科學(xué)不光是科學(xué),它還關(guān)乎政治,國際上圍繞疫情起源的爭議和污名化就是明證。而對(duì)普通民眾而言,科學(xué)關(guān)乎日常生活質(zhì)量和對(duì)現(xiàn)代文明帶來的福祉的享用。如何確保確保民眾日常生活接觸到的科學(xué)性信息的質(zhì)量,可謂茲事體大。
我將要介紹的內(nèi)容,是由我們團(tuán)隊(duì)的博士后陳慧敏和碩士生朱澤宇與我一起準(zhǔn)備完成的。
今天的主題是AI時(shí)代下的新媒體與社交娛樂。剛才王巍總講到內(nèi)容生產(chǎn)從PGC到UGC再到現(xiàn)在TGC的多元化趨勢。我們身處信息生產(chǎn)的社會(huì)化、大眾化乃至萬物生生不息的時(shí)代。另一方面,人作為信息消費(fèi)者,又有其永遠(yuǎn)無法逾越的一些邊界條件,比如一天只有24小時(shí),信息消費(fèi)的時(shí)間和其他活動(dòng)包括睡眠所占的時(shí)間,是一種此消彼長的零和游戲。今天,社會(huì)的發(fā)展已經(jīng)從規(guī)模發(fā)展轉(zhuǎn)變到高質(zhì)量發(fā)展階段,其實(shí)信息的生產(chǎn)和消費(fèi),也必然面臨這樣的轉(zhuǎn)變。我們不缺內(nèi)容,缺的是高質(zhì)量的內(nèi)容,特別是缺由消費(fèi)者特定場景所定義的高質(zhì)量內(nèi)容,包括事關(guān)國計(jì)民生的優(yōu)質(zhì)科學(xué)性內(nèi)容。
剛才Bruckman教授講到,知識(shí)本質(zhì)上是一種社會(huì)建構(gòu)。其實(shí)各種各樣的虛假科學(xué)信息背后,常常也涉及到了很多不同的價(jià)值觀和社會(huì)力量之間的話語權(quán)角逐和爭斗。諸如病毒起源、戴口罩的必要性等問題,不僅是科學(xué)性問題,當(dāng)中所涉及的話語權(quán)和定義權(quán),還關(guān)乎大國博弈、防疫政策和責(zé)任歸因的選擇和感知。因?yàn)槲覀儗?duì)世界的認(rèn)知,歸根到底是受各種所消費(fèi)內(nèi)容的涵化和型塑的。
也正如此,提升民眾的科學(xué)素養(yǎng),讓民眾對(duì)事關(guān)其生活質(zhì)量的各種科學(xué)性信息具有基本的鑒別能力或解惑途徑,在大力推進(jìn)科技創(chuàng)新的同時(shí),同步推進(jìn)科學(xué)普及,是一體兩面的重要舉措。面對(duì)海量的信息的觸手可及,真正有用的高質(zhì)量信息如何為民所用,需要有可落地的方案。而有效監(jiān)測民眾每日接觸到的內(nèi)容中的虛假科學(xué)信息并及時(shí)加以提醒、清除、糾錯(cuò)糾偏,是社會(huì)良治中信息治理的題中之義。
無論是科學(xué)信息的生產(chǎn)還是虛假科學(xué)信息的監(jiān)測,社會(huì)化協(xié)同都是核心機(jī)制。就科學(xué)信息的生產(chǎn)而言,不同機(jī)構(gòu)、領(lǐng)域的專家或科技工作者通過專業(yè)發(fā)表和圈層日常交流,把科學(xué)信息源源不斷輸出到整個(gè)社會(huì)的信息傳播系統(tǒng)中。另一方面,科學(xué)信息在通過媒體特別是社會(huì)化媒體的多層、多級(jí)傳播過程中,大量民眾既作為內(nèi)容的消費(fèi)者又作為內(nèi)容的傳播者參與生產(chǎn),這一過程降低了科學(xué)信息的生產(chǎn)和傳播的門檻。這是我們進(jìn)行虛假科學(xué)信息監(jiān)測所面對(duì)的信息生態(tài)環(huán)境。
下面我們首先把虛假科學(xué)信息的信息特征做一個(gè)簡單的梳理。我們從三個(gè)方面進(jìn)行總結(jié),包括語言特征、內(nèi)容特征和對(duì)象特征。
首先是語言特征。虛假科學(xué)信息常常有一些明顯的語言表達(dá)方式上的特征,比如“長期服用降壓藥會(huì)致死”這類說法,其陳述中通常特別強(qiáng)調(diào)致死、致癌、致殘這一類嚴(yán)重后果。從傳播學(xué)的角度來看,這樣的傳播策略叫訴諸恐懼。這類信息在涉及有關(guān)可能風(fēng)險(xiǎn)時(shí),常??浯笃湓~,或者斷章取義,典型如離開劑量談毒性。事實(shí)上,鑒別社會(huì)化媒體上司空見慣的各種食藥品風(fēng)險(xiǎn)內(nèi)容,一定要和具體人群和應(yīng)用場景結(jié)合起來,才有意義。
還有一種常見的表述,是對(duì)某類疾病或危害的簡單歸因,即科學(xué)方法論上所說的還原論謬誤。這種表述常常有意無意混淆可能性和必然性之間的差異,把多種原因?qū)е碌默F(xiàn)象,簡單歸咎于某一特定因素。比如“常吃米飯會(huì)誘發(fā)糖尿病”這類聳人聽聞的說法,背后就是一種還原論邏輯。
第二是內(nèi)容特征。虛假科學(xué)信息的內(nèi)容,不同于一般的虛假信息之處在于,其所關(guān)涉的事實(shí)是否準(zhǔn)確,涉及到科學(xué)性和專業(yè)性知識(shí)或邏輯判斷問題,而在這方面,虛假科學(xué)信息可以巧妙地布下很多認(rèn)知陷阱,在似是而非間,混淆是非,誤導(dǎo)人們的認(rèn)知和行為。如“食鹽含亞鐵*,不可食用”的說法,首先是有意引導(dǎo)民眾把亞鐵*和*進(jìn)行聯(lián)想置換,產(chǎn)生恐懼。亞鐵*跟*是不一樣。其次,食鹽中只含有的極為微量的亞鐵*,一般人每天食用的食鹽量里面包含的亞鐵*,完全不會(huì)對(duì)人體構(gòu)成健康危險(xiǎn)。但這些相對(duì)專業(yè)的知識(shí)和邏輯,可能并不為普通民眾所熟悉和了解。
第三是對(duì)象特征。很多虛假科學(xué)信息或者科學(xué)謠言的描述對(duì)象,常常是一些新興事物,如“量子波動(dòng)速讀”“5G基站可致癌”“雙黃連可防新冠病毒”等流言或謠言,其中涉及的事物都比較新,超出大部分民眾的知識(shí)儲(chǔ)備。媒體或民眾對(duì)其真?zhèn)谓柚延兄R(shí)難以辨識(shí),于是就會(huì)有寧可信其有不可信其無的心理,導(dǎo)致以訛傳訛。
如何進(jìn)行虛假信息的鑒別或監(jiān)測?基本上有兩種思路,即人工鑒別和機(jī)器鑒別。當(dāng)然在辟謠實(shí)踐中,常常是兩種方法結(jié)合起來的,即機(jī)器快速從海量、動(dòng)態(tài)的信息中定位到一些可疑內(nèi)容,然后通過一系列知識(shí)體系、專家系統(tǒng)和人工方法,來判定有關(guān)信息的真?zhèn)?。值得指出的是,兩種方式各有優(yōu)劣。機(jī)器識(shí)別效率高,但難以精準(zhǔn)識(shí)別專業(yè)性較高的前沿科技內(nèi)容,所以有時(shí)仍需要依賴人工;人工識(shí)別包括專家解讀的優(yōu)勢在于,可以判別一些現(xiàn)有文獻(xiàn)和知識(shí)庫中尚未有明確論述的一些新興科學(xué)性內(nèi)容表述的真?zhèn)?,如新冠病毒爆發(fā)以來,伴隨病毒傳播的還有諸多虛假科學(xué)信息。由于人們對(duì)新冠病毒的性質(zhì)的認(rèn)知也有一個(gè)過程,因此,當(dāng)有關(guān)新冠病毒特性的一些科學(xué)流言和謠言出現(xiàn)時(shí),依賴已有的知識(shí)體系來進(jìn)行機(jī)器識(shí)別,注定是不可靠的,而是需要仰仗一線醫(yī)務(wù)工作者和科學(xué)家的最新研究發(fā)現(xiàn)和臨床經(jīng)驗(yàn)才能判斷真?zhèn)巍.?dāng)然人工鑒別的缺點(diǎn)是效率低。因此,兩者需要有機(jī)結(jié)合。
下面是我針對(duì)我們前面對(duì)虛假科學(xué)信息三個(gè)方面特征的總結(jié)梳理,談?wù)勅斯ぶ悄苤μ摷倏茖W(xué)信息監(jiān)測的解決思路。
基于虛假科學(xué)信息的語言特征,我們可以采用表示學(xué)習(xí)技術(shù),來對(duì)海量動(dòng)態(tài)的內(nèi)容中的虛假科學(xué)信息進(jìn)行快速的初步定位和識(shí)別。通過表示學(xué)習(xí),把待判別文本轉(zhuǎn)化為低維度向量,隨后利用深度神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)這些向量表示中的信息,達(dá)到快速進(jìn)行語義分析的目的?;谡Z言特征進(jìn)行的語義分析技術(shù),目前相對(duì)來說已經(jīng)比較成熟。這是進(jìn)一步對(duì)有關(guān)內(nèi)容科學(xué)性進(jìn)行判別的前提,即我們首先需要讓機(jī)器知道有關(guān)內(nèi)容的主題和觀點(diǎn)具體是什么。
基于內(nèi)容特征,我們可以借助知識(shí)圖譜作為破解虛假科學(xué)信息的途徑。知識(shí)圖譜是人類已有知識(shí)的精華,是人類構(gòu)建的知識(shí)網(wǎng)絡(luò),網(wǎng)絡(luò)里的每個(gè)節(jié)點(diǎn)就代表了某一個(gè)概念,而節(jié)點(diǎn)之間的連邊,就代表了這些概念之間的關(guān)聯(lián)。我們可以將知識(shí)圖譜和神經(jīng)網(wǎng)絡(luò)結(jié)合,識(shí)別虛假科學(xué)信息,即從待判別文本中,抽取出重要的概念以及概念之間的關(guān)聯(lián),并與知識(shí)圖譜中這兩個(gè)概念對(duì)應(yīng)的實(shí)體節(jié)點(diǎn)之間的關(guān)聯(lián)路徑進(jìn)行對(duì)比,看看待判別文本中概念之間的關(guān)聯(lián)性(如“轉(zhuǎn)基因食品”引發(fā)“癌癥”這一表述)的真?zhèn)位虼嬖诘目赡苄?。在科學(xué)謠言的判別中,大部分謠言內(nèi)容的破解,利用知識(shí)圖譜能夠高效地進(jìn)行。
基于虛假科學(xué)信息的對(duì)象特征,即有關(guān)話題對(duì)象或主題通常較新,科學(xué)性和專業(yè)性較強(qiáng),我們提出多層次信息挖掘這樣一個(gè)思路和對(duì)策。
所謂多層次,根據(jù)廣義上的“知識(shí)圖譜”之“知識(shí)”的成熟度,我們區(qū)分了正式出版的文獻(xiàn)、預(yù)印本平臺(tái)內(nèi)容、以及各種知識(shí)問答類眾包平臺(tái)。典型的出版文獻(xiàn)通常是經(jīng)過同行評(píng)審的,其包含的概念和知識(shí)體系相對(duì)比較成熟、自洽,大致和上述通常意義上的“知識(shí)圖譜”中的來源知識(shí)對(duì)應(yīng);鑒于正式出版的審稿、修改周期通常比較長,而諸如新冠疫情這樣的公共衛(wèi)生問題又人命關(guān)天十分緊急,因此,近年來興起一種預(yù)印本發(fā)布制度,讓很多前沿研究成果可以第一時(shí)間可以為同行甚至媒體知曉和參考,雖然其中的內(nèi)容和結(jié)論可能存在出錯(cuò)風(fēng)險(xiǎn),但在對(duì)有關(guān)新問題、新挑戰(zhàn)缺乏更好認(rèn)知和對(duì)策的情況下,聊勝于無,預(yù)印本平臺(tái)上看似不一定“成熟”的內(nèi)容,對(duì)于有關(guān)新興科學(xué)主題的信息真?zhèn)蔚恼鐒e,仍可能起到極有價(jià)值的參考作用。最后就是知識(shí)問答類眾包平臺(tái),以及廣義上存在于各種論壇、圈層上針對(duì)有關(guān)新興、前沿問題的專業(yè)內(nèi)容探討和分享,理論上,這部分內(nèi)容也應(yīng)該作為一個(gè)社會(huì)知識(shí)生產(chǎn)的一種機(jī)制,納入到虛假科學(xué)信息鑒別可資參考和依賴的來源中。我們可以想象,在未來的某一天,我們的人工智能發(fā)展到這樣一種理想的水平,即每一個(gè)用戶在其生活場景中遇到的每一個(gè)不知真?zhèn)蔚目茖W(xué)問題,都可以第一時(shí)間通過諸如語音搜索引擎這種方式,向全網(wǎng)或全社會(huì)詢問或求助;而全網(wǎng)或全社會(huì)也能在第一時(shí)間,把對(duì)這個(gè)問題的最新、最優(yōu)、最權(quán)威認(rèn)知,以提問者所能理解的方式回應(yīng)給他,實(shí)現(xiàn)無縫交互。借助于無所不在的像神經(jīng)網(wǎng)絡(luò)一樣的社會(huì)信息傳播系統(tǒng),一個(gè)社會(huì)通過人工智能,最終得以把整個(gè)社會(huì)的民智進(jìn)行有效的萃取整合。由此,整個(gè)社會(huì)的知識(shí)和智慧,真正成為每一個(gè)個(gè)體予求予取的外腦般的不竭源泉。到那個(gè)時(shí)候,無論虛假信息如何千變?nèi)f化深藏不露,都將被人們輕易鑒別。
顯然,我們離這一天還比較遙遠(yuǎn)。要實(shí)現(xiàn)這樣的一幅理想圖景,我們不僅需要整合知識(shí),還需要協(xié)調(diào)社會(huì)不同民眾的價(jià)值觀,即對(duì)事實(shí)的解讀。不僅涉及到對(duì)知識(shí)的整合,還涉及到對(duì)一個(gè)社會(huì)倫理價(jià)值道德觀念的整合,體現(xiàn)一個(gè)社會(huì)的集體理性和智慧。因此,從根本意義上言,這種多層次信息挖掘和綜合研判,是對(duì)全社會(huì)智慧的有效整合。
總結(jié)而言,我們提出了這樣一套基于人工智能進(jìn)行虛假科學(xué)信息監(jiān)測的框架和思路?;谡Z言特征,機(jī)器學(xué)習(xí)和語義分析可以幫助我們識(shí)別海量內(nèi)容中科學(xué)性方面可疑的信息,這方面的人工智能技術(shù)現(xiàn)在已經(jīng)比較成熟?;趦?nèi)容特征的檢測,利用已有的知識(shí)圖譜,可以比較高效的解決大量的虛假科學(xué)信息的識(shí)別問題,但是它可能不能解決層出不窮的新興話題的真?zhèn)闻袛鄦栴}?;趯?duì)象特征的多層次信息挖掘,通過對(duì)分散在社會(huì)不同系統(tǒng)和平臺(tái)上的知識(shí)體系和認(rèn)知主體的智慧集成,理論上,我們可以對(duì)各種各樣的虛假科學(xué)信息的鑒別需求作出快速回應(yīng)。
值得強(qiáng)調(diào)的是,這個(gè)過程不僅涉及知識(shí)鑒別,還涉及到社會(huì)層面的組織和協(xié)同。事實(shí)上,大數(shù)據(jù)和社會(huì)化媒體的發(fā)展,一方面具有對(duì)普通民眾和整個(gè)社會(huì)進(jìn)行賦能的潛力;另一方面,大量虛假、不實(shí)信息充斥其中,也使得有效信息的甄別和利用成為新的挑戰(zhàn),賦能不當(dāng),可能徒耗民眾的精力、時(shí)間和資源,變成耗能。這不是一個(gè)小問題。如我一開始所言,科學(xué)信息不光是科學(xué),它還可能關(guān)涉到政治和經(jīng)濟(jì),關(guān)乎大國之間的博弈和競爭,涉及到普通人的日常生活,因此,如何進(jìn)行一個(gè)社會(huì)的信息良治,值得我們投入更多的關(guān)注。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!