1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. 人工智能
  4. 正文

人工智能賽事里,藏著人才成長的另一種可能

 2020-12-21 14:59  來源:A5專欄  我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

每每提到“AI開發(fā)者”,大多數(shù)人想到的可能是來自互聯(lián)網大廠的“程序猿”們,他們身居算法工程師、數(shù)據工程師等高光崗位,有著名校博士乃至博士后的傲人學歷,并且拿著動輒百萬的年薪。

正如大家所看到的,人工智能的第三次浪潮已經持續(xù)了一段時間,逐漸從象牙塔走進了社會的角角落落??稍诖蠖鄶?shù)人的認知里,AI仍然有著相當遠的距離,仍然是部分高知分子研究的產物,仍然是一本普通人觸碰不到的“天書”。

但現(xiàn)實中正在發(fā)生的一些事情,儼然超出了我們的預想。

埃隆·馬斯克為特斯拉招聘AI人才時曾直言:“博士學位絕對不是必需的,我不在乎你是否高中畢業(yè)。”不同于許多人對學歷和經歷的癡迷,馬斯克正在尋找那些對人工智能有“深刻理解”的人。

不只是特斯拉的不拘一格,在游離于大多數(shù)人視線外的賽場上,一群20歲上下的少年剛剛經歷了一場在AI世界的“奇幻漂流”,詮釋著他們對人工智能的理解。

01 像看地圖一樣看新聞

正在讀大四的羅運是武漢大學地理信息科學專業(yè)的本科生,他與AI的機緣開始于年初的新冠疫情。

寒假回到家鄉(xiāng)的羅運,剛剛過了幾天可以賴床的生活,就被班級群里的討論繃緊了神經。原來在他們離校幾天后,武漢就因為新冠疫情封了城。羅運想要了解那座熟悉的城市到底發(fā)生了什么,努力在社交媒體和資訊平臺上搜索一切和武漢相關的新聞,卻發(fā)現(xiàn)網上充斥著太多的謠言和假消息,想要進一步查找學校周邊的情況,只能在社交媒體上找到寥寥幾條無法確證的內容。

由于地理信息科學屬于計算機和地理的交叉學科,除了和地理有關的課程,羅運還自學了計算機編程,并且經常在國外的慕課平臺上看一些人工智能的課程和案例??嘤诓檎椅錆h當?shù)匦侣劦牧_運萌生了一個大膽的想法:能不能將地圖和新聞資訊進行結合,像看地圖一樣查看當?shù)氐男侣?

羅運將自己的想法和參加大學生創(chuàng)新創(chuàng)業(yè)比賽時的兩個小伙伴進行了溝通,三人一拍即合,決定打造一款以地圖為導向的時空新聞交互網頁應用。

團隊首先確認了他們想要抓取的比較權威且有公信度的新聞源網站,然后使用Scrapy異步爬蟲框架對新聞進行智能提取,在百度飛槳提供的深度學習框架的支持下,基于文心ERNIE進行命名實體識別,再聯(lián)合百度地圖等的地理編碼服務,利用PostGIS計算空間數(shù)據的尺度、跨度,進行分詞和詞性提取后,運用TF-IDF、LDA等算法進行文本的向量化、詞頻分析、主題分析、相似度分析,最后采用飛槳的GRU4Rec模型根據用戶行為序列與興趣區(qū)域推薦新聞。

經過四個多月的開發(fā)測試后,將地圖和新聞結合的網頁應用正式上線。當羅運將鼠標點向武昌火車站的時候,網頁上彈出了長江網的最新消息,內容是武漢市解除離漢離鄂通道管控,涉及武昌站、武漢站、漢口站等火車站??粗约旱某晒?,羅運比任何一刻都更想念這熟悉的城市、熟悉的學校。

不善言談的他,很快和小伙伴定好了下一步的目標:目前他們正在為這款應用添加新的功能,逐步增加情感趨勢面分析、輿論導向分析等功能,方便普通用戶在地圖上找到不同時段新聞的同時,幫助有關部門從新聞和民眾的情緒中挖掘社會的熱點和痛點。

02 告別垃圾分類的煩惱

距離武漢700多公里的杭州市,杭州電子科技大學信息工程學院計算機專業(yè)的揭金民也在進行一場人工智能之旅 。

家在杭州的揭金民看到媽媽每天都要花不少的時間對廚余垃圾、可回收垃圾、有害垃圾等進行分類,可由于垃圾的種類繁多,常常出現(xiàn)分類錯誤的情況。社區(qū)只好派駐志愿者在各個小區(qū)監(jiān)督,基本就是居民剛剛扔完垃圾后,志愿者需要重新在垃圾桶里扒一遍。

有志愿者守在垃圾桶旁邊檢查,大家反而有了“僥幸心理”——畢竟就算分錯了類也會有志愿者重新分類。看著志愿者每天在臭氣熏天的垃圾桶中滿頭大汗地分揀,揭金民心里有些不是滋味。有沒有什么辦法能讓媽媽不再為垃圾分類頭疼,又能幫助這些志愿者?

作為一名計算機專業(yè)的本科生,揭金民想要用人工智能來改變現(xiàn)狀:倘若可以用計算機視覺技術對垃圾進行分類識別,居民們就能更輕松地完成垃圾分類,準確性也會提升,志愿者也不用再忍受惡臭翻垃圾桶。

揭金民拉上了兩位軟件工程專業(yè)的同學,以三人小分隊的形式踐行自己心中的想法。揭金民負責硬件設計,他要做一個三層結構的智能垃圾桶,第一層進行垃圾的識別,第二層對垃圾進行處理,第三層存儲不同類別的垃圾。另外兩個小伙伴分別負責系統(tǒng)后臺和前端的開發(fā)工作。

敲定了分工后,必須解決的一個核心問題是打造垃圾分類的算法模型。如果自己寫一套圖像識別算法,目前的水平和積累跟不上,會拖延產品成型的時間、錯過了最佳的市場。好在團隊找到了百度的EasyDL平臺,作為一個零門檻的AI開發(fā)平臺,EasyDL上有著豐富的算法模型,包括圖像分類、人臉識別等等,算法模型終于有了“譜”。揭金民和小伙伴如釋重負,立刻把精力放在了硬件和系統(tǒng)開發(fā)上。

在長達一年的時間里,揭金民團隊收集整理了近2萬張垃圾照片,其中包含大量袋裝垃圾,在EasyDL訓練后的識別準確率高達96%。硬件設計組裝完成后,揭金民將智能垃圾桶放在自己家小區(qū)進行試點,目前已經協(xié)助用戶完成了近1000kg垃圾的分類,異常識別率控制在5%以內。

“這只是第一步。我們想推出家庭版的智能分類垃圾桶,還想嘗試推出一種‘代扔垃圾’的服務……”細心的揭金民已經想好了未來的種種可能。

03 解放高空中的補漆工

在國內風能資源最為豐富的西北地區(qū),一座座風車如森林般矗立,源源不斷地將風能轉化為電能。

然而風機的維護卻成了一項讓人頭疼的難題,西安電子科技大學的黃耀輝了解到風機的維護需要工人們綁著繩索爬到高空中,提著漆桶進行補漆維護作業(yè)。

小時候她覺得那是一件有冒險精神的事情,長大后才知道冒險的背后是可怕的風險:高空補漆通常處于二級、三級乃至特級高處作業(yè),二級高處作業(yè)墜落死亡率就高達40% ;同時《工業(yè)衛(wèi)生與職業(yè)病》中指出,油漆工人中7.2%出現(xiàn)了白細胞數(shù)減少, 18.3%患有沙眼,22.8%心電圖異常,17.8%視力下降……

作為西安電子科技大學創(chuàng)新創(chuàng)業(yè)實驗班的學生,黃耀輝在心中一直藏著“解放”高空補漆工的想法,并在課余時間自學了人工智能相關的課程。一次偶然的機會,黃耀輝在學校的微信群中看到同學們在討論飛槳,在好奇心的驅動下走進了深度學習的世界。

與深度學習結緣之時,黃耀輝也認識了一個同校的好伙伴:左誼。那時左誼正在團隊中做一個無人機的項目,他和黃耀輝溝通后,大家迅速萌生了一個新的主意:既然飛槳上有那么多成熟的算法模型,或許可以將人工智能和無人機做一個結合,讓無人機替代工人完成高空中的補漆工作。

團隊討論明確了目標后,左誼作為隊長將無人機的工作拆解為四個過程。第一步是檢查出銹斑并噴涂除銹劑,第二步是讓無人機打磨銹跡,第三步和第四步分別是涂刷底漆和面漆。由于團隊在無人機巡檢和機械控制方面已經有一定的積累,問題主要集中在圖像識別和噴繪控制系統(tǒng)兩個方面。

團隊調用了飛槳里的計算機視覺模型,采用了空地聯(lián)動的形式進行作業(yè),即無人機將第一時間的圖像傳送到地面站,地面站搭建高效識別設備并將數(shù)據再次發(fā)送給無人機。由于采用了視覺SLAM技術,靠無人機上的攝像頭就能完成環(huán)境的感知工作,不僅降低了硬件上的成本,也提升了實地作業(yè)的可行性。

目前這一項目已經在校園內完成了測試:無人機緩緩飛到路燈桿上的電箱附近,準確識別出了電箱上的銹斑,然后打磨、涂刷一氣呵成,距離他們解放高空補漆工人的想法已經越來越近。

作為團隊的一員,黃耀輝這位大西北土生土長的女孩看到無人機飛起時眼眶竟然有些濕潤:“雖然現(xiàn)在還只是一個比賽,但我相信通過我們的努力,那些工人們終歸有一天不用再冒著生命危險爬到高空進行作業(yè)。”

04 讓瀕危語言不再消失

遙遠的英國南約克郡,正在謝菲爾德大學Lincedo組讀博的Xutan Peng(彭煦潭),同樣有一個“科技向善”的公益構想。

2020年初的“國際母語日”期間,Xutan Peng在謝菲爾德大學人文學院聽了一場演講,了解到全球現(xiàn)存7000余種有記錄的語言中,已經有超過400種瀕臨滅絕,超過200種處于接近瀕危的狀態(tài)。“語言是文明的DNA”,當一些語言不再被傳遞給下一代的時候,意味著一個文明正在被人們所忘卻。

科班出身的Xutan Peng,發(fā)現(xiàn)當下瀕危語言的保護手段還是一項“勞動密集性”工作,需要大量專家進行田野調查采集語料。由于還在說瀕危語言的人群以老人為主,他們中極少有人能同時使用漢語和本民族語言,導致對語料進行人工轉寫時存在很大難度。巧合的是,將自然語言處理作為研究方向的Xutan Peng正在關注低資源語言的詞典生成,就萌生了以自身一技之長來減輕瀕危語言保護工作量的念頭。

Xutan Peng戲稱自己是個話癆,所以對語言相關的工作有著天生的興趣。然而現(xiàn)實問題的復雜度遠超Xutan Peng的料想,盡管國內已經在少數(shù)民族語言保護上做了很多卓有成效的工作 ,可很多瀕危語言的文字已經失傳,只有語音留存,研究者甚至無法獲知其背后所傳達的語義。

不過Xutan Peng發(fā)現(xiàn),少數(shù)民族的語料主要圍繞神話傳說、民間故事、民歌和日常會話,或許可以構建現(xiàn)代漢語同領域的語料庫,當各自的語料領域相對近似時,可以通過對齊算法建立瀕危語言和現(xiàn)代漢語之間的聯(lián)系。

Xutan Peng先是拿到了相關數(shù)據的授權,借助PaddleOCR將相關紙質語料轉化成文本,建立了業(yè)界首個大規(guī)模漢語故事數(shù)據集。然后從國際開源語料數(shù)據庫找到了爾蘇、嘉絨、獨龍、撒拉四種語言,并將母語者的錄音進行國際音標轉寫。

最終Xutan Peng將少數(shù)民族語言詞匯嵌入到一個高維語義空間,漢語詞匯被嵌入到另一個空間,基于雙語詞向量結構近似性,利用正交映射對齊兩個空間,生成了高質量大規(guī)模的雙語詞典。

目前Xutan Peng已經將導出的詞典提供給中國社科院的研究者進行內測,在多數(shù)詞和名詞方面的翻譯準確率非常理想,有效提升了對少數(shù)民族語言進行轉錄和瀕危語言典藏工作的速度。這位特別能說的大男生不忘強調:“你們看吧,語言就是這么有趣。”

05 AI人才培養(yǎng)需要閉環(huán)

看完這些故事,你是否發(fā)現(xiàn)這些年輕人們并非都是科班出身,有些甚至在開始這些項目前對編程都知之甚少。但他們也有共性:心思縝密,擅長發(fā)現(xiàn)生活中遇到的痛點,并且希望通過人工智能技術去解決。

好在百度飛槳、EasyDL降低了這群少年走進AI世界的門檻,讓他們略顯稚嫩卻充滿朝氣的想法有了新的可能。

從好創(chuàng)意變成好應用,AI人才培養(yǎng)機制在其中起著關鍵的作用。雖然越來越多的高校開設了人工智能專業(yè)或課程,越來越多的政府和企業(yè)為AI人才開出了優(yōu)渥的條件,動輒百萬的年薪也切實激勵著當下的年輕人,只是選出“千里馬”所需要的不僅僅是伯樂,還要給他們一片可以自由馳騁的寬闊草原。

做一個歸納的話:“聞鼙鼓而思良將,謀大業(yè)而召英才”固然有道理,但AI人才培養(yǎng)還需要有人才培養(yǎng)的閉環(huán)思維,需要政府、高校和企業(yè)一道打通激勵、培養(yǎng)、實訓、競賽、就業(yè)的產業(yè)鏈條。

至少在剛剛結束的中國高校計算機大賽-人工智能創(chuàng)意賽賽場上,免費的算力資源已經幫他們把想法變成了現(xiàn)實,半年的實操經歷也讓他們對想要解決的問題有了更深刻的理解。

所幸百度代表的AI頭雁們已經開始行動。

前面講述的四個故事,不過是百度承辦的第三屆“中國高校計算機大賽-人工智能創(chuàng)意賽”的一隅,同樣懷揣夢想的還有2200多支學生團隊,他們正在各自關注的領域續(xù)寫屬于自己的故事。就像上一屆比賽中獲獎的中南大學“AI 知膚寶”團隊已經拿到數(shù)千萬的孵化基金,他們的項目已經聯(lián)網國內618家醫(yī)院,幫助10000多名醫(yī)生進行初步的病情診斷。

其實“以賽促學”是高校AI人才培養(yǎng)中的重要一環(huán),百度打造的一整套AI人才培養(yǎng)體系已經成型:

面向高校,百度為AI人才培養(yǎng)提供了全套教學和數(shù)據資源,學習與實訓社區(qū)AI Studio以及算力等全面支持,聯(lián)合共建專業(yè)課程體系,舉辦師資培訓班,已累計培訓了1600多名來自近500所高校的教師;

面向企業(yè),百度打造了黃埔學院、AI快車道、AI私享會等面向不同技術層級的培訓方案,構建深度學習專業(yè)加實踐應用的課程體系。此外,百度還通過開展能力評估認證、舉辦競賽等為人才培養(yǎng)保駕護航。

百度已經培養(yǎng)了超過100萬AI人才,未來5年,還將培養(yǎng)500萬AI人才,為中國智能經濟和智能社會的發(fā)展提供人才保障。

有理由相信,在百度等企業(yè)身體力行的推動下,將有越來越多的“少年”在AI世界里進行一場場“奇幻漂流”,用一個個可以觸摸的項目演繹他們心中世界的樣子。

彼時我們再討論百度對于中國AI人才的貢獻時,恐怕不只是培養(yǎng)了高端人才的“黃埔軍校”,也將是無數(shù)優(yōu)秀AI人才的“啟蒙工廠”。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
人工智能
ai技術

相關文章

  • IoT開發(fā)者為王,涂鴉智能硬核“靠邊站”

    IoT盛宴:涂鴉向下,產品向上

    標簽:
    人工智能
  • IPO觀察丨黑芝麻智能遞表港交所,車芯行業(yè)已邁向量產決戰(zhàn)期?

    雖然我國汽車芯片行業(yè)還處在發(fā)展初期,但已經迸發(fā)出無限潛力。一方面,智能汽車的發(fā)展不斷帶動需求增長;另一方面,政策引導下,汽車芯片企業(yè)持續(xù)搶占高地。對此,在7月5日-7日舉辦的2023年中國汽車論壇上,中國汽車工業(yè)協(xié)會副秘書長李邵華就做出表示,“中國將成為未來汽車芯片發(fā)展的集聚地”。車規(guī)芯片行業(yè)近日的

    標簽:
    人工智能
  • 匯聚中國AI頂尖力量 云天勵飛參與華為AI大模型聯(lián)合創(chuàng)新

    2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊”,云天勵飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網大廠、運營商、科研院所等優(yōu)秀團隊

    標簽:
    ai技術
  • 用友大易:邁入AI招聘2.0時代,讓人力資源回歸本質

    這幾個月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個名詞重回C位。過去在AI1.0時代,主要通過訓練模型來實現(xiàn)圖像識別、聲音識別、語言處理等特

    標簽:
    ai技術
  • 新發(fā)布的PaaS2.0,能否助力涂鴉智能再起飛?

    文:互聯(lián)網江湖作者:志剛2023年的IoT需要一個新故事。6月29日,涂鴉智能在開發(fā)者大會上,發(fā)布了企業(yè)級戰(zhàn)略PaaS2.0,希望通過一個平臺+四大開發(fā)服務,建立起IoT生態(tài)。對于這場發(fā)布會,市場的態(tài)度是積極的。美東時間6月29日收盤,涂鴉智能美股股價上漲5.6%,來到1.87美元/股。近日股價穩(wěn)定

    標簽:
    ai技術
  • 庫克已納投名狀:蘋果AI沒得選,只能選百度

    蘋果16弄了兩個版本,一個是專門給中國人用的,準備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型

  • AI加速時代的“進度條”,我們撥動了百分之幾?

    “技術日新月異,人類生活方式正在快速轉變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經熟悉的一切,都開始變得陌生。”計算機之父約翰·馮·諾依曼曾這樣說到。

    標簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭的一句話。

    標簽:
    ai智能
  • “創(chuàng)造市場”與“算法進化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據主導地位的中美雙方,卻也走出了兩條截然不同的技術路徑,前者執(zhí)著于前沿技術的探索,后者則發(fā)力應用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經無法直接進行排位先后、優(yōu)

    標簽:
    ai智能
  • 智能體進化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款AIAgent真的實現(xiàn)了流程全自動化AIAgent構建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應用門檻實在智能重磅發(fā)布實

  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產品更新迭代的速度慢了,民眾的關注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內大模型

    標簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網絡隨著數(shù)字人技術的突破,越來越多的傳統(tǒng)企業(yè)和機構開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標簽:
    數(shù)字人
  • 來到IPO關口,地平線離“三分天下”還有多遠?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關注。據悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機器人大會引領產業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍圖

    8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領域的繁榮生態(tài)。據官方統(tǒng)計數(shù)據,今年現(xiàn)場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知