近日,中國乃至全球的第一份《數據競賽白皮書》(以下簡稱“白皮書”)發(fā)布,首次為我們從全局的角度盤點了數據競賽的發(fā)展歷程、現(xiàn)狀以及價值。白皮書指導單位為“大數據系統(tǒng)軟件國家工程實驗室”,和鯨科技攜旗下第三方數據競賽平臺和鯨社區(qū)(Kesci),聯(lián)合AWS共同發(fā)布。
據發(fā)布方的信息顯示,白皮書通過搜集整理1000場全球競賽數據、1000余份問卷調研、幾十位行業(yè)專家及企業(yè)辦賽負責人的訪談、超過1200小時的分析研究,共同打造并發(fā)布了《數據競賽白皮書》(以下簡稱“白皮書”)。白皮書分為《數據競賽白皮書·上篇·1000場競賽的深度分析》和《數據競賽白皮書·下篇·辦好一場競賽的實操手冊》兩部分。
《數據競賽白皮書·上篇·1000場競賽的深度分析》中指出,數據競賽的發(fā)展起點可追溯至 1997 年首次問世的 KDD Cup,由國際頂會KDD 牽頭舉辦,這也是數據科學領域迄今為止最重要的國際賽事之一,至今已經舉辦22年。
今天,就讓我們跟著白皮書一起,回顧一下這二十多年數據競賽與國際頂會的歷程吧。
2019年夏天有件令人驚喜的事件傳遍了全國——KDD CUP 2019三個賽道的冠軍全都被華人面孔拿下。被譽為數據挖掘領域「奧運會」的 KDD CUP,從1997年到現(xiàn)在已經舉辦了22屆,是目前數據挖掘領域最有影響力的賽事。也是從今年開始開始, KDD CUP 擁有了專屬的獨立議程,供世界數據挖掘界的頂尖專家、學者、工程師、學生等前來參賽,在KDD中的分量越來越重要。
K D D(Conference on KnowledgeDiscovery and Data Mining,知識發(fā)現(xiàn)和數據挖掘會議)隸屬于 ACM(Association forComputing Machinery,國際計算機學會),是響譽全球的頂級學術會議。1997 年, KDD 正式推出 KDD Cup,KDD Cup 要求參賽者通過數據分析,判斷出哪些人有可能成為美國癱瘓退伍軍人協(xié)會的捐贈者,從而幫助協(xié)會更精準地發(fā)送求助郵件,開啟了數據競賽的新模式。此后,KDD Cup 保持了一年一度的舉辦慣例。
1999 年KDD Cup 的賽題更為經典,選用了來自美國國防部高級規(guī)劃署在 MIT 林肯實驗室操作進行的入侵檢測評估項目數據,希望參賽者能夠分辨那些操作是外部入侵,獲勝者是廣為人知的統(tǒng)計分析軟件公司 SAS。作為數據挖掘領域影響力最廣、水平最高的國際頂級賽事,KDD Cup 20 余年以來的賽題設計始終帶有鮮明的工業(yè)應用色彩,每年都會吸引大量優(yōu)秀的企業(yè)、高校或科研機構協(xié)辦賽事,或直接參給與競賽角逐。
通過KDD Cup 的歷年成果上不難看出,雖然面臨的問題日益復雜,但始終帶有強烈的工業(yè)應用色彩,高度契合各類組織機構的實際需求,不斷涌現(xiàn)出全新的應用場景。KDD Cup的成功,帶動了ICCV、NeurlPS、ISBI、Euro CSS、ECML-PKDD、VoxCeleb、MICCAI、C-MIMI、IEEE-CIS、CVPR(ActivityNet)、IWCS、ECCV 等國際頂尖學術會議紛紛加入這一浪潮。
他們除了在世界不同地域舉行年度性盛會外,也開始聯(lián)手全球各地的企業(yè)、科研機構共同籌辦數據競賽,以短時間競賽的形式幫助前沿數據科學技術的進一步發(fā)展。這類享有頂會權威背書和國際影響力的重大賽事在全球范圍內得到了積極響應,參賽對象不僅限于技術水平突出的個人,還囊括了科研實驗室、高校和企業(yè)等一系列組織。
國際頂會數據競賽也往往會積極兼顧市場應用的需求,通過與企業(yè)、政府機構合作,聚集當下技術與數據應用中的難點尋求解決思路, 不斷縮短科研成果與落地應用之間的距離,賽題內容廣泛覆蓋醫(yī)療、軍事、互聯(lián)網、交通出行、快消零售、生態(tài)及文化保護等眾多場景。
中國企業(yè)、高校及科研機構和個人參賽者在國際頂會數據競賽的獲獎次數呈現(xiàn)逐年上升的趨勢,亦反應了中國在數據科學領域的實力和影響力不斷加強。在中國也有一些企業(yè)開始和國際頂會合作,舉辦基于行業(yè)應用的數據競賽。而數據競賽的進程也伴隨著人工智能相關科技專利的爆發(fā)期,從2000年開始不斷向上。
根據麥肯錫全球研究院發(fā)布的 MGI 行業(yè)數字化指數報告,在產業(yè)數字化動態(tài)發(fā)展的過程中,完備的數字資產積累、充分的資本投入與研發(fā)、可持續(xù)的人才連接與協(xié)同推進了產業(yè)數字化程度的不斷加深,進而帶來了較高的平均利潤增長率以及勞動增長率。
《數據競賽白皮書》中提到,通過數據競賽形式并以此建立基于數據價值流動的生態(tài)系統(tǒng),才能充分利用生態(tài)內不斷升級的人才資源和技術資源賦能商業(yè)發(fā)展,已成為越來越多商業(yè)領袖的共識。相較于傳統(tǒng)的數字化進程,主動采用數字化戰(zhàn)略的企業(yè)明顯能在后續(xù)發(fā)展中與競爭對手拉開差距。
中國數據競賽的崛起并非偶然,也不止是對國外先進模式的亦步亦趨,而是在技術落地應用需求增長、宏觀政策支持和云計算基礎不斷成熟等原因之下的必然結果。建立基于數據價值流動的生態(tài)系統(tǒng),充分利用生態(tài)內不斷升級的人才資源和技術資源賦能商業(yè)發(fā)展,已成為越來越多商業(yè)領袖的共識。
據悉,在《數據競賽白皮書·下篇·辦好一場競賽的實操手冊》中,和鯨科技將首次公開自身100+場專業(yè)賽事的服務經驗,開源其數據競賽管理的方法論,這將對數據競賽行業(yè)產生不小的沖擊。和鯨科技是中國對標Kaggle成立的,最早的數據競賽平臺之一,且在這個過程中形成了在用戶數、用戶質量、活躍度方面均有出色表現(xiàn)的中國數據科學家社區(qū)——和鯨社區(qū)(由Kesci發(fā)展而來)。在和鯨社區(qū)上,有來自中國聯(lián)通、中國平安、招商銀行、騰訊、百度、字節(jié)跳動、攜程、IBM、華為、默克中國、南京市人民政府、深圳市人民政府、鵬城實驗室等頭部企業(yè)與機構舉辦數據競賽。通過開放競賽的機制和數據科學的手段,解決各個行業(yè)的業(yè)務難題。
國內最高規(guī)格的大數據競賽,由教育部主辦的“中國高校計算機大賽-大數據挑戰(zhàn)賽”,以及獎金規(guī)模最大的人工智能大賽,由深圳市政府主辦的“全國人工智能大賽”,都選擇在和鯨社區(qū)完成全流程的組織。由此可見,《數據競賽白皮書·下篇·辦好一場競賽的實操手冊》必然會促進“數據競賽”這一高效、敏捷的數字化創(chuàng)新模式,在中國進一步發(fā)展。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
隨著數字中國戰(zhàn)略的步步落實,大數據已經成為錨定戰(zhàn)略定位、搶得市場先機的重要基礎元素。為彰顯行業(yè)發(fā)展現(xiàn)狀,遴選、推薦優(yōu)秀企業(yè),長城戰(zhàn)略咨詢近日在2023中國國際大數據產業(yè)博覽會期間,重磅發(fā)布《中國大數據獨角獸企業(yè)榜單》,根據獨角獸企業(yè)國家推薦性標準,篩選出259家2022年中國大數據(潛在)獨角獸企業(yè)
2023年6月15日至18日,2023北京健康醫(yī)療大數據論壇、醫(yī)促會華夏健康數據與數字醫(yī)學高峰論壇、第三屆中華預防醫(yī)學會腎臟病預防與控制專業(yè)委員會學術會議將同期于北京舉行。論壇以“學術引領數智健康”為主題,著眼國家戰(zhàn)略需求,聚焦前沿科技在健康醫(yī)療領域的發(fā)展與實踐,薈萃全球頂尖學術觀點,促進多方跨界融
近日,北京市科學技術委員會、中關村科技園區(qū)管理委員會公示了北京市2023年第2批科技型中小企業(yè)名單,谷器數據借助優(yōu)秀的科技自主創(chuàng)新能力成功入選。此次評價指標圍繞科研人員、研發(fā)投入、科技成果等三個維度,成功入選科技型中小企業(yè)是對谷器數據專業(yè)化發(fā)展、自主創(chuàng)新能力、產品技術實力的激勵與肯定??萍夹椭行∑髽I(yè)
評審寄語面向車間現(xiàn)場生產制造過程的數字化管理,谷器數據SupplyX·MES通過推動更有效的工廠運行和現(xiàn)場效率,提供從接收生產計劃到制成最終產品全過程的生產活動實現(xiàn)優(yōu)化的信息,成為新型工業(yè)化的標桿力量!近日,由中國科學院《互聯(lián)網周刊》、中國社會科學院信息化研究中心等機構聯(lián)合主辦的“2023(第八屆)
在如今這個數字化轉型時代,大數據在企業(yè)發(fā)展的過程中發(fā)揮了至關重要的作用,大數據技術以更高效和有效的方式提供最好的服務,同時還可以提高生產力、提高客戶滿意度和更高效的智慧化運營。其中,成都四方偉業(yè)軟件股份有限公司(以下簡稱“四方偉業(yè)”)以優(yōu)秀的大數據產品和服務獲得了多項行業(yè)榮譽。去年,2022數博會數
把脈中國數據智能化
2023年,幾乎可以被定義為中國互聯(lián)網公司的“大模型元年”。ChatGPT的全球爆紅,徹底點燃國內的大模型賽道,曾經的“創(chuàng)業(yè)英雄”、如今的商業(yè)領袖們親自下場,接連發(fā)布生成式人工智能產品與大模型布局。大模型火了,沉寂許久的互聯(lián)網行業(yè)又有了新的“戰(zhàn)事”。同時,大模型的快速發(fā)展也改變了云市場的現(xiàn)狀,企業(yè)對
近日,數字化市場研究咨詢機構愛分析發(fā)布了《2022愛分析·數據智能廠商全景報告》,愛分析從技術研發(fā)能力、服務客戶數量、收入規(guī)模等維度對廠商進行了全面專業(yè)的評估
2022年11月18日,首個國家級大數據產業(yè)創(chuàng)新賽事——2022第一屆中國大數據大賽圓滿落幕。工業(yè)和信息化部信息技術發(fā)展司數字經濟推進處處長張建倫,中國電子技術標準化研究院副院長孫文龍出席頒獎典禮并致辭
2022年11月17日,在廈門市工業(yè)和信息化局的指導下,以“數據確權”為主題的2022數據資產(廈門)論壇在廈門成功舉辦。本次論壇以“數據確權”為主題,由廈門市互聯(lián)網域名應用服務產業(yè)協(xié)會和構信網(公信.中國)聯(lián)合主辦
近日,國內知名數字化市場研究咨詢機構愛分析正式發(fā)布《2022愛分析·信創(chuàng)廠商全景報告》(以下簡稱“報告”)。報告綜合考慮企業(yè)關注度、行業(yè)落地進展等因素,遴選出在信創(chuàng)市場中具備成熟解決方案和落地能力的廠商。
10月31日下午,由數博會執(zhí)委會主辦、數據觀(北京)傳媒科技有限公司承辦、貴陽大數據交易所協(xié)辦的第四期數博思享會“實踐先行觀公共數據價值與應用”活動成功舉辦。
近日,由中國國際數字經濟博覽會組委會主辦,中國電子技術標準化研究院、河北省工業(yè)和信息化廳承辦的“第一屆中國大數據大賽”(簡稱大數據大賽)正式啟動。
廣州光點信息科技有限公司自主研發(fā)的數據中臺產品GI大數據中臺V2.0產品是國內率先推出符合新創(chuàng)標準的中臺產品,基于“大數據+AI”等技術全新打造,集數據采集、融合、治理、服務、管理為一體的旗艦平臺。
廣州光點信息科技有限公司自主研發(fā)的數據中臺產品GI大數據中臺V2.0產品是國內率先推出符合新創(chuàng)標準的中臺產品,基于“大數據+AI”等技術全新打造,集數據采集、融合、治理、服務、管理為一體的旗艦平臺