青云科技(qingcloud.com)總裁林源在 AI 算力發(fā)布會和采訪中闡述了AI將給應用和算力帶來的變化,他認為“AI領域一定會出現(xiàn)巨頭,但不是一家獨立的公司,而是一個小的生態(tài)。”
每一次科技創(chuàng)新都給生產(chǎn)生活方式帶來變革,正如移動互聯(lián)網(wǎng)開啟萬物互聯(lián),云計算讓企業(yè)IT遷徙上云,每一次科技創(chuàng)新都給生產(chǎn)生活方式帶來變革。得益于AI高效的生產(chǎn)力與簡單的交互方式,青云科技總裁林源認為,新一波AI浪潮在帶來生產(chǎn)力變革的同時,還將帶來商業(yè)模式、應用門檻、底層架構等眾多變革,產(chǎn)生大量新市場機會。
他表示,相較于過去十年,AI驅(qū)動應用呈現(xiàn)四大變化:首先,移動互聯(lián)網(wǎng)、數(shù)字化的服務應用場景,轉(zhuǎn)變?yōu)樗袘枚家獡肀I或被AI改造,企業(yè)數(shù)智化取代數(shù)字化;第二,從以CPU為核心變?yōu)橐訥PU為核心驅(qū)動應用的創(chuàng)新,“未來的時代一定是一個以GPU為核心的時代”;第三,由于AI訓練成本極高,未來AI應用由延遲敏感型轉(zhuǎn)變?yōu)橐猿杀久舾行蜑橹鳎瑢乃懔难舆t低的東部沿海,向價格更便宜的西部地區(qū)發(fā)展,未來算力分布更加分散;第四,支撐的應用類型變化,由傳統(tǒng)應用和云原生應用,轉(zhuǎn)變?yōu)樵圃鷳?AI應用,客戶業(yè)務更復雜,業(yè)態(tài)更豐富,對技術和平臺的挑戰(zhàn)越來越多。
過去半年中,隨著大模型產(chǎn)品的爆發(fā),AI帶來的變革已經(jīng)逐漸凸顯,其中作為AI應用承載的算力格局變化尤為明顯。
中國信通院發(fā)布的《中國綜合算力指數(shù)(2023年)》顯示,截至2023年6月底,我國算力總規(guī)模達到197EFLOPS,其中智能算力規(guī)模占整體算力規(guī)模的比例提高到25.4%,智能算力規(guī)模同比增長達45%,比算力規(guī)模整體增速高15個百分點。
AI熱潮下,眾多智算中心項目如雨后春筍般落地開工,國家信息中心與相關部門聯(lián)合發(fā)布的《智能計算中心創(chuàng)新發(fā)展指南》顯示,目前全國有超過30個城市正在建設或提出建設智算中心。
在建設如火如荼的同時,智算中心也存在隱憂。林源指出,當前智算中心面臨多方面挑戰(zhàn)。
對于智算中心的主要建設者地方政府、國資央企和地方AI集成商來說,首要挑戰(zhàn)是成本和技術。智算中心投資巨大,一臺最新的NVIDIA的服務器就要兩百萬,未來能否收回成本以及盈利,取決于運營效率與平臺能力,前者降低成本,后者決定能賣給多少客戶。而相比于投資與建設,智算中心的運營更專業(yè)復雜,目前各中心運營能力參差不齊,難以應對。
他直言:“行業(yè)內(nèi)大家對于‘智算中心要怎么建?建成什么樣?未來要支撐什么業(yè)務?’并沒有想的很透徹。”因此造成了有智算功能的某計算中心建成后,由于只支持特定GPU,所以缺乏客戶,運營不起來的情況。
新一波AI熱潮下,智能算力規(guī)模將迎來更加快速的增長,智算中心如何設計規(guī)劃,實現(xiàn)兼顧AI應用、云原生應用與傳統(tǒng)應用需求,支持異構CPU/GPU,高效運營達到盈利?
青云的答案是青云AI算力調(diào)度平臺。
青云AI算力調(diào)度平臺是包括智算中心在內(nèi)的算力中心建設的新模式,讓算力中心像管理本地資源一樣管理AI基礎設施,實現(xiàn)多元算力統(tǒng)一調(diào)度、智能化算力管理,支持大模型訓練場景,提供多種AIGC模型的一站式交付平臺,支撐行業(yè)應用計算、高性能計算、AI計算等多種應用模式。
青云AI算力調(diào)度平臺具備九大關鍵能力:多區(qū)多業(yè)務資源整合、混合組網(wǎng)、容器推理服務平臺、分布式調(diào)度與管理、算法開發(fā)支持、模型倉庫(MaaS)、AI訓練平臺、靈活調(diào)度、高速并行存儲。
相較于市面上其他算力調(diào)度產(chǎn)品,苗慧表示,青云AI算力調(diào)度平臺在資源靈活調(diào)度方面更具優(yōu)勢。
原因在于,青云針對大規(guī)模計算集群研發(fā)了更優(yōu)化的調(diào)度算法,所有節(jié)點、服務器和存儲設備都有路徑標簽,通過算法計算最短鏈路,盡可能調(diào)度同一個交換機內(nèi)的兩個節(jié)點,減少數(shù)據(jù)的傳輸損耗。此外,青云在應用環(huán)境上使用K8s和Slurm兩種調(diào)度平臺同時為客戶服務,可以實現(xiàn)提交分布式計算任務時,相關卡、CPU、進程等調(diào)度信息都能立刻獲取到,在顆粒度和運維傳統(tǒng)機器等方面也有更多優(yōu)化。多措并舉,實現(xiàn)更好的算力調(diào)度,更好的資源利用。
“青云AI算力調(diào)度平臺的服務對象是現(xiàn)在和未來投入智算中心建設的企業(yè),算力中心現(xiàn)在的投資者和未來的運營者。”
對算力中心來說,青云AI算力調(diào)度平臺使用效果如何,實踐案例最有說服力。
據(jù)林源介紹,青云AI算力調(diào)度平臺正式發(fā)布前,已經(jīng)在國家超級計算濟南中心(以下簡稱“濟南超算”)應用,取得了良好效果。
濟南超算擁有超1000P算力,300P存儲,是一個多元異構算力中心,包括HPC、智算和以CPU為主的云計算,既有NVIDIA GPU,也考慮到國產(chǎn)化兼容,擁有一部分國產(chǎn)GPU。自3年前起,濟南超算的整個調(diào)度平臺由青云科技獨家供應,運營至今,平穩(wěn)支撐濟南超算來自高校的傳統(tǒng)科學計算、政務云和企業(yè)數(shù)字化應用上云、智慧城市、AI等多類客戶群體業(yè)務,助力濟南超算提高算力資源利用,目前已經(jīng)實現(xiàn)盈利。
用林源的話說,濟南超算案例說明“青云AI算力調(diào)度平臺具備所說的能力,我們干過,而且干成了。”
從對話的ChatGPT到生成照片的妙鴨相機,AI已經(jīng)在多個領域展現(xiàn)了驚人的生產(chǎn)力與創(chuàng)造力,新一波AI大潮席卷而來,模型迭代迅速,智能算力建設與應用落地加速,企業(yè)如何抓住市場新機遇,踏浪向前?
面對AI帶來的一系列變革,青云希望通過開放的、成熟的、可運營的AI算力調(diào)度平臺,通過自營、合營乃至支撐第三方運營的方式,與生態(tài)同盟一起貢獻“AI Cloud”,共同前行。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!