近日,國內(nèi)領(lǐng)先的云原生數(shù)據(jù)分析平臺公司酷克數(shù)據(jù)正式發(fā)布了旗下云端數(shù)據(jù)倉庫 HashData Enterprise 4.0 新版本,采用了全新升級的產(chǎn)品內(nèi)核,提供了更加豐富的企業(yè)級分析與AI應(yīng)用特性,進一步提升了產(chǎn)品易用性,助力企業(yè)更高效地應(yīng)對 AI 時代的數(shù)據(jù)挑戰(zhàn)。
作為云原生與湖倉一體的倡導(dǎo)者,酷克數(shù)據(jù)公司專注于高性能、全托管的云端數(shù)據(jù)倉庫技術(shù)研發(fā),其產(chǎn)品通過創(chuàng)新的三分離架構(gòu)、開源生態(tài)和完善的管理工具,致力于滿足企業(yè)對多云環(huán)境下的資源管控與高效治理,賦能企業(yè)數(shù)智化轉(zhuǎn)型。
革新功能,賦能企業(yè)釋放數(shù)據(jù)潛力
2020年5月,HashData Enterprise 3.0 版本正式發(fā)布,率先落地實現(xiàn)了元數(shù)據(jù)、計算和存儲三層分離,多集群共享統(tǒng)一數(shù)據(jù)存儲的云原生架構(gòu),提供前所未有的大規(guī)模數(shù)據(jù)納管與分析能力。歷經(jīng)四年的持續(xù)打磨迭代,HashData Enterprise 3 系列已發(fā)布數(shù)十個版本,成功幫助金融、運營商、能源等國民經(jīng)濟重要行業(yè)的領(lǐng)軍企業(yè)加快數(shù)據(jù)架構(gòu)的轉(zhuǎn)型與升級,目前管理著 100+PB 的數(shù)據(jù),每天處理1億+的 SQL 查詢。
此次推出的 HashData Enterprise 4.0 在延續(xù)云原生架構(gòu)優(yōu)勢的基礎(chǔ)上,進一步聚焦性能優(yōu)化、靈活性增強及 AI/ML 應(yīng)用支持能力的提升,以更高效、更智能的方式助力企業(yè)加速邁向數(shù)字化未來,釋放數(shù)據(jù)的真正潛力,賦能行業(yè)創(chuàng)新與變革。
湖倉融合:連接多樣化數(shù)據(jù)生態(tài)
在現(xiàn)代數(shù)據(jù)管理中,企業(yè)面臨的數(shù)據(jù)類型多樣化以及存儲環(huán)境復(fù)雜化對傳統(tǒng)工具提出了新挑戰(zhàn)。HashData Enterprise 4.0 通過湖倉融合的設(shè)計實現(xiàn)數(shù)據(jù)存儲與分析的深度統(tǒng)一:
·無縫對接 Hive:通過 Hive Connector 和 HMS autosync 功能,無需遷移即可訪問 Hive 生態(tài)數(shù)據(jù),保障數(shù)據(jù)資產(chǎn)的完整性與使用效率。
·支持開放數(shù)據(jù)湖格式:集成 Iceberg、Hudi 和 Delta Lake 等主流數(shù)據(jù)湖技術(shù),增強對分布式數(shù)據(jù)管理的靈活支持。
·邏輯數(shù)據(jù)倉庫能力:遷移 PostgreSQL 生態(tài)豐富的 FDW 插件,輕松對接文件、關(guān)系型數(shù)據(jù)庫及分布式存儲,實現(xiàn)跨平臺數(shù)據(jù)的高效分析與查詢。
通過湖倉一體的創(chuàng)新,企業(yè)能夠更便捷地訪問和管理分散的數(shù)據(jù)源,加速數(shù)據(jù)價值的釋放,支持更多復(fù)雜分析場景的實現(xiàn)。
AI/ML 應(yīng)用:推動智能化分析場景落地
HashData Enterprise 4.0 加強了對 AI/ML 及大模型場景的支持,幫助企業(yè)將數(shù)據(jù)分析能力拓展至智能化決策領(lǐng)域:
·向量數(shù)據(jù)支持:引入 pgvector 技術(shù)棧,實現(xiàn)向量存儲和查詢能力,為推薦系統(tǒng)、語義搜索等 RAG 應(yīng)用場景提供有力支持。
·HashML 平臺:整合業(yè)界最前沿的 AI 算法及 MLOps 功能,為企業(yè)提供從數(shù)據(jù)處理到模型部署的一站式體驗,極致簡化復(fù)雜的數(shù)據(jù)管理與分析,使企業(yè)能夠?qū)W⒂诩铀賱?chuàng)新和業(yè)務(wù)價值。
·非結(jié)構(gòu)化數(shù)據(jù)管理:新增 Directory Table 功能,支持文本、圖像等非結(jié)構(gòu)化數(shù)據(jù)的存儲與管理,擴展分析場景的邊界。
這一系列功能將 AI 與數(shù)據(jù)倉庫的深度融合推向新高度,降低了企業(yè)在智能分析場景中的技術(shù)門檻。
查詢性能優(yōu)化:快速響應(yīng)業(yè)務(wù)需求
作為企業(yè)數(shù)據(jù)分析的核心能力,HashData Enterprise 4.0 在查詢性能方面的升級尤為突出:
·向量化執(zhí)行引擎:結(jié)合 SIMD 指令集與 JIT 技術(shù),大幅提升批量數(shù)據(jù)的處理速度。
·行列混存技術(shù):通過結(jié)合行式存儲的高效寫入和列式存儲的快速讀取,優(yōu)化查詢和存儲性能。
·物化視圖增強:支持增量刷新及自動查詢改寫,顯著提升查詢效率。
·緩存和索引優(yōu)化:新增數(shù)據(jù)緩存層及主流索引類型支持,大幅提升小批量數(shù)據(jù)操作的性能,同時支持 HTAP 場景。
這些性能優(yōu)化為企業(yè)提供了更高效的數(shù)據(jù)處理能力,幫助快速響應(yīng)業(yè)務(wù)變化,支持實時決策需求。
強化安全防護,打造可信數(shù)據(jù)環(huán)境
在數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性方面,HashData Enterprise 4.0 實現(xiàn)了全方位升級,為企業(yè)構(gòu)建可信賴的運行環(huán)境。
·數(shù)據(jù)脫敏與加密功能,通過規(guī)則靈活實現(xiàn)脫敏,結(jié)合 pgcrypto 加密函數(shù)確保數(shù)據(jù)在存儲與傳輸中的高度安全性。
·動態(tài)故障轉(zhuǎn)移與無縫恢復(fù)機制可實時檢測并處理故障節(jié)點,通過一致性哈希算法重新分配數(shù)據(jù)文件,保障計算過程不中斷,同時實現(xiàn)故障節(jié)點的自動恢復(fù)與集群再平衡。
·產(chǎn)品級異地災(zāi)備,通過 CDC 技術(shù)實現(xiàn)元數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)的高效同步,滿足不同集群間數(shù)據(jù)一致性的嚴格要求,并支持自定義 RTO/RPO 以適應(yīng)業(yè)務(wù)需求。
·多版本訪問功能允許企業(yè)保留數(shù)據(jù)庫對象的歷史版本,提供時間旅行與 UNDO 操作能力,為數(shù)據(jù)的持久化與高效恢復(fù)提供了更強支持。
·多地多活架構(gòu)打破了地域限制,實現(xiàn)跨地域集群的高效協(xié)同與備份,為企業(yè)提供穩(wěn)定的業(yè)務(wù)連續(xù)性保障。
通過全方位的安全升級與可靠設(shè)計,HashData Enterprise 4.0 幫助企業(yè)應(yīng)對日益復(fù)雜的數(shù)據(jù)安全挑戰(zhàn),為其數(shù)字化轉(zhuǎn)型之路提供可靠保障。
AI 驅(qū)動下的未來云端數(shù)據(jù)倉庫,加速企業(yè)數(shù)據(jù)智能化進程
HashData Enterprise 4.0 新版本的推出,標志著酷克數(shù)據(jù)在云端數(shù)據(jù)倉庫領(lǐng)域的又一次重大迭代。憑借湖倉一體的創(chuàng)新架構(gòu)、AI 深度融合的智能分析能力,以及全面升級的安全防護體系,新版本為企業(yè)在 AI 時代的數(shù)據(jù)管理和分析提供了有力的技術(shù)支持。
未來,酷克數(shù)據(jù)將繼續(xù)秉持創(chuàng)新驅(qū)動的研發(fā)理念,聚焦企業(yè)數(shù)字化轉(zhuǎn)型的核心需求,不斷完善產(chǎn)品生態(tài),為更多行業(yè)賦能。借助 HashData Enterprise 4.0 的強大能力,企業(yè)能夠更加從容地應(yīng)對數(shù)據(jù)挑戰(zhàn),加速邁向以數(shù)據(jù)驅(qū)動的高效、智能化未來。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!