數字經濟時代,數據成為關鍵生產要素。企業從海量數據中挖掘商業價值的需求越發迫切。但這些高維、異構、復雜關聯的數據給傳統大數據處理和關系型數據庫產品帶來了極大挑戰。中山大學聯合創鄰科技 “Galaxybase”圖數據庫,完成了萬億規模交易數據智能挖掘性能測試,為圖數據庫賦能的智慧互聯數字化未來開啟了新紀元。
“超級算力+創新存儲技術”,推動大數據智能革命
2021年11月底工信部印發《“十四五”軟件和信息技術服務業發展規劃》,明確提出“突破大規模并行圖數據處理關鍵技術”,推動高性能數據庫在金融、電信、能源、制造等重點行業關鍵業務系統應用。圖數據庫作為以圖論為設計原理的數據庫管理系統,將現實世界的實體和實體關系抽象表達為頂點和邊,擅長海量圖數據的高效存儲、查詢、計算、分析,能有效解決傳統數據庫技術無法解決的大數據關聯難題,在金融風險、精準零售、物流優化、能源調度、生物制藥、智能交通、疫情防控等多種新興領域有巨大的應用價值。其解決了傳統技術關聯查詢效率低、成本高的問題,具有豐富、高效和敏捷的數據處理能力。而伴隨全球數字化競賽日趨白熱化,這將直接影響企業數字化、智能化進程。
在此背景下,如何建立高性能的圖計算理論及分布式存儲技術,是一個兼具重要性和挑戰性、并亟待解決的重要議題。基于中山大學牽頭的廣東省重點領域研發計劃“軟件、芯片與計算”重大專項項目“軟件定義的圖計算關鍵技術”,中山大學團隊聯合創鄰科技團隊依托國家超級計算廣州中心環境,完成全自主研發的國產高性能圖數據庫Galaxybase的安裝部署、萬億規模超級大圖數據的導入,實現實時大圖數據增刪改查, 并完成多跳查詢、模式挖掘等典型圖查詢、計算操作。
基于超算集群環境,Galaxybase圖數據庫構建了一套基于多級最優圖分片理論、動態任務調度模式及節點間混合通訊機制的分布式并行圖處理體系,通過提供了一個高性能、可擴展、高可靠的圖處理平臺,支撐萬億節點大圖的分布式存儲、實時在線查詢。在自研數據生成器所模擬的萬億級真實金融交易場景數據集上(包含50億條賬戶信息及5萬億條帶屬性的交易信息,涵蓋了最小為10 到最大超過1000萬出入度的超級節點),將賬號、資金、交易信息以交易網絡的形式組織在一起,高效實現了資金流向查詢、資金環路以及嫌疑賬戶間的最短關聯路徑查詢等深度圖查詢及圖計算,其中,通過交易時間進行過濾的六度的深鏈查詢平均耗時僅6.7秒。本項目僅用50臺機器集群實現了當前全球商業圖數據庫支持的最大規模圖數據處理,打破了美國頭部圖技術廠商于2021年6月用1000臺機器集群創造的1.2萬億規模大圖處理的世界紀錄。
高性能圖數據庫Galaxybase,為更深入的數字化未來做好準備
2021年12月12日, 國務院印發的《“十四五”數字經濟發展規劃》正式發布, 標志著我國數字經濟轉向深化應用、規范發展、普惠共享的新階段。
中山大學與創鄰科技的此次合作,充分體現了超級計算與創新存儲技術結合對行業數字化智能的賦能之力,開啟了圖技術賦能行業數字互聯新紀元,為實現“十四五”規劃提出的數字中國偉大目標添磚加瓦。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。