2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ 備案號:
本站除標明“本站原創”外所有信息均轉載自互聯網 版權歸原作者所有。
郵箱:toplearningteam#gmail.com (請將#換成@)
為了解決大數據科學中的一個主要障礙,KAUST研究人員創建了一個框架,用于搜索在不同計算體系結構上輕松運行的大型數據集。他們的成就使研究人員能夠專注于推進搜索引擎或查詢引擎本身,而不是精心編寫特定的計算平臺。

大數據是當今信息繁重世界中最有前途但最具挑戰性的方面之一。雖然巨大且不斷擴展的信息集(如在線收集的數據或遺傳信息)可以為科學和人類提供強有力的見解,但處理和查詢所有這些數據需要高度復雜的技術。
已經探索了許多不同的查詢大數據的方法。但是最強大和計算效率之一是基于使用主題 - 謂詞 - 對象三元組結構分析數據(例如,apple,是a,fruit)。這種結構有助于將其視為具有邊和頂點的圖形,并且該特性已被用于為特定計算體系結構編碼查詢引擎以獲得最大效率。但是,這種特定于體系結構的方法無法輕松移植到不同的平臺,從而限制了分析創新和進步的機會。
“現代計算系統提供多樣化的平臺和加速器,對它們進行編程可能會令人生畏和耗時,”Fuad Jamour和Yanzhao Chen博士說。KAUST極端計算研究中心Panos Kalnis小組的候選人。“我們的研究小組專注于構建用于處理和分析非常大的數據集的系統和算法。這項研究解決了編寫程序一次然后在不同平臺上使用它的愿望。”
該組不是使用先前使用的圖遍歷或窮舉關系索引方法,而是使用稱為稀疏矩陣代數的應用數學方法來查詢三元組數據。
“我們的論文描述了第一個以矩陣代數為核心的研究圖形查詢引擎,以解決可移植性問題,”Jamour說。“大多數現有的圖形查詢引擎都是針對單個計算機或小型分布式內存系統而設計的。將現有引擎移植到大型分布式內存系統(如超級計算機)需要大量的工程工作。我們的稀疏矩陣代數方案可用于構建可擴展的,便攜和高效的圖形查詢引擎。“
該團隊在大型真實和合成數據集上的實驗實現了與現有的復雜查詢專用方法相當或更好的性能。他們的計劃還具有擴展到處理高達512億三元組數據集的超大型計算基礎架構的能力。
“這些想法可以促進圖形數據庫中的分析組件的構建,具有尖端的性能,目前需求量很大,”Chen說。
2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ 備案號:
本站除標明“本站原創”外所有信息均轉載自互聯網 版權歸原作者所有。
郵箱:toplearningteam#gmail.com (請將#換成@)