圖數據庫應用 想問一下圖數據庫neo4j和spark下面的graphx有什么區(qū)別?
想問一下圖數據庫neo4j和spark下面的graphx有什么區(qū)別?Neo4j是一個數據庫(可以理解為類似于HBase的東西,但是Neo4j幾乎是一個獨立的數據庫。與HBase不同,HBase的數據存
想問一下圖數據庫neo4j和spark下面的graphx有什么區(qū)別?
Neo4j是一個數據庫(可以理解為類似于HBase的東西,但是Neo4j幾乎是一個獨立的數據庫。與HBase不同,HBase的數據存儲在HDFS上,由HDFS進行維護。HDFS將數據存儲在exFAT和其他獨立文件系統(tǒng)上。
Neo4j將數據直接格式化到獨立的文件系統(tǒng)。每個服務器都存儲完整的圖形數據。Graphx是一個計算引擎(類似于MapReduce)。它的數據是使用SQL從shark讀取的,或者RDD操作符從文件讀取,然后直接計算。另外,數據庫和計算引擎都可以執(zhí)行計算任務,但數據庫的接口相對較弱,只支持簡單的查詢,計算引擎提供了強大的計算接口,便于編程。PageRank和其他的圖形算法很容易實現。Graphx應該更便于數據挖掘。由于有幾個通用編程端口,neo4j需要編寫自己的代碼。編程很麻煩,但在性能上可能有優(yōu)勢
圖形數據庫中的每個對象都是一個節(jié)點,它們之間的關系是一條邊。與關系數據庫相比,圖形數據庫能夠處理大量復雜的、互聯(lián)的、低結構的、變化迅速的、需要頻繁查詢的數據。在關系數據庫中,這些查詢會導致大量的表連接,從而導致性能問題,不便于設計和使用。
圖形數據庫適用于社交網絡、推薦系統(tǒng)和其他側重于構建關系圖的系統(tǒng)。
圖形數據庫的代表有neo4j、flockdb、infogrid、allegrograph、graphdb等。