編程語(yǔ)言有幾種 想問一下圖數(shù)據(jù)庫(kù)neo4j和spark下面的graphx有什么區(qū)別?
想問一下圖數(shù)據(jù)庫(kù)neo4j和spark下面的graphx有什么區(qū)別?Neo4j是一個(gè)數(shù)據(jù)庫(kù)(可以理解為類似于HBase的東西,但是Neo4j幾乎是一個(gè)獨(dú)立的數(shù)據(jù)庫(kù)。與HBase不同,HBase的數(shù)據(jù)存
想問一下圖數(shù)據(jù)庫(kù)neo4j和spark下面的graphx有什么區(qū)別?
Neo4j是一個(gè)數(shù)據(jù)庫(kù)(可以理解為類似于HBase的東西,但是Neo4j幾乎是一個(gè)獨(dú)立的數(shù)據(jù)庫(kù)。與HBase不同,HBase的數(shù)據(jù)存儲(chǔ)在HDFS上,由HDFS進(jìn)行維護(hù)。HDFS將數(shù)據(jù)存儲(chǔ)在exFAT和其他獨(dú)立文件系統(tǒng)上。
Neo4j將數(shù)據(jù)直接格式化到獨(dú)立的文件系統(tǒng)。每個(gè)服務(wù)器都存儲(chǔ)完整的圖形數(shù)據(jù)。Graphx是一個(gè)計(jì)算引擎(類似于MapReduce)。它的數(shù)據(jù)是使用SQL從shark讀取的,或者RDD操作符從文件讀取,然后直接計(jì)算。另外,數(shù)據(jù)庫(kù)和計(jì)算引擎都可以執(zhí)行計(jì)算任務(wù),但數(shù)據(jù)庫(kù)的接口相對(duì)較弱,只支持簡(jiǎn)單的查詢,計(jì)算引擎提供了強(qiáng)大的計(jì)算接口,便于編程。PageRank和其他的圖形算法很容易實(shí)現(xiàn)。Graphx應(yīng)該更便于數(shù)據(jù)挖掘。由于有幾個(gè)通用編程端口,neo4j需要編寫自己的代碼。編程很麻煩,但在性能上可能有優(yōu)勢(shì)