有spark為什么還要hive 求問(wèn)怎么設(shè)置sparksql讀取hive的數(shù)據(jù)庫(kù)?
求問(wèn)怎么設(shè)置sparksql讀取hive的數(shù)據(jù)庫(kù)?過(guò)去,hive是用來(lái)建立數(shù)據(jù)倉(cāng)庫(kù)的,因此對(duì)hive管理的數(shù)據(jù)查詢有很大的需求。Hive、shark和sparlsql可以查詢Hive數(shù)據(jù)。Shark使
求問(wèn)怎么設(shè)置sparksql讀取hive的數(shù)據(jù)庫(kù)?
過(guò)去,hive是用來(lái)建立數(shù)據(jù)倉(cāng)庫(kù)的,因此對(duì)hive管理的數(shù)據(jù)查詢有很大的需求。Hive、shark和sparlsql可以查詢Hive數(shù)據(jù)。Shark使用hive的SQL語(yǔ)法解析器和優(yōu)化器,修改executor,使其物理執(zhí)行過(guò)程在spark上運(yùn)行;spark-SQL使用自己的語(yǔ)法解析器、優(yōu)化器和executor,spark-SQL還擴(kuò)展了接口,不僅支持hive數(shù)據(jù)查詢,還支持多數(shù)據(jù)源的數(shù)據(jù)查詢。
hive和sparksql的區(qū)別?
功能點(diǎn):hive:[1,數(shù)據(jù)存儲(chǔ)
2,數(shù)據(jù)清理spark:1,數(shù)據(jù)清理2,流計(jì)算hive可以通過(guò)HQL模式讀取hive數(shù)據(jù)進(jìn)行數(shù)據(jù)清理spark可以通過(guò)spark SQL或spark core模式清理數(shù)據(jù),可以讀取數(shù)據(jù)源包live JDBC、hive、elasticsearch、file等,因此spark可以替換數(shù)據(jù)蜂巢的清洗功能,也可以使用蜂巢作為數(shù)據(jù)源。蜂巢的優(yōu)勢(shì)在于1。大數(shù)據(jù)存儲(chǔ)。MapReduce操作通過(guò)SQL降低大數(shù)據(jù)使用門(mén)檻。Spark的優(yōu)勢(shì)在于1?;趦?nèi)存的MapReduce操作,速度快。流計(jì)算(基準(zhǔn)產(chǎn)品Flink,storm)
請(qǐng)問(wèn)寫(xiě)SQL腳本的算不算程序員?
應(yīng)該叫數(shù)據(jù)庫(kù)工程師,也是不錯(cuò)的選擇!