国产成人毛片视频|星空传媒久草视频|欧美激情草久视频|久久久久女女|久操超碰在线播放|亚洲强奸一区二区|五月天丁香社区在线|色婷婷成人丁香网|午夜欧美6666|纯肉无码91视频

kafka多個(gè)生產(chǎn)者同時(shí)生產(chǎn) 日志采集系統(tǒng)flume和kafka有什么區(qū)別及聯(lián)系?

日志采集系統(tǒng)flume和kafka有什么區(qū)別及聯(lián)系?Flume和Kafka有一部分功能是相同的,但是整體來(lái)看,兩者的差別還是很大的;它們使用的場(chǎng)景有所不同,但是可以相互配合使用。Flume簡(jiǎn)單的說(shuō),F(xiàn)

日志采集系統(tǒng)flume和kafka有什么區(qū)別及聯(lián)系?

Flume和Kafka有一部分功能是相同的,但是整體來(lái)看,兩者的差別還是很大的;它們使用的場(chǎng)景有所不同,但是可以相互配合使用。


Flume

簡(jiǎn)單的說(shuō),F(xiàn)lume是分布式日志收集系統(tǒng),它把各個(gè)服務(wù)器上的日志收集起來(lái),傳送到制定的地方,比如傳送到HDFS中。

Kafka

Kafka的定位是分布式消息中間件,自帶存儲(chǔ),提供push和pull存取數(shù)據(jù)功能。


使用場(chǎng)景

在實(shí)際應(yīng)用中,系統(tǒng)實(shí)時(shí)產(chǎn)生的日志需要最后進(jìn)入HDFS,但是生產(chǎn)上的日志數(shù)量會(huì)有波動(dòng),比如由于訪問(wèn)量的增加,導(dǎo)致突然之間產(chǎn)生大量的日志,這時(shí)候可能會(huì)導(dǎo)致日志寫(xiě)入HDFS失敗,所以這時(shí)候可以先把日志數(shù)據(jù)寫(xiě)入到Kafka中,再由Kafka導(dǎo)入到HDFS中。

總結(jié):在日志采集系統(tǒng)中,把Kafka當(dāng)做日志緩存更加合適,F(xiàn)lume做數(shù)據(jù)采集,因?yàn)樗梢远ㄖ坪芏鄶?shù)據(jù)源,減少開(kāi)發(fā)量,所以Flume和Kafka可以配合起來(lái)一起工作。

整體的流程是這樣的:

服務(wù)器上的日志<--Flume-->Kafka-->HDFS-->離線計(jì)算

服務(wù)器上的日志<--Flume-->Kafka-->Storm


希望我的回答能夠幫助到你!

kafka基本概念介紹?

消息中間件,主要是起到一個(gè)緩沖承接數(shù)據(jù)并且保證數(shù)據(jù)不丟的作用,在實(shí)時(shí)計(jì)算中一般會(huì)用到,安裝了kafka的程序可以叫broker,kafka的重要角色生產(chǎn)者和消費(fèi)者,kafka中如果分區(qū)數(shù)量大于1,分區(qū)中角色又分leader和follwer,leader負(fù)責(zé)讀寫(xiě),follwer負(fù)責(zé)同步數(shù)據(jù),面試中經(jīng)常會(huì)被問(wèn)到kafka為什么吞吐量這么大,一是多個(gè)分區(qū)并行執(zhí)行,二是順序?qū)懘疟P,三是操作系統(tǒng)級(jí)別的緩存

如何搭建kafka?該如何學(xué)習(xí)kafka?

百度 一大堆