Eventbus Architecture是我個人喜愛的架構,而Kafka是我這架構中的核心(主角)
[Kafka]Install kafka1.0.0 on CentOS 7
公司目前kafka cluster和zookeeper cluster都安裝在windows上,
後來我們決定回歸Linux,因為之前我吃過只有windows會有的bug,
另外,Linux版本更新比windows版本勤快多了
[Kafka]Install zookeeper on CentOS 7
公司目前kafka cluster和zookeeper cluster都安裝在windows上,
後來我們決定回歸Linux,因為之前我吃過只有windows會有的bug,
另外,Linux版本更新比windows版本勤快多了
[Kafka]Kafka practical experience
Kafka practical experience
[Kafka]performance tools
LinkedIn幫Kafka做了很多吞吐量效能測試,他們以RabbitMQ benchmark為範本來進行一連串的效能測試,
單一producer、100 bytes、3x async-replication每秒高達75MB(每秒可發送786432 的message),
sync-replication約40MB(每秒可發送419430的message)。單一Consumer則每秒有89.7MB(每秒可接收940573的message),
三個Consumer約為249.5MB(每秒可接收2616197.12的message),
而End to End的Producer’s latency平均2 ms,一整個讓我驚艷。
[Kafka]how to scale-out your kafka cluster
Kafka目前已經通過QA環境的壓力測試,也在Staging環境服務超過兩個禮拜了,
我們預計下一個版本將上Production,而那是一個超高流量和concurrent users的環境,
預防可能會有Scale-out的需求,我先來練習一下。
[Kafka]should I use ZK and Kafka together
當時在公司安裝測試Kafka時,同事最常問我是否真的需要ZK呢?
是否可以讓架構更簡單並單純使用Kafka cluster,我當時的回答是:無法避免。
[Kafka]Consumer Offset Manager
管理和理解Consumer offset我覺得是入門kafka的首要基礎,不然可能會遇到一些小問題,
如Consumer為什麼一直pull重複資料?Consumer如何從某個offset開始pull資料?
Consumer為什麼不pull資料?..等
[Kafka]Kafka Eagle
目前我使用Kafka-manager 管理公司的kafka cluster,但管理上我覺得有些地方很不方便,
偏偏其中有一點是我個人覺得很重要的,所以昨天就嘗試了Kafka Eagle用來補足Kafka-manager的不足,
另外我也大概玩了KafkaOffsetMonitor(太久沒更新,無法支援kafka 0.10.2.X)和linkedin/kafka-monitor(可支援kafka 0.10.2.X,但太多javascripts錯誤,我改到一半就放棄了)。
[Kafka]how to change replicate of topic on kafa
目前我使用Kafka manager來管理公司的kafka cluster,但topic無法修改replicate 數量,
這篇紀錄一下如何使用kafka system tools進行修改。
[Kafka]how to build binary of kafka from source
I got a bug of kafka on windows. It caused disk space usage issue because kafka borkers can not delete old log files after the configured time.
So, I have to build binary of kafka with patch from Microsoft/kafka’s version to avoid more disk space usage.
[Kafka]Monitor Kafka with jmxtrans
現在公司使用的Monitoring and Reporting System是由ITG建置而成。
[Kafka]ReConsume
kafka預設保存7天(168 hour)的log在disk,處理message過程中可能會出現異常或非預期錯誤(如網路中斷、disk 問題),
這時有可能造成我們資料遺失或不一致,這篇來看看如何重新consume這些資料。
[Kafka] consumer offset checker
確認Consumer是否有完整消耗kafka message是管理kafka重要的第一步,
因為你不想看到message無法被消耗或累積太多的情況。
[Kafka]Log Aggregation比較
最近我花了一些時間比較分析kafka,rabbitMQ,NATS何者適合Log Aggregation並符合公司系統要求
- 1