首頁 > 軟體

Java分散式學習之Kafka訊息佇列

2022-07-28 14:00:22

介紹

Apache Kafka 是分散式釋出-訂閱訊息系統,在 kafka官網上對 kafka 的定義:一個分散式釋出-訂閱訊息傳遞系統。 它最初由LinkedIn公司開發,Linkedin於2010年貢獻給了Apache基金會併成為頂級開源專案。Kafka是一種快速、可延伸的、設計內在就是分散式的,分割區的和可複製的提交紀錄檔服務。

注意:Kafka並沒有遵循JMS規範(),它只提供了釋出和訂閱通訊方式。

kafka中文官網:http://kafka.apachecn.org/quickstart.html

Kafka核心相關名稱

  1. Broker:Kafka節點,一個Kafka節點就是一個broker,多個broker可以組成一個Kafka叢集
  2. Topic:一類訊息,訊息存放的目錄即主題,例如page view紀錄檔、click紀錄檔等都可以以topic的形式存在,Kafka叢集能夠同時負責多個topic的分發
  3. massage: Kafka中最基本的傳遞物件。
  4. Partition:topic物理上的分組,一個topic可以分為多個partition,每個partition是一個有序的佇列。Kafka裡面實現分割區,一個broker就是表示一個區域。
  5. Segment:partition物理上由多個segment組成,每個Segment存著message資訊
  6. Producer : 生產者,生產message傳送到topic
  7. Consumer : 消費者,訂閱topic並消費message, consumer作為一個執行緒來消費
  8. Consumer Group:消費者組,一個Consumer Group包含多個consumer
  9. Offset:偏移量,理解為訊息 partition 中訊息的索引位置

主題和佇列的區別:

佇列是一個資料結構,遵循先進先出原則

kafka叢集安裝

參考官方檔案:https://kafka.apachecn.org/quickstart.html

  • 每臺伺服器上安裝jdk1.8環境
  • 安裝Zookeeper叢集環境
  • 安裝kafka叢集環境
  • 執行環境測試

安裝jdk環境和zookeeper這裡不詳述了。

kafka為什麼依賴於zookeeper:kafka會將mq資訊存放到zookeeper上,為了使整個叢集能夠方便擴充套件,採用zookeeper的事件通知相互感知。

kafka叢集安裝步驟:

1、下載kafka的壓縮包,下載地址:https://kafka.apachecn.org/downloads.html

2、解壓安裝包

tar -zxvf kafka_2.11-1.0.0.tgz

3、修改kafka的組態檔 config/server.properties

組態檔修改內容:

  • zookeeper連線地址:zookeeper.connect=192.168.1.19:2181
  • 監聽的ip,修改為本機的iplisteners=PLAINTEXT://192.168.1.19:9092
  • kafka的brokerid,每臺broker的id都不一樣broker.id=0

4、依次啟動kafka

./kafka-server-start.sh -daemon config/server.properties

kafka使用

kafka檔案儲存

topic是邏輯上的概念,而partition是物理上的概念,每個partition對應於一個log檔案,該log檔案中儲存的就是Producer生成的資料。Producer生成的資料會被不斷追加到該log檔案末端,為防止log檔案過大導致資料定位效率低下,Kafka採取了分片和索引機制,將每個partition分為多個segment,每個segment包括:“.index”檔案、“.log”檔案和.timeindex等檔案。這些檔案位於一個資料夾下,該資料夾的命名規則為:topic名稱+分割區序號。

例如:執行命令新建一個主題,分三個區存放放在三個broker中:

./kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 3 --topic kaico

  • 一個partition分為多個segment
  • .log 紀錄檔檔案
  • .index 偏移量索引檔案
  • .timeindex 時間戳索引檔案
  • 其他檔案(partition.metadata,leader-epoch-checkpoint)

Springboot整合kafka

maven依賴

 <dependencies>
        <!-- springBoot整合kafka -->
        <dependency>
            <groupId>org.springframework.kafka</groupId>
            <artifactId>spring-kafka</artifactId>
        </dependency>
        <!-- SpringBoot整合Web元件 -->
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-web</artifactId>
        </dependency>
    </dependencies>

yml設定

# kafka
spring:
  kafka:
    # kafka伺服器地址(可以多個)
#    bootstrap-servers: 192.168.212.164:9092,192.168.212.167:9092,192.168.212.168:9092
    bootstrap-servers: www.kaicostudy.com:9092,www.kaicostudy.com:9093,www.kaicostudy.com:9094
    consumer:
      # 指定一個預設的組名
      group-id: kafkaGroup1
      # earliest:當各分割區下有已提交的offset時,從提交的offset開始消費;無提交的offset時,從頭開始消費
      # latest:當各分割區下有已提交的offset時,從提交的offset開始消費;無提交的offset時,消費新產生的該分割區下的資料
      # none:topic各分割區都存在已提交的offset時,從offset後開始消費;只要有一個分割區不存在已提交的offset,則丟擲異常
      auto-offset-reset: earliest
      # key/value的反序列化
      key-deserializer: org.apache.kafka.common.serialization.StringDeserializer
      value-deserializer: org.apache.kafka.common.serialization.StringDeserializer
    producer:
      # key/value的序列化
      key-serializer: org.apache.kafka.common.serialization.StringSerializer
      value-serializer: org.apache.kafka.common.serialization.StringSerializer
      # 批次抓取
      batch-size: 65536
      # 快取容量
      buffer-memory: 524288
      # 伺服器地址
      bootstrap-servers: www.kaicostudy.com:9092,www.kaicostudy.com:9093,www.kaicostudy.com:9094

生產者

@RestController
public class KafkaController {
	/**
	 * 注入kafkaTemplate
	 */
	@Autowired
	private KafkaTemplate<String, String> kafkaTemplate;
	/**
	 * 傳送訊息的方法
	 *
	 * @param key
	 *            推播資料的key
	 * @param data
	 *            推播資料的data
	 */
	private void send(String key, String data) {
		// topic 名稱 key   data 訊息資料
		kafkaTemplate.send("kaico", key, data);
	}
	// test 主題 1 my_test 3
	@RequestMapping("/kafka")
	public String testKafka() {
		int iMax = 6;
		for (int i = 1; i < iMax; i++) {
			send("key" + i, "data" + i);
		}
		return "success";
	}
}

消費者

@Component
public class TopicKaicoConsumer {
    /**
     * 消費者使用紀錄檔列印訊息
     */
    @KafkaListener(topics = "kaico") //監聽的主題
    public void receive(ConsumerRecord<?, ?> consumer) {
        System.out.println("topic名稱:" + consumer.topic() + ",key:" +
                consumer.key() + "," +
                "分割區位置:" + consumer.partition()
                + ", 下標" + consumer.offset());
        //輸出key對應的value的值
        System.out.println(consumer.value());
    }
}

到此這篇關於Java分散式學習之Kafka訊息佇列的文章就介紹到這了,更多相關Java Kafka內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!


IT145.com E-mail:sddin#qq.com