Kami memiliki topologi aliran yang akan bekerja pada banyak mesin. Kami menyimpan hasil agregasi jangka waktu ke penyimpanan negara. Karena penyimpanan negara bagian menyimpan data lokal, menurut saya agregasi harus dilakukan pada topik lain untuk agregasi keseluruhan. Namun sepertinya saya melewatkan sesuatu karena tidak ada satu pun contoh yang melakukan agregasi keseluruhan pada KStream atau Prosesor lain.
Apakah kita perlu menggunakan logika groupBy untuk menyimpan keseluruhan agregasi, atau menggunakan GlobalKtable atau hanya mengimplementasikan kode merger kita sendiri di suatu tempat?
Apa arsitektur yang benar untuk ini?
Dalam kode di bawah ini, saya telah mencoba mengelompokkan semua pesan yang masuk ke prosesor dengan kunci konstan untuk menyimpan keseluruhan agregasi hanya pada satu mesin, tetapi menurut saya paralelisme yang disediakan Kafka akan hilang.
dashboardItemProcessor = streamsBuilder.stream("Topic25", Consumed.with(Serdes.String(), eventSerde))
.filter((key, event) -> event != null && event.getClientCreationDate() != null);
dashboardItemProcessor.map((key, event) -> KeyValue.pair(key, event.getClientCreationDate().toInstant().toEpochMilli()))
.groupBy((key, event) -> "count", Serialized.with(Serdes.String(), Serdes.Long()))
.windowedBy(timeWindow)
.count(Materialized.as(dashboardItemUtil.getStoreName(itemId, timeWindow)));
event.getName()
atauevent.getClientUuid()
, atau serupa, tapi seperti saya katakan, saya tidak tahu data Anda - person OneCricketeer   schedule 12.09.2018