BigDataCon | 24. - 25. April 2018, Mainz

Spark Structured Streaming vs. Kafka Streams: Zwei Stream-Processing-Lösungen auf dem Prüfstand

Session
Infos
Mittwoch, 25. April 2018
10:00 - 11:00
Raum:
Goldsaal C

Unabhängig davon, ob die Quelle von Sensoren, Social Media oder Internet of Things (IoT) stammt, werden Ereignisströme und ihre schnelle und effiziente Handhabung immer wichtiger. Ereignisse müssen rasch und sicher entgegengenommen, verteilt und analysiert werden. Wenn man aber schnell auf eine Situation reagieren will oder muss, ist es nicht zielführend, die Daten erst zu speichern und danach zu analysieren. Die analytischen Operationen müssen direkt auf dem Ereignisstrom durchgeführt werden, wenn sich die Daten noch in Bewegung befinden (als Data in Motion bezeichnet). In dieser Session werden zwei bekannte und populäre Stream-Processing-Frameworks miteinander verglichen: Spark Structured Streaming und Kafka Streams. Wie unterscheiden sich die Frameworks voneinander, wo sind sie ähnlich? Was sind die Alleinstellungsmerkmale der Lösungen? Wie lassen sie sich in eine Big-Data-Umgebung integrieren? Diese und weitere Fragen werden in dieser Präsentation beantwortet.