Session Details

BigDataCon | 9. - 11. Mai 2017, Mainz

10 Mai 2017
11:45 - 12:45
Gutenberg-Saal 1

Ungefähr populär – Moderne Datenstrukturen im Einsatz

10 Mai 2017
11:45 - 12:45
Gutenberg-Saal 1

Mit Hadoop und diversen Streamingframeworks (Spark, Flink) steht ein ganzer Blumenstrauß an Tools bereit, um in (fast) Echtzeit auch große Datenmengen zu analysieren. Gemein haben sie den Grundsatz: Großes Problem braucht mehr Rechenleistung und mehr Speicherplatz. Was aber, wenn wir zur Berechnung eines Ergebnisses sehr viele Daten (z. B. Klickdaten) in Echtzeit nutzen wollen? Oder die benötigte Rechenleistung in keinem Verhältnis zum Problem steht? Hier helfen moderne Datenstrukturen wie z. B. der Bloom-Filter oder der Count-Min Sketch. Diese speichern sehr große Datenmengen auf sehr kleinem Raum.