Session Details

BigDataCon | 9. - 11. Mai 2017, Mainz

10 May 2017
11:45 - 12:45
Gutenberg-Saal 1

Ungefähr populär – Moderne Datenstrukturen im Einsatz

1475132088344_56fbe6a4cc5c896438affb69version1sizefull.png

Mit Hadoop und diversen Streamingframeworks (Spark, Flink) steht ein ganzer Blumenstrauß an Tools bereit, um in (fast) Echtzeit auch große Datenmengen zu analysieren. Gemein haben sie den Grundsatz: Großes Problem braucht mehr Rechenleistung und mehr Speicherplatz. Was aber, wenn wir zur Berechnung eines Ergebnisses sehr viele Daten (z. B. Klickdaten) in Echtzeit nutzen wollen? Oder die benötigte Rechenleistung in keinem Verhältnis zum Problem steht? Hier helfen moderne Datenstrukturen wie z. B. der Bloom-Filter oder der Count-Min Sketch. Diese speichern sehr große Datenmengen auf sehr kleinem Raum.