Schulung: Apache Cassandra

In dieser Schulung lernst Du Apache Cassandra kennen und zu nutzen. Du erwirbst die notwendigen NoSQL und BigData Kenntnisse um die Funktionsweise und Architektur von Cassandra zu verstehen.

Die Cassandra Datenbank garantiert eine hohe Verfügbarkeit und Skalierbarkeit. Für die Menge der verwalteten Daten gibt es kein Limit, selbst Datenbanken in Terra- oder Petabyte Größe sind möglich. Der Zugriff erfolgt über die SQL ähnliche CQL Sprache. Der Grad der Konsistenz kann bei Cassandra selbst bestimmt werden.

Nach der Teilnahme am Kurs wirst du über fundierte Cassandra Kenntnisse verfügen und in der Lage sein, Cassandra im Cluster zu installieren, zu betreiben, Datenbanken zu modellieren und diese in Projekten zu nutzen.

NoSQL & BigData Grundlagen

  • Die drei Vs von Big Data: Volume, Velocity & Variety
  • Wo liegen die Grenzen des relationalen Modells?
  • Das CAP Theorem

Cassandra Architektur

  • Das Dynamo Paper und die Umsetzung in Cassandra: Consistent Hashing, Gossip, Hinted Handoff, ...
  • Der Unterschied zwischen Replikation und Partitioning
  • Tunable Consistency für Schreiben und Lesen
  • Wo liegen die Vorteile von Cassandra und welche Einschränkungen gibt es?

Arbeiten mit CQL

  • Das cqlsh Werkzeug
  • Unterschiede und Gemeinsamkeiten zu SQL
  • SELECT, INSERT, DELETE und UPDATE

Cassandra Data Model

  • Keyspace, Table & Column
  • Auswahl des Partitionkey und Clusteringkeys
  • Effizienz von Abfragen: Wie bekomme ich schnell eine Antwort
  • Modellieren ohne Relationen
  • Optimierung des Datenmodells für spezielle Anwendungen
  • Verwendung eines Index

Clustering

  • Was verwendet man am besten für eine Cassandra Installation? Physikalische Rechner, virtuelle Maschinen oder Container?
  • Installation eines Clusters
  • Hinzufügen und Entfernen von Knoten
  • Aufbau eines Cassandra Clusters auf Amazon AWS
  • Verteilung über mehrere Datacenter
  • Einstellungen für die Produktion

Anwendungsentwicklung mit Cassandra

  • Zugriff mit Java
  • Schreiben von Skripten mit dem Python Driver
  • Batching

Data Science & Analytics mit Cassandra

  • Die Rolle von Cassandra bei Big Data und Analytics
  • Verarbeiten von Cassandra Daten mit Apache Spark

Praxis

  • Für welche Aufgaben eignet sich Cassandra?
  • Performanz Tuning

Zielgruppe

Administratoren, Entwickler, Softwarearchitekten, Analysten, Data Science Specialists

Vorkenntnisse

Für den Besuch des Seminars sind keine Apache Cassandra Kenntnisse notwendig. Datenbank und SQL-Grundkenntnisse werden vorausgesetzt. Java und Python Wissen ist nicht notwendig.

Deine Vorteile

  • Du kannst die Einsatzfelder und den Nutzen von NoSQL Datenbanken und Cassandra für konkrete Projekte beurteilen.
  • Du lernst die Prinzipien und die Architektur von Cassandra kennen.
  • Lernst die Datenmodellierung für Cassandra
  • Du lernst einen Cassandra Cluster zu installieren, zu konfigurieren und zu betreiben

Dauer

2 Tage

Kursunterlage

Handouts aller in der Schulung präsentierten Folien sowie ein Skript mit detailierten Übungen.

Apache and Apache Cassandra sind eingetragen Warenzeichen der The Apache Software Foundation.

* Gesamtpreis pro Teilnehmer inkl. Kursmaterial und Tagesverpflegung zzgl. Mehrwertsteuer