Apache Spark – wiodąca obecnie technologia do rozproszonego przetwarzania danych. Spark Structured Streaming to biblioteka Sparkowa umożliwiająca streamingowe przetwarzanie danych. Szkolenia z Apache Spark realizowane przez RDF polegają na przystępnym wyjaśnieniu architektury oraz zasady działania, a także na praktyce. To właśnie praktyka, niezwykle zbliżona do rzeczywistych problemów, staje się punktem rozpoznawczym naszych szkoleń.

Cel szkolenia – wprowadzić od podstaw w Spark Structured Streaming i nauczyć praktycznych aspektów posługiwania się nim na klastrze.

Czas trwania: 2-3dni

Szkolenie z Apache Spark – zakres

  1. 3 rodzaje przetwarzania danych (wprowadzenie do streamingu)
  2. Wyzwania Streamingu
  3. Delivery Guarantee
  4. Spark Streaming (kilka słów o tym co było – DStreams itd)
  5. Spark Structured Streaming (parę słów wprowadzenia, różnice z [4])
  6. Podstawowa architektura
  7. Output modes
  8. Podstawowa budowa w kodzie (wczytanie-operacje-zapisanie)
  9. Rodzaje Źródeł
  10. Rodzaje writerów/sinków
  11. Kafka – wprowadzenie
  12. Operacje niewspierane przez SSS
  13. Windows Operations
  14. Late Data + watermarking
  15. Joiny

Cennik

Cennik uzależniony jest od zakresu tematycznego, sytuacji firmy, liczby osób. Finalną cenę uzgodnimy podczas wstępnych konsultacji:

Szkolenie ze Spark Structured Streaming stacjonarne: od 3335 zł za osobę

Szkolenie ze Spark Structured Streaming online: od 2900 zł za osobę

Napisz już teraz na marek.czuma@protonmail.com