Apache Spark – wiodąca obecnie technologia do rozproszonego przetwarzania danych. Szkolenia z Apache Spark realizowane przez RDF polegają na przystępnym wyjaśnieniu architektury oraz zasady działania, a także na praktyce. To właśnie praktyka, niezwykle zbliżona do rzeczywistych problemów, staje się punktem rozpoznawczym naszych szkoleń.

Cel szkolenia – wprowadzić od podstaw w Apache Spark i nauczyć praktycznych aspektów posługiwania się nim na klastrze.

Czas trwania: 3-5 dni

Szkolenie z Apache Spark – zakres

Cały plan podzielony jest na 3 części:

  1. Podstawy Sparka
  2. Spark na serwerze
  3. Spark dla zaawansowanych

Podstawy

  1. YARN – podstawy
  2. Czym jest Spark?
  3. Architektura
  4. Struktury Danych (RDD, Dataset, Dataframe)
  5. Budowa logiczna joba Sparkowego (DAG, akcje, transformacje)
  6. Alternatywy dla Sparka
  7. Joiny
  8. UDFy
  9. Pliki zewnętrzne

Spark na serwerze

  1. Różne dystrybucje hadoopa
  2. Spark Submit
  3. Spark a pliki (w tym hdfs)
  4. Logi Sparka na YARNie
  5. Spark UI i Spark History Server

Spark dla zaawansowanych

  1. JDBC + Postgresql
  2. Patrycjonowanie
  3. Praktyczne porady i dobre praktyki
  4. Głębsza teoria z zakresu zarządzania pamięcią
  5. Datasety – jak sprawić, żeby zachować schemę?

Cennik

Cennik uzależniony jest od zakresu tematycznego, sytuacji firmy, liczby osób. Finalną cenę uzgodnimy podczas wstępnych konsultacji:

Szkolenie z Apache Spark stacjonarne: od 3335 zł za osobę

Szkolenie z Apache Spark online: od 2900 zł za osobę

Już teraz napisz na marek.czuma@protonmail.com