{"id":46,"date":"2021-06-18T17:26:52","date_gmt":"2021-06-18T15:26:52","guid":{"rendered":"http:\/\/wp.jankiewicz.pl\/index.php\/krzysztof-jankiewicz-apache-spark-z-wykorzystaniem-jezyka-scala\/"},"modified":"2022-06-20T23:11:03","modified_gmt":"2022-06-20T21:11:03","slug":"krzysztof-jankiewicz-apache-spark-z-wykorzystaniem-jezyka-scala","status":"publish","type":"post","link":"https:\/\/wp.jankiewicz.pl\/index.php\/2021\/06\/18\/krzysztof-jankiewicz-apache-spark-z-wykorzystaniem-jezyka-scala\/","title":{"rendered":"Apache Spark z wykorzystaniem j\u0119zyka Scala"},"content":{"rendered":"\n<h2 class=\"wp-block-heading\"><span style=\"color: revert; font-size: revert; font-weight: revert;\">Harmonogram<\/span><\/h2>\n\n\n\n<h3 class=\"wp-block-heading\"><a href=\"#day1\" data-type=\"internal\" data-id=\"#day1\">Dzie\u0144 1<\/a><\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Scala<\/li><li>Spark &#8211; wprowadzenie<\/li><li>Spark &#8211; RDD (podstawy)<\/li><\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><a href=\"#day2\" data-type=\"internal\" data-id=\"#day2\">Dzie\u0144 2<\/a><\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Spark &#8211; RDD (klucz-warto\u015b\u0107)<\/li><li>Spark &#8211; DataFrames<\/li><li>Spark &#8211; Dataset<\/li><\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><a href=\"#day3\" data-type=\"internal\" data-id=\"#day3\">Dzie\u0144 3<\/a><\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Spark &#8211; RDD (wydajno\u015b\u0107)<\/li><li>Spark &#8211; Delta Lake<\/li><li>Spark &#8211; ML<\/li><\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Wprowadzenie<\/h2>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"alignright size-large is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/wp.jankiewicz.pl\/wp-content\/uploads\/2022\/06\/spark_scala_b86ec74a38.svg\" alt=\"\" class=\"wp-image-210\" width=\"200\" height=\"200\"\/><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Apache Spark okre\u015blany jest mianem standardu de-facto przetwarzania Big Data. Jego popularno\u015b\u0107, wyst\u0119powanie praktycznie w ramach ka\u017cdej z platform chmurowych, w \u015brodowiskach on-premise, API dla j\u0119zyk\u00f3w Scala, Java, ale tak\u017ce Python i R w pe\u0142ni uzasadnia to twierdzenie. <\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Szkolenie <strong><em>Apache Spark z wykorzystaniem j\u0119zyka Scala<\/em><\/strong> prezentuje praktyczne wykorzystanie platformy Apache Spark w kontek\u015bcie przetwarzania Big Data.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Szkolenie prowadzone we wsp\u00f3\u0142pracy z firm\u0105 <a href=\"https:\/\/www.sages.pl\/szkolenia\/apache-spark-z-wykorzystaniem-jezyka-scala\" data-type=\"URL\" data-id=\"https:\/\/www.sages.pl\/szkolenia\/apache-spark-z-wykorzystaniem-jezyka-scala\">Sages<\/a>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Podstawowe cele szkolenia<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Zapoznanie z platform\u0105 Spark oraz jej API w j\u0119zyku Scala<\/li><li>Pokazanie metod analizy du\u017cej ilo\u015bci danych<\/li><\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">G\u0142\u00f3wne jego zalety<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Kompleksowe wprowadzenie do platformy Spark &#8211; po zako\u0144czonym szkoleniu znasz mo\u017cliwo\u015bci i zakres funkcjonalno\u015bci Sparka.<\/li><li>Przedstawienie praktycznych przyk\u0142ad\u00f3w oraz praktyk zwi\u0105zanych z analiz\u0105 du\u017cej ilo\u015bci danych<\/li><li>Praktyka przed teori\u0105 &#8211; nie tylko wiesz jak, ale tak\u017ce dlaczego<\/li><\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Dla kogo?<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Analitycy i programi\u015bci, kt\u00f3rzy znaj\u0105 podstawy Big Data i chc\u0105 rozpocz\u0105\u0107 przygod\u0119 z<br>wykorzystaniem platformy Spark oraz j\u0119zykiem Scala<\/li><\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Wymagania<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Dobra znajomo\u015b\u0107: j\u0119zyka SQL, relacyjnego modelu danych oraz hurtowni danych<\/li><li>Podstawowa znajomo\u015b\u0107 obiektowych j\u0119zyk\u00f3w programowania np.: Java, Python lub Scala<\/li><li>Znajomo\u015b\u0107 zagadnie\u0144 Big Data, platformy Hadoop oraz powi\u0105zanych z ni\u0105 narz\u0119dzi<\/li><li>Zalecany jest wcze\u015bniejszy udzia\u0142 w szkoleniu: <em><a href=\"https:\/\/wp.jankiewicz.pl\/index.php\/2022\/06\/18\/krzysztof-jankiewicz-big-data-i-platforma-hadoop-wprowadzenie\/\" data-type=\"post\" data-id=\"52\">Big Data i platforma Hadoop &#8211; wprowadzenie<\/a><\/em><\/li><\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Struktura kursu<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Kurs podzielony jest na tematy. Ka\u017cdy z temat\u00f3w obejmuje wyk\u0142adowy materia\u0142 wprowadzaj\u0105cy i zestaw \u0107wicze\u0144\/zada\u0144\/tutoriali,<br>kt\u00f3ry w praktyczny spos\u00f3b pozwala zaznajomi\u0107 si\u0119 z przedstawianym tematem.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Materia\u0142 <strong>wyk\u0142adowy<\/strong> ilustrowany jest slajdami z du\u017c\u0105 liczb\u0105 przyk\u0142ad\u00f3w.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Materia\u0142 <strong>praktyczny<\/strong> ma charakter zada\u0144\/warsztat\u00f3w\/tutoriali do samodzielnego wykonania.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Lista temat\u00f3w<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"day1\">Dzie\u0144 1<\/h3>\n\n\n\n<ol class=\"wp-block-list\" start=\"0\"><li>Wprowadzenie<ul><li>Materia\u0142 wyk\u0142adowy<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS00_l1_21-Plan-szkolenia.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Plan szkolenia<\/a><\/li><\/ul><\/li><li>Warsztat<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS00_w1_21-Konfiguracja-Srodowiska-GCP-sages.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Konfiguracja \u015brodowiska GCP<\/a><\/li><\/ul><\/li><\/ul><\/li><li>Scala<ul><li>Materia\u0142 wyk\u0142adowy<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS01_l1_21-Scala.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Scala &#8211; wprowadzenie<\/a><\/li><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/Scala-v2-online-prog%20-%202021-10-20.scala\" target=\"_blank\" rel=\"noreferrer noopener\">Scala &#8211; wprowadzenie &#8211; notatnik (Databricks)<\/a><\/li><\/ul><\/li><li>Warsztat<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS01_w1_21-Scala-intellij-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Scala &#8211; warsztaty<\/a><\/li><\/ul><\/li><\/ul><\/li><li>Spark &#8211; Wprowadzenie<ul><li>Materia\u0142 wyk\u0142adowy<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS02_l1_21-Spark-wprowadzenie.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; wprowadzenie<\/a><\/li><\/ul><\/li><li>Warsztat<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS02_w1_21-Spark-wprowadzenie-gcp-intellij-tutorial.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; wprowadzenie &#8211; tutorial (IntelliJ IDEA)<\/a><\/li><\/ul><\/li><\/ul><\/li><li>Spark &#8211; RDD (Podstawy)<ul><li>Materia\u0142 wyk\u0142adowy<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS03_l1_21-Spark-RDD-podstawy.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; RDD (podstawy)<\/a><\/li><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/RDD-podstawy%20-%202021-10-21.scala\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; RDD (podstawy) &#8211; notatnik (Databricks)<\/a><\/li><\/ul><\/li><li>Warsztat<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS03_w1_21-Spark-RDD-podstawy-gcp-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; RDD (podstawy) &#8211; warsztaty<\/a><\/li><\/ul><\/li><\/ul><\/li><\/ol>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"day2\">Dzie\u0144 2<\/h3>\n\n\n\n<ol class=\"wp-block-list\" start=\"1\"><li>Spark &#8211; RDD (Klucz-Warto\u015b\u0107)<ul><li>Materia\u0142 wyk\u0142adowy<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS04_l1_21-Spark-RDD-klucz-wartosc.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; RDD (klucz-warto\u015b\u0107)<\/a><\/li><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/RDD-klucz-warto%C5%9B%C4%87%20-%202021-10-21.scala\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; RDD (klucz-warto\u015b\u0107) &#8211; notatnik (Databricks)<\/a><\/li><\/ul><\/li><li>Warsztat<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS04_w1_21-Spark-RDD-klucz-wartosc-gcp-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; RDD (klucz-warto\u015b\u0107) &#8211; zadania<\/a><\/li><\/ul><\/li><\/ul><\/li><li>Spark &#8211; DataFrame<ul><li>Materia\u0142 wyk\u0142adowy<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS05_l1_21-Spark-DataFrames.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; DataFrame<\/a><\/li><\/ul><\/li><li>Warsztat<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS05_w1_21-Spark-DataFrames-gcp-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; DataFrame &#8211; zadania<\/a><\/li><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS05_w2_21-Spark-DataFrames-zadania.zpln\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; DataFrame &#8211; notatnik (Zeppelin)<\/a><\/li><\/ul><\/li><\/ul><\/li><li>Spark &#8211; Dataset<ul><li>Materia\u0142 wyk\u0142adowy<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS06_l1_21-Spark-Dataset.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; Dataset<\/a><\/li><\/ul><\/li><li>Warsztat<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS06_w1_21-Spark-Dataset-gcp-projekt-rozw.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; Dataset &#8211; projekt<\/a><\/li><\/ul><\/li><\/ul><\/li><\/ol>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"day3\">Dzie\u0144 3<\/h3>\n\n\n\n<ol class=\"wp-block-list\" start=\"1\"><li>Spark &#8211; RDD (Wydajno\u015b\u0107)<ul><li>Materia\u0142 wyk\u0142adowy<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS07_l1_21-Spark-RDD-wydajnosc.pdf\">Spark &#8211; RDD (wydajno\u015b\u0107)<\/a><\/li><\/ul><\/li><\/ul><\/li><li>Spark &#8211; Delta Lake<ul><li>Materia\u0142 wyk\u0142adowy<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS08_l1_21-Spark-DeltaLake.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; Delta Lake<\/a><\/li><\/ul><\/li><li>Warsztat<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS08_w1_21-Spark-Delta-Lake-gcp-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; Delta Lake &#8211; zadania<\/a><\/li><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS08_w1_21-Spark-Delta-Lake-gcp-zadania.zpln\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; Delta Lake &#8211; notatnik<\/a><\/li><\/ul><\/li><\/ul><\/li><li>Spark &#8211; ML<ul><li>Materia\u0142 wyk\u0142adowy<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS09_l1_21-Spark-ML.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; ML<\/a><\/li><\/ul><\/li><li>Warsztat<ul><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS09_w1_21-Spark-ML-gcp-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; ML &#8211; zadania<\/a><\/li><li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS09_w1_21-Spark-ML-gcp-zadania.zpln\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; ML &#8211; notatnik<\/a><\/li><\/ul><\/li><\/ul><\/li><\/ol>\n","protected":false},"excerpt":{"rendered":"<p>Apache Spark okre\u015blany jest mianem standardu de-facto przetwarzania Big Data. Jego popularno\u015b\u0107, wyst\u0119powanie praktycznie w ramach ka\u017cdej z platform chmurowych, w \u015brodowiskach on-premise, API dla j\u0119zyk\u00f3w Scala, Java, ale tak\u017ce Python i R w pe\u0142ni uzasadnia to twierdzenie.<br \/>\nKurs Apache Spark z wykorzystaniem j\u0119zyka Scala prezentuje praktyczne wykorzystanie platformy Apache Spark w kontek\u015bcie przetwarzania Big Data.<\/p>\n","protected":false},"author":2,"featured_media":185,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"inline_featured_image":false,"footnotes":""},"categories":[7],"tags":[32,37,17,18],"class_list":["post-46","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-big-data","tag-hadoop","tag-scala","tag-spark","tag-sql"],"jetpack_featured_media_url":"https:\/\/wp.jankiewicz.pl\/wp-content\/uploads\/2021\/06\/zielone1200x400.jpg","_links":{"self":[{"href":"https:\/\/wp.jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/posts\/46","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wp.jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/wp.jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/wp.jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/wp.jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/comments?post=46"}],"version-history":[{"count":15,"href":"https:\/\/wp.jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/posts\/46\/revisions"}],"predecessor-version":[{"id":211,"href":"https:\/\/wp.jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/posts\/46\/revisions\/211"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/wp.jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/media\/185"}],"wp:attachment":[{"href":"https:\/\/wp.jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/media?parent=46"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/wp.jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/categories?post=46"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/wp.jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/tags?post=46"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}