Apa yang akan Anda pelajari?
-
Gunakan Python dan Spark bersama-sama untuk menganalisis Big Data
-
Pelajari cara menggunakan Sintaks DataFrame Spark 2.0 baru
-
Kerjakan Proyek Konsultasi yang meniru situasi dunia nyata!
-
Klasifikasikan Churn Pelanggan dengan Regresi Logisitik
-
Gunakan Spark dengan Hutan Acak untuk Klasifikasi
-
Pelajari cara menggunakan Gradient Boosted Trees Spark
-
Gunakan MLlib Spark untuk membuat Model Pembelajaran Mesin yang Kuat
-
Pelajari tentang Platform DataBricks!
-
Siapkan di Amazon Web Services EC2 untuk Analisis Data Besar
-
Pelajari cara menggunakan Layanan AWS Elastic MapReduce!
-
Pelajari cara memanfaatkan kekuatan Linux dengan Spark Environment!
-
Buat filter Spam menggunakan Spark dan Natural Language Processing!
-
Gunakan Spark Streaming untuk Menganalisis Tweet secara Real Time!
Persyaratan
-
Keterampilan Pemrograman Umum dalam Bahasa apa pun (Lebih disukai Python)
-
20 GB ruang kosong di komputer lokal Anda (atau sebagai alternatif, koneksi internet yang kuat untuk AWS)
Keterangan
Pelajari Teknologi Big Data terbaru – Spark! Dan pelajari cara menggunakannya dengan salah satu bahasa pemrograman terpopuler, Python!
Salah satu keterampilan teknologi yang paling berharga adalah kemampuan untuk menganalisis kumpulan data yang sangat besar, dan kursus ini dirancang khusus untuk meningkatkan kecepatan Anda dalam salah satu teknologi terbaik untuk tugas ini, Apache Spark ! Perusahaan teknologi top seperti Google, Facebook, Netflix, Airbnb, Amazon, NASA, dan banyak lagi semuanya menggunakan Spark untuk menyelesaikan masalah data besar mereka!
Spark dapat melakukan hingga 100x lebih cepat dari Hadoop MapReduce , yang telah menyebabkan ledakan permintaan untuk keterampilan ini! Karena kerangka kerja Spark 2.0 DataFrame sangat baru, Anda sekarang memiliki kemampuan untuk dengan cepat menjadi salah satu orang paling berpengetahuan di pasar kerja!
Kursus ini akan mengajarkan dasar-dasar dengan kursus kilat di Python, melanjutkan mempelajari cara menggunakan Spark DataFrames dengan sintaks Spark 2.0 terbaru! Setelah selesai, kita akan membahas cara menggunakan MLlib Machine Library dengan sintaks DataFrame dan Spark. Sepanjang kursus Anda akan memiliki latihan dan Proyek Konsultasi Mock yang menempatkan Anda langsung ke dalam situasi dunia nyata di mana Anda perlu menggunakan keterampilan baru Anda untuk memecahkan masalah nyata!
Kami juga membahas Teknologi Spark terbaru, seperti Spark SQL, Spark Streaming, dan model lanjutan seperti Gradient Boosted Trees! Setelah Anda menyelesaikan kursus ini, Anda akan merasa nyaman menempatkan Spark dan PySpark di resume Anda!
Jika Anda siap terjun ke dunia Python, Spark, dan Big Data, ini adalah kursus untuk Anda!
Untuk siapa kursus ini:
- Seseorang yang mengetahui Python dan ingin mempelajari cara menggunakannya untuk Big Data
- Seseorang yang sangat akrab dengan bahasa pemrograman lain dan perlu belajar Spark