Kursus lengkap untuk Kecerdasan Buatan, persiapan untuk Pembelajaran Penguatan Dalam dengan Aplikasi Perdagangan Saham
Apa yang akan Anda pelajari
- Menerapkan metode pembelajaran mesin yang diawasi berbasis gradien untuk memperkuat pembelajaran
- Memahami penguatan pembelajaran di tingkat teknis
- Memahami hubungan antara penguatan pembelajaran dan psikologi
- Menerapkan 17 algoritma pembelajaran penguatan yang berbeda
Persyaratan
- Kalkulus (turunan)
- Model Probabilitas / Markov
- Numpy, Matplotlib
- Pengalaman ave yang bermanfaat dengan setidaknya beberapa metode pembelajaran mesin yang diawasi
- Keturunan gradien
- Keahlian pemrograman berorientasi objek yang baik
Deskripsi
Ketika orang berbicara tentang kecerdasan buatan , mereka biasanya tidak berarti pembelajaran mesin yang diawasi dan tidak diawasi .
Tugas-tugas ini cukup sepele dibandingkan dengan apa yang kita pikirkan tentang AI lakukan – bermain catur dan Pergi, mengendarai mobil, dan mengalahkan video game pada tingkat manusia super.
Pembelajaran penguatan baru-baru ini menjadi populer untuk melakukan semua itu dan banyak lagi.
Sama seperti pembelajaran yang mendalam , banyak teori yang ditemukan pada tahun 70-an dan 80-an, tetapi baru-baru ini kita dapat mengamati langsung hasil menakjubkan yang mungkin dicapai.
Pada tahun 2016 kami melihat Google AlphaGo mengalahkan Juara dunia di Go.
Kami melihat AI bermain video game seperti Doom dan Super Mario.
Mobil self-driving sudah mulai melaju di jalan nyata dengan pengemudi lain dan bahkan membawa penumpang ( Uber ), semua tanpa bantuan manusia.
Jika itu terdengar luar biasa, persiapkan diri Anda untuk masa depan karena hukum percepatan pengembalian menentukan bahwa kemajuan ini hanya akan terus meningkat secara eksponensial.
Belajar tentang pembelajaran mesin yang diawasi dan tidak diawasi bukanlah prestasi kecil.
Namun pembelajaran penguatan membuka dunia yang sama sekali baru. Seperti yang akan Anda pelajari dalam kursus ini, paradigma pembelajaran penguatan lebih berbeda dari pembelajaran yang diawasi dan tidak diawasi daripada yang mereka lakukan satu sama lain.
Ini mengarah pada wawasan baru dan luar biasa dalam psikologi perilaku dan ilmu saraf. Seperti yang akan Anda pelajari dalam kursus ini, ada banyak proses analog ketika mengajar seorang agen dan mengajar hewan atau bahkan manusia. Ini adalah hal terdekat yang kita miliki sejauh ini dengan kecerdasan buatan umum sejati. Apa yang dibahas dalam kursus ini?
- Cara untuk menghitung rata-rata dan moving average dan hubungannya dengan penurunan gradien stokastik
- Proses Keputusan Markov (MDPs)
- Pemrograman Dinamis
- Monte Carlo
- Pembelajaran Perbedaan Temporal (TD) (Q-Learning dan SARSA)
- Metode aproksimasi (yaitu cara memasang jaringan saraf yang dalam atau model lain yang dapat dibedakan ke dalam algoritma RL Anda)
- Proyek: Terapkan Q-Learning untuk membangun bot perdagangan saham
Jika Anda siap menghadapi tantangan baru, dan belajar tentang teknik AI yang belum pernah Anda lihat sebelumnya dalam pembelajaran mesin terawasi, pembelajaran mesin tanpa pengawasan, atau bahkan pembelajaran mendalam, maka kursus ini cocok untuk Anda.