Salah satu jenis masalah benar-benar mendominasi pembelajaran mesin dan kecerdasan buatan: klasifikasi. Klasifikasi biner, metode utama, mengurutkan data ke dalam salah satu dari dua kategori: pembelian atau tidak, penipuan atau tidak, sakit atau tidak, dll. Pembelajaran mesin dan solusi berbasis AI membutuhkan algoritma yang akurat dan dipilih dengan baik untuk melakukan klasifikasi dengan benar. Kursus ini menjelaskan mengapa proyek analitik prediktif pada akhirnya merupakan masalah klasifikasi, dan bagaimana para ilmuwan data dapat memilih strategi yang tepat untuk proyek mereka. Memanfaatkan teknik-teknik dari statistik tradisional dan pembelajaran mesin modern, mengungkapkan kekuatan dan kelemahan mereka. Menjelaskan cara mendefinisikan strategi klasifikasi Anda, memperjelas bahwa pilihan yang tepat sering merupakan kombinasi pendekatan. Lalu, menunjukkan 11 algoritma berbeda untuk membangun model Anda, dari analisis diskriminan hingga regresi logistik hingga jaringan saraf tiruan. Terakhir, pelajari cara mengatasi tantangan seperti menangani data yang hilang dan melakukan pengurangan data.
Topik meliputi:
Mengapa Anda perlu klasifikasi?
Algoritma statistik versus algoritma pembelajaran mesin
Menggabungkan model menggunakan ansambel
Tantangan pemodelan klasifikasi