Pembelajaran mesin dalam praktik - kursus 41.500 gosok. dari IBS Training Center, pelatihan 24 jam, Tanggal 26 November 2023.
Miscellanea / / December 02, 2023
Kursus ini dibangun berdasarkan beberapa kasus praktis yang berisi tabel dengan data awal.
Untuk setiap kasus, kami menjalani seluruh siklus hidup proyek pembelajaran mesin:
penelitian, pembersihan dan penyiapan data,
memilih metode pelatihan yang sesuai dengan tugas (regresi linier untuk regresi, hutan acak untuk klasifikasi, K-means dan DBSCAN untuk pengelompokan),
pelatihan menggunakan metode yang dipilih,
evaluasi hasil,
optimasi model,
presentasi hasilnya kepada pelanggan.
Pada bagian diskusi kursus, kami membahas masalah-masalah praktis yang dihadapi siswa yang dapat diselesaikan dengan menggunakan metode yang dibahas.
Topik yang dibahas:
1. Review tugas (teori – 1 jam)
Masalah apa yang dapat diselesaikan dengan baik dengan pembelajaran mesin, dan masalah apa yang coba dipecahkan?
Apa yang terjadi jika, alih-alih seorang Data Scientist, Anda mempekerjakan seorang non-spesialis di bidangnya (hanya seorang pengembang/analis/manajer) dengan harapan bahwa mereka akan belajar dalam prosesnya.
2. Persiapan, pembersihan, penelitian data (teori – 1 jam, praktek – 1 jam)
Cara memahami sumber data bisnis (dan secara umum mendeteksi pesanan apa pun di dalamnya).
Urutan pemrosesan.
Apa yang bisa dan harus didelegasikan kepada analis domain, dan apa yang sebaiknya dilakukan oleh Data Scientist itu sendiri.
Prioritas untuk memecahkan masalah tertentu.
3. Pengklasifikasi dan Regresor (teori – 2 jam, praktik – 2 jam)
Bagian praktis - tugas yang diformalkan dengan baik dengan data yang telah disiapkan.
Perbedaan antar tugas (klasifikasi biner/non-biner/probabilistik, regresi), redistribusi tugas antar kelas.
Contoh klasifikasi masalah praktis.
4. Clustering (teori – 1 jam, praktek – 2 jam)
Dimana dan bagaimana melakukan clustering: penelitian data, pengecekan rumusan masalah, pengecekan hasil.
Kasus apa yang bisa direduksi menjadi clustering.
5. Evaluasi model (teori – 1 jam, praktik – 1 jam)
Metrik bisnis dan metrik teknis.
Metrik untuk masalah klasifikasi dan regresi, matriks kesalahan.
Metrik kualitas pengelompokan internal dan eksternal.
Validasi silang.
Menilai pelatihan ulang.
6. Optimasi (teori – 5 jam, latihan – 3 jam)
Apa yang membuat satu model lebih baik dari yang lain: parameter, fitur, ansambel.
Manajemen pengaturan.
Latihan pemilihan fitur.
Tinjauan alat untuk menemukan parameter, fitur, dan metode terbaik.
7. Bagan, laporan, mengerjakan tugas langsung (teori – 2 jam, praktik – 2 jam)
Bagaimana menjelaskan dengan jelas apa yang terjadi: kepada diri Anda sendiri, kepada tim, kepada klien.
Jawaban yang lebih indah untuk pertanyaan yang tidak berarti.
Bagaimana menyajikan hasil tiga terabyte dalam satu slide.
Tes semi-otomatis, titik kontrol proses mana yang sangat dibutuhkan.
Dari tugas langsung hingga proses R&D lengkap (“R&D dalam praktik”) - analisis dan analisis tugas dari audiens.