Pengembangan pembelajaran mesin - kursus gratis dari Sekolah Analisis Data, pelatihan 4 semester, Tanggal: 2 Desember 2023.
Miscellanea / / December 06, 2023
Arah ini cocok bagi mereka yang suka memprogram dan membuat layanan dan aplikasi yang dapat digunakan oleh ribuan dan jutaan orang.
Tulis kode yang efektif, bangun dan optimalkan sistem berbasis data yang efisien secara industri.
Dalam pengembangan produk teknologi tinggi berdasarkan pembelajaran mesin.
Setiap siswa harus berhasil menyelesaikan setidaknya tiga mata kuliah selama semester tersebut. Misalnya, jika program utama ada dua, maka Anda harus memilih salah satu mata kuliah khusus.
Pengetahuan diuji terutama melalui pekerjaan rumah - ujian dan tes dilakukan hanya dalam mata pelajaran tertentu.
Semester pertama
Wajib
Algoritma dan struktur data, bagian 1
01Kompleksitas dan model komputasi. Analisis nilai akuntansi (awal)
02Analisis nilai akuntansi (akhir)
03Algoritma Merge-Sort dan Quick-Sort
04Statistik ordinal. Tumpukan (awal)
05Tumpukan (akhir)
06Hashing
07Cari pohon (awal)
08Cari pohon (lanjutan)
09Cari pohon (akhir). Sistem himpunan lepas
10Masalah RMQ dan LCA
11Struktur data untuk pencarian geometris
12Masalah konektivitas dinamis dalam grafik tidak berarah
Pelatihan bahasa C++, bagian 1
C++ adalah bahasa yang kuat dengan warisan yang kaya. Bagi mereka yang baru mulai menguasai bahasa ini, sangat mudah tersesat dalam banyaknya teknik dan teknik yang diciptakan selama 30 tahun terakhir. Kursus ini mengajarkan "C++ Modern" - bagian modern dari bahasa tersebut (standar 11, 14 dan 17). Banyak perhatian diberikan pada alat dan perpustakaan - hal-hal yang bukan bagian dari bahasa, tetapi tanpanya tidak mungkin membangun proyek yang besar dan kompleks.
01Pengantar C++.
02Konstanta. Petunjuk dan tautan. Melewati argumen ke suatu fungsi.
03Kelas.
04Manajemen memori dinamis.
05Variabel, pointer dan referensi.
06Manajemen memori, penunjuk cerdas, RAII.
07Perpustakaan templat standar.
08Warisan dan fungsi virtual.
09Penanganan kesalahan.
10Pola desain.
11Namespace Memindahkan semantik Penerusan sempurna.
12Representasi struktur dan kelas dalam memori. Penyelarasan data. Petunjuk kepada anggota kelas/metode. Templat variadik.
Pembelajaran mesin, bagian 1
01Konsep dasar dan contoh soal terapan
02Metode klasifikasi metrik
03Metode klasifikasi logis dan pohon keputusan
04Metode klasifikasi linier gradien
05Mendukung Mesin Vektor
06Regresi linier multivariat
07Regresi nonlinier dan nonparametrik, fungsi kerugian non-standar
08Perkiraan deret waktu
09Metode klasifikasi Bayesian
10Regresi logistik
11Cari aturan asosiasi
Istilah kedua
Wajib
Pembelajaran mesin, bagian 2
01Metode klasifikasi dan regresi jaringan saraf
02Metode klasifikasi dan regresi komposisi
03Kriteria pemilihan model dan metode pemilihan fitur
04Peringkat
05Pembelajaran penguatan
06Belajar tanpa guru
07Masalah dengan pelatihan parsial
08Pemfilteran kolaboratif
09Pemodelan topik
Untuk memilih dari
Algoritma dan struktur data, bagian 2
01Melewati lebarnya. Traversal Pertama Kedalaman (mulai)
02 Perayapan kedalaman (lanjutan)
03 Perayapan kedalaman (akhir). 2 potong
04Menemukan jalur terpendek (awal)
05Menemukan jalur terpendek (lanjutan)
06Pohon merentang minimum
07 Pemotongan minimal. Pencarian substring (mulai)
08Mencari substring (lanjutan)
09Cari substring (akhir)
10Pohon akhiran (awal)
11Pohon akhiran (berakhir). Array akhiran (mulai)
12Array akhiran (berakhir)
13Substring umum terpanjang. Perkiraan pencarian substring.
atau
bahasa piton
01Dasar-Dasar Bahasa (Bagian 1)
02Dasar-Dasar Bahasa (Bagian 2)
03Pemrograman berorientasi objek
04Penanganan kesalahan
05Desain dan pengujian kode
06Bekerja dengan string
07Model memori
08Pemrograman fungsional
09Tinjauan perpustakaan (bagian 1)
10Tinjauan perpustakaan (bagian 2)
11Komputasi paralel dengan Python
12Pekerjaan tingkat lanjut dengan objek
atau
Pelatihan bahasa C++, bagian 2
Bagian kedua dari kursus C++, yang mencakup topik tingkat lanjut dan kemampuan bahasa.
01Pemrograman multi-utas. Menyinkronkan thread menggunakan mutex dan variabel kondisi.
02Variabel atom. Model memori C++. Contoh struktur data bebas kunci.
03Teknik pemrograman meta tingkat lanjut di C++. Metafungsi, SFINAE, konsep.
04Pemrograman kompetitif, interaksi dengan jaringan.
arsitektur 05llvm. Bekerja dengan pohon parse C++. Pengembangan alat untuk menganalisis kode C++.
Semester ketiga
Untuk memilih dari
Pemrosesan Bahasa Alami
“NLP (Natural Language Processing) adalah bagian dari bidang AI yang lebih luas yang berupaya mengajarkan komputer untuk memahami dan memproses data mentah dalam bahasa alami. Sebagian besar informasi yang tersedia saat ini bukanlah teks terstruktur. Sebagai manusia tentunya tidak sulit bagi kita untuk memahaminya (kalau dalam bahasa ibu kita), namun kita tidak mampu mengolah data sebanyak yang bisa diproses mesin. Namun bagaimana Anda bisa membuat mesin memahami data ini dan, terlebih lagi, mengekstrak beberapa informasi darinya? Beberapa tahun yang lalu, pada pembukaan ACL (salah satu konferensi NLP utama, jika bukan yang terpenting) di dalamnya Pidato kepresidenan Marti Hearst mengaku tak bisa lagi memberikan favoritnya kepada siswa latihan. Dengan menggunakan HAL 9000 sebagai contoh (salah satu contoh kecerdasan buatan dalam fiksi ilmiah), dia bertanya kepada siswa apa yang bisa dilakukan mesin seperti HAL dan apa yang belum bisa dilakukan mesin tersebut. Saat ini hal ini tidak lagi merupakan latihan yang baik, karena hampir semua hal tersebut sekarang dapat dilakukan oleh komputer. Sungguh menakjubkan betapa cepatnya bidang ini berkembang dan seberapa banyak yang telah kami capai. Dalam kursus ini kami akan mencoba membuat Anda memahami dan merasakan apa yang terjadi di dunia. Masalah apa yang dipecahkan, bagaimana hal ini terjadi; bagaimana beberapa pendekatan statistik (yang hampir seluruhnya dikhususkan untuk kursus NLP beberapa tahun yang lalu) menerima kehidupan baru dan interpretasi baru dalam jaringan saraf, dan pendekatan mana yang secara bertahap punah. Kami akan menunjukkan bahwa NLP bukanlah sekumpulan pasangan (masalah, solusi), tetapi gagasan umum yang menembus berbagai masalah dan mencerminkan beberapa konsep umum. Anda juga akan mempelajari apa yang terjadi dalam praktik dan kapan pendekatan mana yang lebih dapat diterapkan. Inilah yang kami lakukan, apa yang kami sukai, dan kami siap membaginya dengan Anda :)"
01 https://lena-voita.github.io/nlp_course.html
02 https://github.com/yandexdataschool/nlp_course
atau
Visi komputer
Kursus ini dikhususkan untuk metode dan algoritma visi komputer, yaitu mengekstraksi informasi dari gambar dan video. Mari kita lihat dasar-dasar pengolahan gambar, klasifikasi gambar, pencarian gambar berdasarkan konten, pengenalan wajah, segmentasi gambar. Kemudian kita akan berbicara tentang algoritma pemrosesan dan analisis video. Bagian terakhir dari kursus ini dikhususkan untuk rekonstruksi 3D. Untuk sebagian besar masalah, kita akan membahas model jaringan saraf yang ada. Dalam kursus ini kami mencoba untuk memperhatikan hanya metode paling modern yang saat ini digunakan dalam memecahkan masalah praktis dan penelitian. Kursus ini sebagian besar bersifat praktis daripada teoretis. Oleh karena itu, semua perkuliahan dilengkapi dengan laboratorium dan pekerjaan rumah, yang memungkinkan Anda untuk mencoba sebagian besar metode yang dibahas dalam praktik. Pekerjaan ini dilakukan dengan Python menggunakan berbagai perpustakaan."
01Pencitraan digital dan koreksi nada
02Dasar-dasar pemrosesan gambar
03Penjahitan gambar
04Klasifikasi gambar dan cari yang serupa
05Jaringan saraf konvolusional untuk klasifikasi dan pencarian gambar serupa
06Deteksi objek
07Segmentasi semantik
08Transfer gaya dan sintesis gambar
09Pengenalan video
10Rekonstruksi 3D yang jarang
11Rekonstruksi 3D yang padat
12Rekonstruksi dari satu frame dan point cloud, model parametrik
atau
Metode Bayesian dalam pembelajaran mesin
01Pendekatan Bayesian terhadap teori probabilitas
02Inferensi Bayesian analitik
03Pemilihan model Bayesian
04Penentuan relevansi secara otomatis
05 Metode vektor relevansi untuk masalah klasifikasi
06Model probabilistik dengan variabel laten
07Inferensi Bayesian variasi
08Model pemisahan campuran Bayesian dari Gaussians
09Metode Monte Carlo dengan rantai Markov
10Alokasi Dirichlet Laten
11Proses Gaussian untuk regresi dan klasifikasi
12Metode Bayesian Nonparametrik
Semester keempat
Wajib
Praktek Rekayasa ML
Kursus ini adalah pekerjaan proyek untuk mengembangkan proyek ML dalam tim.
Praktek Penelitian ML
Kursus ini mewakili pekerjaan pada proyek penelitian tim di bidang pembelajaran mesin.
Kursus khusus yang direkomendasikan
Pembelajaran mendalam
01Materi kursus
Pembelajaran penguatan
01Materi kursus
Mobil Mengemudi Sendiri
Kursus ini mencakup komponen inti teknologi self-driving: lokalisasi, persepsi, prediksi, tingkat perilaku, dan perencanaan gerak. Untuk setiap komponen, pendekatan utama akan dijelaskan. Selain itu, siswa akan menjadi akrab dengan kondisi pasar saat ini dan tantangan teknologi.
01Ikhtisar komponen utama dan sensor kendaraan tak berawak. Tingkat otonomi. Berkendara dengan Kawat. Mobil self-driving sebagai produk bisnis. Cara untuk mengevaluasi kemajuan dalam pembuatan drone. Dasar-dasar pelokalan: gnss, odometri roda, filter Bayesian.
02Metode lokalisasi Lidar: ICP, NDT, LOAM. Pengenalan visual SLAM menggunakan ORB-SLAM sebagai contoh. Pernyataan masalah GraphSLAM. Mengurangi masalah GraphSLAM menjadi metode kuadrat terkecil nonlinier. Memilih parameterisasi yang benar. Sistem dengan struktur khusus di GraphSLAM. Pendekatan arsitektur: frontend dan backend.
03Tugas pengenalan pada mobil self-driving. Hambatan statis dan dinamis. Sensor untuk sistem pengenalan. Representasi hambatan statis. Deteksi hambatan statis menggunakan lidar (VSCAN, metode jaringan saraf). Menggunakan lidar bersama dengan gambar untuk mendeteksi statika (segmentasi gambar semantik, penyelesaian kedalaman). Kamera stereo dan mendapatkan kedalaman dari sebuah gambar. Dunia Stixel.
04Representasi hambatan dinamis pada mobil self-driving. Metode jaringan saraf untuk mendeteksi objek dalam 2D. Deteksi berdasarkan pandangan mata burung dari representasi awan lidar. Menggunakan lidar dengan citra untuk mendeteksi hambatan dinamis. Deteksi mobil dalam 3D berdasarkan gambar (pemasangan kotak 3D, model CAD). Deteksi hambatan dinamis berbasis radar. Pelacakan objek.
05Pola mengemudi mobil: roda belakang, roda depan. Perencanaan jalur. Konsep ruang konfigurasi. Metode grafik untuk membangun lintasan. Lintasan yang meminimalkan sentakan. Metode optimasi untuk membangun lintasan.
06Perencanaan kecepatan dalam lingkungan yang dinamis. perencanaan ST. Memprediksi perilaku pengguna jalan lainnya
Metode Neuro-Bayesian
Kursus ini berfokus pada penerapan metode Bayesian dalam pembelajaran mendalam. Perkuliahan akan membahas tentang penggunaan pemodelan probabilistik untuk membangun model data generatif, penggunaan kompetisi jaringan untuk perkiraan inferensi, pemodelan ketidakpastian dalam parameter jaringan saraf, dan beberapa masalah terbuka secara mendalam pelatihan.
01Inferensi variasi stokastik
02Inferensi variasi stokastik ganda
03Autoencoder variasi, menormalkan aliran untuk inferensi variasional
04Metode untuk mengurangi varians dalam model variabel laten
05Estimasi rasio kepadatan distribusi, penerapannya menggunakan contoh \alpha-GAN
06Jaringan saraf Bayesian
07Kompresi jaringan saraf Bayesian
08Inferensi variasional semi-implisit