MLOps - tarif 80.000 gosok. dari Otus, pelatihan 5 bulan, tanggal 30 November 2023.
Miscellanea / / November 30, 2023
Anda akan menguasai semua keterampilan pembelajaran mesin yang diperlukan untuk streaming data dan lingkungan terdistribusi. Program ini mencakup pengetahuan yang diperlukan dari bidang Ilmu Data dan Rekayasa Data, yang memungkinkan Anda memproses data besar dan menulis algoritma terdistribusi di Spark.
Anda akan mempraktikkan setiap modul dengan menyelesaikan pekerjaan rumah. Di akhir pelatihan, Anda akan memiliki proyek akhir yang memungkinkan Anda merangkum semua pengetahuan yang telah Anda peroleh dan menambah portofolio Anda. Hal ini dapat dilakukan sebagai bagian dari tugas pekerjaan pada kumpulan data Anda atau menjadi proyek pembelajaran berdasarkan data yang disediakan oleh OTUS.
Untuk siapa kursus ini?
Untuk spesialis Pembelajaran Mesin atau Insinyur Perangkat Lunak yang ingin mempelajari cara bekerja dengan data besar. Biasanya, tugas seperti itu ada di perusahaan IT besar dengan produk digital berskala besar.
Untuk Data Scientist yang ingin memperkuat keahliannya dengan keterampilan teknik. Berkat kursus ini, Anda akan dapat memproses data dan secara mandiri menampilkan hasil solusi ML dalam produksi.
Untuk mempelajarinya, Anda memerlukan keterampilan ilmu data dasar. Kami menyarankan Anda melihat peta kursus Ilmu Data di OTUS untuk mengetahui tingkat pelatihan yang diperlukan.
Anda akan belajar:
- Gunakan alat pipeline ML standar di lingkungan terdistribusi;
- Kembangkan blok Anda sendiri untuk pipeline ML;
- Menyesuaikan algoritme ML dengan lingkungan terdistribusi dan alat data besar;
- Gunakan Spark, SparkML, Spark Streaming;
- Mengembangkan algoritma untuk streaming persiapan data untuk pembelajaran mesin;
- Memastikan kontrol kualitas di semua tahap perpindahan solusi ML ke operasi industri.
Permintaan akan spesialis
Keterampilan yang akan Anda kuasai diterapkan dan menjanjikan mungkin. Semakin banyak produk digital bermunculan di pasar, yang pengembangannya memerlukan kerja sama dengan data besar dan pemrosesan aliran. Saat ini, spesialis dengan keahlian dan pengalaman kerja tertentu dapat memenuhi syarat untuk mendapatkan gaji 270 ribu. rubel Tren lainnya adalah otomatisasi proses pelatihan dan validasi, sebaliknya, dalam beberapa hal merendahkan pekerjaan Data Scientist klasik. Semuanya bergerak menuju titik di mana bahkan orang non-spesialis pun dapat melakukan prediksi yang tepat. Oleh karena itu, mereka yang memiliki setidaknya keterampilan teknik yang dangkal sudah mendapat nilai tertinggi.
Fitur Kursus
Banyak latihan bekerja dengan data
Beragam keterampilan mulai dari ML terdistribusi dan pemrosesan data streaming hingga hasil produksi
Alat dan teknologi terkini: Scala, Spark, Python, Docker
Komunikasi langsung dengan para ahli melalui webinar dan obrolan Slack
4
kursusTerlibat dalam pengembangan tim Ilmu Data yang menyediakan fungsionalitas berdasarkan pembelajaran mesin untuk produk dan layanan perusahaan. Sebagai Data Scientist, beliau berpartisipasi dalam pengembangan Kaspersky MLAD dan MDR AI Analyst. DI DALAM...
Terlibat dalam pengembangan tim Ilmu Data yang menyediakan fungsionalitas berdasarkan pembelajaran mesin untuk produk dan layanan perusahaan. Sebagai Data Scientist, beliau berpartisipasi dalam pengembangan Kaspersky MLAD dan MDR AI Analyst. Sebagai pengembang C++, ia berpartisipasi dalam pembuatan MaxPatrol SIEM. Ia telah mengajar komputer selama bertahun-tahun. disiplin sains di MSTU GA.Penulis serangkaian laporan tentang manajemen dan pengembangan proyek ML, C++, DS tim. Anggota konferensi PC C++ Rusia. Manajer Program
8
kursus20+ tahun pengalaman dalam proyek pengembangan khusus di bidang TI. Lusinan proyek berhasil, termasuk yang berada di bawah kontrak pemerintah. Pengalaman dalam pengembangan dan implementasi sistem ERP, solusi sumber terbuka, dukungan untuk aplikasi beban tinggi. Guru kursus di...
20+ tahun pengalaman dalam proyek pengembangan khusus di bidang TI. Lusinan proyek berhasil, termasuk yang berada di bawah kontrak pemerintah. Pengalaman dalam pengembangan dan implementasi sistem ERP, solusi sumber terbuka, dukungan untuk aplikasi beban tinggi. Guru kursus Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE, serta mentor kursus HighLoad
1
SehatSpesialis dalam bekerja dengan data besar dan pembelajaran mesin. Selama 8 tahun dia bekerja di Odnoklassniki.ru. Mengelola tim OK Data Lab (laboratorium bagi para peneliti di bidang big data dan mesin...
Spesialis dalam bekerja dengan data besar dan pembelajaran mesin. Selama 8 tahun dia bekerja di Odnoklassniki.ru. Mengelola tim OK Data Lab (laboratorium bagi peneliti di bidang big data dan pembelajaran mesin). Analisis data besar di Odnoklassniki telah menjadi peluang unik untuk menggabungkan pelatihan teoretis dan landasan ilmiah dengan pengembangan produk nyata dan sesuai permintaan. Sejak 2019, ia bekerja di Bank Tabungan sebagai Managing Director. Bertindak sebagai pemimpin cluster untuk mengembangkan platform sistem rekomendasi di divisi personalisasi massal. Ia lulus dari Universitas Negeri St. Petersburg pada tahun 2004, di mana ia mempertahankan gelar PhD dalam metode logika formal pada tahun 2007. Saya bekerja di outsourcing selama hampir 9 tahun tanpa kehilangan kontak dengan universitas dan lingkungan ilmiah.
Pengenalan dasar untuk memulai kursus
-Topik 1. Penurunan gradien dan model linier
-Topik 2.Ikhtisar metode dan metrik pembelajaran mesin dasar
-Topik 3.Evolusi pendekatan untuk bekerja dengan data
-Topik 4.Dasar-dasar pemrograman di Scala
Basis teknologi pemrosesan data terdistribusi
-Topik 5. Sistem file terdistribusi
-Topik 6. Manajer sumber daya dalam sistem terdistribusi
-Topik 7. Evolusi kerangka komputasi paralel dan terdistribusi secara masif
-Topik 8. Dasar-dasar Apache Spark 1
-Topik 9. Dasar-dasar Apache Spark 2
Dasar-dasar ML Terdistribusi
-Topik 10. Transfer algoritma ML ke lingkungan terdistribusi
-Topik 11.ML di Apache Spark
-Topik 12.Mengembangkan blok Anda sendiri untuk SparkML
-Topik 13.Optimasi hyperparameter dan AutoML
Pemrosesan aliran
-Topik 14. Aliran pemrosesan data
-Topik 15. Perpustakaan pihak ketiga untuk digunakan dengan Spark
-Tema 16.Spark Streaming
-Topik 17. Streaming terstruktur dan berkelanjutan di Spark
-Topik 18. Kerangka streaming alternatif
Penetapan tujuan dan analisis hasil
-Topik 19. Penentuan tujuan proyek ML dan analisis awal
-Topik 20. Tujuan ML jangka panjang menggunakan contoh tugas mengurangi churn
-Topik 21.Pengujian A/B
-Topik 22.Topik tambahan
Mengeluarkan hasil ML ke produksi
-Topik 23. Pendekatan untuk menghadirkan solusi ML ke dalam produksi
-Topik 24. Pembuatan versi, reproduktifitas, dan pemantauan
-Topik 25. Penyajian model secara online
-Topik 26. Pola untuk streaming asinkron ML dan ETL
-Topik 27. Jika Anda membutuhkan Python
ML dengan Python dalam produksi
-Topik 28.Kode Produksi dengan Python. Kode Pengorganisasian dan Pengemasan
-Topik 29.Arsitektur REST: Flask API
-Topik 30.Docker: Struktur, aplikasi, penerapan
-Topik 31.Kubernetes, orkestrasi kontainer
-Tema 32. Alat MLOPS untuk Kubernetes: KubeFlow, Seldon Core. Fitur pengoperasian sistem heterogen di industri.
-Tema 33.Amazon Sagemaker
-Topik 34.Layanan AWS ML
Topik lanjutan
-Topik 35. Jaringan saraf
-Topik 36. Pembelajaran terdistribusi dan inferensi jaringan saraf
-Topik 37.Peningkatan gradien pada pohon
-Topik 38. Pembelajaran penguatan
Pekerjaan proyek
-Topik 39. Pemilihan topik dan organisasi pekerjaan proyek
-Topik 40. Konsultasi proyek dan pekerjaan rumah
-Topik 41.Perlindungan karya desain