Загальні засади машинного навчання
Мета вивчення дисципліни – формування у здобувачів глибокого розуміння основних принципів та методів машинного навчання, розвиток навичок застосування різних алгоритмів та технік для вирішення практичних задач, а також підвищення рівня професійної компетентності в використанні сучасних мов програмування, бібліотек та інструментів, що забезпечують ефективну реалізацію методів машинного навчання. Дисципліна викладається протягом 6 семестру та входить до циклу професійної підготовки обов’язкової частини навчального плану освітньої програми «Інтелектуальний аналіз даних» для підготовки здобувачів першого (бакалаврського) рівня вищої освіти.
Практичне значення та використання отриманих знань – практичне значення та використання отриманих знань – отримані знання мають практичну цінність для розв'язання реальних задач, пов'язаних із аналізом даних та автоматизацією процесів на основі машинного навчання. Студенти, опанувавши основи машинного навчання, здатні ефективно застосовувати різні алгоритми та моделі для класифікації, регресії, кластеризації та інших завдань в аналізі даних. Вміння обирати правильні методи для вирішення конкретних задач, налаштовувати моделі та оцінювати їх ефективність забезпечує більш професійний підхід до обробки даних і створення інтелектуальних систем, підвищує ефективність роботи в команді та конкурентоспроможність фахівця на сучасному ринку праці.
Тематика та види навчальних занять
Для денної форми здобування освіти
Лекційні заняття
Лекція №1 «Вступ до машинного навчання: основні поняття, задачі та класифікація методів».
Лекція №2 «Типи задач машинного навчання: класифікація, регресія та кластеризація».
Лекція №3 «Попередня обробка даних: очищення, нормалізація та трансформація».
Лекція №4 «Лінійна та логістична регресія: моделювання та застосування».
Лекція №5 «Методи регуляризації: L1 та L2 для зменшення перенавчання».
Лекція №6 «Дерева рішень: побудова, критерії розгалуження та застосування».
Лекція №7 «Ансамблеві методи: випадковий ліс та його застосування в класифікації».
Лекція №8 «Основи бустингу: принцип роботи та застосування у задачах класифікації».
Лекція №9 «Методи кластеризації: K-середніх, ієрархічна кластеризація та DBSCAN».
Лекція №10 «Оцінка та валідація моделей: метрики, крос-валідація та вибір моделі».
Лекція №11 «Методи зменшення розмірності даних: аналіз головних компонент (PCA)».
Лекція №12 «Алгоритми оптимізації в машинному навчанні: градієнтний спуск та його модифікації».
Лекція №13 «Робота з класовим дисбалансом: методи балансування даних».
Лекція №14 «Основи обробки текстових даних: векторизація та базові підходи до NLP».
Лекція №15 «Ансамблювання моделей: стекінг, блендинг та їх застосування у моделюванні».
Лабораторні роботи
Лабораторна робота №1 «Вступ до інструментів для машинного навчання». Мета роботи: набуття навичок роботи зі середовищами розробки та бібліотеками, що використовуються для задач машинного навчання.
Лабораторна робота №2 «Вирішення задач класифікації, регресії та кластеризації». Мета роботи: практичне застосування базових підходів до класифікації, регресії та кластеризації на простих наборах даних.
Лабораторна робота №3 «Обробка та попередня підготовка даних». Мета роботи: виконання операцій очищення, нормалізації та трансформації даних для покращення якості моделей.
Лабораторна робота №4 «Реалізація лінійної та логістичної регресії для прогнозування». Мета роботи: застосування лінійної та логістичної регресії для вирішення задач передбачення на основі реальних даних.
Лабораторна робота №5 «Практика регуляризації: боротьба з перенавчанням». Мета роботи: дослідження ефектів L1 та L2 регуляризації на моделі для покращення узагальнюючої здатності.
Лабораторна робота №6 «Побудова та оцінка дерев рішень для задач класифікації». Мета роботи: побудова дерев рішень та аналіз критеріїв розгалуження для вирішення задач класифікації.
Лабораторна робота №7 «Використання випадкового лісу для покращення результатів класифікації». Мета роботи: реалізація та оцінка методу випадкового лісу для задач класифікації.
Лабораторна робота №8 «Застосування бустингу для підвищення точності моделей». Мета роботи: дослідження принципів та реалізація методу бустингу на наборах даних з різними характеристиками.
Лабораторна робота №9 «Реалізація методів кластеризації: K-середніх та DBSCAN». Мета роботи: виконання кластеризації з використанням алгоритмів K-середніх та DBSCAN на прикладних наборах даних.
Лабораторна робота №10 «Оцінка моделей за допомогою метрик та крос-валідації». Мета роботи: використання різних метрик та крос-валідації для об'єктивного оцінювання моделей.
Лабораторна робота №11 «Зменшення розмірності даних за допомогою PCA». Мета роботи: виконання аналізу головних компонент для візуалізації та зменшення розмірності даних.
Лабораторна робота №12 «Застосування градієнтного спуску для оптимізації моделей». Мета роботи: практичне використання градієнтного спуску для налаштування параметрів моделі.
Лабораторна робота №13 «Методи балансування класів у нерівномірних даних». Мета роботи: використання методів для балансування класів у наборах даних з дисбалансом.
Лабораторна робота №14 «Векторизація текстових даних для подальшого моделювання». Мета роботи: преобробка текстових даних та їх векторизація для застосування в задачах класифікації.
Лабораторна робота №15 «Ансамблювання моделей: створення стекінгових ансамблів». Мета роботи: побудова ансамблів моделей за допомогою стекінгу та блендингу для підвищення точності.
Для заочної форми здобування освіти
Лекційні заняття
Лекція №1 «Основи машинного навчання: типи задач, методи побудови моделей та ансамблеві підходи».
Лекція №2 «Обробка даних, оптимізація моделей та оцінка ефективності в машинному навчанні».
Лабораторні роботи
Лабораторна робота №1 «Інтеграція та оптимізація моделей машинного навчання». Мета роботи: застосування методів ансамблювання для інтеграції різних моделей, включаючи випадковий ліс, бустинг та стекінг, з метою покращення точності та узагальнюючої здатності моделей. Виконання оптимізації параметрів моделей та дослідження їх ефективності за допомогою метрик та крос-валідації.
Лабораторна робота №2 «Передобробка та аналіз даних для розв'язання реальних задач». Мета роботи: виконання попередньої обробки та трансформації даних для вирішення задач класифікації, регресії та кластеризації. Використання методів зменшення розмірності даних, таких як PCA, та балансування класів для покращення якості моделей і точності прогнозів.
Консультації здійснюються впродовж семестру згідно встановленого розкладу.
Індивідуальна робота
Для денної та заочної форми здобуття освіти
Для денної форми здобуття освіти, для даної дисципліни індивідуальна робота не передбачена.
Для заочної форми здобуття освіти передбачено виконання контрольної роботи.
Завдання для контрольної роботи здобувач отримує а установчій лекції. Робота містить 5 теоретичних питань та практичне завдання. Кожне теоретичне питання оцінюється у 4 бали, практичне завдання оцінюється у 40 балів. Максимальна оцінка за контрольну роботу – 60 балів.
Відповіді на теоретичні питання повинні бути написані самостійно, без використання матеріалу конспекту лекцій. Термін надання виконаної контрольної роботи на перевірку – не пізніше, ніж за місяць до початку сесії.
Форми контрольних заходів та оцінювання результатів навчання
Для денної форми здобуття освіти
Поточний контроль полягає у виконанні:
1) 15-ти лабораторних робіт. Лабораторні роботи виконуються на комп’ютері з використанням додаткових інструментів Google Colab та Kaggle, відповідно до мети та завдань лабораторних занять. Бездоганне виконання лабораторних робіт №1 – №7 оцінюється у 4 бали, бездоганне виконання лабораторних робіт №8 – №15 оцінюється у 3 бали;
2) двох модульних контрольних робіт. Модульні контрольні роботи складаються з теоретичної і практичної частин та проводяться у формі комп'ютерного тестування. Бездоганне виконання першої модульної контрольної роботи оцінюється у 22 бали, бездоганне виконання другої модульної контрольної роботи оцінюється у 26 балів;
Підсумковий контроль – екзамен. Максимальна оцінка, яку може отримати студент – 100 балів.
Для заочної форми здобуття освіти
Поточний контроль полягає у виконанні:
1) двох лабораторних робіт. Лабораторні роботи виконуються на комп’ютері з використанням додаткових інструментів Google Colab та Kaggle, відповідно до мети та завдань лабораторних занять. Бездоганне виконання кожної лабораторної роботи оцінюється у 20 балів;
2) контрольної роботи. Бездоганне виконання та захист контрольної роботи оцінюється у 60 балів;
Підсумковий контроль – екзамен. Максимальна оцінка, яку може отримати студент – 100 балів.
ПР1. Застосовувати знання основних форм і законів абстрактно-логічного мислення, основ методології наукового пізнання, форм і методів вилучення, аналізу, обробки та синтезу інформації в предметній області комп'ютерних наук.
ПР4. Використовувати методи обчислювального інтелекту, машинного навчання, нейромережевої та нечіткої обробки даних, генетичного та еволюційного програмування для розв’язання задач розпізнавання, прогнозування, класифікації, ідентифікації об’єктів керування тощо.
ПР12. Застосовувати методи та алгоритми обчислювального інтелекту та інтелектуального аналізу даних в задачах класифікації, прогнозування, кластерного аналізу, пошуку асоціативних правил з використанням програмних інструментів підтримки багатовимірного аналізу даних на основі технологій DataMining, TextMining, WebMining.