Інтелектуальний аналіз даних
Анотація навчальної дисципліни
Мета дисципліни:
Метою вивчення дисципліни «Інтелектуальний аналіз даних» є теоретична та практична підготовка студентів до вивчення систем обробки даних та принципів інтелектуального аналізу даних на основі методів та алгоритмів Data Mining.
Практичне значення та використання отриманих знань:
формування у студентів уяви про застосування технологій зберігання та організації даних; опанування методів та алгоритмів Data Mining; вивчення процесів виявлення знань; знайомство з принципами побудови сховищ даних; вивчення способів візуального представлення даних.
Основні результати навчання
ПРН14. Застосовувати на практиці інструментальні програмні засоби доменного аналізу, проектування, тестування, візуалізації, вимірювань та документування програмного забезпечення.
ПРН15. Мотивовано обирати мови програмування та технології розробки для розв’язання завдань створення і супроводження програмного забезпечення.
ПРН18. Знати та вміти застосовувати інформаційні технології обробки, зберігання та передачі даних.
ПРН28. Здатність використовувати знання у системах штучного інтелекту (СШІ), принципів побудови СШІ, зокрема, експертних систем.
ПРН29. Здатність використовувати знання з технологій побудови інтелектуальних систем, представлення їх в загальній структурі ІТ.
ПРН30. Здатність використовувати системи штучного інтелекту для розв’язання прикладних задач у різних предметних галузях.
ПРН31. Здатність проектувати системи штучного інтелекту, експертні системи.
Тематика та види навчальних занять
1 тиждень
Лекція 1 «Вступ в інтелектуальний аналіз даних. Системи підтримки прийняття рішень. Системи автоматизованого проектування.»
2 тиждень
Лекція 2. «Data Mining – інтелектуальний аналіз даних: етапи, завдання, методи.»
Лабораторне заняття 1. «Навчання найпростішої нейронної мережі за алгоритмом зворотного поширення помилки. Частина 1.»
3 тиждень
Лекція 3. Моделі представлення знань Data Mining.
4 тиждень
Лекція 4. «Основні поняття. Генеральна сукупність. Вибірка.»
Лабораторне заняття 2. «Навчання найпростішої нейронної мережі за алгоритмом зворотного поширення помилки. Частина 2.»
5 тиждень
Лекція 5. «Нейронні мережі. Функції активації.»
6 тиждень
Лекція 6. «Архітектури нейронних мереж.»
Лабораторне заняття 3. «Моделювання періодичної функції однієї змінної. Частина 1.»
7 тиждень
Лекція 7. «Представлення знань.»
8 тиждень
Лекція 8. «Алгоритми навчання нейронних мереж.»
Лабораторне заняття 4. «Моделювання періодичної функції однієї змінної. Частина 2.»
Модульна контрольна робота 1.
9 тиждень
Лекція 9. «Генетичні алгоритми.»
10 тиждень
Лекція 10. «Дерево прийняття рішень.»
Лабораторне заняття 5. «Прогнозування часових рядів з використанням нейронних мереж. Частина 1.»
11 тиждень
Лекція 11. «Метод найближчих сусідів.»
12 тиждень
Лекція 12. «Visual Mining – візуальний аналіз даних.»
Лабораторне заняття 6. «Прогнозування часових рядів з використанням нейронних мереж. Частина 2.»
13 тиждень
Лекція 13. «Text Mining – текстовий аналіз даних.»
14 тиждень
Лекція 14. «WebMining – отримання даних з web.»
Лабораторне заняття 7. «Прогнозування часових рядів з використанням нейронних мереж. Частина 3.»
15 тиждень
Лекція 15. «Стандарти Data Mining.»
Самостійна робота
Самостійна робота складає 91 години. Розподіл самостійної роботи за видами навчальних робіт:
1) підготовка до лекційних занять – 21 годину;
підготовка до лабораторних занять та до виконання модульних контрольних завдань – разом 40 годин;
2) підготовка до екзамену – 30 годин.
Оцінювання результатів навчання
Оцінювання результатів навчання з дисципліни здійснюється за накопичувальною системою, яка дає можливість здобувачеві протягом семестру отримати максимально 100 балів.
Модуль 1
Оцінка за виконання лабораторних робіт – максимально 20 балів за модуль.
Модульна контрольна робота – бездоганне виконання 30 балів (в кожному завданні модульної контрольної роботи наведено максимальну кількість балів за виконання завдання).
Модуль 2
Оцінка за виконання лабораторних робіт – максимально 20 балів за модуль.
Модульна контрольна робота – бездоганне виконання 30 балів (в кожному завданні модульної контрольної роботи наведено максимальну кількість балів за виконання завдання).
Підсумковим контролем з дисципліни є усний екзамен. Екзаменаційний білет з дисципліни складається з двох частин: перевірки теоретичних знань у способі опитування та виконання практичних завдань. Мінімальна кількість балів. що зараховується як позитивний результат, дорівнює 60 (за 100-бальною системою).
Екзаменаційний білет містить 3 питання рівної складності. Кожне питання містить в собі теоретичну (60% оцінки) та практичну складові (40% оцінки). За бездоганну відповідь на перше питання студент отримує 30 балів, на друге питання – 40 балів, третє питання – 30 балів. При цьому відповідь теоретичної складової вважається бездоганною, якщо студент повністю розкрив суть питання, послідовно і логічно його доповів, навів приклади, проілюстрував відповідь необхідною і достатньою кількістю записів; зробив посилання на відповідні літературні джерела. Кожне завдання практичної складової іспиту вважається виконаним бездоганно, якщо при його розв’язанні послідовно і логічно викладено рішення, зроблені всі необхідні графіки, представлені всі архітектурні рішення, моделі, лістинги коду.
За виконання кожного питання практичної частини бали можуть бути зняті:
– 100% балів – за повну відсутність виконання питання практичної частини;
– 75% балів – рішення не отримане або не вірне, але при цьому хід розв’язання та усі використані засади обрані вірно;
– 50% балів – наведене правильне рішення, але при цьому є помилки у розв’язанні;
– 35% балів – наведене правильне рішення, але при цьому не повністю виконані обов’язкові пояснення;
– 25% балів – за неправильне тлумачення вихідних даних, що не порушило загалом правильного ходу розв’язання задачі;
– 15% балів – за допущену помилку, що не вплинула на відповідь та загальний хід розв’язання питання;
– 10% балів – за нераціональне розв’язання завдання при наявності докладних пояснень та вірного кінцевого результату.
Якщо студент відмовився відповідати, то він отримує незадовільну оцінку.
Іспит вважається не складеним, якщо студент отримав незадовільну оцінку.
Максимальна оцінка за правильні відповіді на всі питання екзаменаційного білету становить 100 балів.
Література
1. Інтелектуальний аналіз даних: Комп’ютерний практикум [Електронний ресурс] : навч. посібник / О. О. Сергеєв-Горчинський, Г. В. Іщенко. – Київ : КПІ ім. Ігоря Сікорського, 2018. – 73 с. – Режим доступу: https://ela.kpi.ua/bitstream/123456789/24971/1/Komp_prakt.pdf
2. Фісун М.Т. Інтелектуальний аналіз даних: практикум. - Видавництво: Новий світ-2000, 2021. – 162 с.
3. Шпігельхальтер Д. Мистецтво статистики. Прийняття аргументованих рішень на основі даних. - Видавництво КМ-БУКС, 2023. - 384 с.
4. Mohammed J. Zaki, Wagner Meira, Jr., Data Mining and Machine Learning: Fundamental Concepts and Algorithms [Electronic resource] 2nd Edition, Cambridge University Press, March 2020. Access mode: https://dataminingbook.info/book_html/