Аналіз даних
Мета дисципліни: набуття теоретичних і практичних знань з основ аналізу даних; оволодіння основними поняттями аналізу даних; оволодіння з новітніми інформаційними технологіями аналітичної обробки первинної інформації; набуття практичних навичок по використанню аналізу даних для розв’язання прикладних завдань.
Завдання дисципліни:
освоєння основних понять теорії аналізу даних;
освоєння основних математичних моделей, що лежать в основі аналізу даних;
набути практичні навики застосування програмного забезпечення для аналізу даних;
освоєння методів опрацювання емпіричних даних;
набути практичні навики застосування методів дискримінантного аналізу;
освоєння основних методів кореляційного та регресійного аналізу для виявлення взаємозв’язків між ознаками;
освоєння основних принципів використання кластерного аналізу;
набути практичні навики із опису предметної області і задач, що розв’язуються, приймати рішення щодо застосування того або іншого методу обробки даних; застосовувати різноманітні методи обробки даних;
використовувати можливості обчислювальної техніки при обробці та аналізі даних експерименту;
використовувати результати для формулювання висновків.
Основні результати навчання
Знати основні методи системного аналізу, закономірності побудови, функціонування та розвитку систем для розв’язання задач аналізу та синтезу.
Збирати та інтерпретувати відповідні дані й аналізувати складності в межах своєї спеціалізації для донесення суджень, які відбивають відповідні соціальні та етичні проблеми.
Форми організації освітнього процесу та види навчальних занять
Л – лекційні заняття; ПЗ – практичні заняття; ЛЗ – практичні заняття; СРС – самостійна робота здобувача вищої освіти; КО – контрольні опитування; МКР – модульна контрольна робота; К – консультації.
Тематика та види навчальних занять
1 тиждень
Л1. Введення в аналіз даних.
ЛЗ1. Налаштування Python під Windows. Створення та запуск програм. Методи роботи з матрицями.
СРС. К.
2 тиждень
Л2. Інструменти і стратегія дослідження зв' язків ознак.
ЛЗ2. Файлове введення та виведення масивів. Створення функцій.
СРС. К.
3 тиждень
Л3. Лінійний регресійний аналіз.
ЛЗ3. Регресійний аналіз: парний і множинний.
СРС. К.
4 тиждень
Л4. Нелінійна регресія та множинний регресійний аналіз.
ЛЗ4. Регресійний аналіз: парний і множинний.
СРС. К.
5 тиждень
Л5. Матриця даних.
ЛЗ5. Нелінійний метод найменших квадратів.
СРС. К.
6 тиждень
Л6. Визначення близькості між об'єктами.
ЛЗ6. Нелінійний метод найменших квадратів.
СРС. К.
7 тиждень
Л7. Нормалізація ознак.
ЛЗ7. Ієрархічні методи кластер-анализа.
СРС. К.
8 тиждень
Л8. Ієрархічні методи кластер-анализа.
ЛЗ8. Ієрархічні методи кластер-анализа.
МКР1.
СРС. К.
9 тиждень
Л9. Інші ієрархічні методи кластер-аналіза.
ЛЗ9. Неієрархічні методи кластер-анализа.
СРС. К.
10 тиждень
Л10. Неієрархічні методи кластер-анализа.
ЛЗ10. Класифікація об'єктів, заданих двома ознаками, за принципом мінімуму відстані.
СРС. К.
11 тиждень
Л11. Сучасні методи ієрархічні методи кластер-анализа.
ЛЗ11. Класифікація об'єктів, заданих двома ознаками, за принципом мінімуму відстані.
СРС. К.
12 тиждень
Л12. Приклад застосування кластерного аналізу для кластерізації статей із потоку новин.
ЛЗ12. Розпізнавання цифр методом дискримінантного аналізу.
СРС. К.
13 тиждень
Л13. Дискрімінантний аналіз як метод класифікації даних.
ЛЗ13. Розпізнавання цифр методом дискримінантного аналізу.
СРС. К.
14 тиждень
Л14. Зниження розмірності ознакового простору.
ЛЗ14. Метод головних компонент.
СРС. К.
15 тиждень
Л15. Метод головних компонент.
ЛЗ15. Метод головних компонент.
МКР2.
СРС. К.
(порожній рядок)*
(й рядок)*
Індивідуальна робота
(порожній рядок)*
Виконується РГР.
Мета РГР:
набуття студентами практичних навичок у дослідженні і вирішенні задач за допомогою аналізу даних.
1–6 тижні
Отримання завдання. Збір даних для аналізу, вибір методу розв’язання задачі.
7–11 тижні
Програмна реалізація методу аналізу даних.
12–13 тижні
Доведення програмної реалізації та оцінювання виконаної розробки. Оформлення пояснювальної записки та підготовка до захисту РГР.
14 тиждень
Захист роботи.
Самостійна робота
Самостійна робота складає 75 годин. Розподіл самостійної роботи за видами навчальних робіт:
1) підготовка до лекційних занять – 15 годин;
2) підготовка до лабораторних занять – 15 годин;
3) виконання РГР – 15 годин;
4) підготовка до екзамену – 30 годин.
Процедура оцінювання
Система оцінювання рівня навчальних досягнень ґрунтується на принципах ЄКТС та є накопичувальною. Дисципліна поділяється на два семестрові модулі. Здобувачі протягом семестру готуються до лекційних, лабораторних занять, виконують 2 модульні контрольні роботи.
Модульні контрольні роботи №1, №2 виконуються у письмовій формі. Максимальна оцінка за бездоганне виконання становить 20 балів. Модульна робота складається з теоретичної частини (2 запитання) та практичної частини (1 завдання). Максимальна оцінка за правильне виконання теоретичної частини становить 10 балів, та за правильне виконання практичної частини становить 10 балів. Кожна правильна відповідь за теоретичне запитання оцінюється в 5 балів. Завдання вважається розв’язаним, якщо отримана правильна відповідь, послідовно наведено рішення, виконано всі необхідні рисунки та схеми, проставлені розмірності, пояснено формули.
Кожний модуль оцінюється у максимально можливі 50 балів.
Семестровий модуль № 1
ЛЗ. Оцінка за виконання – 5 балів. Термін надання – 1, 2, 3, 5, 7 тиждень.
МКР1. Модульна контрольна робота – 20 балів (8 тиждень). Перескладання можливе протягом 9–11 тижнів за розкладом консультацій.
Семестровий модуль № 2
ЛЗ. Оцінка за виконання робіт – 5 балів. Термін надання – 9, 10, 12, 14 тиждень.
МКР2. Модульна контрольна робота – 20 балів (15 тиждень).
Максимальна оцінка за повний обсяг виконаних навчальних елементів дисципліни – 100 балів.
Підсумковий контроль відбувається у вигляді екзамену. Екзаменаційна робота складається з теоретичної частини (3 питання) та практичної частини (2 задачі). Мінімальна кількість балів, яка зараховується як позитивний результат, дорівнює 60 (100-бальній системі). Бали діляться таким чином: 60 балів - теоретична частина і 40 - практична. Екзаменаційний квиток містить 3 теоретичних питання однакової складності. За бездоганну відповідь на кожне питання здобувач отримує 20 балів. При цьому відповідь вважається бездоганною, якщо здобувач не зробив жодної помилки і повністю виклав зміст питання. Екзаменаційний білет містить практичну частину у вигляді двох прикладів-завдань, які необхідно вирішити вказаними методами. Практична частина іспиту вважається виконаною бездоганно, якщо при вирішенні прикладу не допущена жодної помилки і всі дії виконані вірно. Всі записи рішення задачі послідовні, виконана перевірка отриманого рішення і дано пояснення результату рішення. Іспит вважається не зданим, якщо здобувач отримав незадовільну оцінку.
Виконання РГР повинно включати пояснювальну записку, друкований і електронний варіант виконаної роботи. У пояснювальній записці студент описує постановку задачі, обсновує вибір методу розв’язання, описує алгоритм і результати виконання завдання. В електронному вигляді представляє реалізовану на обраній мові програмування РГР.
Оцінювання роботи здійснюється з розрахунку 10 балів:
Семестровий модуль № 1
РГР(ч.1). Оцінка за виконання – 5 балів. Термін надання – 8 тиждень.
Семестровий модуль № 2
РГР(ч.2). Оцінка за виконання – 5 балів. Термін надання та захист – 14 тиждень.
Умови допуску до підсумкового контролю
До екзамену допускаються здобувачі вищої освіти, які виконали всі види навчальних елементів навчальної дисципліни на не менш, ніж на 60 %.
Політика освітнього процесу
Здобувач зобов’язаний своєчасно та якісно виконувати всі отримані завдання; за необхідністю з метою з’ясування всіх не зрозумілих під час самостійної та індивідуальної роботи питань, відвідувати консультації викладача. Дотримуватись принципів академічної доброчесності.
Робота, яка виконана після встановлених викладачем термінів, не приймається.
Відсутність здобувача на контрольній роботі відповідає оцінці «0».
Під час лекції здійснювати телефонні дзвінки забороняється.
Заборонено використання будь-яких підручників, посібників, конспектів лекцій, шпаргалок під час проходження модульних контролів.
(порожній рядок)*