Методи програмної інженерії у BIG DATA
Мета дисципліни є формування у висококваліфікованих фахівців з інженерії програмного забезпечення, сучасного рівня інформаційної та цифрової культури, оволодіння здобувачами сучасними методами і програмними засобами обробки структурованих та неструктурованих великих даних; застосування ефективних інструментальних засобів відбиття великих даних та сприяння системному уявленню архітектури відповідних технологічних платформ на основі веб-рішень та хмарних обчислень; вивчення моделей, методів і засобів аналітичної обробки великих масивів даних, а також придбання практичних навичок розв’язання задач професійної діяльності на ПЕОМ з їх використанням; отримання практичних навиків з аналізу та обробки великих даних з використанням сучасних технологій; теоретичних та прикладними аспектами технології Data Mining, методами інтелектуального аналізу даних, можливостями їх застосування; здатність до розробки інтерфейсного програмного забезпечення для поєднання джерела великих даних (ВД) з відповідним програмним середовищем; здатність реалізовувати обчислювальний процес на основі хмарних сервісів і технологій, паралельних і розподілених обчислень. набуття знань, практичних навичок та умінь використання сучасних методів, алгоритмів обробки високовимірних, великих за обсягом та таких, що швидко змінюються різноформатними даними, в т. ч. спотворених зовнішніми неконтрольованими завадами, з урахуванням умов неповної визначеності, для отримання «прихованих» знань, необхідних для підтримки прийняття рішень. Задачі дисципліни є: формування у здобувачів вищої освіти теоретичних знань про методи та моделі інструментальних засобів обробки даних, практичного застосування Big Data в в наукових дослідженнях; розвиток практичних навичок використання методів і алгоритмів Data Mining для розв’язування практичних задач за допомогою сучасних інструментальних систем; підготовка здобувачів до ефективного розв’язування задач, що постають в подальшій професійній діяльності; користування методами обробки структурованих та неструктурованих даних, використовуючи різні програмні засоби, методики та технології; вивчення процедур роботи з хмарними технологіями; опанування методами обробки великих даних за допомогою Spark та вміння розв’язувати відповідні задачі; розуміння базових підходів до конструювання програмного забезпечення, способів управління ним, практичних аспектів, що виникають при конструюванні програмного забезпечення, проектування за допомогою «шаблонів проектування» та UML; набуття знань та практичних навичок використання методів видобування даних, які застосовуються для формування паралельних обчислень, «хешування», потокової обробки даних тощо; розуміння задачі тестування у його зв’язку з надійністю та якістю програмного продукту, а також систематизація знань стосовно способів досягнення сприйнятого рівня надійності та якості продукту; розкриття змісту тестування як окремого зрізу процесу розробки програмного продукту, вплив тестування на показники якості продукту, а також у формування навичок з організації і проведення тестування програмного забезпечення довільного типу і рівня складності.
Основні результати навчання
Вміти приймати технічні, методологічні, організаційно-управлінські рішення в умовах невизначеності. Цілеспрямовано шукати, розуміти, аналізувати, необхідні для рішення професійних наукових задач інформаційно-довідникові та науково-технічні ресурси і джерела знань з урахуванням сучасних досягнень науки і техніки. Знати та вміти аналізувати фундаментальні та сучасні праці провідних зарубіжних та вітчизняних вчених у обраній проблематиці дослідження, формулювати мету та завдання власного наукового дослідження як складові загальноцивілізаційного процесу. Вивчати, узагальнювати та впроваджувати в навчальний процес інновації в інженерії програмного забезпечення. Усвідомлювати та використовувати в повсякденній діяльності тенденції розвиту інформаційних технологій. Знати основні концепції та розуміти теоретичні та практичні проблеми в сучасному науковому напрямку досліджень. Набувати нові наукові та професійні знання, вдосконалювати навички, прогнозувати розвиток програмних систем та інформаційних технологій. Розуміння теоретичних засад, що лежать в основі методів досліджень інформаційних систем та програмного забезпечення, методології проведення досліджень та обчислювальних експериментів. Уміти з нових дослідницьких позицій формулювати загальну методологічну базу власного наукового дослідження, визначити його актуальність, мету і значення для розвитку інших галузей науки, суспільно-політичного, економічного життя. Володіти загальнонауковими філософськими знаннями, необхідними для формулювання наукового світогляду, професійної етики, та культурного кругозору. Вміти досліджувати робочі параметри процесів життєвого циклу програмного забезпечення, а також здійснювати аналіз вибраних методів та засобів підтримки цих процесів та бути спроможним обґрунтувати свій вибір. Вміти вести спеціалізовані наукові семінари, організовувати та проводити навчальні заняття. Володіти способами організації навчально-пізнавальної та практичної діяльності.
Форми організації освітнього процесу та види навчальних занять
Л – лекційні заняття; СРЗ – самостійна робота здобувача вищої освіти; ПЗ – практичні заняття; К – консультації викладача; МКР – модульна контрольна робота.
Тематика та види навчальних занять
1 тиждень
Л1. Предмет та задачі курсу «Моделі програмної інженерії у BIG DATA».
ПЗ1. Основні поняття та означення Big Data.
СРЗ, К
2 тиждень
Л2. Інтелектуальний аналіз даних, як елемент науки про дані.
СРЗ, К.
3 тиждень
Л3. Методи теорії множин та комбінаторики в інтелектуальному аналізі даних.
ПЗ2. Порівняння використання реляційних й нереляційних способів збереження даних.
СРЗ, К
4 тиждень
Л4. Алгебра логіки та статистичні методи в інтелектуальному аналізі даних.
СРЗ, К.
5 тиждень
Л5. Проблеми обробки великих масивів даних.
ПЗ3. Технології і тенденції роботи з Big Data. Запити за великими даними.
СРЗ, К
6 тиждень
Л6. Етапи опрацювання великих даних.
СРЗ, К.
7 тиждень
Л7. Створення інформаційної бази та масштабування баз даних.
ПЗ4. Вивчення інфраструктури для збереження і обробки великих об`ємів даних.
СРЗ, К, МКР1
8 тиждень
Л8. Методи і алгоритми чіткої та нечіткої кластеризації.
СРЗ, К.
9 тиждень
Л9. Підходи, методи і алгоритми кластеризації текстових документів.
ПЗ5. Загальні методи обробки великих даних.
СРЗ, К
10 тиждень
Л10. Сучасні програмно-алгоритмічні засоби для роботи з великими даними.
СРЗ, К.
11 тиждень
Л11. Модифікація інформаційних та математичних моделей.
ПЗ6. Аналіз великих даних за допомогою Microsoft R.
СРЗ, К
12 тиждень
Л12. Аналіз достовірності великих масивів даних.
СРЗ, К.
13 тиждень
Л13. Реструктуризація моделей. Декомпозиція.
ПЗ7. Створення та оцінка регресійних моделей та моделей розподілу.
СРЗ, К
14 тиждень
Л14. Машинне навчання на великих об’ємах даних.
СРЗ, К.
15 тиждень
Л15. Підходи і організація оптимального тестування.
ПЗ8. Використання моделей Azure Machine Learning для розв’язування прикладних задач.
СРЗ, К, МКР2
Індивідуальна робота
Не передбачена
Самостійна робота
Самостійна робота становить 74 годин. Розподіл самостійної роботи за видами навчальних робіт: 1) підготовка до лекційних занять – 22 години; 2) підготовка до практичних занять – 52 години.
Процедура оцінювання
Система оцінювання рівня навчальних досягнень ґрунтується на принципах ЄКТС та є накопичувальною. Для забезпечення оперативного контролю за успішністю та якістю рівня навчальних досягнень здобувачів вищої освіти дисципліна поділяється на два семестрові модулі. Здобувачі протягом семестру готуються до лекційних та практичних занять. Кожна з двох Модульних контрольних робіт (МКР№1 та МКР№2) складається з теоретичних та практичних частин. Теоретична частина оцінюється в 20 балів, по 5 балів кожне питання рівної складності, та практична частина, яка оцінюється в 10 балів. Загальна оцінка за кожну з модульних робіт може складати 30 балів. Кожний модуль оцінюється у максимально можливі 50 балів.
Семестровий модуль № 1
ПЗ1 Оцінка за виконання – 5 балів. Термін надання – 1 тиждень.
ПЗ2 Оцінка за виконання – 5 балів. Термін надання – 3 тиждень.
ПЗ3 Оцінка за виконання – 5 балів. Термін надання – 5 тиждень.
ПЗ4 Оцінка за виконання – 5 балів. Термін надання – 7 тиждень.
МК1. Модульна контрольна робота – 30 балів (7 тиждень). Перескладання можливе протягом 9–11 тижнів за розкладом консультацій.
Семестровий модуль № 2
ПЗ5 Оцінка за виконання – 5 балів. Термін надання – 9 тиждень.
ПЗ6 Оцінка за виконання – 5 балів. Термін надання – 11 тиждень.
ПЗ7 Оцінка за виконання – 5 балів. Термін надання – 13 тиждень.
ПЗ8 Оцінка за виконання – 5 балів. Термін надання – 15 тиждень.
МК2. Модульна контрольна робота – 30 балів (15 тиждень).
Максимальна оцінка за повний обсяг виконаних навчальних елементів дисципліни – 100 балів. Підсумковий контроль виконується у формі заліку, який виставляється здобувачу вищої освіти, як сумарна оцінка за виконання всіх елементів навчальної дисципліни.
Умови допуску до підсумкового контролю
*
До заліку допускаються здобувачі вищої освіти, які виконали всі види навчальних елементів навчальної дисципліни на не менш, ніж на 60 %.
Складання/перескладання заліку організується за встановленим деканатом розкладом.
Політика освітнього процесу
Здобувач зобов’язаний своєчасно та якісно виконувати всі отримані завдання; за необхідністю з метою з’ясування всіх не зрозумілих під час самостійної та індивідуальної роботи питань, відвідувати консультації викладача. Дотримуватись принципів академічної доброчесності.
*
Робота, яка виконана після встановлених викладачем термінів, не приймається.
*
Відсутність здобувача на контрольній роботі або на заліку відповідає оцінці «0».
*
Під час лекції здійснювати телефонні дзвінки забороняється.
Складання/перескладання екзаменів – за встановленим деканатом розкладом.
Під час лекції здійснювати телефонні дзвінки забороняється.