Аналіз методів чіткої та нечіткої кластеризації на основі освітніх даних навчання студентів
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Волинський національний університет імені Лесі Українки
Abstract
У роботі проведено комплексне дослідження методів чіткої та нечіткої кластеризації освітніх даних на прикладі опитування ENAPE 2021, що охоплює соціально-демографічні характеристики домогосподарств та освітні траєкторії студентів. Для досягнення мети було використано мову програмування R та середовище RStudio, що забезпечили можливість попередньої обробки та підготовки даних, зокрема очищення, відбору змінних і нормалізації. У процесі дослідження було реалізовано алгоритми K-Means та Fuzzy C-Means (FCM), що дозволило порівняти роботу чітких і нечітких методів кластеризації та визначити їхні переваги й обмеження. Якість отриманих кластерів оцінювалась за допомогою таких показників, як силуетний коефіцієнт, індекс Калінскі-Харабаза та коефіцієнт нечіткості (FPC). Для візуалізації багатовимірних даних застосовано метод головних компонент (PCA), який дав змогу інтерпретувати результати кластеризації у зручній двовимірній формі. За результатами аналізу оптимальним виявився поділ на три кластери, що дозволило виділити групи студентів з різними навчальними та психоемоційними характеристиками. Дослідження показало, що нечіткі методи, на відміну від чітких, дають ширше розуміння різноманітності студентів, адже відображають різні ступені належності до кластерів
Description
Keywords
Citation
Матвійчук О. М. Аналіз методів чіткої та нечіткої кластеризації на основі освітніх даних навчання студентів : робота на здобуття кваліфікаційного ступеня магістра : спец. 122 Комп’ютерні науки / наук. кер. Т. І. Мамчич ; Волинський національний університет імені Лесі Українки. Луцьк, 2025. 67 с.
