ПРОГРАМНЕ ЗАБЕЗПЕЧЕННЯ КЛАСТЕРИЗАЦІЇ ДАНИХ НА ОСНОВІ МОДИФІКАЦІЙ МЕТОДУ K-СЕРЕДНІХ

  Владислав Поліщук, Ольга Мацуга (Дніпро, Україна) |    Завантажити статтю

Задача кластеризації (розбиття об’єктів деякої множини на групи за принципом схожості) постає в багатьох галузях наукової та практичної діяльності. Одним з найбільш відомих та використовуваних методів її розв’язання є k-середніх [1].З огляду на широку популярність він реалізований в багатьох програмних продуктах, що підтримують кластеризацію даних. Проте метод має певні недоліки. Наприклад, він вимагає, щоб кількість кластерів була відома заздалегідь, а на практиці це не завжди можливо. Також усі алгоритми, що реалізують цей метод, є ітераційні і вкрай чутливі до вибору початкових центрів кластерів. Для подолання цих недоліків запропоновано значну кількість модифікацій методу, які не знайшли належного впровадження у сучасному програмному забезпеченні. З огляду на це було розроблено програмне забезпечення кластеризації даних«k-meansclustering» на основі алгоритмів методу k-середніх та їх модифікацій. Його опис представлено в даній роботі.