ПОРІВНЯЛЬНИЙ АНАЛІЗ ІЄРАРХІЧНИХ МЕТОДІВ КЛАСТЕРІЗАЦІЇ, ПРИДАТНИХ ДЛЯ ОБРОБЛЕННЯ ДАНИХ МОРФОЛОГІЧНИХ ОЗНАК СОРТІВ РОСЛИН

Abstract

Незважаючи на те, що кластеризація є безконтрольною класифікацією багатовимірних даних у відповідні кластери, застосування кластерного аналізу під час дослідження морфологічних харак-теристик сортів рослин дозволяє зменшити розмірність вибірки даних, що сприяє більш точній іде-нтифікації нових сортів. Саме тому важливим питанням є порівняння результатів кластеризації із застосуванням різних методів і метрик та виявлення найбільш придатних для аналізу морфологічних характеристик. Методи: аналітичний, математичний, статистичний, графічний. Під час виконан-ня досліджень використано широко відомий набір даних, що має назву Іриси Фішера. Результати. Досліджено вплив на результат кластерного аналізу різних ієрархічних агломеративних методів класифікації (ближнього сусіда, дальнього сусіда, середнього зв'язку, середнього сусіда (центроїда) та метода Варда) із застосуванням евклідових та не евклідових метрик. Оцінено результати клас-терізації з використанням засобів описової статистики (методу перехресних таблиць). Встановле-но, що найбільш придатними для проведення кластеризації за морфологічними характеристиками для наборів даних, які описуються метричними шкалами є методи: середнього зв'язку (між групами) із застосуванням кореляції Пірсона, середнього зв'язку (всередині групи) із застосуванням метрик Косінус та кореляції Пірсона, а також методу Варда із застосуванням метрики Косінус. Запропо-новано використовувати апарат частотної статистики (перехресні таблиці) для оцінювання якос-ті результатів класифікації. Висновки. Проведене тестування довело, що не існує жодного універса-льного алгоритму, який би ідеально розподілив набір Ірисів Фішера на кластери. Не зважаючи на те, що встановлено методи й метрики, які є найбільш вдалими для класифікації протестованого набору даних, ці методи не можна рекомендувати для використання під час тестування морфологічних оз-нак усіх ботанічних таксонів. Кластеризацію сортів рослин потрібно проводити ітераційно, послі-довно застосовуючи найбільш поширені алгоритми кластеризації та ретельно оцінювати результа-ти кластеризації з метою вибору метода та метрики, які найбільш оптимально класифікують сор-ти рослин та дозволять правильно інтерпретувати результати класифікації. Результати такої кластеризації рекомендовано оцінювати з використанням методу перехресних таблиць та обирати кращий за якістю кластерів.

Authors and Affiliations

Н. С. Орленко, К. М. Мажуга, М. Б. Душар, В. В. Маслечкін

Keywords

Related Articles

Веґетація квасолі під впливом передпосівної інокуляції насіння та удобрення

У статті висвітлено результати досліджень тривалості веґетаційного періоду квасолі та окре-мих його фаз для середньостиглих сортів Мавка, Пе-рлина, Надія залежно від рівня удобрення та іноку-лювання насіння «Ризобофітом...

Екологічне обґрунтування формування регіональної екологічної мережі для визначення напрямків функціонування прирічкових зон. Теорія і практика

Сучасний стан природних ландшафтів України лише частково відповідає критеріям віднесення їх до Всеєвропейської екологічної мережі. Відмічається погіршення умов забезпечення територіальної єдно-сті ділянок із природними л...

Формування і мінливість структурних елементів урожайності пшениці озимої в умовах контрольованого середовища

Викладено результати чотирьохрічних дослі-джень (2013–2016 рр.) з вивчення формування і мін-ливості головного структурного елемента врожай-ності пшениці озимої – «маса зерна з колосу» (М1) в умовах контрольованого середо...

ВИКОРИСТАННЯ РІЗНИХ СХЕМ СИНХРОНІЗАЦІЇ ГОЛШТИНСЬКИХ КОРІВ В УМОВАХ СТОВ «ПРОМІНЬ» МИКОЛАЇВСЬКОЇ ОБЛАСТІ

Підвищення рентабельності молочного скотарства в Україні можна здійснити за допомогою зростання продуктивних показників тварин та зменшення витрат на одержання продукції. Ефек-тивність молочного скотарства тісно пов’язан...

Дослідження інтенсивної технології вирощування озимої пшениці та різних агротехнічних прийомів у Луганській області

Важко сьогодні уявити технологію вирощування зернових культур без використання регуляторів рос-ту. І це зрозуміло. Адже, ведучи мову про рентабель-не виробництво зерна, ми неодмінно асоціюємо це з підвищенням рівня врожа...

Download PDF file
  • EP ID EP622439
  • DOI 10.31210/visnyk2019.02.35
  • Views 91
  • Downloads 0

How To Cite

Н. С. Орленко, К. М. Мажуга, М. Б. Душар, В. В. Маслечкін (2019). ПОРІВНЯЛЬНИЙ АНАЛІЗ ІЄРАРХІЧНИХ МЕТОДІВ КЛАСТЕРІЗАЦІЇ, ПРИДАТНИХ ДЛЯ ОБРОБЛЕННЯ ДАНИХ МОРФОЛОГІЧНИХ ОЗНАК СОРТІВ РОСЛИН. Вісник Полтавської державної аграрної академії, 2(2), 261-269. https://europub.co.uk/articles/-A-622439