ПОРІВНЯЛЬНИЙ АНАЛІЗ ІЄРАРХІЧНИХ МЕТОДІВ КЛАСТЕРІЗАЦІЇ, ПРИДАТНИХ ДЛЯ ОБРОБЛЕННЯ ДАНИХ МОРФОЛОГІЧНИХ ОЗНАК СОРТІВ РОСЛИН

Abstract

Незважаючи на те, що кластеризація є безконтрольною класифікацією багатовимірних даних у відповідні кластери, застосування кластерного аналізу під час дослідження морфологічних харак-теристик сортів рослин дозволяє зменшити розмірність вибірки даних, що сприяє більш точній іде-нтифікації нових сортів. Саме тому важливим питанням є порівняння результатів кластеризації із застосуванням різних методів і метрик та виявлення найбільш придатних для аналізу морфологічних характеристик. Методи: аналітичний, математичний, статистичний, графічний. Під час виконан-ня досліджень використано широко відомий набір даних, що має назву Іриси Фішера. Результати. Досліджено вплив на результат кластерного аналізу різних ієрархічних агломеративних методів класифікації (ближнього сусіда, дальнього сусіда, середнього зв'язку, середнього сусіда (центроїда) та метода Варда) із застосуванням евклідових та не евклідових метрик. Оцінено результати клас-терізації з використанням засобів описової статистики (методу перехресних таблиць). Встановле-но, що найбільш придатними для проведення кластеризації за морфологічними характеристиками для наборів даних, які описуються метричними шкалами є методи: середнього зв'язку (між групами) із застосуванням кореляції Пірсона, середнього зв'язку (всередині групи) із застосуванням метрик Косінус та кореляції Пірсона, а також методу Варда із застосуванням метрики Косінус. Запропо-новано використовувати апарат частотної статистики (перехресні таблиці) для оцінювання якос-ті результатів класифікації. Висновки. Проведене тестування довело, що не існує жодного універса-льного алгоритму, який би ідеально розподілив набір Ірисів Фішера на кластери. Не зважаючи на те, що встановлено методи й метрики, які є найбільш вдалими для класифікації протестованого набору даних, ці методи не можна рекомендувати для використання під час тестування морфологічних оз-нак усіх ботанічних таксонів. Кластеризацію сортів рослин потрібно проводити ітераційно, послі-довно застосовуючи найбільш поширені алгоритми кластеризації та ретельно оцінювати результа-ти кластеризації з метою вибору метода та метрики, які найбільш оптимально класифікують сор-ти рослин та дозволять правильно інтерпретувати результати класифікації. Результати такої кластеризації рекомендовано оцінювати з використанням методу перехресних таблиць та обирати кращий за якістю кластерів.

Authors and Affiliations

Н. С. Орленко, К. М. Мажуга, М. Б. Душар, В. В. Маслечкін

Keywords

Related Articles

Мінливість тривалості веґетаційного періоду у колекційних зразків сої

Наведено результати вивчення тривалості веґе-таційного періоду 145 колекційних зразків сої протя-гом 2013–2015 рр. На основі статистичного аналізу даних встановлено, що коефіцієнт варіації (V) три-валості веґетаційного п...

Застосування нейронних мереж для автоматизованого керування вологозабезпеченістю сільськогосподарських культур

Розглянуто нейромережевий підхід до автомати-зованого керування вологозабезпеченістю сільського-сподарських культур. Сучасний стан теорії і прак-тики створення штучних нейронних мереж і нейро-комп’ютерів надав можливість...

Систематизація сортів та селекційних ліній пшениці озимої за кількісними ознаками в умовах контрольованого середовища з використанням кластерного аналізу

Викладено результати чотирьохрічних дослі-джень (2013–2016 рр.) із визначення збалансованості кількісних ознак сортів та селекційних ліній пшениці озимої за строками сівби при використанні кластер-ного аналізу. В досліді...

ПОШИРЕННЯ ВАРООЗУ МЕДОНОСНИХ БДЖІЛ НА ТЕРИТОРІЇ ПОЛТАВСЬКОЇ ОБЛАСТІ

Сучасне бджільництво є важливою галуззю сільського господарства у різних країнах світу, зок-рема в Україні, що забезпечує запилення ентомофільних сільськогосподарських культур, виробництво меду, воску та іншої продукції...

Математичне моделювання процесу завантаження силосів зерном

Технологічний процес завантаження силосів зерном передбачає підйом зерна на певну висоту, потім транспортування його до завантажувального отвору ємності. В цьому процесі використовуються ковшові елеватори, скребкові та с...

Download PDF file
  • EP ID EP622439
  • DOI 10.31210/visnyk2019.02.35
  • Views 107
  • Downloads 0

How To Cite

Н. С. Орленко, К. М. Мажуга, М. Б. Душар, В. В. Маслечкін (2019). ПОРІВНЯЛЬНИЙ АНАЛІЗ ІЄРАРХІЧНИХ МЕТОДІВ КЛАСТЕРІЗАЦІЇ, ПРИДАТНИХ ДЛЯ ОБРОБЛЕННЯ ДАНИХ МОРФОЛОГІЧНИХ ОЗНАК СОРТІВ РОСЛИН. Вісник Полтавської державної аграрної академії, 2(2), 261-269. https://europub.co.uk/articles/-A-622439