ПОРІВНЯЛЬНИЙ АНАЛІЗ ІЄРАРХІЧНИХ МЕТОДІВ КЛАСТЕРІЗАЦІЇ, ПРИДАТНИХ ДЛЯ ОБРОБЛЕННЯ ДАНИХ МОРФОЛОГІЧНИХ ОЗНАК СОРТІВ РОСЛИН
Journal Title: Вісник Полтавської державної аграрної академії - Year 2019, Vol 2, Issue 2
Abstract
Незважаючи на те, що кластеризація є безконтрольною класифікацією багатовимірних даних у відповідні кластери, застосування кластерного аналізу під час дослідження морфологічних харак-теристик сортів рослин дозволяє зменшити розмірність вибірки даних, що сприяє більш точній іде-нтифікації нових сортів. Саме тому важливим питанням є порівняння результатів кластеризації із застосуванням різних методів і метрик та виявлення найбільш придатних для аналізу морфологічних характеристик. Методи: аналітичний, математичний, статистичний, графічний. Під час виконан-ня досліджень використано широко відомий набір даних, що має назву Іриси Фішера. Результати. Досліджено вплив на результат кластерного аналізу різних ієрархічних агломеративних методів класифікації (ближнього сусіда, дальнього сусіда, середнього зв'язку, середнього сусіда (центроїда) та метода Варда) із застосуванням евклідових та не евклідових метрик. Оцінено результати клас-терізації з використанням засобів описової статистики (методу перехресних таблиць). Встановле-но, що найбільш придатними для проведення кластеризації за морфологічними характеристиками для наборів даних, які описуються метричними шкалами є методи: середнього зв'язку (між групами) із застосуванням кореляції Пірсона, середнього зв'язку (всередині групи) із застосуванням метрик Косінус та кореляції Пірсона, а також методу Варда із застосуванням метрики Косінус. Запропо-новано використовувати апарат частотної статистики (перехресні таблиці) для оцінювання якос-ті результатів класифікації. Висновки. Проведене тестування довело, що не існує жодного універса-льного алгоритму, який би ідеально розподілив набір Ірисів Фішера на кластери. Не зважаючи на те, що встановлено методи й метрики, які є найбільш вдалими для класифікації протестованого набору даних, ці методи не можна рекомендувати для використання під час тестування морфологічних оз-нак усіх ботанічних таксонів. Кластеризацію сортів рослин потрібно проводити ітераційно, послі-довно застосовуючи найбільш поширені алгоритми кластеризації та ретельно оцінювати результа-ти кластеризації з метою вибору метода та метрики, які найбільш оптимально класифікують сор-ти рослин та дозволять правильно інтерпретувати результати класифікації. Результати такої кластеризації рекомендовано оцінювати з використанням методу перехресних таблиць та обирати кращий за якістю кластерів.
Authors and Affiliations
Н. С. Орленко, К. М. Мажуга, М. Б. Душар, В. В. Маслечкін
Аналітичний стан нормативно-правової бази України щодо морських ссавців
Наведено аналіз стану нормативно-правової бази України щодо морських ссавців. Розглядається, для порівняння, нормативно-правова база щодо морських ссавців зарубіжних країн. Передові країни світу ак-тивно використовують м...
ВИДОВИЙ СКЛАД ОСНОВНИХ ШКІДНИКІВ АГРОЦЕНОЗУ КУКУРУДЗИ ЛІВОБЕРЕЖНОГО ЛІСОСТЕПУ УКРАЇНИ
Шкідники кукурудзи найбільше перешкоджають зростанню врожайності культури порівняно з іншими чинниками, оскільки наявні на посівах увесь вегетаційний період її вирощування, і пошкоджують рослини в усіх фазах розвитку – в...
Вплив ультрафіолетового випромінювання на проростання, схожість та ростові процеси насіння пшениці
Досліджено передпосівний вплив ультрафіолето-вого (УФ) опромінення насіння пшениці озимої м’якої на посівні властивості (енергія проростання та схожість). В якості джерел УФ-опромінення вико-ристовували ультрафіолетові л...
Епізоотологічні особливості ктеноцефальозу собак в умовах міста Полтави
Мета статті – дослідження епізоотологічних особливостей ктеноцефальозу собак на території міста Полтава, оскільки ктеноцефальоз є одним із найбільш розповсюджених захворювань собак, що виникає внаслідок зараження блохами...
Дослідження особливостей завершення машинного доїння високопродуктивних корів на комплексах промислового типу
Мета статті – дослідження технологічних особливостей завершення машинного доїння високопродуктивних корів на доїльних установках за різного часу затримки знімання доїльних апаратів. Методика дослідження. Науково-господар...