МЕТОД ПОШУКУ ТА АНАЛІЗУ ДАНИХ З ІНТЕРНЕТ РЕСУРСІВ ДЛЯ ФОРМУВАННЯ АКТУАЛЬНИХ ВИМОГ ДО КАНДИДАТІВ

Abstract

У статті розглянуті питання екстракції даних з Web-ресурсів на прикладі збору інформації щодо вакансій. Виділено три основні взаємодіючі сторони цього процесу: джерело даних, база даних та експерт. Розглянуто основні проблематичні сторони процесу видобування даних, а саме: наявність декількох джерел даних; представлення даних різними мовами; видобування даних з різних форматів файлів; багаторазові повторювані операції і безперервні оновлення. Проаналізовано та визначено переваги та недоліки таких методів WebMiningяк:аналіз DOM дерева, парсинг рядків, використання регулярних виразів, XML парсинг та візуальний підхід. У статті застосовано метод аналізу DOM дерева з використання XPath. Запропоновано використання методу компараторной ідентифікації для моделювання процесу видобування даних. Представлено приклад застосування наведеного підходу для ідентифікації певної вакансії на сайті пошуку роботи. Розроблено тезаурус вимог роботодавців та налаштовано роботу парсера.

Authors and Affiliations

Ольга Чередніченко, Марина Гринченко, Артем Василенко, Олександр Матвєєв

Keywords

Related Articles

ЦІННІСТНО-ОРІЄНТОВАНЕ УПРАВЛІННЯ ПРОЕКТАМИ АЛЬТЕРНАТИВНОЇ ЕНЕРГЕТИКИ

Пропонується ціннісно-орієнтований підхід до управління проектами альтернативної енергетики, в основу якого покладені: класифікація етапів життєвого циклу продуктів ПАЕ, адаптована під цілі і завдання інформаційного моде...

ОГЛЯД НАУКОВО-ТЕОРЕТИЧНИХ АСПЕКТІВ БЕЗПЕКИ ОБ’ЄКТІВ КРИТИЧНОЇ ІНФРАСТРУКТУРИ ТРАНСПОРТУ

Проведено аналіз основних науково-теоретичних аспектів, досвіду та концепцій захисту критичної інфраструктури в Україні та світі. Визначено, що на сьогодні важливим та пріоритетним вектором безпекової політики держави є...

СТРАТИФІКАЦІЯ ІНДИВІДУАЛЬНИХ КОМПЕТЕНЦІЙ З МЕТОЮ ПОБУДОВИ ДИНАМІЧНИХ МОРФОЛОГІЧНИХ МОДЕЛЕЙ ПРОЕКТНОГО УПРАВЛІННЯ

Діючі стандарти управління проектами, програмами та портфелями базуються на засадах індивідуальних компетенцій індивідуумів, команд, менеджерів та організацій на основі їхньої творчості та креативності. Одним з напрямків...

ОСОБЕННОСТИ ЖИЗНЕННОГО ЦИКЛА ЛЕЧЕБНЫХ ПРОЕКТОВ

Рассматривается схема перемещения пациента между уровнями оказания медицинской помощи, после реформирования системы здравоохранения. Разработана модель жизненного цикла лечебного процесса, которая представлена в виде спи...

ФОРМУВАННЯ ВІДПОВІДАЛЬНОСТІ ЯК ПОВЕДІНКОВОЇ КОМПЕТЕНЦІЇ ФАХІВЦЯ З УПРАВЛІННЯ ПРОЕКТАМИ

Розглянуто сутність феномену відповідальності та її роль в житті й діяльності людини і суспільства. Показано, що відповідальність має розглядатися як одна з найважливіших поведінкових компетенцій фахівця з управління про...

Download PDF file
  • EP ID EP477836
  • DOI 10.20998/2413-3000.2018.1277.5
  • Views 110
  • Downloads 0

How To Cite

Ольга Чередніченко, Марина Гринченко, Артем Василенко, Олександр Матвєєв (2018). МЕТОД ПОШУКУ ТА АНАЛІЗУ ДАНИХ З ІНТЕРНЕТ РЕСУРСІВ ДЛЯ ФОРМУВАННЯ АКТУАЛЬНИХ ВИМОГ ДО КАНДИДАТІВ. Вісник НТУ «ХПІ». Стратегічне управління, управління портфелями, програмами та проектами, 9(0), 31-38. https://europub.co.uk/articles/-A-477836