USING GRAPH EMBEDDINGS FOR WIKIPEDIA LINK PREDICTION
Journal Title: Вісник Національного технічного університету «ХПІ». Серія: Системний аналiз, управління та iнформацiйнi технологiї - Year 2019, Vol 0, Issue 1
Abstract
Link prediction is an important area of study in network analysis and graph theory which tries to answer the question of whether two nodes in the graph might have an association in the future. Nowadays, graphs are ubiquitously present in our lives (social networks, circuits, roads etc.), which is why the problem is crucial to the development of intelligent applications. In the past, there have been proposed methods of solving link prediction problem through algebraic formulations and heuristics, however, their expressive power and transferability fell short. Recently, graph embedding methods have risen to popularity because of their effectiveness and the ability to transfer knowledge between tasks. Inspired by the famous in machine learning and natural language processing research Word2Vec approach, these methods try to learn a distributed vector representation, called an embedding, of graph nodes. After that a binary classifier given a pair of embeddings predicts the probability of the existence of a link between the encoded nodes. In this paper, we review several graph embedding approaches for the problem of Wikipedia link prediction, namely Wikipedia2vec, Role2vec, AttentionWalk and Walkets. Wikipedia link prediction tries to find pages that should be interlinked due to some semantic relation. We evaluate prediction accuracy on a hold-out set of links and show which one proves to be better at mining associations between Wikipedia concepts. The results include qualitative (principal component analysis dimensionality reduction and visualization) and quantitative (accuracy) differences between the proposed methods. As a part of the conclusion, further research questions are provided, including new embedding architectures and the creation of a graph embedding algorithms benchmark.
Authors and Affiliations
Roman Shaptala, Gennadiy Kyselev
ОБҐРУНТУВАННЯ ПОПЕРЕДНЬОГО ВИБОРУ АРХІТЕКТУРИ СИСТЕМИ ОБРОБКИ ДАНИХ З ВИКОРИСТАННЯМ НЕЧІТКОЇ ЛОГІКИ
<p class="104">Метою роботи є формування підходу до попереднього обґрунтування вибору типу архітектури системи обробки даних і управління. Архітектура системи являє собою способи побудови та організації її функціонування...
Розробка представлення знань на основі марківських логічних мереж в системі процесного управління
<span>Досліджено проблему побудови представлення знань в системі процесного управління на основі аналізу поведінки бізнес-процесів, що представлена у вигляді логів подій. Кожна подія характеризує дію бізнес-процесу. Акту...
ОПТИМІЗАЦІЯ ІЄРАРХІЧНОЇ СТРУКТУРИ ДАНИХ ІНТЕЛЕКТУАЛЬНОЇ СИСТЕМИ ФУНКЦІОНАЛЬНОГО ДІАГНОСТУВАННЯ ТЕХНІЧНОГО СТАНУ СКЛАДНОЇ МАШИНИ
Розглядається метод інформаційно-екстремального машинного навчання системи функціонального діагностування технічного стану складної машини з оптимізацією ієрархічної структури вхідних даних. Показано, що на функціональну...
Використання serverless підходу для створення веб-додатку моніторінгу товарів
<span>Використовуються сучасні підходи до організації веб-застосунків. Аналіз проблемної області проведено на прикладі оцінки моніторингу зміни вартості товарів в інтернет-магазинах з використанням технології Amazon. В р...
ФОРМУВАННЯ ПРОФЕСІЙНОЇ КОМУНІКАТИВНОЇ КОМПЕТЕНТНОСТІ ПІД ЧАС ПРОЕКТНО-ОРІЄНТОВАНОГО НАВЧАННЯ В УМОВАХ ВИКОРИСТАННЯ МЕТОДОЛОГІЇ SCRUM
<p class="104"><span lang="UK">Розглянуто практичний досвід формування професійної комунікативної компетентності студентів Харківського комп’ютерно-технологічного коледжу Національного технічного університету «Харківськи...