Similarity Estimation for HTML Code Blocks

Journal Title: Jaunųjų mokslininkų darbai - Year 2018, Vol 48, Issue 1

Abstract

Data mining from web pages becomes more frequently adapted in business areas. However on the one hand while analyzing the current situation, we observe that solutions for mining structured data from web pages exists. On the other hand we see that a scientific dataset for unstructured data that would allow create and test new data selection methods does not exist. This limits the development and research of unstructured web data therefore we propose a method for HTML code block similarity estimation. The method combines both data and structure comparison and allows quantitative similarity presentation of two HTML code blocks

Authors and Affiliations

Simona Ramanauskaitė, Kiril Griazev

Keywords

Related Articles

INVESTIGATION OF IMAGE MAGNIFICATION METHODS

Image magnification is a process by which the image is magnified only visually. Image magnification is applied in many different areas. The images are magnified to make a diagnosis in medicine, to identify people or obje...

Analysis of Database Management Systems

The aim of this work - investigate the database management systems according to various criteria, to do the comparison and evaluate its adaptability in enterprises. The material gathered in this work will be used as a me...

SUPLEIŠĖJUSIŲ GELŽBETONINIŲ SIJŲ-SIENUČIŲ ĮTEMPIŲ SKAIČIAVIMAS

Straipsnyje nagrinėjamas įtempimų būvis gelžbetoninėse sijose-sienutėse. Sijos-sienutės plačiai naudojamos įrengiant bunkerius, galerijas, nuleidžiamus šulinius, rezervuarus. Sienučių aukščio ir angos santykis keitėsi nu...

Paauglių delinkventinio elgesio apraiškos mokykloje

Paauglystė yra itin svarbus periodas žmogaus gyvenime. Noras tapti nepriklausoma asmenybe tampa prioritetu, kurio siekiama įvairiais būdais – priimtinais ir laužančiais nusistovėjusias visuomenės normas bei standartus. T...

PLIENO CIKLINIO NESTABILUMO ĮVERTINIMAS ESANT MAŽACIKLIAM DEFORMAVIMUI

Šiame straipsnyje, apdorojus 286 medžiagų standaus apkrovimo tyrimo rezultatus, mėginta įvertinti medžiagų ciklinių savybių sritis pagal mechanines charakteristikas. Tyrimas parodė, kad pagal santykį Rm / ReL ir (Rm / Re...

Download PDF file
  • EP ID EP335910
  • DOI -
  • Views 75
  • Downloads 0

How To Cite

Simona Ramanauskaitė, Kiril Griazev (2018). Similarity Estimation for HTML Code Blocks. Jaunųjų mokslininkų darbai, 48(1), 30-35. https://europub.co.uk/articles/-A-335910