Automatic RDF-ization of big data semi-structured datasets

Journal Title: MASKANA - Year 2016, Vol 7, Issue 3

Abstract

Linked data adoption continues to grow in many fields at a considerable pace. However, some of the most important datasets usually remain underexploited because of two main reasons: the huge volume of the datasets and the lack of methods for automatic conversion to RDF. This paper presents an automatic approach to tackle these problems by leveraging recent Big Data tools and a program for automatic conversion from a relational model to RDF. Overall, the process can be summarized in three steps: 1) bulk transfer of data from different sources to Hive/HDFS; 2) transformation of data on Hive to RDF using D2RQ; and 3) storing the resulting RDF in CumulusRDF. By using these Big Data tools, the platform will cope with the handling of big amounts of data available in different sources, which can include structured or semi-structured data. Moreover, since the RDF data are stored in CumulusRDF in the final step, users or applications can consume the resulting data by means of web services or SPARQL queries. Finally, an evaluation in the hydro-meteorological domain demonstrates the soundness of our approach.

Authors and Affiliations

Ronald Gualán, Renán Freire, Andrés Tello, Mauricio Espinoza, Víctor Saquicela

Keywords

Related Articles

Control HSMC para regulación de glucosa sanguínea

Este artículo propone una nueva estrategia de control basada en medidas continuas de glucosa y un controlador por modo deslizante que se habitúa (HSMC). El HSMC es desarrollado, combinando la ley de control por modo de...

Comparación de las eficiencias de recuperación de lípidos de las microalgas Chlorella y Scenedesmus obtenidas con diferentes disolventes

Las microalgas son capaces de producir lípidos que pueden ser usados para obtener biocombustibles de tercera generación, los cuales buscan reemplazar a los combustibles fósiles. Los objetivos de este estudio fueron: det...

“Soft Robotic”: Una nueva generación de robots

La necesidad de crear robots que puedan interactuar, de una forma más fácil y efectiva con el mundo real, ha traído consigo un creciente interés en el uso de nuevos materiales y morfologías robóticas no convencionales....

Especificidad del hongo micorrizico (Rhizoctonia sp.) en Phalaenopsis sp., Cymbidium sp., Trichoceros antenifer, Oncidium excavatum, y Cyrtochilum sp

Las orquídeas producen abundantes semillas pequeñas, careciendo de endospermo, cotiledones y sustancias de reserva para llevar a cabo su germinación. Es por esto que estratégicamente las semillas establecen una relació...

Efecto de la época del año sobre las características seminales de toros de fenotipo Criollo ecuatoriano

El bovino criollo ecuatoriano, así como otros grupos genéticos criollos en Latinoamérica, ha tenido un largo proceso de adaptación de cinco siglos a los diversos climas y ambientes en los que se ha establecido. Debido...

Download PDF file
  • EP ID EP42148
  • DOI -
  • Views 216
  • Downloads 0

How To Cite

Ronald Gualán, Renán Freire, Andrés Tello, Mauricio Espinoza, Víctor Saquicela (2016). Automatic RDF-ization of big data semi-structured datasets. MASKANA, 7(3), -. https://europub.co.uk/articles/-A-42148