Automatic RDF-ization of big data semi-structured datasets

Journal Title: MASKANA - Year 2016, Vol 7, Issue 3

Abstract

Linked data adoption continues to grow in many fields at a considerable pace. However, some of the most important datasets usually remain underexploited because of two main reasons: the huge volume of the datasets and the lack of methods for automatic conversion to RDF. This paper presents an automatic approach to tackle these problems by leveraging recent Big Data tools and a program for automatic conversion from a relational model to RDF. Overall, the process can be summarized in three steps: 1) bulk transfer of data from different sources to Hive/HDFS; 2) transformation of data on Hive to RDF using D2RQ; and 3) storing the resulting RDF in CumulusRDF. By using these Big Data tools, the platform will cope with the handling of big amounts of data available in different sources, which can include structured or semi-structured data. Moreover, since the RDF data are stored in CumulusRDF in the final step, users or applications can consume the resulting data by means of web services or SPARQL queries. Finally, an evaluation in the hydro-meteorological domain demonstrates the soundness of our approach.

Authors and Affiliations

Ronald Gualán, Renán Freire, Andrés Tello, Mauricio Espinoza, Víctor Saquicela

Keywords

Related Articles

Descubriendo patrones de modelos de contexto basados en i

La construcción de modelos del contexto empresarial, herramienta fundamental para el diseño de sistemas de información modernos, es generalmente una tarea difícil de conducir, en gran medida debido a la falta de comuni...

Manejo de la hipertensión arterial desde los servicios de atención primaria

El objetivo de este estudio fue validar un modelo de Atención Primaria de Salud en pacientes hipertensos, en dos Centros de Salud de la ciudad de Cuenca, con el fin de: identificar los factores de riesgo, aplicar un pr...

Remoción de la hemoglobina por adsorción sobre nanopartículas magnéticas de Fe3O4/TiO2

La remoción de la hemoglobina (Hb) por adsorción de la proteína sobre nanopartículas (Nps) magnéticas de Fe3O4/TiO2 (núcleo/coraza) aplicando un campo magnético externo, fue investigada mediante espectroscopia ultravio...

Factores de riesgo asociados a la osteoporosis posmenopáusica: Estudio de casos de los Hospitales Vicente Corral y José Carrasco

El objetivo del estudio es determinar la asociación entre los factores de riesgo: índice de masa corporal bajo, alimentación con bajo contenido de calcio, menarquia tardía, menopausia precoz, sedentarismo y condición s...

Modelo origen destino para estimar el flujo de tráfico usando algoritmos genéticos

En este trabajo se ha desarrollado un nuevo método basado en Inteligencia Artificial para resolver un problema del matriz origen-destino (O-D) aplicado al caso de una red de tráfico vehicular en la ciudad de Ambato. El...

Download PDF file
  • EP ID EP42148
  • DOI -
  • Views 253
  • Downloads 0

How To Cite

Ronald Gualán, Renán Freire, Andrés Tello, Mauricio Espinoza, Víctor Saquicela (2016). Automatic RDF-ization of big data semi-structured datasets. MASKANA, 7(3), -. https://europub.co.uk/articles/-A-42148