APLICACIÓN DE LOS PRINCIPIOS DE LAS ONTOLOGÍAS A LA RECUPERACIÓN DE INFORMACIÓN EN BIG DATA

Libro 2 Investigación en Información-81-92.pdf

Dublin Core

Title

Subject

Ontologías, Big Data.

Creator

Zuriñe Piña Landaburu

Description

En los últimos años, el área tecnológica de Big Data ha vivido un crecimiento excepcional. Este concepto puede definirse como la gestión, análisis y tratamiento de grandes volúmenes de datos mediante diferentes técnicas, con el objetivo de encontrar patrones que se repiten, siendo esto una valiosa fuente de información. Esta información se puede usar habitualmente en el ámbito empresarial o el marketing; incluso, se trata de una información aplicable a ámbitos tan dispares como el análisis político o la investigación científica. Esta información es un activo imprescindible para ayudar a las organizaciones a tomar buenas decisiones.
Al tratarse de grandes volúmenes de datos –en algunos casos, correspondientes a distintas bases de datos-, es necesario aplicar herramientas de análisis y gestión propias, específicas de esta área tecnológica; sin embargo, existen herramientas de representación y gestión del conocimiento que, convenientemente adaptadas, pueden aplicarse a estos grandes volúmenes de datos. Existen algunas herramientas tradicionales ya utilizadas, como la minería de datos o el análisis de texto;
sin embargo, es interesante aplicar otras iniciativas, ya conocidas en el ámbito de las Ciencias de la Documentación, para potenciar y mejorar la capacidad de recuperación de grandes volúmenes de datos. Un ejemplo de estas herramientas son las ontologías: definidas como “una especificación formal de una conceptualización compartida”, han pasado a ser un concepto tradicional propio de la filosofía a herramientas de gestión del conocimiento íntimamente relacionadas con las Nuevas Tecnologías e Internet.
La aplicación de las ontologías al ámbito de Big Data está directamente relacionada con la esencia misma de los datos que se manejan: su heterogeneidad. Como se ha explicado, se trata de grandes volúmenes de datos, a menudo de diferentes orígenes; esto implica una descentralización y desorganización, que puede repercutir negativamente a la recuperación de información. Existe, por tanto, un paralelismo con la problemática a la que se enfrentan los desarrolladores de ontologías a la hora de establecer la representación de un dominio: descentralización, desorganización y falta de estructura. Teniendo en cuenta que las ontologías han demostrado ser muy eficaces para solventar este problema, se considera que la aplicación de algunos de los principios ontológicos a la recuperación de la información en Big Data
puede ser muy beneficiosa. Hay que tener en cuenta que se trata de una aproximación teórica; es decir, se analizan los diversos aspectos fundamentales del diseño y desarrollo de una ontología, para observar su posterior aplicación a
los grandes volúmenes de datos. Para ello, podemos establecer paralelismos entre conceptos fundamentales de las ontologías y su reflejo desde la perspectiva de recuperación de la información en Big Data. Un ejemplo de ello es el dominio, como se ha dicho. La organización fundamental de un dominio es decir, de un elemento del mundo real- se realiza mediante la división de sus conceptos en clases, es
decir, en categorías que comparten unas características comunes. Por su parte, otros aspectos fundamentales de las ontologías como las propiedades y las instancias
pueden ser el reflejo –desde un punto de vista teórico- de una representación de un entorno complejo; un ejemplo de ello es la aplicación de estos principios a la idea del análisis de la información relevante del área de Big Data que se esté analizando, especialmente en relación a su uso posterior. Esta información, que usualmente estará compuesta por los conceptos propios del “mundo real” que se estudia, puede
verse reflejada en el marco teórico de las ontologías como las instancias. De la misma manera, en el caso de las propiedades, se puede aplicar un meta-análisis de los “datos sobre los datos”, es decir, de la información utilizada para la definición, descripción y delimitación de la información que se ha considerado relevante.
En conclusión, podemos ver que la aplicación de un marco teórico propio de la representación del conocimiento en el ámbito de las ontologías puede ser beneficioso al ámbito de Big Data. Por supuesto, al tratarse de un acercamiento teórico, es necesario llevar a cabo un análisis en profundidad tanto desde
el punto de vista de la recuperación de la información como desde el punto de vista de la propia arquitectura de Big Data. En consecuencia, el marco ideal para ello sería un trabajo en conjunto de profesionales de estas dos áreas, para poder obtener un resultado que aúne las ventajas de ambas.

Publisher

Universidad Complutense de Madrid - UCM

Date

14/11/2016

Rights

Universidad Complutense de Madrid - UCM

Zuriñe Piña Landaburu

Format

PDF

Language

Espanhol

Type

Texto

Identifier

ISBN: 978-84-617-6684-0

Coverage

Programação científica

ITEM DOCUMENTO TIPO TEXTO Item Type Metadata

Descrição GT

Organização, tratamento e organização de informações.

Descrição Coordenador

Dra. Georgete Medleg Rodrigues

Dra. María Antonia García Moreno

Data Publicação

2017

Instituição de Origem

Universidad Complutense de Madrid - UCM

Cidade de Origem

Madri

País de Origem

Espanha

Localização

Facultad de Ciencias de la Documentación
Departamento de Biblioteconomía y Documentación
Universidad Complutense de Madrid - Espanhol

Position: 408 (500 views)