Dublin Core
Título
APLICACIÓN DE LOS PRINCIPIOS DE LAS ONTOLOGÍAS A LA RECUPERACIÓN DE INFORMACIÓN EN BIG DATA
Assunto
Ontologías, Big Data.
Autor
Zuriñe Piña Landaburu
Descrição
En los últimos años, el área tecnológica de Big Data ha vivido un crecimiento excepcional. Este concepto puede definirse como la gestión, análisis y tratamiento de grandes volúmenes de datos mediante diferentes técnicas, con el objetivo de encontrar patrones que se repiten, siendo esto una valiosa fuente de información. Esta información se puede usar habitualmente en el ámbito empresarial o el marketing; incluso, se trata de una información aplicable a ámbitos tan dispares como el análisis político o la investigación científica. Esta información es un activo imprescindible para ayudar a las organizaciones a tomar buenas decisiones.
Al tratarse de grandes volúmenes de datos –en algunos casos, correspondientes a distintas bases de datos-, es necesario aplicar herramientas de análisis y gestión propias, específicas de esta área tecnológica; sin embargo, existen herramientas de representación y gestión del conocimiento que, convenientemente adaptadas, pueden aplicarse a estos grandes volúmenes de datos. Existen algunas herramientas tradicionales ya utilizadas, como la minería de datos o el análisis de texto;
sin embargo, es interesante aplicar otras iniciativas, ya conocidas en el ámbito de las Ciencias de la Documentación, para potenciar y mejorar la capacidad de recuperación de grandes volúmenes de datos. Un ejemplo de estas herramientas son las ontologías: definidas como “una especificación formal de una conceptualización compartida”, han pasado a ser un concepto tradicional propio de la filosofía a herramientas de gestión del conocimiento íntimamente relacionadas con las Nuevas Tecnologías e Internet.
La aplicación de las ontologías al ámbito de Big Data está directamente relacionada con la esencia misma de los datos que se manejan: su heterogeneidad. Como se ha explicado, se trata de grandes volúmenes de datos, a menudo de diferentes orígenes; esto implica una descentralización y desorganización, que puede repercutir negativamente a la recuperación de información. Existe, por tanto, un paralelismo con la problemática a la que se enfrentan los desarrolladores de ontologías a la hora de establecer la representación de un dominio: descentralización, desorganización y falta de estructura. Teniendo en cuenta que las ontologías han demostrado ser muy eficaces para solventar este problema, se considera que la aplicación de algunos de los principios ontológicos a la recuperación de la información en Big Data
puede ser muy beneficiosa. Hay que tener en cuenta que se trata de una aproximación teórica; es decir, se analizan los diversos aspectos fundamentales del diseño y desarrollo de una ontología, para observar su posterior aplicación a
los grandes volúmenes de datos. Para ello, podemos establecer paralelismos entre conceptos fundamentales de las ontologías y su reflejo desde la perspectiva de recuperación de la información en Big Data. Un ejemplo de ello es el dominio, como se ha dicho. La organización fundamental de un dominio es decir, de un elemento del mundo real- se realiza mediante la división de sus conceptos en clases, es
decir, en categorías que comparten unas características comunes. Por su parte, otros aspectos fundamentales de las ontologías como las propiedades y las instancias
pueden ser el reflejo –desde un punto de vista teórico- de una representación de un entorno complejo; un ejemplo de ello es la aplicación de estos principios a la idea del análisis de la información relevante del área de Big Data que se esté analizando, especialmente en relación a su uso posterior. Esta información, que usualmente estará compuesta por los conceptos propios del “mundo real” que se estudia, puede
verse reflejada en el marco teórico de las ontologías como las instancias. De la misma manera, en el caso de las propiedades, se puede aplicar un meta-análisis de los “datos sobre los datos”, es decir, de la información utilizada para la definición, descripción y delimitación de la información que se ha considerado relevante.
En conclusión, podemos ver que la aplicación de un marco teórico propio de la representación del conocimiento en el ámbito de las ontologías puede ser beneficioso al ámbito de Big Data. Por supuesto, al tratarse de un acercamiento teórico, es necesario llevar a cabo un análisis en profundidad tanto desde
el punto de vista de la recuperación de la información como desde el punto de vista de la propia arquitectura de Big Data. En consecuencia, el marco ideal para ello sería un trabajo en conjunto de profesionales de estas dos áreas, para poder obtener un resultado que aúne las ventajas de ambas.
Al tratarse de grandes volúmenes de datos –en algunos casos, correspondientes a distintas bases de datos-, es necesario aplicar herramientas de análisis y gestión propias, específicas de esta área tecnológica; sin embargo, existen herramientas de representación y gestión del conocimiento que, convenientemente adaptadas, pueden aplicarse a estos grandes volúmenes de datos. Existen algunas herramientas tradicionales ya utilizadas, como la minería de datos o el análisis de texto;
sin embargo, es interesante aplicar otras iniciativas, ya conocidas en el ámbito de las Ciencias de la Documentación, para potenciar y mejorar la capacidad de recuperación de grandes volúmenes de datos. Un ejemplo de estas herramientas son las ontologías: definidas como “una especificación formal de una conceptualización compartida”, han pasado a ser un concepto tradicional propio de la filosofía a herramientas de gestión del conocimiento íntimamente relacionadas con las Nuevas Tecnologías e Internet.
La aplicación de las ontologías al ámbito de Big Data está directamente relacionada con la esencia misma de los datos que se manejan: su heterogeneidad. Como se ha explicado, se trata de grandes volúmenes de datos, a menudo de diferentes orígenes; esto implica una descentralización y desorganización, que puede repercutir negativamente a la recuperación de información. Existe, por tanto, un paralelismo con la problemática a la que se enfrentan los desarrolladores de ontologías a la hora de establecer la representación de un dominio: descentralización, desorganización y falta de estructura. Teniendo en cuenta que las ontologías han demostrado ser muy eficaces para solventar este problema, se considera que la aplicación de algunos de los principios ontológicos a la recuperación de la información en Big Data
puede ser muy beneficiosa. Hay que tener en cuenta que se trata de una aproximación teórica; es decir, se analizan los diversos aspectos fundamentales del diseño y desarrollo de una ontología, para observar su posterior aplicación a
los grandes volúmenes de datos. Para ello, podemos establecer paralelismos entre conceptos fundamentales de las ontologías y su reflejo desde la perspectiva de recuperación de la información en Big Data. Un ejemplo de ello es el dominio, como se ha dicho. La organización fundamental de un dominio es decir, de un elemento del mundo real- se realiza mediante la división de sus conceptos en clases, es
decir, en categorías que comparten unas características comunes. Por su parte, otros aspectos fundamentales de las ontologías como las propiedades y las instancias
pueden ser el reflejo –desde un punto de vista teórico- de una representación de un entorno complejo; un ejemplo de ello es la aplicación de estos principios a la idea del análisis de la información relevante del área de Big Data que se esté analizando, especialmente en relación a su uso posterior. Esta información, que usualmente estará compuesta por los conceptos propios del “mundo real” que se estudia, puede
verse reflejada en el marco teórico de las ontologías como las instancias. De la misma manera, en el caso de las propiedades, se puede aplicar un meta-análisis de los “datos sobre los datos”, es decir, de la información utilizada para la definición, descripción y delimitación de la información que se ha considerado relevante.
En conclusión, podemos ver que la aplicación de un marco teórico propio de la representación del conocimiento en el ámbito de las ontologías puede ser beneficioso al ámbito de Big Data. Por supuesto, al tratarse de un acercamiento teórico, es necesario llevar a cabo un análisis en profundidad tanto desde
el punto de vista de la recuperación de la información como desde el punto de vista de la propia arquitectura de Big Data. En consecuencia, el marco ideal para ello sería un trabajo en conjunto de profesionales de estas dos áreas, para poder obtener un resultado que aúne las ventajas de ambas.
Editor
Universidad Complutense de Madrid - UCM
Data
14/11/2016
Direitos
Universidad Complutense de Madrid - UCM
Zuriñe Piña Landaburu
Formato
PDF
Idioma
Espanhol
Tipo
Texto
Identificador
ISBN: 978-84-617-6684-0
Abrangência
Programação científica
ITEM DOCUMENTO TIPO TEXTO Item Type Metadata
Descrição GT
Organização, tratamento e organização de informações.
Descrição Coordenador
Dra. Georgete Medleg Rodrigues
Dra. María Antonia García Moreno
Data Publicação
2017
Instituição de Origem
Universidad Complutense de Madrid - UCM
Cidade de Origem
Madri
País de Origem
Espanha
Localização
Facultad de Ciencias de la Documentación
Departamento de Biblioteconomía y Documentación
Universidad Complutense de Madrid - Espanhol
Departamento de Biblioteconomía y Documentación
Universidad Complutense de Madrid - Espanhol
Posição: 584 (139 visualizações)