La Wikipedia semántica

La Wikimedia Foundation está pensando ahora en cómo adaptar Wikepedia a la Web 3.0 o Web semántica. Esto implica hacer que algunos de los datos de los 15 millones (y en aumento) de artículos incluidos en la Wikipedia resulten comprensibles para los ordenadores, además de para los seres humanos.

En el congreso de tecnología semántica 2010 Semantic Technology, celebrado en San Francisco el mes pasado, el subdirector de la fundación, Erik Möller, mostró algunos de los primeros pasos que la fundación ha dado para estudiar el modo de incorporar una estructura más semántica a la Wikipedia. También hizo un llamamiento a la comunidad de la Web semántica para que les ayude a encontrar el modo de que los conocimientos de la Wikipedia sean más accesibles para los ordenadores y el software.

“La información semántica ya existe en la Wikipedia y ya hay personas trabajando en ello” señala Möller. “Pero, lamentablemente, no les estamos ayudando y tienen que recurrir a un procesamiento extenso para hacerlo”.

Un ejemplo es DBpedia, una base de datos semántica construida utilizando el software de recopilación de datos de las páginas del sitio y mantenida por la Universidad Libre de Berlín y la Universidad de Leipzig, ambas en Alemania. Otra es Freebase, base de datos de conocimientos de pago, la mayoría de los cuales se obtuvieron también rastreando la Wikipedia. Freebase es la fuente de datos utilizada por el motor de búsqueda que responde a preguntas, Powerset, adquirido por Microsoft para formar parte de su motor de búsqueda Bing.

El primer objetivo son las “InfoBoxes”, que aparecen como resúmenes en muchas páginas de la Wikipedia; y las tablas de entradas como la que muestra el producto nacional bruto de todos los países del mundo.

Así, se podría eliminar el trabajo manual que requiere, actualmente, el mantenimiento de las tablas y las listas. En su lugar, las listas se podrían generar automáticamente desde las Infoboxes de otras páginas. También sería posible generar mapas, utilizando las coordenadas de ubicación que se ofrecen en algunas páginas, o generar automáticamente líneas de tiempo para resumir los períodos de historia cubiertos en muchas otras páginas, señala Möller.

Fuente: Technology Review