Saltar al contenido

Éste es otro post rescatado de los borradores que tengo acumulados. Es una referencia a un artículo de Dale Dougherty: deconstructing databases, deconstruyendo las bases de datos.

La idea que expone es que en ciertas aplicaciones no es necesario modelar los datos utilizando una base de datos, sino que plantea cómo alternativa almacenar los datos en forma parcialmente desestructurada (algunos campos en la base de datos más textos en bruto) y utilizar herramientas de búsqueda de información para recuperar la información. Parte de  un ejemplo concreto, la herramienta de seguimiento de problemas de  google code. Pero hay que tener en cuenta que google debe tener las herramientas más potentes de búsqueda de información en textos. Otra herramienta que va en esta línea es google squared, que partiendo de la información desestructurada de la web, trata de devolver información estructurada.

De otra forma diferente, pero creo que con la misma idea subyacente, lei hace poco una reflexión de Ignacio de Miguel sobre el abuso de las bases de datos. Aunque la reflexión de Ignacio está más relacionada con el abuso de recursos, parte de un base similar, el uso del modelo de base de datos para todo. Almacenar textos en forma desestructurada y utilizar herramientas de búsqueda de información en textos para recupar esa información de forma ordenada, podría se una forma de romper ese abuso.

Por otra parte, de cara al usuario, las aplicaciones convencionales que almacenan y presentan la información en forma esructurada, son normalmente muy rígidas (formularios con multitud de campos desglosados). La alternativa es permitir que el usuario escriba texto libremente del que se pueda extraer información ordenada por medio de algoritmos de comprensión de textos. Para el común de los desarrolladores, creo que todavía no hay herramientas suficientemente avanzadas, aunque seguramente los desarrolladores de google tengan ventaja.

Esta vez he encontrado la inspiración para escribir una entrada en la publicidad contextual de google que tengo en este blog (como dije me parece un ejemplo de inteligencia artificial en la práctica). Éstos son algunos anuncios que han aparecido últimamente:

publicidad google

Los anuncios del bloque superior están relacionados con el tarot y las predicciones del futuro. El algoritmo de google de análisis de textos ha detectado que algunas de mis últimas entradas está relacionadas con el tarot y el futuro. Sin embargo estas entradas no tratan sobre el tarot o la futurología, sino sobre inteligencia artificial que simula un tarot o un divino del futuro. Es una diferencia sutil, difícil de discriminar incluso para una persona, pero es la forma en la que suelen fallar los algoritmos de comprensión de textos actuales. Sin embargo, el algoritmo es lo suficientemente bueno como se puede ver en el pantallazo en los anuncios del latral izquierdo: anuncios apropiados sobre robótica.