Google Refine: Optimizar, depurar y limpiar base de datos

google refineGoogle sorprende nuevamente con su nueva herramienta Google Refine (anteriormente Freebase Gridworks), una aplicación disponible para Windows, Mac OS X y Linux, que promete y mucho.

Con Google Refine vamos a poder, de una forma relativamente simple, normalizar nuestras tablas, evitando inconsistencias y depurando posibles errores, algo que muy comúnmente ocurre en tablas por ejemplo de Excel que son cargadas manualmente y que con el pasar del tiempo van almacenando pequeños (y no tan pequeños) errores. Algo que a la larga termina por dar increíbles errores haciendo que aplicar un simple filtro sea una tarea casi imposible.

La potencia de Google Refine no solamente se queda ahí, permite exportar los datos a distintos motores de datos, transformandose en no solo una herramienta de depuración de información sino en un potente conversor. Una vez que importamos la información desde nuestra tabla podemos optimizarla haciendo usos de llaves para valores repetidos, una practica muy común para aquellos acostumbrados a trabajar con bases de datos, de esta manera vamos a reducir considerablemente el peso, como así también vamos a mejorar sustancialmente la velocidad de procesamiento de los datos.

Video de introducción a Google Refine:

Web: Google Refine

Categorizado en: