Los datos ayudan a generar conocimiento, pero para ello hay que tener acceso a ellos y procesarlos con las herramientas adecuadas.
Cuando usamos Google o cualquier otro buscador online, no somos conscientes de la ingente cantidad de páginas indexadas que se nos mostrarán en una lista en función de qué andamos buscando.
Con el tiempo, los buscadores se han especializado, dividiéndose en buscadores de imágenes, buscadores de noticias, buscadores de productos…
Uno de los proyectos más ambiciosos en este sentido es Google Dataset Search, un buscador enfocado a la búsqueda de datos y conjuntos de datos que se beneficia del open data, es decir, de los datos disponibles para todo el público.
Todavía en fase Beta pero totalmente funcional, Google Dataset Search utiliza como fuentes de referencia universidades, organismos públicos y privados y cualquier institución que comparta datos de estudios o análisis para el aprovechamiento de otros investigadores.
Tal y como indica Google en su página de ayuda, “en muchos casos, los buscadores no han enlazado ni indexado la información sobre estos conjuntos, por lo que encontrar datos resulta tedioso o, en algunos casos, imposible”.
Y es que durante años, el mundo académico y las instituciones públicas han sido muy celosas con los datos generados en sus investigaciones. Gracias a la filosofía del open data es posible acceder a estos datos, y Google Dataset Search pretende ser el buscador de estos datos.
Encontrando conjuntos de datos
Investigadores y científicos utilizan datos hasta el punto de especializarse en esta disciplina. Incluso hay periodistas que se centran en el análisis de datos generando así reportajes e investigaciones impensables años atrás.
Pero trabajar con datos no es tarea fácil, en especial porque los datos están desperdigados en multitud de páginas web y bases de datos, desconectadas entre sí, y algunas sólo disponibles bajo petición.
De ahí que Google lanzara en septiembre de 2018 su buscador de conjuntos de datos Google Dataset Search, disponible para cualquiera con curiosidad o del ámbito académico, periodístico o científico.
Un ejemplo sencillo. Si le preguntas a Google qué tiempo hace en tu ciudad, obtendrás la temperatura de hoy, la previsión para mañana, etc. Si haces lo propio en Google Data Search, obtendrás datos estadísticos sobre climatología y estudios relacionados con los que comprender su evolución gracias a estudios y análisis de universidades y centros de investigación.
Una biblioteca digital de datos
El funcionamiento de Google Dataset Search es simple. Realizamos una búsqueda y obtendremos distintas bases de datos o conjuntos de datos, indicando la fuente de procedencia, en qué consiste y la fecha de publicación o actualización.
Al igual que en Google, es posible realizar una búsqueda genérica o centrarnos en una única fuente de información, tal y como indica el ejemplo de búsqueda weather site:noaa.gov que encontraremos en su página inicial.
Haciendo clic en cada uno, veremos su licencia, normalmente Creative Commons y similares, de ahí que esté disponible para todo el mundo, así como el formato de descarga de los datos: Excel, Json, CSV…
Y como curiosidad, indica si esos datos se han empleado en estudios indexados en Google Académico o Google Scholar en inglés, el buscador de Google especializado en estudios, artículos científicos e investigaciones.
Encontrarás mas información sobre Google Dataset Search en su página de preguntas frecuentes y en su artículo de lanzamiento.