Photo Credit: iStockPhoto.com

Finalmente, Google no lo sabe todo

Escuche

Según algunos estudios probabilísticos, si usted elige un número al azar, tiene mayores posibilidades de acertar que Google cuando intentó predecir el porcentaje de incremento de enfermedades como la influenza.

Hace algunos años, Google incluyó en su buscador una herramienta que se basaba en las búsquedas sobre la gripe o alguno de sus síntomas con la cual evaluaba las tendencias y las fluctuaciones de la enfermedad en numerosos países del mundo. Según Google, a partir del uso del buscador y de esa función, uno podía saber si en su ciudad de residencia, había posibilidades de brotes de gripe, hasta con diez días de antelación, evitando así que los sistemas sanitarios de esas ciudades fueran desbordados por epidemias.

iStockPhoto.com

iStockPhoto.com

Pero últimamente, se ha demostrado que el uso de este cumulo de datos basados en búsquedas no son lo suficientemente fidedignos como para predecir el futuro próximo. De esta manera se desmitifica el uso de este tipo de “Big Data” por parte de las grandes empresas para predecir tendencias puntuales.

Esto se debe a que los datos utilizados para vaticinar la gripe son obtenidos directamente de las búsquedas realizadas en el buscador, entradas de blogs y mensajes compartidos en redes sociales, es decir, datos “no estructurados”. Este tipo de información es muy diferente a la que se construye a partir del flujo lento y estructurado de información que puede recogerse usando los formularios que los pacientes llenan en las salas de espera de consultorios y clínicas y que en realidad era lo que se utilizaba para hacer este tipo de predicciones antes de la creación del algoritmo de Google para el estudio de este tipo de “Big Data”.

El problema para Google en este caso es que la recopilación de información de Flu-trend resultó ser terriblemente inexacta. En un período de 108 semanas durante los años 2012 y 2013, su estimación resulto ser errónea aproximadamente 100 veces, según reveló un estudio reciente. Algunas veces calculó el doble del número de casos efectivamente registrados por los servicios de salud, puntualmente en Estados Unidos.

David Lazer, uno de los autores del estudio de la Northern University dijo que la solución a esta disparidad entre predicción y realidad es realmente sencilla: “es un poco como un rompecabezas, porque realmente no hubiera requerido mucho trabajo mejorar sustancialmente los resultados de Google Flu Trends reequilibrando las escalas de medida del algoritmo utilizado por el buscador.

Y quizás, el problema más grande para el gigante informático es que numerosas  empresas estaban muy interesadas en utilizar esos inmensos cúmulos de información no estructurada para monitorear cómo les estaba yendo a sus marcas, y para poder modificar ligeramente sus operaciones cuando descubrían oportunidades comerciales o potenciales desastres de relaciones públicas.

iStock_000036830874Small

iStockPhoto.com

Kaiser Fung, un estadístico que escribió mucho sobre los problemas relacionados con estos proyectos de “Big Data” asegura que “no existe tal cosa como datos limpios y estables”.  Cuando se habla de “limpios y estables” se refiere a que es un error pensar que los datos que Google recogió para su Flu-trend hoy son los mismos que recopiló la semana, el mes o el año pasado. La empresa del buscador altera regularmente los algoritmos que usa para elaborar índices de vida y, como resultado, puede estar tomando muestras de cosas  muy diferentes entre un mes y otro, lo que agrega un alto grado de inestabilidad en ese conjunto de datos. Fung agrega que este error puede producirse en cualquier conjunto de datos recopilado por cualquier persona. Según el especialista, los resultados se verán contaminados de alguna manera, ya que pasará por alto algo, debido a las singularidades del código subyacente que se utiliza para analizar e indexar la información compartida en internet. Kaiser Fung añade que las empresas que poseen grandes cuerpos de datos pueden asumir que toda la información que necesitan está allí. Sin embargo, la premisa según la cual “N es igual a TODO” es errada.

En definitiva, esta “herramienta de marketing” de Google no dio los resultados esperados. Algunos analistas salieron al cruce manifestando que la sobrestimación del impacto de la gripe por Flu-trend no debe tomarse necesariamente como una crítica al empleo de “Big Data” para las investigaciones, sino más bien como una demanda de transparencia a la empresa del buscador que no hace público el algoritmo, cegado por sus intereses económicos.
column-banner-leo

Fuente: BBC Mundo, Agencias

Categorías: Internacional, Internet, ciencias y tecnologías, Salud, Sociedad
Etiquetas:

¿Encontró un error? ¡Pulse aquí!

Por razones que escapan a nuestro control, y por un período de tiempo indefinido, el espacio de comentarios está cerrado. Sin embargo, nuestras redes sociales siguen abiertas a sus contribuciones.