iStockPhoto.com

La IA logra descubrimientos científicos explorando documentos antiguos

La IA (Inteligencia Artificial) sigue dando que hablar. En una época donde la IA gana terreno en una amplia gama de disciplinas, un grupo de científicos utilizaron un algoritmo de aprendizaje automático basado en IA para analizar millones de documentos antiguos y lograron realizar descubrimientos científicos completamente nuevos. 

Un grupo de investigadores y profesionales del Laboratorio Nacional Lawrence Berkeley desarrollaron un algoritmo de IA que comenzó, con muy poca formación, a hacer lectura y aprendizaje a partir de antiguos documentos, que contenían elementos importantes en el estudio de la ciencia de los materiales, y que no habían llamado la atención de los científicos que realizaron dichos escritos. 

Los profesionales de este laboratorio utilizaron un algoritmo llamado “Word2Vec” con el cual procedieron al análisis de millones de documentos científicos en busca de conexiones que los humanos pasaron por alto o simplemente no siguieron las huellas con suficiente atención. En este caso, dicho algoritmo, encontró esos lazos y luego generó predicciones sobre posibles materiales termoeléctricos para la conversión del calor en energía (una de los grandes descubrimientos científicos de la historia) que luego  podría ser utilizada para numerosas aplicaciones tanto en calefacción como en refrigeración. 

iStockPhoto.com

Los investigadores utilizaron el ya conocido enfoque de “aprendizaje automático” de la IA que a lo largo del estudio y de un número elevado de iteraciones se va tornando paulatinamente en “aprendizaje profundo” y que puede producir ciertos contenidos que tienen sentido para el ser humano. Este proceso de la IA llamado “Machine Learning” (aprendizaje automático), que luego de se transforma en “Deep Learning” (aprendizaje profundo) es cada vez más utilizado en las esferas científicas con el objetivo de simplificar y acortar los tiempos de lectura y revisión de documentos del marco teórico. En este caso en particular, el algoritmo fue preparado para encontrar “conocimiento latente” o conexiones que podrían haberse perdido en un campo de investigación  en particular aunque los datos estuvieron siempre presentes. 

La revista Nature dió a conocer que estos científicos fueron alimentando el algoritmo Word2Vec con cerca de 3.3 millones de resúmenes sobre la ciencia de los materiales de aproximadamente mil revistas científicas distintas que fueron publicadas entre 1922 y 2018. Dicho algoritmo recuperó 500 mil palabras distintas de estos resúmenes y logró construir conexiones matemáticas entre ellos. Según se informó, estos resultados otorgaron al algoritmo un poder de predicción muy intrigante para los científicos. 

“En cada campo de investigación hay 100 años de literatura científica y cada semana se publican docenas de estudios más”, dijo en declaraciones publicadas en el sitio iflscience el Dr. Vaje Tshitoyan, becario postdoctoral de Berkeley Lab y uno de los autores principales de este estudio y que actualmente trabaja en Google. Tshitoyan explicó que “un investigador sólo puede acceder a una fracción de esa documentación. Y es justamente a partir de esa premisa que comenzaron a indagar sobre los usos de la IA en este campo del análisis de textos científicos. En primera instancia se capacitó al algoritmo de IA y lo programaron de tal manera que asociara palabras con sus significados y luego extrapolar conexiones a otros conceptos con las mismas características. 

Luego de haber analizado una gran parte de la literatura científica, la IA logró determinar qué materiales tenían las mejores propiedades termoeléctricas, datos que no habían sido encontrados en las investigaciones anteriores. Y los científicos encontraron algo que les pareció extraordinario; cuando se alimentó el algoritmo con resúmenes publicados hasta el 2008, Word2vec logró predecir los materiales que aparecen en estudios posteriores. 

iStockPhoto.com

Otro dato interesante sobre el algoritmo es que en realidad, los científicos no le dieron formación en ciencia de los materiales. Él mismo, usando asociación de palabras y conceptos, fue capaz de proporcionar candidatos para futuros materiales termoeléctricos, que según los científicos podrían ser hasta mejores que los que estamos usando hoy en día. 

Otro de los investigadores de este proyecto, el Dr. Anubhav Jain, quien lleva adelante el proyecto “Hacking Materials group”,  en declaraciones publicadas en la revista Vice, agregó que “el algoritmo puede leer cualquier documento sobre la ciencia de los materiales, así que puede hacer conexiones que ningún científico podría…. A  veces hace lo que un investigador haría, otras veces, hace estas asociaciones interdisciplinarias”, El Dr. Jain explicó también las base del funcionamiento del algoritmo, explicando que de entrena al Word2vec con un modelo de red neuronal para eliminar cada palabra y predecir cuáles serán las palabras que se encuentran junto a ella. Al entrenar una red neuronal se obtienen representaciones de palabra que realmente pueden conferir conocimiento”. 

En definitiva, este algoritmo logró a partir de resúmenes científicos, entender conceptos como la tabla periódica, la estructura química de las moléculas entre otros. Y todo esto sin haber sido específicamente alimentado con conceptos y o datos científicos específicos. A partir de estos resultados, se puede inferir que este mismo algoritmo podría ser utilizado en otras disciplinas, con un reentrenamiento en la literatura específica del tema que se desee, pues al no estar supervisado, construye sus propias conexiones. Según Tshitoyan, el algoritmo podría ser utilizado en cualquier disciplina, aunque declara que la química y la medicina son campos óptimos, pues la información está ahí, aunque las conexiones no están hechas porque es imposible para un científico leer todos los artículos. 

Fuentes: Nature, Vice, iflscience, Berkeley Lab, Hacking Materials RG

Categorías: Internet, ciencias y tecnologías
Etiquetas:

¿Encontró un error? ¡Pulse aquí!

Por razones que escapan a nuestro control, y por un período de tiempo indefinido, el espacio de comentarios está cerrado. Sin embargo, nuestras redes sociales siguen abiertas a sus contribuciones.