DeepMind y el Instituto Europeo de Bioinformática (EMBL-EBI) de EMBL realizaron predicciones impulsadas por IA de las estructuras tridimensionales de casi todas las proteínas catalogadas conocidas por la ciencia. es el catalogo libre y abiertamente disponible para la comunidad científica a través de la base de datos de estructuras de proteínas AlphaFold.
Las dos organizaciones esperan que la base de datos ampliada continúe aumentando nuestra comprensión de la biología, ayudando a muchos más científicos en su trabajo mientras se esfuerzan por enfrentar los desafíos globales.
Este importante hito marca una expansión de la base de datos de aproximadamente 200 veces. Ha crecido de casi 1 millón de estructuras de proteínas a 200 millones, y ahora incluye casi todos los organismos de la Tierra cuyos genomas han sido secuenciados. Las estructuras pronosticadas para especies que incluyen plantas, bacterias, animales y otros organismos ahora se incluyen en la base de datos ampliada. Esto abre nuevas vías de investigación en las ciencias de la vida que tendrán un impacto en los desafíos globales, incluida la sostenibilidad, la inseguridad alimentaria y las enfermedades desatendidas.
Una estructura predicha ahora estará disponible para casi todas las secuencias de proteínas UniProt base de datos de proteinas Este lanzamiento también abrirá nuevas vías de investigación, incluidas la bioinformática y la computación, lo que permitirá a los científicos descubrir patrones y tendencias potenciales en la base de datos.
«AlphaFold ahora ofrece una vista en 3D del universo de las proteínas», dijo la directora general de EMBL, Edith Hurd. «La popularidad y el crecimiento de la base de datos AlphaFold es un testimonio del éxito de la colaboración entre DeepMind y EMBL. Nos muestra un atisbo del poder de la ciencia multidisciplinar».
«Estamos sorprendidos por la velocidad a la que AlphaFold ya se ha convertido en una herramienta esencial para cientos de miles de científicos en laboratorios y universidades de todo el mundo», dijo Demis Hassabis, fundador y director ejecutivo de DeepMind. “Desde la lucha contra las enfermedades hasta la lucha contra la contaminación plástica, AlphaFold ya ha tenido un impacto increíble en nuestros mayores desafíos globales. Nuestra esperanza es que esta base de datos ampliada ayude a muchos más científicos en su importante trabajo y abra vías completamente nuevas de descubrimiento científico».
Una herramienta imprescindible para los científicos.
DeepMind y EMBL-EBI ha empezado Base de datos AlphaFold en julio de 2021. En ese momento, contenía más de 350 000 predicciones de estructuras de proteínas, incluido el proteoma humano completo. Las actualizaciones posteriores vieron la adición de UniProtKB/SwissProt y 27 nuevos proteomas, 17 de los cuales representan enfermedades tropicales desatendidas que persisten. destruir la vida de más de mil millones de personas en todo el mundo.
Más de 1000 artículos científicos han citado la base de datos y más de 500 000 investigadores de más de 190 países han accedido a la base de datos AlphaFold para ver más de dos millones de estructuras en un año.
El equipo también vio a los investigadores aprovechar AlphaFold para crear y personalizar herramientas como búsqueda plegable: y: Perder el tiempo que permiten a los usuarios buscar registros similares a una determinada proteína. Otros han adoptado las ideas centrales de aprendizaje automático detrás de AlphaFold, formando la columna vertebral de nuevos algoritmos en el espacio o aplicándolos a áreas como: predicción de la estructura del ARN o desarrollo de nuevos modelos para el diseño de proteínas.
El impacto y el futuro de AlphaFold y la base de datos
AlphaFold también ha tenido un impacto en áreas como la mejora de nuestras capacidades luchar contra la contaminación plásticateniendo una idea enfermedad de Parkinsoncreciente salud de las abejascomprensión como se forma el hieloen la lucha enfermedades desatendidas como la enfermedad de Chagas y la leishmaniasis y la investigación evolución humana.
“Lanzamos AlphaFold con la esperanza de que otros equipos pudieran aprender y aprovechar el progreso que hemos logrado, y ha sido emocionante ver que sucedió tan rápido. Otras organizaciones de investigación de IA ahora han ingresado al campo y están aprovechando los avances de AlphaFold para crear más avances. Esta es verdaderamente una nueva era en biología estructural, y los métodos basados en IA proporcionarán avances increíbles”, dijo John Jumper, investigador y líder de AlphaFold en DeepMind.
“AlphaFold ha enviado ondas a través de la comunidad de biología molecular. Solo en el último año, ha habido más de mil artículos científicos sobre una amplia gama de temas de investigación que utilizan estructuras AlphaFold; Nunca había visto algo así», dice Sameer Velankar, líder del equipo del banco de datos de proteínas de EMBL-EBI en Europa. «Y esto es solo el efecto de un millón de predicciones. imagine el impacto de más de 200 millones de predicciones de estructuras de proteínas en la base de datos AlphaFold.
DeepMind y EMBL-EBI continuarán actualizando regularmente la base de datos con el objetivo de mejorar las características y la funcionalidad en respuesta a los comentarios de los usuarios. El acceso a las compilaciones seguirá estando completamente abierto bajo la licencia CC-BY 4.0, y las descargas masivas estarán disponibles a través de Conjuntos de datos públicos de Google Cloud.
Aficionado a los viajes. Lector exasperantemente humilde. Especialista en internet incurable