La convergencia entre genómica e inteligencia artificial define el futuro farmacéutico, donde la calidad del dato dicta el éxito predictivo. Illumina aborda el cuello de botella en el desarrollo terapéutico, presentando una herramienta que acelera la validación de objetivos genéticos a escala industrial.
Una alianza estratégica para la medicina de precisión
Illumina lanzó el “Billion Cell Atlas”, el mayor set de datos de perturbación genética diseñado específicamente para alimentar algoritmos de IA. Con el respaldo fundacional de AstraZeneca, Merck y Eli Lilly, esta iniciativa busca integrar data crítica en flujos de I+D para optimizar tiempos de descubrimiento.
Jacob Thaysen, director ejecutivo de Illumina, posiciona este lanzamiento como un recurso vital para entrenar la próxima generación de modelos de IA y desentrañar vías biológicas complejas.
"Creemos que el atlas celular es un desarrollo clave que nos permitirá escalar significativamente la IA para el descubrimiento de fármacos. Estamos construyendo un recurso inigualable [...] ayudando en última instancia a mapear las vías biológicas detrás de algunas de las enfermedades más devastadoras del mundo".

Decodificando la biología a escala de petabytes
El valor técnico radica en correlacionar genética con función celular real, superando las limitaciones de los modelos teóricos actuales. El atlas documenta la respuesta de mil millones de células a cambios vía CRISPR en más de 200 líneas relevantes para enfermedades.
Iya Khalil, vicepresidenta y jefa de Datos, IA y Ciencias del Genoma en Merck, detalla cómo utilizarán esta información para fundamentar modelos en variaciones biológicas reales y agilizar el tránsito clínico.
"[...] los científicos de Merck están construyendo y aprovechando modelos de IA fundamentados en la variación biológica real [...] y traduciendo esos conocimientos en nuevos objetivos y biomarcadores de precisión que importan para los pacientes".

Tecnología CRISPR y el futuro del modelado celular
Gestionada por la unidad BioInsight, la infraestructura generará 20 petabytes de datos transcriptómicos anuales mediante el pipeline DRAGEN. Esta capacidad permite observar efectos de activación y desactivación en 20.000 genes, abarcando desde trastornos inmunológicos hasta patologías raras.
Slavé Petrovski, vicepresidente del Centro de Investigación Genómica de AstraZeneca, destaca la importancia de visualizar las perturbaciones genéticas humanas para convertir señales en biología mecanicista y tomar decisiones de desarrollo más claras.
"Traducir la información genética en una comprensión clara de los mecanismos de la enfermedad [...] sigue siendo un desafío central en I+D. Al mostrar cómo se desarrollan perturbaciones genéticas específicas [...] podemos ayudar a convertir las señales genéticas en biología mecanicista que podemos estudiar directamente [...]".
Hacia un ecosistema de 5 mil millones de células
El “Billion Cell Atlas” inicia un programa ambicioso para crear un mapa de 5 mil millones de células en tres años. Este recurso busca la densidad de datos necesaria para que el aprendizaje automático prediga mecanismos de enfermedad hoy inalcanzables.
Ruth Gimeno, vicepresidenta del grupo de Investigación Cardiometabólica en Eli Lilly and Company, enfatiza que la evolución del descubrimiento de fármacos mediante IA depende de alcanzar una escala de datos biológicos inédita.
"La próxima generación de descubrimiento de fármacos impulsado por IA dependerá de datos biológicos a una escala nunca antes lograda. Los conjuntos de datos completos [...] ofrecen la base crítica necesaria para generar conocimientos significativos sobre las enfermedades humanas".

