A través de un nuevo método de inteligencia artificial, investigadores del Colegio de Médicos y Cirujanos Vagelos de la Universidad de Columbia (Estados Unidos), pudieron comenzar a predecir con precisión la actividad de los genes dentro de cualquier célula humana, revelando esencialmente los mecanismos internos de la célula que se esté observando.

Los hallazgos, publicados en Nature, revelan que de esta forma se podría transformar el modo en que los científicos trabajan para comprender todo, desde el cáncer hasta las enfermedades genéticas. Desde la investigación, señalaron: "Los modelos computacionales predictivos generalizables permiten descubrir procesos biológicos de forma rápida y precisa. Estos métodos pueden llevar a cabo experimentos computacionales a gran escala de forma eficaz, impulsando y guiando los enfoques experimentales tradicionales".

Un método para predecir

Con los métodos tradicionales se puede revelar cómo son las células al momento de realizar su trabajo o reaccionar a perturbaciones, pero no se pueden realizar predicciones sobre cómo funcionan las células o cómo reaccionarían a los cambios, como sucede con una mutación que causa cáncer.

"Poder predecir con precisión las actividades de una célula transformaría nuestra comprensión de los procesos biológicos fundamentales. Convertiría a la biología, dejaría de ser una ciencia que describe procesos aparentemente aleatorios, en una ciencia capaz de predecir los sistemas subyacentes que rigen el comportamiento celular", subrayaron.

En el nuevo estudio, se intentó utilizar la inteligencia artificial para predecir qué genes están activos en células específicas. Esta información sobre la expresión genética, puede indicar a los investigadores la identidad de la célula y cómo realiza sus funciones: "Los modelos anteriores se han entrenado con datos de tipos de células particulares, generalmente líneas celulares cancerosas o algo que tiene poca semejanza con células normales".

En tal sentido, este grupo de investigadores decidió adoptar un enfoque diferente y entrenar un aprendizaje automático con datos de expresión genética de millones de células obtenidas de tejidos humanos normales. Los datos de entrada consistían en secuencias genómicas y datos que mostraban qué partes del genoma son accesibles y se expresan.

Con un enfoque similar al funcionamiento de ChatGPT y otros modelos de "base" populares, estos sistemas usan un conjunto de datos de entrenamiento para identificar reglas subyacentes, la gramática del lenguaje, y luego aplican dichas reglas a nuevas situaciones: "Aquí es lo mismo, aprendemos la gramática en muchos estados celulares diferentes y luego pasamos a una condición particular de un tipo de célula enferma o sana, y podemos intentar ver qué tan bien predecimos patrones a partir de esta información".

Luego del entrenamiento, con datos de más de 1,3 millones de células humanas, el sistema se volvió lo suficientemente preciso como para predecir la expresión genética en tipos de células que no se habían visto nunca, produciendo resultados que coincidían estrechamente con los datos experimentales.

Descubrir la biología aún oculta

Posteriormente, los investigadores demostraron el poder de su sistema de IA cuando se solicitó que descubriera la biología aún oculta de células enfermas. En el estudio, se trató de una forma hereditaria de leucemia pediátrica. Fue así que con la IA se predijo que las mutaciones alteran la interacción entre dos factores de transcripción diferentes que determinan el destino de las células leucémicas.

Luego, los experimentos de laboratorio confirmaron la predicción de la IA. Comprender el efecto de estas mutaciones revela mecanismos específicos que impulsan esta enfermedad.

Los nuevos métodos computacionales deberían permitir también comenzar a explorar el rol de la "materia oscura" del genoma, un término tomado de la cosmología que hace referencia a la gran mayoría del genoma que no codifica genes conocidos. Este rol quiere explorarse en el cáncer y otras enfermedades.

"La gran mayoría de mutaciones que se encuentran en los pacientes con cáncer se encuentran en las regiones oscuras del genoma. Estas mutaciones no afectan la función de una proteína y permanecieron en su mayor parte sin explorar. La idea es que, utilizando estos modelos, podamos observar mutaciones y arrojar luz sobre esa parte del genoma", concluyeron.

Por ello, el equipo ya se encuentra trabajando con investigadores de Columbia (Estados Unidos) y otras universidades, explorando distintos tipos de cáncer, aprendiendo la gramática de la regulación en células normales y cómo las células cambian en el proceso de desarrollo del cáncer. El trabajo también abre nuevas vías para comprender más enfermedades y, potencialmente, identificar objetivos para nuevos tratamientos

Al presentarse mutaciones novedosas al modelo informático, se pueden obtener conocimientos y predicciones más profundos sobre cómo esas mutaciones afectan a una célula.

Fuente: Europa Press.