Investigación privada DFNB16

STRC c.4976 AC

I asked AI what that means. Came up with a variant pathogenicity analysis and a new hypothesis.

Mi hijo Michael tiene 4 años y no oye bien. Su prueba genética indica que tiene dos copias rotas del gen STRC. Una está confirmada como patogénica. La otra es una «Variante de significado incierto». Esta clasificación lo excluye de los futuros ensayos clínicos de terapia génica.

No soy genetista. Trabajo en tecnología, producción creativa y educación en IA. Así que utilicé herramientas de IA para investigar la variante yo mismo. Encontré evidencia computacional para la reclasificación, confirmé que la posición está conservada en todos los mamíferos y descubrí que las herramientas genéticas estándar fallan para este gen debido a un pseudogén. Presenté una solicitud formal de reclasificación al hospital.

Luego continué. Analicé si una proteína más corta podría caber en un solo vector de terapia génica. Comprobé si CRISPR podría corregir la mutación específica. Escribí a los investigadores que fueron pioneros en la terapia génica STRC. Recibí respuestas alentadoras.

La ciencia no debería estar encerrada detrás de jerga. Hay un podcast y un video abajo (ambos generados por IA) para quien prefiera escuchar en vez de revisar estructuras proteicas.

Listen to podcast
AI-generated · NotebookLM
Watch video overview
AI-generated · NotebookLM
Built with OpenClaw (free, open source) + Claude Opus 4.6 (API, ~$50-100) + AlphaFold + AlphaFold 3 + AlphaMissense + UniProt + Ensembl (all free)
Egor y Michael

Egor y Michael, Hong Kong

AlphaMissense
0.9016
Probablemente patogénica
AlphaFold pLDDT
95.69
Muy alta confianza
Puntuación REVEL
0.65
Predicción deletérea
Conservación
9/9
Mamíferos conservados
Parte 1

Evidencia de reclasificación

Evidencia computacional que respalda la reclasificación de VUS a Probablemente patogénica para NM_153700.2:c.4976A>C p.(Glu1659Ala)

Saturación AlphaMissense

Cada posible sustitución de aminoácidos en la posición 1659 es predicha como Probablemente patogénica. Esta posición es estructuralmente invariante: cualquier cambio rompe la proteína.

EW
0.9997
EF
0.9992
EP
0.9985
EC
0.9984
EY
0.9981
EL
0.9929
EH
0.9927
EI
0.9923
EM
0.9909
EN
0.9822
ET
0.9666
EV
0.9664
ER
0.9634
ED
0.9483
ES
0.9433
EK
0.9272
EG
0.9191
EA
0.9016 MISHA
EQ
0.8460
Umbral: Probablemente patogénica > 0,564 | Ambigua 0,340-0,564 | Probablemente benigna < 0,340

Conservación evolutiva

NUEVO

E1659 está conservado al 100% en todos los mamíferos probados, abarcando ~80 millones de años de evolución. El motivo circundante PEIFTEIGTIAAG es idéntico en cada especie.

Especie Posición Residuo Contexto
Humano1659EPEIFTEIGTIAAG
Ratón1693EPEIFTEIGTIAAG
Rata1693EPEIFTEIGTIAAG
Vaca1647EPEIFTEIGTIAAG
Mono verde1659EPEIFTEIGTIAAG
Cerdo1650EPEIFTEIGTIAAG
Perro1649EPEIFTEIGTIAAG
Murciélago1646EPEIFTEIGTIAAG
Oso1643EPEIFTEIGTIAAG

9/9 especies conservan el ácido glutámico (E) en esta posición. El motivo de 13 residuos circundante (PEIFTEIGTIAAG) es idéntico en todos los mamíferos probados. Este nivel de conservación sugiere fuertemente importancia funcional y apoya la patogenicidad de cualquier sustitución (evidencia PP1 de apoyo según ACMG). Fuente de datos: secuencias ortólogas de UniProt, alineación basada en motivos.

Estructura proteica 3D

Estereocilina (Q7RTU9, 1775 aa) de AlphaFold v6. Posición E1659 resaltada en magenta. Arrastra para rotar, desplaza para hacer zoom.

Proteína completa

Color: confianza pLDDT (azul=alta, rojo=baja)

Primer plano E1659

Cadena lateral del ácido glutámico mostrada como palillos

Tipo salvaje: Ácido Glutámico (E)

  • Carga: Negativa (-1)
  • Volumen cadena lateral: 138,4 A3
  • Capacidad enlace de hidrógeno: Donante + Aceptor
  • Función: puentes de sal, interacciones electrostáticas

Mutante: Alanina (A)

  • Carga: Neutra (0)
  • Volumen cadena lateral: 67,0 A3 (-52%)
  • Capacidad enlace de hidrógeno: Ninguna
  • Impacto: pérdida de carga, pérdida de enlaces H, creación de cavidad

Por qué AlphaMissense es crucial para STRC

El problema del pseudogén STRC

STRC tiene un pseudogén casi idéntico (STRCP1) ubicado adyacente en el cromosoma 15q15.3. Esto hace que la mayoría de las herramientas computacionales estándar fallen o devuelvan resultados poco fiables para las variantes STRC:

SIFT
Devuelve null para E1659A. No puede alinear STRC de forma fiable debido al pseudogén.
PolyPhen-2
Devuelve null. Mismo problema de alineación con pseudogén.
CADD
Sin puntuación disponible para esta posición. Mapeo de coordenadas genómicas afectado por el pseudogén.
AlphaMissense
Funciona. Usa predicción de estructura proteica (AlphaFold), no alineación genómica. Inmune a la interferencia del pseudogén. Puntuación: 0,9016.

AlphaMissense es únicamente valioso para STRC porque predice la patogenicidad a partir de la estructura proteica, evitando el paso de alineación de secuencias donde el pseudogén STRCP1 provoca el fallo de otras herramientas. REVEL (0,65) también proporciona una predicción concordante, usando un enfoque de conjunto que mitiga parcialmente este problema.

Clasificación ACMG

Criterio Fuerza Evidencia
PM3 Moderada Detectado en trans con deleción patogénica de gen completo (confirmada paterna)
PP3_Moderate Moderada AlphaMissense 0,9016 + REVEL 0,65 concordantes (umbral Pejaver 2022)
PM2_Supporting Apoyo Ausente en gnomAD (0 alelos en 251.000+ individuos)
PP1_Supporting Apoyo E1659 100% conservado en 9 especies mamíferas (~80M años). Motivo idéntico PEIFTEIGTIAAG.
Resultado: Probablemente patogénica

2 Moderadas + 2 Apoyo = Probablemente patogénica según las reglas de combinación ACMG/AMP 2015

Parte 2

Hipótesis de investigación

Hipótesis computacionales para acelerar la terapia génica STRC. Requieren validación experimental.

Hipótesis Mini-STRC

NUEVO COMPUTACIONAL

La terapia génica STRC actual requiere dos vectores AAV porque el gen (5.325 pb) supera el límite de empaquetamiento de un solo AAV (~4.400 pb utilizables). El análisis estructural de AlphaFold sugiere que un enfoque de un solo vector podría ser posible.

El problema de empaquetamiento

ADNc STRC completo 5325 bp
Límite AAV (con promotor/ITR) ~4400 bp
Mini-STRC (predicho) 3984 bp

Lo que revela AlphaFold

AlphaFold predice la estructura de la estereocilina con confianza variable a lo largo de la proteína. La región N-terminal (residuos 1-615) tiene muy baja confianza (pLDDT < 50), indicando que probablemente está intrínsecamente desordenada sin estructura 3D estable. El núcleo funcional comienza alrededor del residuo 616.

E1659
cortar aquí
1 N-terminal (desordenado) Dominio LRR C-terminal (núcleo funcional) 1775

Eliminar (447 aa, 1341 pb)

  • 23-114 N-terminal desordenado (pLDDT 30,6)
  • 132-251 Región desordenada (pLDDT 37,0)
  • 309-387 Bucles desordenados (pLDDT 38-47)
  • 449-485 Bucle desordenado (pLDDT 47,5)
  • 496-615 Gran región desordenada (pLDDT 31,1)

Todas las regiones tienen pLDDT < 50 (sin estructura estable predicha)

Conservar (1328 aa, 3984 pb)

  • 1-22 Péptido señal (secreción)
  • 616-1074 Dominio LRR (interacciones proteicas)
  • 1075-1775 C-terminal (anclaje a membrana tectorial)
  • 1659 Posición de la variante de Misha (preservada)
  • 8 sitios de glicosilación en el núcleo funcional preservados

3984 pb cabe en un solo AAV (< 4400 pb)

Precedente: micro-distrofina

Este enfoque tiene un precedente demostrado. El gen de la distrofina (11.000 pb) era demasiado grande para cualquier AAV. Los investigadores crearon la «micro-distrofina» eliminando repeticiones espectrina no esenciales, haciéndola caber en un solo AAV. Ahora está en ensayos clínicos de fase 3 (Sarepta SRP-9001). El mismo principio: identificar el núcleo estructural, eliminar regiones desordenadas/redundantes, preservar la función. Nadie ha intentado esto para STRC todavía.

Importante: Esta es una hipótesis computacional basada en predicciones estructurales de AlphaFold. Requiere validación experimental: ¿se pliega correctamente el mini-estereocilina? ¿Se localiza en los extremos de los estereocilios? ¿Forma conectores horizontales superiores y uniones a la membrana tectorial? Estas preguntas requieren trabajo de laboratorio. Pero los datos estructurales sugieren fuertemente que la región N-terminal es prescindible y que un enfoque mini-STRC de vector único merece investigación.

Experimentos AlphaFold 3

6 TRABAJOS

Prueba computacional sistemática de la hipótesis mini-STRC y el impacto de la variante. Modelos 3D renderizados en vivo desde archivos CIF de AlphaFold 3. Arrastra para rotar, desplaza para hacer zoom.

Hallazgo clave

Mini-STRC (sin N-terminal) alcanza pTM 0,81, significativamente mejor que el tipo salvaje completo (pTM 0,63). La región N-terminal eliminada solo puntúa pTM 0,27 con 38% de desorden. Eliminar el N-terminal desordenado produce una proteína que se pliega mejor y cabe en un solo vector AAV.

¿Podríamos corregir solo esa letra?

COMPUTACIONAL

En lugar de reemplazar el gen STRC completo (5.325 pb), ¿qué pasaría si pudiéramos corregir solo la única base mutada? Hay tres tipos de herramientas de edición génica. Verifiqué cada una contra la variante específica de Michael.

La mutación de Michael: una sola letra incorrecta
Sano: ...AATTTACAGTG...
Michael: ...AATTTCCAGTG...
Necesitamos cambiar C de vuelta a A. Esto se llama una transversión C>A.
CBE (Editor de Base Citosina)
Qué hace:
C T solo
Necesitamos C→A. CBE solo puede hacer C→T.
No puede corregir esta variante
ABE (Editor de Base Adenina)
Qué hace:
A G solo
Dirección completamente incorrecta. Irrelevante aquí.
No puede corregir esta variante
Prime Editor
Qué hace:
any any (las 12 sustituciones)
C→A incluido. Necesita un sitio PAM cercano.
SÍ puede corregir esta variante
Sitio PAM encontrado: 4 pb de la variante

La edición prime requiere un «pad de aterrizaje» (sitio PAM, secuencia NGG) cerca del objetivo. Descargué la secuencia genómica desde Ensembl REST API y busqué motivos NGG dentro de 15 pb de la variante.

chr15:43600521-43600581 (GRCh38)
CCCAGCTCCCCACCTGCTATGGTGCCCCAATTT[C]AGTGAAGATCTCAGG
..........................PAM↑....↑variant
..........................4bp apart
Cómo lo encontré: La API Ensembl devuelve la secuencia genómica. Busqué «CC» (complemento inverso del PAM NGG) dentro de 15 pb de la posición 43600551. Encontré uno a 4 pb de distancia. Esto está dentro de la ventana óptima de edición prime (0-13 pb).

Verificación de realidad: La edición prime no ha sido probada en células ciliadas del oído interno in vivo. Entregar el prime editor + ARN guía a las células ciliadas externas en lo profundo de la cóclea es un desafío no resuelto. Pero este análisis confirma que la variante específica de Michael es técnicamente targetable. Si se resuelve la entrega (un área activa de investigación), esta mutación puede corregirse a nivel de ADN.

Parte 3

Cómo lo hice

Metodología paso a paso para que cualquiera pueda reproducir estos resultados

Day 1, evening

Soy un padre sin formación científica que trabaja en tecnología y producción creativa. Aquí está exactamente lo que hice, paso a paso, para que cualquier persona en la misma situación pueda reproducirlo.

1

Comencé con el informe genético de mi hijo

El informe WES de Michael del Hospital Infantil de Hong Kong (Nº de lab: 23C7500174, diciembre 2022) listaba dos variantes STRC. Una estaba etiquetada como «Patogénica» (una deleción de gen completo de su padre, confirmada por MLPA). La otra estaba etiquetada como «Variante de significado incierto» (un cambio de letra de su madre, confirmada por secuenciación Sanger): NM_153700.2:c.4976A>C p.(Glu1659Ala). Necesitaba saber: ¿es realmente dañina esta segunda variante?

Lo que necesitas: el informe de prueba genética de tu hijo con la nomenclatura exacta de la variante (nombre del gen, notación c., notación p.).
2

Pregunté: ¿dónde está esta proteína?

Le pedí a Claude que buscara la proteína STRC. Buscó en UniProt y encontró el ID: Q7RTU9. Claude me señaló AlphaFold, que tiene la estructura 3D predicha. La puntuación de confianza (pLDDT) en la posición 1659 era 95,69 sobre 100, lo que significa que la predicción de estructura en ese punto es muy fiable.

Paso A: Ve a uniprot.org, busca el nombre de tu gen, anota el ID de acceso UniProt
Paso B: Ve a alphafold.ebi.ac.uk/entry/[TU_ID], verifica pLDDT en la posición de tu variante
uniprot.org
Q7RTU9 · STRC_HUMAN
Estereocilina · 1.775 aa
Gen: STRC · Organismo: Homo sapiens
alphafold.ebi.ac.uk
AF-Q7RTU9-F1 (v6)
pLDDT en pos 1659: 95,69
Estructura de muy alta confianza
3

Pregunté: ¿es dañina esta mutación? (el descubrimiento clave)

AlphaMissense es una herramienta de Google DeepMind que predice si una mutación proteica es dañina. Descargué el archivo de predicciones de AlphaMissense para la estereocilina y busqué «E1659A» (E = Ácido glutámico, el aminoácido original; A = Alanina, la variante de Michael).

El resultado: 0,9016 sobre 1,0 (Probablemente patogénica). Cualquier valor por encima de 0,564 se considera probablemente dañino. Luego verifiqué los otros 19 posibles cambios en la posición 1659. Cada uno puntuó por encima de 0,846. Esto significa que la posición 1659 es estructuralmente crítica: cualquier cambio rompe la proteína.

Cómo: Descargar este archivo CSV (predicciones AlphaMissense para STRC)
Luego: Abrir en Excel o Google Sheets, buscar tu variante (ej. «E1659A»). Puntuación > 0,564 = Probablemente patogénica
Para otros genes: Reemplaza Q7RTU9 con el ID UniProt de tu proteína en la URL
AF-Q7RTU9-F1-aa-substitutions.csv (filtrado)
protein_variantam_pathogenicityam_class
E1659A0.9016LPath
E1659D0.9483LPath
E1659G0.9191LPath
... 19 sustituciones en total: LPath (0,846-0,999)
4

Pregunté: ¿es importante esta posición entre especies?

Si una posición es importante para la proteína, debería ser el mismo aminoácido en diferentes especies. Claude descargó secuencias de estereocilina de 9 mamíferos en UniProt (humano, ratón, rata, vaca, mono, cerdo, perro, murciélago, oso) y buscó el motivo alrededor de la posición 1659 en cada uno.

Resultado: 100% conservada. Las 9 especies tienen Ácido Glutámico (E) en esta posición. El motivo de 13 residuos circundante (PEIFTEIGTIAAG) es idéntico a través de ~80 millones de años de evolución. Esta es evidencia PP1 de Apoyo bajo los criterios ACMG.

Luego: Descarga FASTA para cada especie, busca un motivo único cerca de la posición de tu variante
Atajo: Si el aminoácido + residuos circundantes son idénticos entre mamíferos, la posición está conservada
5

Probamos las herramientas estándar (fallaron)

Normalmente, los genetistas usan SIFT, PolyPhen-2 y CADD para verificar variantes. Claude lo intentó todo a través de la API Ensembl VEP. Todas devolvieron nada para esta variante.

La razón: STRC tiene un gen «gemelo» casi idéntico junto a él en el cromosoma 15 (un pseudogén llamado STRCP1) que confunde las herramientas basadas en alineación de secuencias. Por eso AlphaMissense es únicamente importante para STRC: funciona desde la estructura 3D de la proteína, no desde la secuencia de ADN, por lo que el pseudogén no le afecta.

Verifica: API Ensembl VEP para esta variante (no devuelve SIFT/PolyPhen)
Nota: Si tu gen no tiene pseudogén, SIFT/PolyPhen pueden funcionar. Verifica tu gen en NCBI primero
6

Pregunté: ¿suma esto una reclasificación?

Las directrices ACMG/AMP (Richards et al., 2015) son el marco estándar que usan los genetistas para clasificar variantes. Cada pieza de evidencia recibe un código y nivel de fuerza. Aprendí las reglas y las apliqué:

  • PM3 (Moderada): La variante se encontró en trans con una deleción patogénica conocida (una de cada padre, confirmada por pruebas parentales). Reglas ClinGen SVI
  • PP3_Moderada (Moderada): Dos herramientas computacionales concordantes predicen patogenicidad: AlphaMissense (0,9016) + REVEL (0,65). Actualizado de Apoyo a Moderada según Pejaver et al. 2022
  • PM2_Apoyo (Apoyo): Ausente de gnomAD (0 alelos en 251.000+ individuos)
  • PP1_Apoyo (Apoyo): Posición 100% conservada en 9 especies mamíferas (ver Paso 4)

2 Moderadas + 2 Apoyo = Probablemente patogénica. Según las reglas de combinación ACMG (Tabla 5), esto cumple el umbral para la clasificación Probablemente patogénica.

7

Escribí al hospital

Compilé toda la evidencia en una carta formal dirigida al Laboratorio de Patología Química del Hospital Infantil de Hong Kong, solicitando una revisión de reclasificación de la variante de VUS a Probablemente patogénica. Adjunté los datos de AlphaMissense, el análisis de conservación y el desglose de los criterios ACMG. También construí este sitio web para que la evidencia sea transparente, reproducible y accesible a cualquiera que revise el caso.

8

Qué pasa después

Si el hospital acepta la reclasificación, el diagnóstico molecular de Michael será confirmado: STRC patogénico bialélico (DFNB16). Este es un requisito previo para futuros ensayos clínicos de terapia génica. La terapia génica dual-AAV ya ha restaurado la audición en ratones deficientes en STRC (Iranfar et al., enero 2026). Los ensayos humanos se esperan en 2-3 años. Michael tendrá 7-8 años.

Más allá de la reclasificación

No podía detenerme ahí

Una vez que entendí cómo leer las estructuras proteicas, me di cuenta de que podía ir más lejos. No soy genetista, pero estas herramientas existen, son gratuitas, y el futuro de mi hijo podría depender de que alguien haga las preguntas correctas. Así que continué.

10

Verifiqué si CRISPR podría corregir la mutación directamente

En lugar de reemplazar todo el gen, ¿qué pasaría si pudiéramos corregir solo la letra incorrecta? Descargué la secuencia genómica alrededor de la variante de Michael desde Ensembl y verifiqué si las herramientas de edición génica podían apuntarla.

Edición de base (CBE/ABE): no puede corregir esta variante (la transversión C>A está fuera de su alcance). Edición prime: factible. Encontré un sitio PAM adecuado a solo 4 pares de bases de la mutación. Un prime editor podría teóricamente corregir el cambio de base único, aunque este enfoque no ha sido probado aún en células del oído interno.

11

Pregunté: ¿puede el gen caber en un solo virus?

La terapia génica actual para STRC requiere dos virus (dual-AAV) porque el gen es demasiado largo para uno solo. Dos virus significa menor eficiencia: ambos deben entrar en la misma célula. Analicé la estructura de AlphaFold y noté que los primeros ~600 aminoácidos tienen muy baja confianza estructural (pLDDT < 50), sugiriendo que pueden no formar una estructura estable y podrían ser prescindibles.

Si se eliminan esas regiones, la «mini-estereocilina» restante (1.328 aa, 3.984 pb) cabe en un solo vector AAV. Es una hipótesis computacional. Necesita pruebas de laboratorio. Pero el precedente existe: la micro-distrofina (eliminando partes no esenciales de la distrofina) está ahora en ensayos clínicos de fase 3 para distrofia muscular.

12

Predije la interacción proteína-proteína (AlphaFold 3)

Para probar más la hipótesis mini-STRC, enviamos un trabajo al Servidor AlphaFold 3 para predecir la estructura 3D de la estereocilina unida a su pareja de interacción TMEM145 (una proteína descubierta recientemente como esencial para la función de la estereocilina, Nature Communications 2025).

Primeros resultados recibidos (Trabajo 1). ipTM = 0,47, pTM = 0,48. Baja confianza en la unión directa. El análisis de la matriz PAE muestra los mejores contactos inter-cadena en los residuos N-terminales 174-185 (pero aún deficientes a 8,6 A).

Luego envié 5 trabajos más para probar sistemáticamente la hipótesis mini-STRC:

Experimento Estado Prueba
1 STRC completo + TMEM145 Completado (ipTM 0,47) Interacción de referencia
2 Mini-STRC + TMEM145 Completado (ipTM 0,43) N-terminal prescindible (0,43 vs 0,47 referencia)
3 Mutante STRC E1659A (solo) En progreso ¿La mutación de Misha rompe el plegamiento?
4 STRC tipo salvaje (solo) Completado (pTM 0,63) Referencia: 16% desordenado (N-terminal arrastra la puntuación)
5 Mini-STRC solo Completado (pTM 0,81) ¡SÍ! Mini-STRC se pliega excelentemente (7% desordenado)
6 Solo N-terminal (1-615) Completado (pTM 0,27) CONFIRMADO: 38% desordenado, pTM 0,27
Job 1 · Job 3 · Job 2 · Job 4 · Job 5 · Job 6
13

Escribí a los investigadores

Envié correos electrónicos a los principales investigadores que trabajan en terapia génica STRC en instituciones de Estados Unidos, Francia y China. Compartí la evidencia de reclasificación, la hipótesis mini-STRC y un enlace a este sitio web.

Recibí respuestas alentadoras que confirman que el enfoque computacional es sólido y que el análisis ha sido compartido con equipos de investigación que trabajan en terapia génica STRC.