Recherche privée DFNB16

STRC c.4976 AC

I asked AI what that means. Came up with a variant pathogenicity analysis and a new hypothesis.

Mon fils Michael a 4 ans et entend mal. Son test génétique indique qu'il possède deux copies non fonctionnelles du gène STRC. L'une est confirmée pathogène. L'autre est un « Variant de signification incertaine ». Cette classification l'exclut des futurs essais cliniques de thérapie génique.

Je ne suis pas généticien. Je travaille dans la technologie, la production créative et l'éducation à l'IA. J'ai donc utilisé des outils d'IA pour étudier ce variant moi-même. J'ai trouvé des preuves computationnelles en faveur d'une reclassification, confirmé que la position est conservée chez tous les mammifères, et découvert que les outils génétiques standard échouent pour ce gène en raison d'un pseudogène. J'ai soumis une demande formelle de reclassification à l'hôpital.

Puis j'ai continué. J'ai analysé si une protéine plus courte pouvait tenir dans un seul vecteur de thérapie génique. J'ai vérifié si CRISPR pouvait corriger la mutation spécifique. J'ai écrit aux chercheurs qui ont été les pionniers de la thérapie génique STRC. J'ai reçu des réponses encourageantes.

La science ne devrait pas être enfermée derrière du jargon. Il y a un podcast et une vidéo ci-dessous (générés par IA) pour ceux qui préfèrent écouter plutôt que parcourir des structures protéiques.

Listen to podcast
AI-generated · NotebookLM
Watch video overview
AI-generated · NotebookLM
Built with OpenClaw (free, open source) + Claude Opus 4.6 (API, ~$50-100) + AlphaFold + AlphaFold 3 + AlphaMissense + UniProt + Ensembl (all free)
Egor et Michael

Egor et Michael, Hong Kong

AlphaMissense
0.9016
Probablement pathogène
AlphaFold pLDDT
95.69
Très haute confiance
Score REVEL
0.65
Prédit délétère
Conservation
9/9
Mammifères conservés
Partie 1

Preuves de reclassification

Preuves computationnelles en faveur de la reclassification de VUS en Probablement pathogène pour NM_153700.2:c.4976A>C p.(Glu1659Ala)

Saturation AlphaMissense

Toutes les substitutions d'acides aminés possibles à la position 1659 sont prédites Probablement pathogènes. Cette position est structuralement invariante : toute modification altère la protéine.

EW
0.9997
EF
0.9992
EP
0.9985
EC
0.9984
EY
0.9981
EL
0.9929
EH
0.9927
EI
0.9923
EM
0.9909
EN
0.9822
ET
0.9666
EV
0.9664
ER
0.9634
ED
0.9483
ES
0.9433
EK
0.9272
EG
0.9191
EA
0.9016 MISHA
EQ
0.8460
Seuil : Probablement pathogène > 0,564 | Ambigu 0,340-0,564 | Probablement bénin < 0,340

Conservation évolutive

NOUVEAU

E1659 est conservé à 100 % chez tous les mammifères testés, couvrant ~80 millions d'années d'évolution. Le motif environnant PEIFTEIGTIAAG est identique dans chaque espèce.

Espèce Position Résidu Contexte
Humain1659EPEIFTEIGTIAAG
Souris1693EPEIFTEIGTIAAG
Rat1693EPEIFTEIGTIAAG
Vache1647EPEIFTEIGTIAAG
Singe vert1659EPEIFTEIGTIAAG
Porc1650EPEIFTEIGTIAAG
Chien1649EPEIFTEIGTIAAG
Chauve-souris1646EPEIFTEIGTIAAG
Ours1643EPEIFTEIGTIAAG

9/9 espèces conservent l'acide glutamique (E) à cette position. Le motif de 13 résidus environnant (PEIFTEIGTIAAG) est identique chez tous les mammifères testés. Ce niveau de conservation suggère fortement une importance fonctionnelle et soutient la pathogénicité de toute substitution (preuve PP1 Soutien selon les critères ACMG). Source des données : séquences orthologues UniProt, alignement par motif.

Structure protéique 3D

Stéréocilline (Q7RTU9, 1775 aa) issue d'AlphaFold v6. Position E1659 en surbrillance magenta. Faites glisser pour tourner, défilez pour zoomer.

Protéine entière

Couleur : confiance pLDDT (bleu=haute, rouge=basse)

Gros plan E1659

Chaîne latérale acide glutamique en représentation bâton

Type sauvage : Acide glutamique (E)

  • Charge : Négative (-1)
  • Volume chaîne latérale : 138,4 A3
  • Capacité liaison hydrogène : Donneur + Accepteur
  • Rôle : ponts salins, interactions électrostatiques

Mutant : Alanine (A)

  • Charge : Neutre (0)
  • Volume chaîne latérale : 67,0 A3 (-52%)
  • Capacité liaison hydrogène : Aucune
  • Impact : perte de charge, perte de liaisons H, création de cavité

Pourquoi AlphaMissense est crucial pour STRC

Le problème du pseudogène STRC

STRC possède un pseudogène presque identique (STRCP1) situé adjacent sur le chromosome 15q15.3. Cela entraîne l'échec de la plupart des outils computationnels standard pour les variants STRC :

SIFT
Retourne null pour E1659A. Impossible d'aligner STRC de manière fiable à cause du pseudogène.
PolyPhen-2
Retourne null. Même problème d'alignement pseudogène.
CADD
Pas de score disponible pour cette position. Mapping des coordonnées génomiques affecté par le pseudogène.
AlphaMissense
Fonctionne. Utilise la prédiction de structure protéique (AlphaFold), pas l'alignement génomique. Immunisé contre l'interférence du pseudogène. Score : 0,9016.

AlphaMissense est particulièrement précieux pour STRC car il prédit la pathogénicité à partir de la structure protéique, contournant l'étape d'alignement de séquences où le pseudogène STRCP1 provoque l'échec des autres outils. REVEL (0,65) fournit également une prédiction concordante, utilisant une approche d'ensemble qui atténue partiellement ce problème.

Classification ACMG

Critère Force Preuve
PM3 Modérée Détecté en trans avec une délétion pathogène de gène entier (paternelle confirmée)
PP3_Moderate Modérée AlphaMissense 0,9016 + REVEL 0,65 concordants (seuil Pejaver 2022)
PM2_Supporting Soutien Absent de gnomAD (0 allèle chez 251 000+ individus)
PP1_Supporting Soutien E1659 conservé à 100 % chez 9 espèces mammifères (~80 millions d'années). Motif identique PEIFTEIGTIAAG.
Résultat : Probablement pathogène

2 Modérées + 2 Soutien = Probablement pathogène selon les règles de combinaison ACMG/AMP 2015

Partie 2

Hypothèses de recherche

Hypothèses computationnelles pour accélérer la thérapie génique STRC. Une validation expérimentale est nécessaire.

Hypothèse Mini-STRC

NOUVEAU COMPUTATIONNEL

La thérapie génique STRC actuelle nécessite deux vecteurs AAV car le gène (5 325 pb) dépasse la limite d'encapsidation d'un seul AAV (~4 400 pb utilisables). L'analyse structurale AlphaFold suggère qu'une approche monovec pourrait être possible.

Le problème d'encapsidation

ADNc STRC complet 5325 bp
Limite AAV (avec promoteur/ITR) ~4400 bp
Mini-STRC (prédit) 3984 bp

Ce qu'AlphaFold révèle

AlphaFold prédit la structure de la stéréocilline avec une confiance variable le long de la protéine. La région N-terminale (résidus 1-615) présente une très faible confiance (pLDDT < 50), indiquant qu'elle est probablement intrinsèquement désordonnée sans structure 3D stable. Le cœur fonctionnel commence vers le résidu 616.

E1659
couper ici
1 N-terminal (désordonné) Domaine LRR C-terminal (cœur fonctionnel) 1775

À retirer (447 aa, 1341 pb)

  • 23-114 N-terminal désordonné (pLDDT 30,6)
  • 132-251 Région désordonnée (pLDDT 37,0)
  • 309-387 Boucles désordonnées (pLDDT 38-47)
  • 449-485 Boucle désordonnée (pLDDT 47,5)
  • 496-615 Grande région désordonnée (pLDDT 31,1)

Toutes les régions ont un pLDDT < 50 (aucune structure stable prédite)

À conserver (1328 aa, 3984 pb)

  • 1-22 Peptide signal (sécrétion)
  • 616-1074 Domaine LRR (interactions protéiques)
  • 1075-1775 C-terminal (ancrage membrane tectoriale)
  • 1659 Position du variant de Misha (préservée)
  • 8 sites de glycosylation dans le cœur fonctionnel préservés

3984 pb tient dans un seul AAV (< 4400 pb)

Précédent : micro-dystrophine

Cette approche a un précédent démontré. Le gène de la dystrophine (11 000 pb) était trop grand pour tout AAV. Des chercheurs ont créé la « micro-dystrophine » en supprimant des répétitions spectrine non essentielles, la faisant tenir dans un seul AAV. Elle est maintenant en essai de phase 3 (Sarepta SRP-9001). Le même principe : identifier le cœur structural, retirer les régions désordonnées/redondantes, préserver la fonction. Personne n'a encore essayé cela pour STRC.

Important : Il s'agit d'une hypothèse computationnelle fondée sur les prédictions structurales d'AlphaFold. Une validation expérimentale est nécessaire : la mini-stéréocilline se replie-t-elle correctement ? Se localise-t-elle aux extrémités des stéréocils ? Forme-t-elle des connecteurs horizontaux supérieurs et des attachements à la membrane tectoriale ? Ces questions nécessitent un travail en laboratoire. Mais les données structurales suggèrent fortement que la région N-terminale est dispensable et qu'une approche mini-STRC à vecteur unique mérite d'être étudiée.

Expériences AlphaFold 3

6 TÂCHES

Test computationnel systématique de l'hypothèse mini-STRC et de l'impact du variant. Modèles 3D rendus en direct depuis les fichiers CIF d'AlphaFold 3. Faites glisser pour tourner, défilez pour zoomer.

Constat clé

Mini-STRC (sans N-terminal) atteint pTM 0,81, significativement meilleur que le type sauvage pleine longueur (pTM 0,63). La région N-terminale supprimée ne score que pTM 0,27 avec 38% de désordre. La suppression du N-terminal désordonné produit une protéine mieux repliée qui tient dans un seul vecteur AAV.

Peut-on corriger juste cette seule lettre ?

COMPUTATIONNEL

Au lieu de remplacer le gène STRC entier (5325 pb), et si on ne corrigeait que la seule base mutée ? Il existe trois types d'outils d'édition génique. J'ai vérifié chacun contre le variant spécifique de Michael.

La mutation de Michael : une seule mauvaise lettre
Sain : ...AATTTACAGTG...
Michael : ...AATTTCCAGTG...
On doit changer C en A. C'est une transversion C>A.
CBE (Éditeur de base Cytosine)
Ce qu'il fait :
C T seulement
On a besoin de C→A. CBE ne peut faire que C→T.
Ne peut pas corriger ce variant
ABE (Éditeur de base Adénine)
Ce qu'il fait :
A G seulement
Direction totalement opposée. Sans rapport ici.
Ne peut pas corriger ce variant
Prime Editor
Ce qu'il fait :
any any (toutes les 12 substitutions)
C→A inclus. Nécessite un site PAM à proximité.
PEUT corriger ce variant
Site PAM trouvé : à 4 pb du variant

L'édition prime nécessite un « pad d'atterrissage » (site PAM, séquence NGG) près de la cible. J'ai téléchargé la séquence génomique depuis l'API REST Ensembl et recherché des motifs NGG dans un rayon de 15 pb du variant.

chr15:43600521-43600581 (GRCh38)
CCCAGCTCCCCACCTGCTATGGTGCCCCAATTT[C]AGTGAAGATCTCAGG
..........................PAM↑....↑variant
..........................4bp apart
Comment j'ai trouvé : L'API Ensembl retourne la séquence génomique. J'ai cherché « CC » (complément inverse du PAM NGG) dans un rayon de 15 pb de la position 43600551. Trouvé à 4 pb de distance. C'est dans la fenêtre d'édition optimale du prime editing (0-13 pb).

Réalité : L'édition prime n'a pas été testée dans les cellules ciliées de l'oreille interne in vivo. La livraison du prime editor + ARN guide aux cellules ciliées externes profondes dans la cochlée est un défi non résolu. Mais cette analyse confirme que le variant spécifique de Michael est techniquement ciblable. Si la livraison est résolue (un domaine de recherche actif), cette mutation peut être corrigée au niveau de l'ADN.

Partie 3

Comment j'ai procédé

Méthodologie étape par étape pour que chacun puisse reproduire ces résultats

Day 1, evening

Je suis un père sans formation scientifique. Je travaille dans la technologie et la production créative. Voici exactement ce que j'ai fait, étape par étape, pour que toute personne dans la même situation puisse le reproduire.

1

J'ai commencé avec le rapport génétique de mon fils

Le rapport WES de Michael de l'Hôpital pour enfants de Hong Kong (Nº de labo : 23C7500174, décembre 2022) listait deux variants STRC. L'un était étiqueté « Pathogène » (une délétion de gène entier venant de son père, confirmée par MLPA). L'autre était étiqueté « Variant de signification incertaine » (un changement de lettre venant de sa mère, confirmé par séquençage Sanger) : NM_153700.2:c.4976A>C p.(Glu1659Ala). Je devais savoir : ce deuxième variant est-il réellement délétère ?

Ce dont vous avez besoin : le rapport du test génétique de votre enfant avec la nomenclature exacte du variant (nom du gène, notation c., notation p.).
2

J'ai trouvé la protéine dans AlphaFold

J'ai cherché « STRC » sur UniProt et découvert que l'identifiant de la stéréocilline est Q7RTU9. Puis j'ai consulté AlphaFold et trouvé la structure 3D prédite de la protéine. Le score de confiance (pLDDT) à la position 1659 était de 95,69 sur 100, ce qui signifie que la prédiction de structure à cet endroit est très fiable.

Étape A : Aller sur uniprot.org, chercher le nom de votre gène, noter l'identifiant d'accession UniProt
Étape B : Aller sur alphafold.ebi.ac.uk/entry/[VOTRE_ID], vérifier le pLDDT à la position de votre variant
uniprot.org
Q7RTU9 · STRC_HUMAN
Stéréocilline · 1 775 aa
Gène : STRC · Organisme : Homo sapiens
alphafold.ebi.ac.uk
AF-Q7RTU9-F1 (v6)
pLDDT à pos. 1659 : 95,69
Structure de très haute confiance
3

J'ai utilisé AlphaMissense (la découverte clé)

AlphaMissense est un outil de Google DeepMind qui prédit si une mutation protéique est nocive. J'ai téléchargé le fichier de prédictions pour la stéréocilline et cherché « E1659A » (E = acide glutamique, l'acide aminé original ; A = alanine, le variant de Michael).

Le résultat : 0,9016 sur 1,0 (Probablement pathogène). Tout score supérieur à 0,564 est considéré probablement délétère. J'ai ensuite vérifié les 19 autres changements possibles à la position 1659. Chacun a obtenu un score supérieur à 0,846. Cela signifie que la position 1659 est structuralement critique : tout changement détériore la protéine.

Comment : Télécharger ce fichier CSV (prédictions AlphaMissense pour STRC)
Puis : Ouvrir dans Excel ou Google Sheets, chercher votre variant (ex. « E1659A »). Score > 0,564 = Probablement pathogène
Pour d'autres gènes : Remplacer Q7RTU9 par l'identifiant UniProt de votre protéine dans l'URL
AF-Q7RTU9-F1-aa-substitutions.csv (filtré)
protein_variantam_pathogenicityam_class
E1659A0.9016LPath
E1659D0.9483LPath
E1659G0.9191LPath
... 19 substitutions au total : LPath (0,846-0,999)
4

J'ai vérifié la conservation évolutive

Si une position est importante pour la protéine, elle devrait être le même acide aminé chez différentes espèces. J'ai téléchargé les séquences de stéréocilline de 9 mammifères sur UniProt (humain, souris, rat, vache, singe, porc, chien, chauve-souris, ours) et cherché le motif autour de la position 1659 dans chacune.

Résultat : 100 % conservé. Les 9 espèces possèdent l'acide glutamique (E) à cette position. Le motif de 13 résidus environnant (PEIFTEIGTIAAG) est identique sur ~80 millions d'années d'évolution. Il s'agit d'une preuve PP1 Soutien selon les critères ACMG.

Puis : Télécharger le FASTA de chaque espèce, chercher un motif unique près de la position de votre variant
Raccourci : Si l'acide aminé + les résidus environnants sont identiques chez les mammifères, la position est conservée
5

J'ai essayé les outils standard (ils ont échoué)

Normalement, les généticiens utilisent SIFT, PolyPhen-2 et CADD pour vérifier les variants. J'ai tout essayé via l'API Ensembl VEP. Tous ont retourné aucun résultat pour ce variant.

La raison : STRC possède un « jumeau » presque identique adjacent sur le chromosome 15 (un pseudogène appelé STRCP1) qui perturbe les outils basés sur l'alignement de séquences. C'est pourquoi AlphaMissense est particulièrement important pour STRC : il fonctionne à partir de la structure 3D de la protéine, pas de la séquence ADN, donc le pseudogène ne l'affecte pas.

Vérifier : API Ensembl VEP pour ce variant (ne retourne aucun SIFT/PolyPhen)
Note : Si votre gène n'a pas de pseudogène, SIFT/PolyPhen peuvent fonctionner. Vérifier votre gène sur NCBI d'abord
6

J'ai appliqué les règles de classification ACMG

Les recommandations ACMG/AMP (Richards et al., 2015) constituent le cadre standard utilisé par les généticiens pour classifier les variants. Chaque élément de preuve reçoit un code et un niveau de force. J'ai appris les règles et les ai appliquées :

  • PM3 (Modérée) : Le variant a été trouvé en trans avec une délétion pathogène connue (un variant venant de chaque parent, confirmé par test parental). Règles ClinGen SVI
  • PP3_Modérée (Modérée) : Deux outils computationnels concordants prédisent la pathogénicité : AlphaMissense (0,9016) + REVEL (0,65). Rehaussé de Soutien à Modéré selon Pejaver et al. 2022
  • PM2_Soutien (Soutien) : Absent de gnomAD (0 allèle chez 251 000+ individus)
  • PP1_Soutien (Soutien) : Position 100 % conservée chez 9 espèces mammifères (voir Étape 4)

2 Modérées + 2 Soutien = Probablement pathogène. Selon les règles de combinaison ACMG (Tableau 5), cela satisfait le seuil de classification Probablement pathogène.

7

J'ai écrit à l'hôpital

J'ai rassemblé toutes les preuves dans une lettre formelle adressée au Laboratoire de pathologie chimique de l'Hôpital pour enfants de Hong Kong, demandant une révision de la reclassification du variant de VUS à Probablement pathogène. J'ai joint les données AlphaMissense, l'analyse de conservation et le détail des critères ACMG. J'ai également construit ce site web pour que les preuves soient transparentes, reproductibles et accessibles à toute personne examinant le cas.

8

Ce qui se passe ensuite

Si l'hôpital accepte la reclassification, le diagnostic moléculaire de Michael sera confirmé : STRC biallélique pathogène (DFNB16). C'est une condition préalable pour les futurs essais cliniques de thérapie génique. La thérapie génique double-AAV a déjà restauré l'audition chez des souris déficientes en STRC (Iranfar et al., janvier 2026). Les essais chez l'humain sont attendus dans 2 à 3 ans. Michael aura 7-8 ans.

Au-delà de la reclassification

Les questions ne s'arrêtaient pas

La reclassification est l'objectif immédiat. Mais une fois qu'on commence à poser des questions, on ne peut plus s'arrêter. Peut-on rendre le gène plus petit ? Corriger juste une lettre ? Et si on le testait computationnellement avant que quelqu'un dépense un euro en laboratoire ? Ce ne sont pas des insights de génie. Ce sont des questions évidentes. La différence, c'est d'avoir un agent IA qui peut aller chercher les réponses.

10

J'ai demandé : CRISPR pourrait-il corriger juste cette lettre ?

Au lieu de remplacer tout le gène, et si on pouvait corriger juste la mauvaise lettre ? Claude a téléchargé la séquence génomique autour du variant de Michael depuis Ensembl et vérifié si des outils d'édition génique pouvaient le cibler.

Édition de base (CBE/ABE) : ne peut pas corriger ce variant (la transversion C>A est hors de leur portée). Prime editing : faisable. Claude a trouvé un site PAM adapté à seulement 4 paires de bases de la mutation. Un prime editor pourrait théoriquement corriger le changement de base unique, bien que cette approche n'ait pas encore été testée dans les cellules de l'oreille interne.

11

J'ai demandé : peut-on raccourcir le gène pour tenir dans un seul virus ?

La thérapie génique actuelle pour STRC nécessite deux virus (dual-AAV) car le gène est trop long pour un seul. Deux virus signifie une efficacité réduite : les deux doivent entrer dans la même cellule. Claude a analysé la structure AlphaFold et identifié que les premiers ~600 acides aminés ont une très faible confiance structurale (pLDDT inférieur à 50), suggérant qu'ils ne forment peut-être pas une structure stable et pourraient être dispensables.

Si ces régions sont retirées, la « mini-stéréocilline » restante (1328 aa, 3984 pb) tient dans un seul vecteur AAV. C'est une hypothèse computationnelle. Il faut des tests en laboratoire. Mais le précédent existe : la micro-dystrophine (supprimant les parties non essentielles de la dystrophine) est maintenant en essais de phase 3 pour la dystrophie musculaire.

12

J'ai demandé : ces protéines interagissent-elles vraiment ?

Pour tester davantage l'idée mini-STRC, nous avons soumis une tâche au serveur AlphaFold 3 pour prédire la structure 3D de la stéréocilline liée à son partenaire d'interaction TMEM145 (une protéine récemment découverte comme essentielle pour la fonction de la stéréocilline, Nature Communications 2025).

Premiers résultats reçus (Tâche 1). ipTM = 0,47, pTM = 0,48. Faible confiance dans la liaison directe. L'analyse de la matrice PAE montre les meilleurs contacts inter-chaînes aux résidus N-terminaux 174-185 (mais encore médiocres à 8,6 A).

J'ai ensuite soumis 5 autres tâches pour tester systématiquement l'hypothèse mini-STRC :

Expérience Statut Tests
1 STRC complet + TMEM145 Terminé (ipTM 0,47) Interaction de base
2 Mini-STRC + TMEM145 Terminé (ipTM 0,43) N-terminal dispensable (0,43 vs 0,47 base)
3 Mutant STRC E1659A (solo) En cours La mutation de Misha brise-t-elle le repliement ?
4 STRC type sauvage (solo) Terminé (pTM 0,63) Base : 16% désordonné (N-terminal tire le score)
5 Mini-STRC solo Terminé (pTM 0,81) OUI ! Mini-STRC se replie excellemment (7% désordonné)
6 N-terminal seul (1-615) Terminé (pTM 0,27) CONFIRMÉ : 38% désordonné, pTM 0,27
Job 1 · Job 3 · Job 2 · Job 4 · Job 5 · Job 6
13

J'ai écrit aux chercheurs

J'ai envoyé des e-mails aux principaux chercheurs travaillant sur la thérapie génique STRC dans des institutions aux États-Unis, en France et en Chine. J'ai partagé les preuves de reclassification, l'hypothèse mini-STRC et un lien vers ce site web.

J'ai reçu des réponses encourageantes confirmant que l'approche computationnelle est solide et que l'analyse a été partagée avec des équipes de recherche travaillant sur la thérapie génique STRC.