I asked AI what that means. Came up with a variant pathogenicity analysis and a new hypothesis.
Mon fils Michael a 4 ans et entend mal. Son test génétique indique qu'il possède deux copies non fonctionnelles du gène STRC. L'une est confirmée pathogène. L'autre est un « Variant de signification incertaine ». Cette classification l'exclut des futurs essais cliniques de thérapie génique.
Je ne suis pas généticien. Je travaille dans la technologie, la production créative et l'éducation à l'IA. J'ai donc utilisé des outils d'IA pour étudier ce variant moi-même. J'ai trouvé des preuves computationnelles en faveur d'une reclassification, confirmé que la position est conservée chez tous les mammifères, et découvert que les outils génétiques standard échouent pour ce gène en raison d'un pseudogène. J'ai soumis une demande formelle de reclassification à l'hôpital.
Puis j'ai continué. J'ai analysé si une protéine plus courte pouvait tenir dans un seul vecteur de thérapie génique. J'ai vérifié si CRISPR pouvait corriger la mutation spécifique. J'ai écrit aux chercheurs qui ont été les pionniers de la thérapie génique STRC. J'ai reçu des réponses encourageantes.
La science ne devrait pas être enfermée derrière du jargon. Il y a un podcast et une vidéo ci-dessous (générés par IA) pour ceux qui préfèrent écouter plutôt que parcourir des structures protéiques.
Egor et Michael, Hong Kong
Preuves computationnelles en faveur de la reclassification de VUS en Probablement pathogène pour NM_153700.2:c.4976A>C p.(Glu1659Ala)
Toutes les substitutions d'acides aminés possibles à la position 1659 sont prédites Probablement pathogènes. Cette position est structuralement invariante : toute modification altère la protéine.
E1659 est conservé à 100 % chez tous les mammifères testés, couvrant ~80 millions d'années d'évolution. Le motif environnant PEIFTEIGTIAAG est identique dans chaque espèce.
| Espèce | Position | Résidu | Contexte |
|---|---|---|---|
| Humain | 1659 | E | PEIFTEIGTIAAG |
| Souris | 1693 | E | PEIFTEIGTIAAG |
| Rat | 1693 | E | PEIFTEIGTIAAG |
| Vache | 1647 | E | PEIFTEIGTIAAG |
| Singe vert | 1659 | E | PEIFTEIGTIAAG |
| Porc | 1650 | E | PEIFTEIGTIAAG |
| Chien | 1649 | E | PEIFTEIGTIAAG |
| Chauve-souris | 1646 | E | PEIFTEIGTIAAG |
| Ours | 1643 | E | PEIFTEIGTIAAG |
9/9 espèces conservent l'acide glutamique (E) à cette position. Le motif de 13 résidus environnant (PEIFTEIGTIAAG) est identique chez tous les mammifères testés. Ce niveau de conservation suggère fortement une importance fonctionnelle et soutient la pathogénicité de toute substitution (preuve PP1 Soutien selon les critères ACMG). Source des données : séquences orthologues UniProt, alignement par motif.
Stéréocilline (Q7RTU9, 1775 aa) issue d'AlphaFold v6. Position E1659 en surbrillance magenta. Faites glisser pour tourner, défilez pour zoomer.
Couleur : confiance pLDDT (bleu=haute, rouge=basse)
Chaîne latérale acide glutamique en représentation bâton
STRC possède un pseudogène presque identique (STRCP1) situé adjacent sur le chromosome 15q15.3. Cela entraîne l'échec de la plupart des outils computationnels standard pour les variants STRC :
AlphaMissense est particulièrement précieux pour STRC car il prédit la pathogénicité à partir de la structure protéique, contournant l'étape d'alignement de séquences où le pseudogène STRCP1 provoque l'échec des autres outils. REVEL (0,65) fournit également une prédiction concordante, utilisant une approche d'ensemble qui atténue partiellement ce problème.
| Critère | Force | Preuve |
|---|---|---|
| PM3 | Modérée | Détecté en trans avec une délétion pathogène de gène entier (paternelle confirmée) |
| PP3_Moderate | Modérée | AlphaMissense 0,9016 + REVEL 0,65 concordants (seuil Pejaver 2022) |
| PM2_Supporting | Soutien | Absent de gnomAD (0 allèle chez 251 000+ individus) |
| PP1_Supporting | Soutien | E1659 conservé à 100 % chez 9 espèces mammifères (~80 millions d'années). Motif identique PEIFTEIGTIAAG. |
2 Modérées + 2 Soutien = Probablement pathogène selon les règles de combinaison ACMG/AMP 2015
Hypothèses computationnelles pour accélérer la thérapie génique STRC. Une validation expérimentale est nécessaire.
La thérapie génique STRC actuelle nécessite deux vecteurs AAV car le gène (5 325 pb) dépasse la limite d'encapsidation d'un seul AAV (~4 400 pb utilisables). L'analyse structurale AlphaFold suggère qu'une approche monovec pourrait être possible.
AlphaFold prédit la structure de la stéréocilline avec une confiance variable le long de la protéine. La région N-terminale (résidus 1-615) présente une très faible confiance (pLDDT < 50), indiquant qu'elle est probablement intrinsèquement désordonnée sans structure 3D stable. Le cœur fonctionnel commence vers le résidu 616.
Toutes les régions ont un pLDDT < 50 (aucune structure stable prédite)
3984 pb tient dans un seul AAV (< 4400 pb)
Cette approche a un précédent démontré. Le gène de la dystrophine (11 000 pb) était trop grand pour tout AAV. Des chercheurs ont créé la « micro-dystrophine » en supprimant des répétitions spectrine non essentielles, la faisant tenir dans un seul AAV. Elle est maintenant en essai de phase 3 (Sarepta SRP-9001). Le même principe : identifier le cœur structural, retirer les régions désordonnées/redondantes, préserver la fonction. Personne n'a encore essayé cela pour STRC.
Important : Il s'agit d'une hypothèse computationnelle fondée sur les prédictions structurales d'AlphaFold. Une validation expérimentale est nécessaire : la mini-stéréocilline se replie-t-elle correctement ? Se localise-t-elle aux extrémités des stéréocils ? Forme-t-elle des connecteurs horizontaux supérieurs et des attachements à la membrane tectoriale ? Ces questions nécessitent un travail en laboratoire. Mais les données structurales suggèrent fortement que la région N-terminale est dispensable et qu'une approche mini-STRC à vecteur unique mérite d'être étudiée.
Test computationnel systématique de l'hypothèse mini-STRC et de l'impact du variant. Modèles 3D rendus en direct depuis les fichiers CIF d'AlphaFold 3. Faites glisser pour tourner, défilez pour zoomer.
Interaction de faible confiance. Meilleur PAE inter-chaînes : 8,6 A au N-terminal.
La suppression N-terminale affecte à peine la liaison (0,43 vs 0,47). Confirme dispensable.
Aucun dommage structurel. Le repliement est intact. E1659A affecte la fonction, pas la structure.
Protéine entière. Le N-terminal tire le score vers le bas (16% désordonné).
La protéine tronquée se replie excellemment. 7% désordonné. Résultat clé.
Confirmé désordonné. 38% non structuré. Sûr à retirer.
Mini-STRC (sans N-terminal) atteint pTM 0,81, significativement meilleur que le type sauvage pleine longueur (pTM 0,63). La région N-terminale supprimée ne score que pTM 0,27 avec 38% de désordre. La suppression du N-terminal désordonné produit une protéine mieux repliée qui tient dans un seul vecteur AAV.
Au lieu de remplacer le gène STRC entier (5325 pb), et si on ne corrigeait que la seule base mutée ? Il existe trois types d'outils d'édition génique. J'ai vérifié chacun contre le variant spécifique de Michael.
L'édition prime nécessite un « pad d'atterrissage » (site PAM, séquence NGG) près de la cible. J'ai téléchargé la séquence génomique depuis l'API REST Ensembl et recherché des motifs NGG dans un rayon de 15 pb du variant.
Réalité : L'édition prime n'a pas été testée dans les cellules ciliées de l'oreille interne in vivo. La livraison du prime editor + ARN guide aux cellules ciliées externes profondes dans la cochlée est un défi non résolu. Mais cette analyse confirme que le variant spécifique de Michael est techniquement ciblable. Si la livraison est résolue (un domaine de recherche actif), cette mutation peut être corrigée au niveau de l'ADN.
Méthodologie étape par étape pour que chacun puisse reproduire ces résultats
Je suis un père sans formation scientifique. Je travaille dans la technologie et la production créative. Voici exactement ce que j'ai fait, étape par étape, pour que toute personne dans la même situation puisse le reproduire.
Le rapport WES de Michael de l'Hôpital pour enfants de Hong Kong (Nº de labo : 23C7500174, décembre 2022) listait deux variants STRC. L'un était étiqueté « Pathogène » (une délétion de gène entier venant de son père, confirmée par MLPA). L'autre était étiqueté « Variant de signification incertaine » (un changement de lettre venant de sa mère, confirmé par séquençage Sanger) : NM_153700.2:c.4976A>C p.(Glu1659Ala). Je devais savoir : ce deuxième variant est-il réellement délétère ?
J'ai cherché « STRC » sur UniProt et découvert que l'identifiant de la stéréocilline est Q7RTU9. Puis j'ai consulté AlphaFold et trouvé la structure 3D prédite de la protéine. Le score de confiance (pLDDT) à la position 1659 était de 95,69 sur 100, ce qui signifie que la prédiction de structure à cet endroit est très fiable.
AlphaMissense est un outil de Google DeepMind qui prédit si une mutation protéique est nocive. J'ai téléchargé le fichier de prédictions pour la stéréocilline et cherché « E1659A » (E = acide glutamique, l'acide aminé original ; A = alanine, le variant de Michael).
Le résultat : 0,9016 sur 1,0 (Probablement pathogène). Tout score supérieur à 0,564 est considéré probablement délétère. J'ai ensuite vérifié les 19 autres changements possibles à la position 1659. Chacun a obtenu un score supérieur à 0,846. Cela signifie que la position 1659 est structuralement critique : tout changement détériore la protéine.
| protein_variant | am_pathogenicity | am_class |
| E1659A | 0.9016 | LPath |
| E1659D | 0.9483 | LPath |
| E1659G | 0.9191 | LPath |
| ... 19 substitutions au total : LPath (0,846-0,999) | ||
Si une position est importante pour la protéine, elle devrait être le même acide aminé chez différentes espèces. J'ai téléchargé les séquences de stéréocilline de 9 mammifères sur UniProt (humain, souris, rat, vache, singe, porc, chien, chauve-souris, ours) et cherché le motif autour de la position 1659 dans chacune.
Résultat : 100 % conservé. Les 9 espèces possèdent l'acide glutamique (E) à cette position. Le motif de 13 résidus environnant (PEIFTEIGTIAAG) est identique sur ~80 millions d'années d'évolution. Il s'agit d'une preuve PP1 Soutien selon les critères ACMG.
Normalement, les généticiens utilisent SIFT, PolyPhen-2 et CADD pour vérifier les variants. J'ai tout essayé via l'API Ensembl VEP. Tous ont retourné aucun résultat pour ce variant.
La raison : STRC possède un « jumeau » presque identique adjacent sur le chromosome 15 (un pseudogène appelé STRCP1) qui perturbe les outils basés sur l'alignement de séquences. C'est pourquoi AlphaMissense est particulièrement important pour STRC : il fonctionne à partir de la structure 3D de la protéine, pas de la séquence ADN, donc le pseudogène ne l'affecte pas.
Les recommandations ACMG/AMP (Richards et al., 2015) constituent le cadre standard utilisé par les généticiens pour classifier les variants. Chaque élément de preuve reçoit un code et un niveau de force. J'ai appris les règles et les ai appliquées :
2 Modérées + 2 Soutien = Probablement pathogène. Selon les règles de combinaison ACMG (Tableau 5), cela satisfait le seuil de classification Probablement pathogène.
J'ai rassemblé toutes les preuves dans une lettre formelle adressée au Laboratoire de pathologie chimique de l'Hôpital pour enfants de Hong Kong, demandant une révision de la reclassification du variant de VUS à Probablement pathogène. J'ai joint les données AlphaMissense, l'analyse de conservation et le détail des critères ACMG. J'ai également construit ce site web pour que les preuves soient transparentes, reproductibles et accessibles à toute personne examinant le cas.
Si l'hôpital accepte la reclassification, le diagnostic moléculaire de Michael sera confirmé : STRC biallélique pathogène (DFNB16). C'est une condition préalable pour les futurs essais cliniques de thérapie génique. La thérapie génique double-AAV a déjà restauré l'audition chez des souris déficientes en STRC (Iranfar et al., janvier 2026). Les essais chez l'humain sont attendus dans 2 à 3 ans. Michael aura 7-8 ans.
La reclassification est l'objectif immédiat. Mais une fois qu'on commence à poser des questions, on ne peut plus s'arrêter. Peut-on rendre le gène plus petit ? Corriger juste une lettre ? Et si on le testait computationnellement avant que quelqu'un dépense un euro en laboratoire ? Ce ne sont pas des insights de génie. Ce sont des questions évidentes. La différence, c'est d'avoir un agent IA qui peut aller chercher les réponses.
Au lieu de remplacer tout le gène, et si on pouvait corriger juste la mauvaise lettre ? Claude a téléchargé la séquence génomique autour du variant de Michael depuis Ensembl et vérifié si des outils d'édition génique pouvaient le cibler.
Édition de base (CBE/ABE) : ne peut pas corriger ce variant (la transversion C>A est hors de leur portée). Prime editing : faisable. Claude a trouvé un site PAM adapté à seulement 4 paires de bases de la mutation. Un prime editor pourrait théoriquement corriger le changement de base unique, bien que cette approche n'ait pas encore été testée dans les cellules de l'oreille interne.
La thérapie génique actuelle pour STRC nécessite deux virus (dual-AAV) car le gène est trop long pour un seul. Deux virus signifie une efficacité réduite : les deux doivent entrer dans la même cellule. Claude a analysé la structure AlphaFold et identifié que les premiers ~600 acides aminés ont une très faible confiance structurale (pLDDT inférieur à 50), suggérant qu'ils ne forment peut-être pas une structure stable et pourraient être dispensables.
Si ces régions sont retirées, la « mini-stéréocilline » restante (1328 aa, 3984 pb) tient dans un seul vecteur AAV. C'est une hypothèse computationnelle. Il faut des tests en laboratoire. Mais le précédent existe : la micro-dystrophine (supprimant les parties non essentielles de la dystrophine) est maintenant en essais de phase 3 pour la dystrophie musculaire.
Pour tester davantage l'idée mini-STRC, nous avons soumis une tâche au serveur AlphaFold 3 pour prédire la structure 3D de la stéréocilline liée à son partenaire d'interaction TMEM145 (une protéine récemment découverte comme essentielle pour la fonction de la stéréocilline, Nature Communications 2025).
Premiers résultats reçus (Tâche 1). ipTM = 0,47, pTM = 0,48. Faible confiance dans la liaison directe. L'analyse de la matrice PAE montre les meilleurs contacts inter-chaînes aux résidus N-terminaux 174-185 (mais encore médiocres à 8,6 A).
J'ai ensuite soumis 5 autres tâches pour tester systématiquement l'hypothèse mini-STRC :
| N° | Expérience | Statut | Tests |
|---|---|---|---|
| 1 | STRC complet + TMEM145 | Terminé (ipTM 0,47) | Interaction de base |
| 2 | Mini-STRC + TMEM145 | Terminé (ipTM 0,43) | N-terminal dispensable (0,43 vs 0,47 base) |
| 3 | Mutant STRC E1659A (solo) | En cours | La mutation de Misha brise-t-elle le repliement ? |
| 4 | STRC type sauvage (solo) | Terminé (pTM 0,63) | Base : 16% désordonné (N-terminal tire le score) |
| 5 | Mini-STRC solo | Terminé (pTM 0,81) | OUI ! Mini-STRC se replie excellemment (7% désordonné) |
| 6 | N-terminal seul (1-615) | Terminé (pTM 0,27) | CONFIRMÉ : 38% désordonné, pTM 0,27 |
J'ai envoyé des e-mails aux principaux chercheurs travaillant sur la thérapie génique STRC dans des institutions aux États-Unis, en France et en Chine. J'ai partagé les preuves de reclassification, l'hypothèse mini-STRC et un lien vers ce site web.
J'ai reçu des réponses encourageantes confirmant que l'approche computationnelle est solide et que l'analyse a été partagée avec des équipes de recherche travaillant sur la thérapie génique STRC.
Tous les outils sont gratuits. AlphaFold 3 Server nécessite un compte Google. Tout le reste ne nécessite ni compte, ni clé API, ni programmation. Coût total : 0 €.