我是一位没有科学背景的父亲,从事技术和创意制作工作。以下是我的每一个步骤,详细记录,以便任何面临相同处境的人都能够复现。
Michael的全外显子组测序(WES)报告来自香港儿童医院(实验室编号:23C7500174,2022年12月),列出了两个STRC变异。一个被标注为"致病性"(父系来源的全基因缺失,经MLPA确认)。另一个被标注为"意义不明变异(VUS)"(母系来源的单碱基改变,经Sanger测序确认):NM_153700.2:c.4976A>C p.(Glu1659Ala)。我需要了解:这第二个变异是否真的有害?
我在UniProt上搜索"STRC",找到静纤毛蛋白的编号为Q7RTU9。然后在AlphaFold中找到该蛋白的预测三维结构。1659位点的置信度评分(pLDDT)为95.69(满分100),说明该位点的结构预测非常可靠。
AlphaMissense是Google DeepMind开发的工具,用于预测蛋白质突变是否有害。我下载了静纤毛蛋白的预测文件,并搜索"E1659A"(E = 谷氨酸,原始氨基酸;A = 丙氨酸,Michael的变异)。
结果:0.9016/1.0(可能致病)。超过0.564即认为可能有害。我随后检查了1659位点所有其他19种可能的改变,每一种评分均在0.846以上。这意味着1659位点在结构上至关重要:任何改变都会破坏蛋白质功能。
| protein_variant | am_pathogenicity | am_class |
| E1659A | 0.9016 | LPath |
| E1659D | 0.9483 | LPath |
| E1659G | 0.9191 | LPath |
| ... 全部19种替换:LPath(0.846-0.999) | ||
如果某个位点对蛋白质功能重要,那么它在不同物种中应该是相同的氨基酸。我从UniProt下载了9个哺乳动物(人、小鼠、大鼠、牛、猴、猪、狗、蝙蝠、熊)的静纤毛蛋白序列,并在每个物种中搜索1659位点周围的基序。
结果:100%保守。所有9个物种在该位点均含有谷氨酸(E)。周围13个残基的基序(PEIFTEIGTIAAG)在约8000万年的进化历史中完全相同。这是ACMG标准下的PP1支持证据。
通常,遗传学家使用SIFT、PolyPhen-2和CADD来检验变异。我通过Ensembl VEP API尝试了三者,均对该变异无结果返回。
原因:STRC在15号染色体上有一个几乎完全相同的"孪生"基因(称为STRCP1的假基因),会干扰基于序列比对的工具。这正是AlphaMissense对STRC独特重要的原因:它基于蛋白质三维结构而非DNA序列,因此不受假基因影响。
ACMG/AMP指南(Richards et al., 2015)是遗传学家对变异进行分类的标准框架。每项证据均有代码和强度等级。我学习了规则并加以应用:
2项中等证据 + 1项支持证据 = VUS(VUS-high)。去除PP1后,未达到按ACMG联合规则(表5)的可能致病阈值。根据Holt实验室框架(波士顿儿童医院/哈佛大学),该变异亚分类为VUS-high——一个被许多临床试验机构认可的类别,可考虑纳入隐性疾病研究(当一个等位基因为P/LP时)。
我将所有证据整理成正式信函,呈送香港儿童医院化学病理学实验室,请求将该变异从VUS重分类为可能致病性变异。附件包括AlphaMissense数据、保守性分析和ACMG标准分解。我还建立了本网站,使证据透明、可复现,供审阅该病例的任何人查阅。
如果医院接受重分类,Michael的分子诊断将得到确认:双等位基因致病性STRC(DFNB16)。这是参与未来基因治疗临床试验的前提。双AAV基因治疗已在STRC缺陷小鼠中恢复了听力(Iranfar et al., 2026年1月)。人体临床试验预计将在2-3年内启动。届时Michael将年满7-8岁。
一旦我学会了如何阅读蛋白质结构,我意识到自己可以走得更远。我并非遗传学家,但这些工具是免费的,而我儿子的未来或许取决于有人提出正确的问题。于是我继续前行。
与其替换整个基因,能否只修复那一个错误的碱基?我从Ensembl下载了Michael变异周围的基因组序列,检验基因编辑工具能否将其靶向。
碱基编辑(CBE/ABE):无法修复此变异(C>A颠换超出其编辑范围)。先导编辑:可行。我在距突变位点仅4个碱基对处找到了合适的PAM位点。先导编辑器理论上可以纠正该单碱基改变,但此方案尚未在内耳细胞中得到验证。
目前STRC基因治疗需要两个病毒载体(双AAV),因为基因太长无法装入一个。两个病毒意味着效率更低:两者必须同时进入同一细胞。我分析了AlphaFold结构,注意到前约600个氨基酸的结构置信度极低(pLDDT低于50),提示它们可能无法形成稳定结构,也许是可删除的。
若删除这些区域,剩余的"mini-静纤毛蛋白"(1076个氨基酸,3228 bp)可装入单个AAV载体。这是计算假说,需要实验室验证。但先例已经存在:微型肌营养不良蛋白(删除肌营养不良蛋白的非必需部分)目前已进入肌营养不良症治疗的III期临床试验。
为进一步验证mini-STRC假说,我向AlphaFold 3服务器提交了任务,预测静纤毛蛋白与其相互作用伴侣TMEM145结合的三维结构(TMEM145是2025年《自然通讯》最新发现的静纤毛蛋白功能必需蛋白)。
首批结果已获取(任务1)。ipTM = 0.47,pTM = 0.48。直接结合置信度较低。PAE矩阵分析显示最佳链间接触位于N端残基174-185(但PAE值仍较差,为8.6 A)。
随后我又提交了5个任务,系统性地检验mini-STRC假说:
| # | 实验 | 状态 | 测试内容 |
|---|---|---|---|
| 1 | 完整STRC + TMEM145 | 完成(ipTM 0.47) | 基线相互作用 |
| 2 | Mini-STRC + TMEM145 | 完成(ipTM 0.43) | N端可删除(0.43对0.47基线) |
| 3 | STRC E1659A突变体(单独) | 进行中 | Misha的突变会破坏折叠吗? |
| 4 | STRC野生型(单独) | 完成(pTM 0.63) | 基线:16%无序(N端拉低分数) |
| 5 | Mini-STRC单独 | 完成(pTM 0.81) | 是!Mini-STRC折叠极佳(7%无序) |
| 6 | 仅N端(1-615) | 完成(pTM 0.27) | 已确认:38%无序,pTM 0.27 |
| 7 | mini-STRC + Piezo2 CED | 已提交 | mini-STRC是否与机械敏感通道相互作用? |
| 8 | NFATC1 + Calcineurin A/B | 已完成(ipTM 0.73) | 已验证:CnA-CnB ipTM 0.91,NFAT-CnA ipTM 0.72。级联已确认 |
我向美国、法国和中国从事STRC基因治疗研究的顶尖科学家发送了电子邮件,分享了重分类证据、mini-STRC假说以及本网站的链接。
我收到了令人鼓舞的回复,确认计算方法思路正确,相关分析已转达给正在从事STRC基因治疗研究的团队。
第三天,我们提出了一个改变研究方向的问题:与其使用持续开启的组成型启动子,不如使用一个响应声音的启动子?毛细胞已经能将声音转化为钙信号。这是一个我们可以利用的内置传感器。
毛细胞具有机械换能(MET)通道,当声音使其静纤毛偏转时会开放。Ca²⁺流入,激活钙调磷酸酶-NFAT信号通路。该通路在声遗传学文献中已被充分描述(Wu et al., Nature Communications 2023),研究人员利用它实现了62倍基因诱导,且三周内零背景泄漏。
我们设计了一个构建体:6xNFAT启动子 + mini-STRC。6xNFAT启动子是一个含有6个NFAT响应元件拷贝的合成元件,形成一个需要持续钙信号才能激活的协同数字开关。结合mini-STRC(来自第2天),总构建体为3,893 bp,在4,700 bp的AAV包装限制内尚有807 bp余量。
为了超越推测,我们建立了完整信号级联的ODE(常微分方程)模型:声音强度 → MET通道开放概率 → Ca²⁺内流 → 钙调磷酸酶激活 → NFAT核转位 → 转录 → 翻译 → 蛋白质积累。每个参数均来自同行评审文献。
结果:在现实的助听器使用时间表下(白天16小时开启,夜间8小时关闭),模型预测仅需13小时即可达到治疗性立体纤毛蛋白水平(每个OHC >15,000个分子)。在安静环境中,系统仅产生目标值的6.8%(启动子实际上处于关闭状态)。完整Python代码已在GitHub上发布,供任何人复现或扩展。
为从结构上验证机械敏感假设,我们提交了两项新的AlphaFold 3任务。任务7:mini-STRC + Piezo2 CED(立体纤毛蛋白是否与机械敏感通道发生物理接触?)。任务8:NFATC1 + Calcineurin A/B(阳性对照,验证级联模型)。
结果待定。如果任务7显示高ipTM(>0.6),则意味着立体纤毛蛋白直接与Piezo2相互作用,暗示存在反馈回路:STRC缺陷不仅影响结构连接,还影响机械感应本身。
基因治疗目前需要手术注射至耳蜗。如果超声波能够非侵入性地将治疗药物推过圆窗膜呢?我查阅了相关文献,发现微泡+超声波可在圆窗膜中产生临时小孔(Shih et al. 2019:渗透性提高5.2倍,24小时内完全恢复,零听力损伤)。
我建立了完整递送链的ODE模型:超声波 → 小孔形成 → 纳米粒子扩散 → 细胞摄取 → 蛋白质产生。诚实的结果:基础参数不足(每次0.39%,需258次)。使用可离子化脂质的优化LNPs:每次78%,共2次。瓶颈在于内体逃逸,而非超声波。最现实的路径:一次性AAV手术,多年后若表达减弱,再进行非侵入性LNP补充。