← Home
Part 3 — Methodology

How I Did This

Day 1, evening

我是一位没有科学背景的父亲,从事技术和创意制作工作。以下是我的每一个步骤,详细记录,以便任何面临相同处境的人都能够复现。

1

从儿子的基因报告开始

Michael的全外显子组测序(WES)报告来自香港儿童医院(实验室编号:23C7500174,2022年12月),列出了两个STRC变异。一个被标注为"致病性"(父系来源的全基因缺失,经MLPA确认)。另一个被标注为"意义不明变异(VUS)"(母系来源的单碱基改变,经Sanger测序确认):NM_153700.2:c.4976A>C p.(Glu1659Ala)。我需要了解:这第二个变异是否真的有害?

您需要准备:您孩子的基因检测报告,包含精确的变异命名(基因名称、c.标注、p.标注)。
2

在AlphaFold中查找蛋白质

我在UniProt上搜索"STRC",找到静纤毛蛋白的编号为Q7RTU9。然后在AlphaFold中找到该蛋白的预测三维结构。1659位点的置信度评分(pLDDT)为95.69(满分100),说明该位点的结构预测非常可靠。

步骤A:访问uniprot.org,搜索基因名称,记录UniProt登录号
步骤B:访问alphafold.ebi.ac.uk/entry/[您的编号],查看变异位点的pLDDT值
uniprot.org
Q7RTU9 · STRC_HUMAN
静纤毛蛋白 · 1,775个氨基酸
基因:STRC · 物种:智人
alphafold.ebi.ac.uk
AF-Q7RTU9-F1 (v6)
1659位点pLDDT:95.69
极高置信度结构
3

检查AlphaMissense(关键发现)

AlphaMissense是Google DeepMind开发的工具,用于预测蛋白质突变是否有害。我下载了静纤毛蛋白的预测文件,并搜索"E1659A"(E = 谷氨酸,原始氨基酸;A = 丙氨酸,Michael的变异)。

结果:0.9016/1.0(可能致病)。超过0.564即认为可能有害。我随后检查了1659位点所有其他19种可能的改变,每一种评分均在0.846以上。这意味着1659位点在结构上至关重要:任何改变都会破坏蛋白质功能。

方法:下载此CSV文件(STRC的AlphaMissense预测)
然后:用Excel或Google Sheets打开,搜索您的变异(如"E1659A")。评分 > 0.564 = 可能致病
其他基因:将URL中的Q7RTU9替换为您蛋白质的UniProt编号
AF-Q7RTU9-F1-aa-substitutions.csv(筛选后)
protein_variantam_pathogenicityam_class
E1659A0.9016LPath
E1659D0.9483LPath
E1659G0.9191LPath
... 全部19种替换:LPath(0.846-0.999)
4

检查进化保守性

如果某个位点对蛋白质功能重要,那么它在不同物种中应该是相同的氨基酸。我从UniProt下载了9个哺乳动物(人、小鼠、大鼠、牛、猴、猪、狗、蝙蝠、熊)的静纤毛蛋白序列,并在每个物种中搜索1659位点周围的基序。

结果:100%保守。所有9个物种在该位点均含有谷氨酸(E)。周围13个残基的基序(PEIFTEIGTIAAG)在约8000万年的进化历史中完全相同。这是ACMG标准下的PP1支持证据。

然后:下载各物种的FASTA文件,在变异位点附近搜索独特基序
捷径:若氨基酸及其周围残基在哺乳动物间相同,则该位点保守
5

尝试标准工具(均告失败)

通常,遗传学家使用SIFT、PolyPhen-2和CADD来检验变异。我通过Ensembl VEP API尝试了三者,均对该变异无结果返回。

原因:STRC在15号染色体上有一个几乎完全相同的"孪生"基因(称为STRCP1的假基因),会干扰基于序列比对的工具。这正是AlphaMissense对STRC独特重要的原因:它基于蛋白质三维结构而非DNA序列,因此不受假基因影响。

自行验证:该变异的Ensembl VEP API(不返回SIFT/PolyPhen结果)
注意:若您的基因没有假基因,SIFT/PolyPhen可能适用。请先在NCBI上查看您的基因
6

应用ACMG分类规则

ACMG/AMP指南(Richards et al., 2015)是遗传学家对变异进行分类的标准框架。每项证据均有代码和强度等级。我学习了规则并加以应用:

  • PM3(中等):变异与已知致病性缺失呈反式检出(父母各一份,经亲本检测确认)。ClinGen SVI规则
  • PP3_Moderate(中等):两个一致的计算工具预测致病性:AlphaMissense(0.9016)+ REVEL(0.65)。按Pejaver et al. 2022由支持级升至中等级
  • PM2_Supporting(支持):在gnomAD中未见(251,000+个体中等位基因频率为0)
  • PP1_Supporting (已移除):保守性数据已包含在REVEL评分中(通过GERP++、SiPhy、phyloP)。PP1专用于受影响家庭成员的共分离分析,此处不适用。

2项中等证据 + 1项支持证据 = VUS(VUS-high)。去除PP1后,未达到按ACMG联合规则(表5)的可能致病阈值。根据Holt实验室框架(波士顿儿童医院/哈佛大学),该变异亚分类为VUS-high——一个被许多临床试验机构认可的类别,可考虑纳入隐性疾病研究(当一个等位基因为P/LP时)。

7

向医院提交申请

我将所有证据整理成正式信函,呈送香港儿童医院化学病理学实验室,请求将该变异从VUS重分类为可能致病性变异。附件包括AlphaMissense数据、保守性分析和ACMG标准分解。我还建立了本网站,使证据透明、可复现,供审阅该病例的任何人查阅。

8

后续步骤

如果医院接受重分类,Michael的分子诊断将得到确认:双等位基因致病性STRC(DFNB16)。这是参与未来基因治疗临床试验的前提。双AAV基因治疗已在STRC缺陷小鼠中恢复了听力(Iranfar et al., 2026年1月)。人体临床试验预计将在2-3年内启动。届时Michael将年满7-8岁。

重分类之外

我没有就此停步

一旦我学会了如何阅读蛋白质结构,我意识到自己可以走得更远。我并非遗传学家,但这些工具是免费的,而我儿子的未来或许取决于有人提出正确的问题。于是我继续前行。

10

检验CRISPR能否直接修复突变

与其替换整个基因,能否只修复那一个错误的碱基?我从Ensembl下载了Michael变异周围的基因组序列,检验基因编辑工具能否将其靶向。

碱基编辑(CBE/ABE):无法修复此变异(C>A颠换超出其编辑范围)。先导编辑:可行。我在距突变位点仅4个碱基对处找到了合适的PAM位点。先导编辑器理论上可以纠正该单碱基改变,但此方案尚未在内耳细胞中得到验证。

11

探讨:基因能否装入单个病毒载体?

目前STRC基因治疗需要两个病毒载体(双AAV),因为基因太长无法装入一个。两个病毒意味着效率更低:两者必须同时进入同一细胞。我分析了AlphaFold结构,注意到前约600个氨基酸的结构置信度极低(pLDDT低于50),提示它们可能无法形成稳定结构,也许是可删除的。

若删除这些区域,剩余的"mini-静纤毛蛋白"(1076个氨基酸,3228 bp)可装入单个AAV载体。这是计算假说,需要实验室验证。但先例已经存在:微型肌营养不良蛋白(删除肌营养不良蛋白的非必需部分)目前已进入肌营养不良症治疗的III期临床试验。

12

预测蛋白质-蛋白质相互作用(AlphaFold 3)

为进一步验证mini-STRC假说,我向AlphaFold 3服务器提交了任务,预测静纤毛蛋白与其相互作用伴侣TMEM145结合的三维结构(TMEM145是2025年《自然通讯》最新发现的静纤毛蛋白功能必需蛋白)。

首批结果已获取(任务1)。ipTM = 0.47,pTM = 0.48。直接结合置信度较低。PAE矩阵分析显示最佳链间接触位于N端残基174-185(但PAE值仍较差,为8.6 A)。

随后我又提交了5个任务,系统性地检验mini-STRC假说:

# 实验 状态 测试内容
1 完整STRC + TMEM145 完成(ipTM 0.47) 基线相互作用
2 Mini-STRC + TMEM145 完成(ipTM 0.43) N端可删除(0.43对0.47基线)
3 STRC E1659A突变体(单独) 进行中 Misha的突变会破坏折叠吗?
4 STRC野生型(单独) 完成(pTM 0.63) 基线:16%无序(N端拉低分数)
5 Mini-STRC单独 完成(pTM 0.81) 是!Mini-STRC折叠极佳(7%无序)
6 仅N端(1-615) 完成(pTM 0.27) 已确认:38%无序,pTM 0.27
7 mini-STRC + Piezo2 CED 已提交 mini-STRC是否与机械敏感通道相互作用?
8 NFATC1 + Calcineurin A/B 已完成(ipTM 0.73) 已验证:CnA-CnB ipTM 0.91,NFAT-CnA ipTM 0.72。级联已确认
Job 1 · Job 3 · Job 2 · Job 4 · Job 5 · Job 6
13

联系研究人员

我向美国、法国和中国从事STRC基因治疗研究的顶尖科学家发送了电子邮件,分享了重分类证据、mini-STRC假说以及本网站的链接。

我收到了令人鼓舞的回复,确认计算方法思路正确,相关分析已转达给正在从事STRC基因治疗研究的团队。

第3天:新假设

如果治疗能够自我调控剂量呢?

第三天,我们提出了一个改变研究方向的问题:与其使用持续开启的组成型启动子,不如使用一个响应声音的启动子?毛细胞已经能将声音转化为钙信号。这是一个我们可以利用的内置传感器。

14

我问:声音本身能否激活基因?

毛细胞具有机械换能(MET)通道,当声音使其静纤毛偏转时会开放。Ca²⁺流入,激活钙调磷酸酶-NFAT信号通路。该通路在声遗传学文献中已被充分描述(Wu et al., Nature Communications 2023),研究人员利用它实现了62倍基因诱导,且三周内零背景泄漏。

我们设计了一个构建体:6xNFAT启动子 + mini-STRC。6xNFAT启动子是一个含有6个NFAT响应元件拷贝的合成元件,形成一个需要持续钙信号才能激活的协同数字开关。结合mini-STRC(来自第2天),总构建体为3,893 bp,在4,700 bp的AAV包装限制内尚有807 bp余量。

15

我建立了一个数学模型来验证

为了超越推测,我们建立了完整信号级联的ODE(常微分方程)模型:声音强度 → MET通道开放概率 → Ca²⁺内流 → 钙调磷酸酶激活 → NFAT核转位 → 转录 → 翻译 → 蛋白质积累。每个参数均来自同行评审文献。

结果:在现实的助听器使用时间表下(白天16小时开启,夜间8小时关闭),模型预测仅需13小时即可达到治疗性立体纤毛蛋白水平(每个OHC >15,000个分子)。在安静环境中,系统仅产生目标值的6.8%(启动子实际上处于关闭状态)。完整Python代码已在GitHub上发布,供任何人复现或扩展。

16

我又提交了两项AF3任务

为从结构上验证机械敏感假设,我们提交了两项新的AlphaFold 3任务。任务7:mini-STRC + Piezo2 CED(立体纤毛蛋白是否与机械敏感通道发生物理接触?)。任务8:NFATC1 + Calcineurin A/B(阳性对照,验证级联模型)。

结果待定。如果任务7显示高ipTM(>0.6),则意味着立体纤毛蛋白直接与Piezo2相互作用,暗示存在反馈回路:STRC缺陷不仅影响结构连接,还影响机械感应本身。

17

我问:能否无需手术进行递送?

基因治疗目前需要手术注射至耳蜗。如果超声波能够非侵入性地将治疗药物推过圆窗膜呢?我查阅了相关文献,发现微泡+超声波可在圆窗膜中产生临时小孔(Shih et al. 2019:渗透性提高5.2倍,24小时内完全恢复,零听力损伤)。

我建立了完整递送链的ODE模型:超声波 → 小孔形成 → 纳米粒子扩散 → 细胞摄取 → 蛋白质产生。诚实的结果:基础参数不足(每次0.39%,需258次)。使用可离子化脂质的优化LNPs:每次78%,共2次。瓶颈在于内体逃逸,而非超声波。最现实的路径:一次性AAV手术,多年后若表达减弱,再进行非侵入性LNP补充。

← Home