
生命密码的“第二套字母表”:蛋白质测序,窥见生命的真谛
如果生命是一套精密的指令系统,那么DNA序列就像是写有基础原料和大致步骤的“蓝图”,而最终构建并驱动生命运行的“实体机器”则是蛋白质。然而,我们无法仅凭DNA的序列信息来完全、准确地确认蛋白质的最终形态与功能。这是因为从DNA到蛋白质的路径并非一条笔直的流水线,而是一个充满复杂调控与修饰的过程。
基因序列在转录为信使RNA后,会经历选择性剪接,使得同一个基因可以产生多种不同结构的RNA模板;在翻译为蛋白质链后,新生的肽链还会经历折叠、切割以及至关重要的翻译后修饰——如磷酸化、糖基化、乙酰化等。这些修饰如同在蛋白质“骨架”上添加了各式各样的“化学标签”,彻底改变了其活性、定位与相互作用,而这些关键信息在原始的DNA蓝图中毫无记载。因此,直接测定蛋白质自身的氨基酸序列,是窥见生命功能真实状态的不可或缺的一步,它对于理解疾病的分子机制、发现药物靶点以及探索生命过程的本质具有决定性意义。
为了解读这套由20种氨基酸写就的“实体密码”,科学家们发展出了蛋白质测序技术。诺贝尔奖获得者Sanger教授在1953年像拆解一个未知的精密锁具一样,首次完整测定了胰岛素分子的氨基酸序列,他所开创的“Sanger法”如同逐级拆解的“化学梯子”,通过反复切割和鉴定末端氨基酸来完成测序。同期,P.V. Edman教授提出的Edman降解法为蛋白质测序开辟了新纪元,其原理是使用异硫氰酸苯酯与多肽或蛋白质的N端氨基酸发生特异性反应,将这个被标记的N端氨基酸选择性地切割下来进行鉴定,而剩余的肽链则保持完整。此过程可循环进行,从而实现从N端开始对氨基酸序列的逐一轮读。
蛋白质测序技术的真正分水岭,是上世纪80年代质谱技术的引入,使得科学家能够精确测量蛋白质及其碎片的质量,从而高效地推导序列,实现了从“化学梯子”到“质量天平”的范式革命。而如今多种新技术不断涌现,包括隧穿电流法、荧光指纹法和实时动态荧光法等,这些新技术均取得了一些令人兴奋的进展,但尚未实现对蛋白质的从头测序。

图1. 基于纳米孔技术的多肽测序新方法
以纳米孔技术为代表的单分子测序展现了新的可能性,其主要方法分为:纳米孔全链长测序、纳米孔蛋白质指纹测序和酶切辅助的纳米孔蛋白质测序。2024年中国科学院化学研究所吴海臣研究员团队发表在Nature Methods上的一项题为《基于主客体相互作用辅助的纳米孔多肽测序》的研究,为解决纳米孔技术在肽段测序中的关键难题提供了创新思路。他们发现,当多肽的N端为苯丙氨酸时,其与主体分子胍环结合后可显著延长在纳米孔中的穿孔时间。这一变化使得纳米孔对该多肽N端第三位氨基酸的分辨能力大幅提升。基于该结果,为实现完整的多肽序列测定,研究人员发展了一套巧妙的“分步解码”策略:首先,利用羧肽酶A和羧肽酶B将肽链中的氨基酸从C端逐一水解;随后,将这些释放出的游离氨基酸通过偶联反应连接到多肽探针上;最后,将连接后的探针穿过纳米孔,产生特征电流信号(图1)。根据电流信号的丰度可以推断不同氨基酸在序列中的位置,从而实现对多肽序列的从头测定。这项研究为纳米孔技术应用于蛋白质测序开辟了一条新路径。通过对该方法的进一步优化,未来有望拓展至更复杂、更长的蛋白质序列分析中,为蛋白质组学研究提供一种高效、精准的新型工具。
参考文献:https://doi.org/10.1038/s41592-023-02095-4
附件下载: