酶是一类具有催化活性的生物大分子,本质为蛋白质或核酸分子,是细胞内推动生化反应有序进行的关键组分。尽管酶的真实身份直到20世纪初才被揭示,但早在公元前21世纪人类就已经有意识地利用酵母中的酶来酿造谷酒,其主要工艺及酒曲制备的方法流传至今。酶本质的揭秘大幅度加速了酶的发现和酶学反应的研究,也极大地拓宽了酶的应用领域。经过数十年的高速发展,人类已不再满足于新酶的发现和微生物的筛选,尤其在巨大商业利益的驱动下,酶的定向进化技术已开始在工业界大显身手。
酶的定向进化指人为选择和改善酶的性质,使其获得更高的催化效率或更强的选择性等,以适应特定的应用场景。相比于自然进化,人工筛选取代了自然选择,缩短了酶分子性能进化周期,丰富了酶的底物谱和反应类型等(图1)。在合成生物学蓬勃发展的背景下,酶的定向改造成为了传统生物育种和代谢途径优化的有效补充,能够精准地提升催化路径的效率以及开辟新的催化和代谢通路。
图1. 定向进化原理
(图片源自:doi: 10.1021/acs.chemrev.1c00260.)
定向进化主要包括文库构建与突变体筛选两部分,关键点则在于建立基因型和表型(即突变体性能)之间的物理对应关系。本文小编主要介绍文库构建的部分。
突变体文库的构建大致可分为三种方法(图2):随机突变,定点突变和基因重组。
图2. 突变体文库的构建
(图片源自:doi: 10.1002/bit.28009. Epub 2022 Jan 7.)
随机突变
随机突变包括以菌株诱变为媒介的体内随机突变和以易错PCR为代表的体外随机突变。
当微生物内的DNA聚合酶(如大肠杆菌DNA聚合酶III ε亚基DnaQ和聚合酶I)发生突变,或者DNA错配修复相关蛋白(如MutS、SeqA)、核苷酸修饰及代谢基因(如Dam、UGI、PmCDA1)异常表达时,碱基突变出现的概率大幅度提高,此过程将伴随着微生物基因组复制而全局性地发生(如PACE进化系统)。体内诱变虽然简化了建库流程,但由于过程不可控从而提高了宿主致死和目的蛋白失活的风险。体外的随机突变则可在PCR的基础上通过以下方式实现:引入干扰物降低DNA聚合时的保真性(如二价金属离子、醇等)或直接使用易错DNA聚合酶(图3)、降低模板浓度、投入dNTP类似物或比例失衡的dNTP。获得的DNA产物再经过重组、转化等环节完成突变体文库的制备。易错PCR可以有效避免宿主的死亡,并实现对目的基因突变范围、突变频率的灵活控制。
图3. 基于易错PCR的随机突变
(图片源自:doi: org/10.1016/j.trechm.2022.02.004.)
随机突变可以用极低的成本获得巨大的突变体文库,用于多种应用场景的筛选,但依然面临着一些挑战:碱基突变的偏好性使得部分突变类型缺失,影响了文库的均一性和多样性。为了解决这个问题,Twist Bioscience开发了硅基DNA合成平台,可个性化定制并体外合成无偏倚的寡核苷酸,保证在一定范围内(300 bp内)实现全位点的饱和突变。但超过300 bp尺度的合成文库的构建则只能寄希望于新的技术来寻求突破。
定点突变
定点突变是指基于大量实验数据、文献资料或者计算机辅助来确定热点氨基酸,再针对性地设计并引入突变。
制备定点突变文库最经济的方法是设计简并引物,引物上目标区域的碱基随机排布,蛋白质的特定三联密码子将可能出现包含终止子在内的所有类型。构建好的文库可涂布于固体平板上,挑取单克隆培养后进行筛选。不过,受简并引物均一性、菌株生长偏好性等因素的影响,测试的样品数量需超过理论突变类型总量的3倍以上,才能实现超过95%的覆盖度(图4)。
图4. 测试深度与样本覆盖度
(图片源自:doi: 10.1002/cbic.200800298.)
除了上述包含全组合碱基的简并引物外,一些针对氨基酸类型而设计的简并引物可显著减少理论突变体的种类(如NNK、NDT文库),提升筛选效率。构建定点突变文库除了需要一定的理论基础外,在热点氨基酸数量较多、分布零散时,引物设计和质粒构建将面临较大挑战,文库体量也将因为位点数目的增加而成指数级放大。
另一方面,体内的定点突变技术也取得了一些进展。这些策略的主要原理是将序列特异性DNA结合蛋白(如转录因子、调控因子、转座酶等)与一些碱基修饰酶、切口酶、核酸酶等融合,DNA结合蛋白负责靶向目标序列,融合酶则负责在目标区域附近引入突变(图5)。目前,这类策略还只能在靶向序列侧翼数十个碱基以内引入突变,且具体突变位点和突变类型难以控制,结合蛋白的脱靶效应也会带来宿主死亡的风险。
图5. 体内定点突变
(图片源自:doi: org/10.1016/j.trechm.2022.02.004.)
基因重组
基因重组是指将不同来源的DNA片段进行重新组合,以形成新的DNA分子或基因的过程。在构建突变文库时DNA片段一般有两种来源,一种是同源酶蛋白的DNA,当序列一致性不足时可通过密码子优化来提升;另一种是不同突变体的DNA,可作为随机突变和定点突变文库的补充。此外,考虑到真核生物mRNA的可变剪切,外显子重排(Exon shuffling)也是一种提升蛋白多样性的方法。作为建库母本的长片段先经过酶切、超声等处理成短的DNA片段,再通过PCR或者连接酶完成片段的多样性装配,最终形成一些规模可观、序列组合新颖的突变体文库(图6)。尤其当亲本酶性能差异显著时,基因重组可能产生一些功能全面、性能卓越的子代酶。
图6. DNA重排
(图片源自:doi: org/10.1016/j.trechm.2022.02.004.)
文库的质量是定向进化成功的先决条件,突变体的多样性越多、库容量越大,越容易筛选获得符合预期的突变体,但文库的总量又受制于筛选技术的通量,以及酶功能与结构信息的准确性。不仅如此,文库构建所涉及的分子生物学技术(如连接方式、转化方法)和耗材(如感受态细胞、限制性内切酶、重组酶等)也是易被忽视的影响因素。
综上所述,不同突变体文库构建的方法总结如下表,实际可根据不同需求选择。
翌圣ZymeEditor™酶改造定制服务
若您有酶改造或生产的需求,请联系技术:罗15180132598(微信同号),邮箱:luodan@yeasen.com