基因编辑时,Cas9蛋白你选对了吗
Cas是CRISPR相关蛋白的简称,簇状规则间隔的短回文重复序列(CRISPR)和相关蛋白(Cas)构成CRISPR–Cas系统;该系统分为3大类,且有许多种类的Cas蛋白,第2类CRISPR-Cas系统是由单一、大、多结构域的蛋白质组成复合体发挥作用,一些2类效应蛋白,如Cas9,已经成功地用于基因组工程。
在设计gRNA的时候如何选择Cas9蛋白,可以综合考虑以下关键因:
️1.目标序列的PAM(原间隔相邻基序)
Cas9的只有当DNA靶位点附近存在PAM时,才能进行准确切割。PAM的存在也是激活酶Cas9所必需的,不同Cas9蛋白识别不同的PAM序列,可需根据目标位点附近的可用PAM选择对应的Cas9:
①SpCas9(最常用):PAM为NGG(或较弱的NAG);
②SaCas9:PAM为NNGRRT(更复杂,但体积更小,适合AAV递送);
③xCas9或SpCas9变体(如SpG、SpRY):可识别更广谱的PAM(如NG、GAA等);
④其他同源物:如St1Cas9(NNAGAAW)、NmCas9(NNNNGATT)等;
️2.蛋白尺寸与递送方式
常用的有SpCas9,尺寸比较大,会受到病毒载体限制(如AAV容量~4.7kb),这时候可能需要更小的Cas9变体:如SaCas9(编码序列大小为3.2kb)或超小型Cas9 Mini(编码序列大小为2.7kb)。
也可尝试非病毒递送,如质粒、RNP复合体等方法,则无需考虑蛋白尺寸,可使用SpCas9或其他大体积高活性变体。
️3.特异性需求
基因组极为复杂,gRNA可能与非靶向序列局部匹配,这种局部匹配也会激活Cas 9内切酶活性,从而产生脱靶效应。脱靶可能影响正常基因的功能表达,甚至激活致癌因子、抑制抑癌基因,造成安全隐患,这极大的阻碍了该技术在临床的进一步应用。
为了减少脱靶,可选择一些高保真变体如通过突变降低脱靶活性的SpCas9-HF1、eSpCas9、HypaCas9等;
传统的Cas9蛋白包含RuvC和HNH两个催化结构,RuvC和HNH可分别剪切DNA的两条链形成双链断裂,采用CRISPR/Cas9n系统(如Cas9 D10A变体),仅在一条链上产生单链切口(Single-strand break, SSB),有效降低脱靶活性。
️4.应用场景
对于基因敲除(KO),可选择标准SpCas9或高活性变体(如SpCas9-VRQR);若需进行碱基编辑(Base Editing),需匹配对应的dCas9-脱氨酶融合蛋白(如BE4max)。
对于基因激活/抑制(CRISPRa/i),可选择选择催化失活型的dCas9并融合转录效应子(如dCas9-VP64);
如果要先导编辑(Prime Editing),需使用逆转录酶融合的Cas9(如PE2);
️5.细胞类型与物种兼容性
哺乳动物细胞选择SpCas9、SaCas9、HiFi Cas9等常用;植物或微生物可能需要优化密码子或选择特定同源物(如FnCas9);针对原代细胞或难转染细胞:推荐RNP递送(Cas9蛋白+gRNA复合体),减少毒性并提高效率。
️6.特殊功能需求
温度敏感型Cas9(如tsaCas9)可在特定温度下激活/失活,运用于时空控制编辑;光控Cas9(如Light-inducible Cas9)能通过光信号调控活性;多基因编辑时可采用正交Cas9系统,组合不同Cas9(如SpCas9+SaCas9)避免gRNA交叉干扰。