视频教程∣CRISPR-Cas9基因敲除,从sgRNA设计开始!

来源: 上海吉凯基因化学技术有限公司   2019-7-10   访问量:765评论(0)

CRISPR-Cas9作为新一代的基因编辑技术,在基因功能研究、模式动物构建、基因治疗等方面具有广阔的应用前景。

该技术的原理是小向导RNA(sgRNA)引导cas9蛋白靶向基因组特定位点进行基因编辑。sgRNA序列特征、设计位置对于敲除的有效性及基因功能变化至关重要,那么sgRNA到底是如何设计的呢?

如需视频教程,扫描下方二维码即可跟着视频学习,并可获得技术专家的指导!

sgRNA设计原则

评分: 优先挑选高评分靶点
碱基序列 :

①Spcas9为20bp+NGG;Sacas9为21bp+NNGRRT

②避免出现连续4个及以上的T—终止信号

GC含量:40%~60%

靶点位置 :

①必须设计在CDS区

②设计在独立外显子,尽量靠近蛋白N端(编码区前三分之一)

③不宜紧邻翻译起始密码子,避免翻译从下游ATG开始;多个靶点之间序列不重叠,避免snp影响靶点有效性

特异性:

①默认针对同源区设计

②在基因组其他位置至少错配三个碱基


sgRNA靶点设计及比对

一、NCBI


从NCBI获取关键信息:Genbank ID、转录本之间的同源性。

在NCBI主页GENE界面输入“基因名称”、“物种”,搜索对应的基因。以人源NLE1为例,输入“NLE1 human”搜索。下拉至“Genomic regions, transcripts, and products”,可以看到转录本信息Genbank ID(共计3个转录本),此ID与序列对应,可在核酸界面查询序列。

Genbank ID命名规则如下:

NM,XM--编码类型转录本(NM为认证的,XM属于预测的)

NC,NG,AC等--基因组类型

NR,XR--非编码转录本(NR表示认证的,XR表示预测的)

AK,AF等命名--看注释,大部分为文章的作者提交的序列

Genbank ID对应的横线表示前体RNA 竖形方块表示外显子 浅色方块表示UTR

深色方块表示编码区 每个Genbank ID共有的方块即为同源区

选择同源编码区外显子,如NLE1基因NM_001014445和NM_018096,NM_018096从第一号外显子即编码,而NM_001014445从第7号外显子才为编码区,因此, NM_001014445的第七号外显子设计才是同源区。

需要注意的是,如果同源编码区位置太靠后,势必会造成某些转录本实际敲除区域也靠后,那么功能是否会有残留呢?如NLE1同源区设计的靶点对于NM_018096转录本而言位于蛋白末尾的三分之一,如果N端过多的蛋白依然有功能,就得设计多套靶点共同感染细胞,不同靶点分别敲除不同转录本达到基因功能缺失的目的(是否有功能残留需要了解目的蛋白的结构域特征—可通过文献或者uniprot蛋白数据库查阅)。当然,如果想特异性敲除某一转录本,可针对非同源编码区设计(如NM_018096第一至六号外显子设计的靶点不会影响NM_001014445蛋白)。

二 、序列获取


以snapgen软件打开NM_001014445,复制第七号外显子的编码区,软件操作见视频。

三、 sgRNA设计


打开张锋CRISPOR设计网站,点击“CRISPOR”,进入信息填写页面:

Step1:添入待设计靶点的序列;

Step2:选择对应物种,可搜索如mouse;若出现多个选项,可默认选择带有年份及年份较新的子数据库;

Step3:选择对应的cas9类型,最常见的是spCAS9,其次为saCAS9,根据类型选择对应的即可。

信息填完整之后点击“submit”,出现结果页面:


结果界面显示:位置、序列、特异性评分、有效性、脱靶等众多参数;网站排序以特异性评分为基准排序,也就是排序靠前的为综合评分较好的。常规“MIT Specificity Score”及“CFD Spec. score”都大于70算较优的靶点;至于有效性可以依靠设计多个靶点规避无效的情况;脱靶率较高是cas9常见问题,功能实验补个回复实验(详情参考:你的RNAi文章为什么被驳回)则完全可以cover技术短板及审稿人的疑虑。

四、 BLAST比对


虽然网站给出了特异性评分这一项,但自行与基因组比对还是有必要的。

打开BLAST主页,直接在“BLAST Genomes”处选择或者搜索对应物种,点击“search”,此处以“human”为例:

下一步填入靶点序列即可,点击blast:

Blast结果界面分析同siRNA教学,“Max score”匹配值唯一:即输入的碱基数乘以2,与染色体完全匹配的只有一个(此处输入20bp,完全匹配值只有一个40.1;第二匹配值为32.2,表示只有16个碱基配对,为四个碱基错配—表示特异性OK)

严谨的读者指出:唯一匹配项如果不是针对目的基因怎么办?

下拉至Alignments第一个完全匹配的结果,看染色体编号以及位置(已标出):

回到NCBI-GENE界面,“Genomic context”区同样的信息,若前者包含在对应的基因区域,那么靶点就是座落在该基因的。

以上即sgRNA靶点设计及比对的流程,设计2~3个靶点进行验证,更加有利于筛选出有效靶点。

今天的靶点设计,你学会了吗?!或许你还想关注SiRNA的靶点设计:SiRNA设计从入门到精通,教会您如何筛选有效靶点!有空就一起学一下吧!

附:



讲师介绍

陈建儒,吉凯基因工具病毒产品售前技术专家;从事载体构建相关工作5年有余,熟悉各类核酸数据库及核酸相关的分子设计、预测;录制过诸多基因操作软件和网站使用的课程,被广大用户一致评价为“实用性极强、简单易学”!

接下来陈老师的以下课程将会与大家见面,如果您对课程感兴趣,想进一步进行技术交流,欢迎添加微信号(13162396225),获得陈老师的1V1指导哦~~

1.如何查找基因序列?
2.如何设计引物?
3.如何设计RNAi/CRISPR靶点?【点击这里查看教程
4.如何预测miRNA靶基因/miRNA结合位点?
5.如何预测转录激活因子结合位点?

热门“工具病毒”的选择与应用指南,吉凯基因将于7月18日 15:30进行直播这次您可不要错过哦!

热门“工具病毒”的选择与应用指南

网络课程第四期开始啦!



上海吉凯基因化学技术有限公司   商家主页

地址:上海市浦东新区张江高科技园区爱迪生路332号
联系人:陈先生
电话:18516626958/18621058196(企业用户)
传真:021-51370635
Email:marketing@genechem.com.cn;xin.chen@genechem.com.cn