突破认知:LncRNA、circRNA编码啦!!

来源: 上海吉凯基因化学技术有限公司   2020-1-15   访问量:368评论(0)

提到lncRNA、circRNA,大家最先想到的研究热点是什么?lncRNA的cis、trans?还是circRNA的ceRNA?事实上,两种非编码RNA(ncRNA)的另一种共有属性还未被广泛发现,那就是“编码”!



一、非编码RNA"编码"概况



纳尼?非编码还能编码,这是什么新特性!确实,根据许多标准,它们不太可能编码功能蛋白。这些标准包括缺乏长的ORF,缺乏氨基酸序列保守性和缺乏已知的蛋白质结构域1。由于技术手段受限,长久以来,人们忽视了这些分子编码的短肽对生命活动的影响。


得益于分子技术的发展,Orera2等分析了六种生物的核糖体谱数据,发现lncRNA与核糖体关联达到30-82%(编码为>92%),预示着lncRNA存在较大的编码潜力;Ariel3等人运用核糖体足迹技术鉴定出人和斑马鱼表达的数百个短的阅读框(short ORFs)sORFs;pncr003:2L编码两个短肽,调节果蝇的心脏收缩4;人MRI-2(69个氨基酸)刺激DNA双链断裂连接5;人lncRNA-HOXB-AS3可编码长约53位氨基酸的短肽,该短肽而非lncRNA可抑制结肠癌的发生6。


环状RNA(circRNA),同样具有编码短肽的功能。不同于mRNA、lncRNA具有5端帽子,3端polyA尾结构,circRNA为闭环的RNA分子,其翻译特性由m6A或者IRES(招募核糖体功能)驱动。根据circRNADb收录的数据,32914条环状RNA,预测编码超过100个氨基酸的达16328条,存在IRES的达7170条,表明很多环状RNA也存在编码短肽的能力:Circ-FBXW7表达185aa的短肽与胶质母细胞瘤表型相关7;circ-SHPRH表达146aa的短肽可起到抑制胶质瘤的发生8;circ-ZNF609编码的短肽可控制成肌细胞的增殖9。


一系列的报道预示着,sORFs是一片蓝海有待发掘。那么,如何研究ncRNA的编码特性呢?我们以HOXB-AS3(NCBI登录号NR_033201)为例为您详解lncRNA-sORF的预测及实验设计过程。



二、lncRNA-sORF预测



1. ORF预测


大部分lncRNA编码的肽段较短、或者一条长链里面包含多个ORF,优先选择ORF较长的研究。打开orffinder预测网站(点击可进入),输入登录号ID或者序列,其他参数默认(参考已发现最小的短肽,目前预测短肽的最小值是24aa),点击“submit”,可看到两条预测结果:

注意只看“strand”为“+”的结果,因为RNA是单链的,编码区不会存在负义链上。网站预测到HOXB-AS3存在两个短肽,分别为53、40个氨基酸,接下来就是进行实验验证。


2. 实验设计


针对预测的短肽是否编码,常规是构建过表达载体并在ORF的C端添加标签(荧光或者WB标签),并需要将翻译起始位点ATG进行突变,以确认翻译的起始位点。具体操作如下:


方法一:针对较长的肽,可采取融合flag直接进行WB,直接将flag插入在全长lncRNA的ORF末端,并设计ATG突变作为对照(文章还设计了只构建编码区作为阳参),随后进行WB实验即可。


方法二:针对短肽,若WB灵敏度不足以检测到,那么采取短肽融合荧光策略较优。方法类似,后续通过荧光的表达即可确认肽是否编码。



三、circRNA预测



得益于circRNADb数据库对收录的circRNA进行了较多的注释,circRNA可以直接查询网站统计好的预测数据。以FBXW7(hsa_circ_0001451)为例,直接在circrnadb数据库查找FBXW7名称,找到对应的circRNA(在circrnadb的ID是hsa_circ_16502),可以获得数据库预测的IRES(也可以用IRESfinder预测)以及ORF区(同样可以用ORFfinder预测,但是要将序列成环延伸变为线性再进行预测):


接下来仿照lncRNA的做法,在ORF末端加上标签,进行密码子ATG突变,以及IRES缺失构建环状RNA过表达,进行表达验证:


非编码RNA通常转录活性较低,且由于较短的ORF,同于早前认为lncRNA是转录垃圾,一些科研人员认为大部分短肽是无功能的翻译垃圾。然而研究发现:多数人类特异性编码基因是从猕猴或黑猩猩低表达的非编码RNA进化而来10,这表示在选择压力下,ncRNA编码的肽可作为物种进化时新肽的重要来源2,至于ncRNA表达的肽是否具有更加广泛的生物学意义,还待更多的科学研究!!!


吉凯可提供相关服务,欢迎添加客服微信【GeneChemV】咨询~~


【参考文献】

1.GENCODE: the reference human genome annotation for The ENCODE Project;

2.Long non-coding RNAs as a source of new peptides;

3.Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation;

4.Conserved regulation of cardiac calcium uptake by peptides encoded in small open reading frames;

5.A human short open reading frame (sORF)-encoded polypeptide that stimulates DNA end joining;

6.A Peptide Encoded by a Putative lncRNA HOXB-AS3 Suppresses Colon Cancer Growth;

7.Novel Role of FBXW7 Circular RNA in Repressing Glioma Tumorigenesis;

8.A novel protein encoded by the circular form of the SHPRH gene suppresses glioma tumorigenesis;

9.Circ-ZNF609 Is a Circular RNA that Can Be Translated and Functions in Myogenesis;

10.Hominoid-Specific De Novo Protein-Coding Genes Originating from Long Non-Coding RNAs.



吉凯基因,年产上万次慢病毒、腺病毒、腺相关病毒;
建有国内大型的慢病毒文库,包含几乎覆盖人类所有基因的,近 15 万个独立克隆;
国内集产品采购和资讯分享的一体化综合服务平台,为科研工作者提供一键式的采购服务,产品周期短至 5 个工作日
18年品质保证、助力客户发表10000+ 篇 SCI,多项科研成果发表于Nature Medicine、Nature Immunology、Gastroenterology、Cell Metabolism、Nature Neuroscience等顶级期刊上



上海吉凯基因化学技术有限公司   商家主页

地址:上海市浦东新区张江高科技园区爱迪生路332号
联系人:陈先生
电话:18516626958/18621058196(企业用户)
传真:021-51370635
Email:marketing@genechem.com.cn;xin.chen@genechem.com.cn