超实用的网站!蛋白序列、功能快速查询及预测

来源: 上海吉凯基因化学技术有限公司   2020-11-16   访问量:1521评论(0)

蛋白质(protein)是生命的物质基础,是构成细胞的基本有机物。其结构多样,功能复杂,尤其是翻译后水平的多样化修饰更为其增添了神秘色彩,同时也增加了深入研究的难度。那么,如何在不做任何实验的前提下,尽可能窥探其奥秘呢?小编这里重点依据两个网站为大家进行介绍:


一、蛋白定位


俗语云:屁股决定脑袋,蛋白在机体的定位直接限定了其功能,各类型定位与研究较多的功能如下:
我们以人源CD28为例,可以在uniprot直接查询:



由此可得出CD28是跨膜蛋白(I型跨膜含有信号肽,其他类型跨膜如II型跨膜、多次跨膜不含信号肽),以及能明确知悉其各区段亚细胞定位。

那针对未知基因名称的序列、亦或者uniprot未标注的转录本(uniprot往往针对一个基因的一个转录本标注,但是很多基因亚型众多,彼此可能定位、功能有差异)如何分析呢?此时可以用CBS预测网站进行蛋白定位信号分析。CBS与蛋白定位预测的相关模块:

以CD28蛋白序列为例(uniprot有序列),打开CBS-SignalP,fasta格式输入:

结果显示,该序列含有信号肽,且切割位置位于18-19位氨基酸—意味着信号肽位于1-18位,与前面查询结果完全一致;含有信号肽意味着序列可能是分泌蛋白,也可能是I型跨膜蛋白,下面再分析下跨膜区同样以fasta格式预测CBS-TMHMM,直接输出结果如下:
结果显示含有跨膜区,且跨膜区位置为154-176位,与uniprot收录的位置是重叠的,由此可断定,未知基因是I型跨膜。

二、结构域与蛋白互作查询

氨基酸通过不同的折叠方式,形成多样化的功能模块,典型的如转录因子常包含DNA结合、转录激活结构域。

Uniprot收录了大量文献报道的蛋白结构信息,可以直接查询,对于做COIP的研究者来说,根据结构域做截断体即可,以人源PKM为例:


单个物种收录的结构域信息可能不全,如研究大鼠的PKM,可以查询人、小鼠的结构域信息,再以蛋白同源性比对得出大鼠的结构域即可(常见三大物种蛋白同源性一般在90%左右,同源交叉分析具有参考价值)。

Uniprot引用了STRING数据库蛋白互作信息,可展开链接查询与目的蛋白有互作关系的蛋白:

STRING数据库提供了文献收集、预测、实验验证等多样化的互作搜罗,在“settings”设定根据需要选择数据来源、互作数量等参数:

三、氨基酸突变


组成蛋白的氨基酸若发生突变,极有可能造成蛋白结构、定位、功能发生变化,最终导致表型的改变。Uniprot同样收罗了基因突变的信息并给出了对应文献。

蛋白数据库收录的突变型信息毕竟有限,也可以在SNP4Disease(点击进入)查找对应基因的突变型与功能的变化关系。对于未知蛋白,如果鉴定出突变型,尤其是较多的情况下,可以借助CBS-NetDiseaseSNP预测突变是否会引发疾病:


四、蛋白修饰

蛋白翻译后的化学修饰种类多样,常见的如磷酸化、乙酰化、甲基化、糖基化、泛素化等,这些修饰丰富了蛋白功能,那么如何查找对应的位点及突变呢?

Uniprot基于两种策略:文献收集及同源性比对,收罗了基因大量的修饰位点信息(PKM为例),可直接查询:

也可以借助CBS预测,相关功能模块如下:
以PKM输出结果为例,给定了评分以及对应调控的激酶,预测给出的“Answer”为“YES”的为修饰可能性较大的位点,运用此模块,可先查询在目的细胞表达的激酶,然后再根据预测结果选择,可最大限度缩小候选位点范围。
两个网站的常用功能就介绍到此,其余功能大家可根据自身需求摸索。

借助网站收集或者预测的信息,可极大减少查阅文献的时间,如果大家有更多需求,快来吉凯咨询吧!!!

扫码添加微信↑,免费获取直播课程+工具病毒手册



上海吉凯基因化学技术有限公司   商家主页

地址:上海市浦东新区张江高科技园区爱迪生路332号
联系人:陈先生
电话:18516626958/18621058196(企业用户)
传真:021-51370635
Email:market@genechem.com.cn;xin.chen@genechem.com.cn;zhangjie@genechem.com.cn;hui.hu@genechem.com.cn