评论

分享6个基因结构预测分析工具

1

ORFinder

ORFfinder用于分析查找序列中的ORF区 (open reading frame,开放阅读框)。ORFfinder使用标准的或其它特殊的遗传密码子查找序列中所有可能的ORF区,并推导出相应的氨基酸序列。

工具链接:

https://www.ncbi.nlm.nih.gov/orffinder/

在线版本的ORFfinder可提交最长50kb的序列,当然也可以下载Linux本地版本,这样就没有序列长度的限制。这里以家鼠的AQP1序列(NM_007472.2)为例,将最小的ORF长度设为75nt,仅使用“ATG”作为起始密码,然后点Submit按钮。

结果如下,共找到24个ORF,其中ORF1 (193~1002) 序列(810nt)最长。在NCBI搜索AQP1序列(NM_007472.2),可简单验证下ORF的查找结果。

2

Softberry

Softberry包含数百个实用的在线分析小工具,其中,大家比较熟悉的FGENESH是一款较为准确的真核基因预测工具。

工具链接:

http://www.softberry.com/berry.phtml

软件的用法很简单,将DNA序列复制粘贴到序列输入框,或者点击上 “选择文件”按钮,上传DNA序列文件,然后搜索并选择核酸序列所对应的物种,比如我这里的范例文件是人的序列,然后点击“search”按钮提交任务即可。

提交任务数秒后会得到预测结果,如下图,从结果中我们可以看出从提交的序列(74293bp)中共找到3个基因,正链2个,负链1个;找到外显子18个,正链16个,负链2个。

点击“Show picture of predicted genes in PDF file”,以PDF格式打开预测结果,点击下载按钮可将pdf报告下载到本地。图中的TSS为转录起始位点(tranion start site),CDSf为起始外显子(First-Starting with Start codon),CDSi为中间外显子(internal exon),CDSl为末端外显子(last coding segment),CDSo为唯一外显子(only exon),PolA为末端polyA 尾区。

3

GeneWise

使用GeneWise可基于同源蛋白进行基因预测。我们只需依次上传蛋白序列和目标DNA序列,点击Submit按钮进行Pairwise Sequence Alignment即可。

工具链接:

https://www.ebi.ac.uk/Tools/psa/genewise/

4

Prompter 2.0

Promoter 2.0主要用于预测脊椎动物DNA序列中Pol II(RNA聚合酶Ⅱ)启动子的转录起始位点(启动子)。它基于神经网络和遗传算法,模拟转录因子与启动子区序列相互作用的过程。

工具链接:

https://services.healthtech.dtu.dk/service.php?Promoter-2.0

5

IBS

IBS (illustrator for biological sequence)是一个绘制基因蛋白序列结构示意图的在线工具,个人建议,如果不知道如何动手绘制的时候,可参考示例文件的样式进行绘制。

工具网址:

http://ibs.biocuckoo.org/

6

SMART

SMART (Simple Modular Architecture Research Tool),它是一个用于蛋白质结构域鉴定、注释的在线分析工具。它的数据与UniProt、Ensembl和STRING数据库同步,且人工注释的蛋白结构域超过1300个。

工具网址:

http://smart.embl-heidelberg.de/

SMART有两种模式:normal和genomic。主要区别是二者底层使用的数据库的不同,前者是冗余的,而后者只使用完成基因组测序的蛋白组数据。两种模式的颜色不同,而界面相似,通过单击相应模式可进行切换,比如进入genomic模式是这样的:

通过输入Uniprot/Ensembl蛋白序列的ID(或ACC)或者蛋白序列查找蛋白的结构域。点Sequence SMART按钮即可提交任务,大约10秒后即可得到下图的预测结果,网页的结构图是交互式的,还可保存为svg格式的矢量图。

好啦,本次的实用在线工具就分享到这里啦!

*未经许可,不得以任何方式复制或抄袭本篇文章之部分或全部内容。版权所有,侵权必究。

基迪奥生物|专业定制测序服务

联系方式:020-39341079;service@genedenovo.com返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()