侧边栏壁纸
  • 累计撰写 54 篇文章
  • 累计创建 1 个标签
  • 累计收到 19 条评论
标签搜索

目 录CONTENT

文章目录

序列比对 - Diamond序列比对

食用菌精准育种实验室-实验宝典
2024-01-20 / 0 评论 / 0 点赞 / 1,129 阅读 / 570 字
欢迎来到青岛农业大学于浩团队
开放交流·合作共赢

原创内容,欢迎转载,转载请注明出处


Diamond介绍和安装

1、Diamond介绍

官网地址:https://github.com/bbuchfink/diamond

  • Diamond是比Blast更快的序列比对工具,速度是Blastp的500-20000倍,资源消耗小,自己的电脑就可以运行。

  • Diamond只能够比对蛋白序列,包括翻译后的核苷酸和蛋白数据库进行比对,不能进行核算与核算比对。

2、Diamond下载使用(windows系统)

(1)直接从下载页下载"diamond-windows.zip"文件:http://github.com/bbuchfink/diamond/releases

(2)解压缩。

(3)直接用powershell进入解压缩后diamond.exe所在的文件夹,直接运行就行。

3、Diamond安装(Linux版本)

(1)可以用conda安装

(2)也可以用直接下载安装。

进入下载页,点击下载tar.gz文件:http://github.com/bbuchfink/diamond/releases

对压缩文件进行解压缩:

tar -zxvf diamond-linux64.tar.gz

把解压缩出来的diamond文件拷贝到合适的路径,把这个路径添加到环境变量中。


Diamond使用

1、查看帮助文档

diamond help

2、构建数据库

点击下载demo文件:proteins.fa是数据库文件,start.fa是蛋白检索序列,nucl.start.fa核酸检索序列。

diamond makedb --in proteins.fa  --db  database
# --in 数据库的蛋白质文件
# --db 生成的数据库的前缀

3、蛋白与蛋白比对

diamond blastp --db database --query start.fa --out result.txt
# --db 后面跟着上面构建的进化树的前缀
# --query 后面跟着要来进行检索的检索序列
# --out 生成的结果文本文档的名字

4、核酸(cds)与蛋白数据库比对

diamond blastx --db database --query nucl.start.fa --out result.txt

5、更详细的一些参数和用法

diamond blastp --db database --query start.fa --out result.txt  --max-target-seqs  1  --evalue  0.001  --threads  10  
# --evalue 后面跟着的是阈值,默认值是0.001
# --max-target-seqs 后面跟着每个序列输出的比对结果的条数
# --threads 使用现成的数量
0

评论区