使用R语言通过DIOPT数据库检索同源基因-RDIOPT包

RDIOPT包 是 DIOPT 同源基因查找器 (DIOPT Ortholog Finder) 的一个简单包装器(wrapper)。这个包(package)的目的是允许用户直接从 R 语言环境中查询同源基因,而不需要复制和粘贴操作。RDIOPT 依赖于 DIOPT API 来执行查询和搜索结果。

安装

1
2
#install.packages("devtools")
devtools::install\_github("myuhao/RDIOPT")

函数及参数

find_orthologs(genes, from = 9606, to = 7227, filter = "none", version = 8)

genes 字符向量,基因的enterzID​。gene symbol​。
from 源物种NCBI Taxonomy ID
to 目标物种NCBI Taxonomy ID
filter 筛选结果,具体参数见后面内容。
version 版本,8​或者9

from​ 和 to​为NCBI Taxonomy ID​. DIOPT 目前支持以下 IDs (DRSC - DRSC Integrative Ortholog Prediction Tool):

  • all​: 以下所有物种 (仅限to​使用)

  • 83333​ Escherichia coli [ E. coli ]

  • 3702​ Arabidopsis thaliana [ Thale cress ]

  • 4896​ Schizosaccharomyces pombe [ Fission yeast ]

  • 4932​ Saccharomyces cerevisiae [ Yeast ]

  • 6239​ Caenorhabditis elegans [ Worm ]

  • 7165​ Anopheles gambiae [ Mosquito ]

  • 7227​ Drosophila melanogaster [ Fly ]

  • 7955​ Danio rerio [ Zebrafish ]

  • 8364​ Xenopus tropicalis [ Western clawed frog ]

  • 10116​ Rattus norvegicus [ Rat ]

  • 10090​ Mus musculus [ Mouse ]

  • 9606​ Homo sapiens [ Human ]

filter

  • none​ 无过滤,显示所有结果。

  • best_match​ 只有当每个输入基因或蛋白有一个以上匹配时,才返回最佳匹配。

  • exclude_score_less_1​ 排除低diopt得分( score > 1 ,除非仅匹配得分为1)

  • exclude_score_less_2​ 排除低diopt得分( score > 2 ,除非仅匹配得分为1或2)

示例

以黑腹果蝇 [ Drosophila melanogaster (fruit fly) ] 的Akt, CaMKI基因为例

1
2
3
4
5
6
7
8
9
10
library(RDIOPT)
# Entrez ID
gene_of_Dm <- c(41957,43792)
# 安装了AnnotationDbi可以使用gene sysmbol
if (require(org.Dm.eg.db)) {
gene_of_Dm <- c("Akt","CaMKI")
}
# 果蝇NCBI Taxonomy ID为7227
Dm_orthologs <- RDIOPT::find_orthologs(gene_of_Dm, from = 7227, to = "all", filter = "best_match")
Dm_orthologs

参考

  1. myuhao/RDIOPT: R interface to run DIOPT ortholog finders

  2. DRSC - DRSC Integrative Ortholog Prediction Tool