Home

バイオ やばいぉ・・・

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
  • Comments (Close): -
  • TrackBack (Close): -

BioPerlでデータベースID検索

いままではデータベースからIDのわかっているタンパク質の配列などをとってこさせていましたが、
実際に検索する際には、IDなどはわかっていないので、検索することになります。

今回はキーワード検索した結果を一覧表示するプログラムです。

use Bio::DB::GenBank;
use Bio::DB::Query::GenBank;
$query = "Homo sapiens[ORGN] AND CYP2C[TITL] AND 100:3000[SLEN]";
$query_obj = Bio::DB::Query::GenBank->new(-db => 'nucleotide', -query => $query );
$gb_obj = Bio::DB::GenBank->new;
$stream_obj = $gb_obj->get_Stream_by_query($query_obj);
while ($seq_obj = $stream_obj->next_seq) {
$n++;
print $n, ". ",$seq_obj->display_id, " (",$seq_obj->length, ") ",
substr($seq_obj->desc,0,50), "...\n", ;
}


解説
01:use Bio::DB::GenBank;
02:use Bio::DB::Query::GenBank;
03:$query = "Homo sapiens[ORGN] AND CYP2C[TITL] AND 100:3000[SLEN]";
04:$query_obj = Bio::DB::Query::GenBank->new(-db => 'nucleotide', -query => $query );
05:$gb_obj = Bio::DB::GenBank->new;
06:$stream_obj = $gb_obj->get_Stream_by_query($query_obj);
07:while ($seq_obj = $stream_obj->next_seq) {
08:$n++;
09:print $n, ". ",$seq_obj->display_id, " (",$seq_obj->length, ") ",
10substr($seq_obj->desc,0,50), "...\n", ;
11:}

01:おまじない
02:おまじない
03:query="□□□□"で検索ワードを設定する。
  [ORGN]は生物種
[TITL]はタイトル
を指定しています。
04:
05:
06:
07:
08:
09:
10:
11:


では次に検索の対象をタンパク質に絞って、その一覧をfasta形式のファイルに出力してみます。

use Bio::SeqIO;
use Bio::DB::GenBank;
use Bio::DB::Query::GenBank;
$query = "Homo sapiens[ORGN] AND TNFa[TITL]";
$query_obj = Bio::DB::Query::GenBank->new(-db => 'protein', -query => $query );
$gb_obj = Bio::DB::GenBank->new;
$stream_obj = $gb_obj->get_Stream_by_query($query_obj);
$seqio_obj = Bio::SeqIO->new(-file => '>sequence.fas', -format => 'fasta' );
while ($seq_obj = $stream_obj->next_seq) {
$seqio_obj->write_seq($seq_obj);
}


解説
01:use Bio::SeqIO;
02:use Bio::DB::GenBank;
03:use Bio::DB::Query::GenBank;
04:$query = "Homo sapiens[ORGN] AND TNFa[TITL]";
05:$query_obj = Bio::DB::Query::GenBank->new(-db => 'protein', -query => $query );
06:$gb_obj = Bio::DB::GenBank->new;
07:$stream_obj = $gb_obj->get_Stream_by_query($query_obj);
08:$seqio_obj = Bio::SeqIO->new(-file => '>sequence.fas', -format => 'fasta' );
09:while ($seq_obj = $stream_obj->next_seq) {
10:$seqio_obj->write_seq($seq_obj);
11:}

01:~03:おまじない
04:
05:
06:
07:
08:
09
10:
11:09の{を閉じた。
スポンサーサイト

Home

最新記事はRSSで
コメント
最新トラックバック
リンク
ブログで苗木 グリムス
blog parts

track feed

Powered by SEO Stats

ページランク

個人サイト検索 あったかNAVI

この日記のはてなブックマーク数

フィードメーター - バイオ やばいぉ・・・

tracker あわせて読みたいブログパーツ

Page Top

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。