Home > スポンサー広告 > バイオインフォマティクス用語集

スポンサーサイト

スポンサード リンク
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

Comments:-

コメント欄

Trackback:-

この記事へのTrackBack URL
http://bioinformatics.blog7.fc2.com/tb.php/2-bfdf975a
スポンサーサイト from バイオ やばいぉ・・・

Home > スポンサー広告 > バイオインフォマティクス用語集

Home > バイオインフォマティクス用語集 > バイオインフォマティクス用語集

バイオインフォマティクス用語集

スポンサード リンク
* ORF→あるDNA二重鎖が一連のコドン(連続した3塩基の組)によってタンパク質をコードする場合,一方向に3つ,逆方向に3つ,合計6つの読み枠(reading frame)がありうる.そのうち,実際に遺伝子としてタンパク質をコードしている読み枠のことをOpen Reading Frame(ORF)とよぶ。

ORFは開始コドン(ATG)で始まり終止コドンで終わっている領域のことで、タンパク質をコードしている可能性が高い。

* SOSUI→美宅成樹教授を中心とする研究グループによって開発された、膜タンパク質やダンベル型タンパク質の判別と2次構造予測、およびシグナルペプチドの予測を行うソフトウェアです。
既知の配列との相同性比較やニューラルネットワークなどを用いた予測法と異なり、新規に定義したものを含む複数の指標を用いることで、従来の手法よりも高速に予測・判別を行うことが可能です。
* PSORT→中井教授(HGC) による、細胞内のタンパク質局在部位を予測するプログラムです。入力情報として、アミノ酸配列とその生物種の情報を受けとると、既知のタンパク質分類シグ ナルの様々な配列の特徴を記したルールに基づいて分析します。その結果、入力されたタンパク質が局在する候補部位を、その可能性の情報と共に出力します。
* アラインメント→複数の配列を比較して、似ている部分同士を並べ合わせることです。置換、挿入、欠失の操作を用いて、もっともコストの低い組み合わせを探索して文字の一致数を最大にします。アラインメントには、類似性の高い部分を局所的に調べるローカルアラインメント(局所的アラインメント)と、配列全体の類似性を調べるグローバルアラインメント(大域的アラインメント)がある。例えば、2つのアミノ酸配列MIGMMITとMMIGPITは、局所的な類似性を考慮して、
  MIGMMIT
  ---MMIGPIT
のようにアラインメントをとることができる。このようなアラインメントをローカルアラインメントという。また、配列全体の類似性を考慮して、
  M-IGMMIT
  MMIGP-IT
のようにアラインメントをとることができる。このようなアラインメントをグローバルアラインメントという。
* マルチプルアラインメント→複数の配列が与えられた際に,文字間の最適な対応関係を求め,配列の一致度を最大になるよう整列することである.整列の方法として,空白を挿入し列の開始位置をずらす,配列の途中にギャップ (-)を挿入する,といった操作で実行する。配列の個数が2つの場合はペアワイズアライメントという。
* アノテーション→配列のもつ機能の特定や意味づけをすること。
* アルゴリズム→コンピュータを使ってある特定の目的を達成するための処理手順。
* 隠れマルコフモデル(Hidden Markov Model; HMM)→相同配列のファミリーを規定する微妙なパターンを記述するためのコンピュータ用の構造で、遠い類縁関係を検出し、タンパク質の折りたたみパターンを予測するための強力なツールになっている。



* ハッシュ法→データ検索アルゴリズムの一種で、もっともポピュラーなものの一つ。検索対象のデータを一定の規則にしたがってハッシュ値と呼ばれる整数に変換し、ハッシュ値を比較して検索を行なう方式。
* ホモロジー解析→遺伝子やタンパク質の機能を、生物種間のアミノ酸配列の類似性に基づいて調べる手法。遺伝子およびタンパク質の機能を調べる有力な手段となる。代表的な解析ソフトウェアとしてFASTA(Fast Alignment)およびBLAST(Basic Local Alignment Search Tool)がある。FASTAとBLASTを比べるとBLASTのほうが処理速度は速いため、より一般的に使われている。FASTAは検索感度に優れているので、より詳しい解析に用いられる。
* Smith-Watermanアルゴリズム→ローカルアラインメントでは、アラインメントしたい領域が明らかでなく、2つの配列の部分的に良いアラインメントを求める必要がある。このようなアラインメントは、例えば、2つのタンパク質が共通のドメインをもっていたり、広い範囲のゲノムDNA配列の断片を比較する場合などに意味がある。例えば、2本の配列がその全体にわたって共通の祖先から進化したものではあるが、それらが非常に離れてしまった場合の配列の比較に適用できる。Smith-Watermanアルゴリズムは最適なローカルアラインメントを求めるアルゴリズムである。
* Needleman-Wunschアルゴリズム→ダイナミックプログラミングを適用したグローバルアラインメントのアルゴリズムである。最適なスコアとアラインメントを計算するアルゴリズムの一つであり、m×nのステップ数(m、nは2つの配列の長さ)を要します。これらのダイナミックプログラミングアルゴリズムは、最初はタンパク質配列の比較のために、NeedlemanとWunschによって開発されたものです。
* ダイナミックプログラミング法→ 問題を段階的に解く過程で、ある段階(部分問題)で得られた最適解をもとに、次の段階(より大きなサイズの部分問題)の最適解を求めるという操作を繰り返 し行う手法をいう。ダイナミックプログラミング法は、全てのアラインメントの可能性を探索して、その中から最適なグローバルアラインメントを確実に探すこ とが出来ます。
* 配列データベース核酸塩基配列→GenBank、DDBJ、EMBL。
* 配列データベースアミノ酸配列→SwissProt、PIR、PRF。
* 配列データベースヒトゲノム配列→UniGene (NCBIが提供する配列データの重複をなくした核酸配列データベース)、DDBJ/CIB Human Genomics Studio<ヒトゲノム情報工房>(DDBJ/EMBL/GenBankのDNA配列データからヒトゲノム配列の再現が試みられている。)、HOWDY<ヒトゲノム情報統合データベース>(科学技術振興事業団が開発したヒトゲノム情報の統合データベース)、RefSeq、Human Genomeなど。
* 配列データベース真核生物ゲノム配列→Mouse、Rat、ZebraFishなど。
* 配列データベース微生物ゲノム配列→XanaGenome。
* 配列データベースウイルスゲノム配列→Complete Viral Genomes、Retro Viruses。
* 配列データベース多型・変異データ→JSNP:IMS-JST SNPs Databa、NCBI's dbSNP、The SNP Consortium、Whitehead cSNP Data、HGBASE (Human Genic Bi-Allelic SEquences)、PMD。
* 配列解析アミノ酸・核酸配列相同性検索→BLASTが 中心。相同性検索のための強力なツールである。2本の配列を比較したときに,連続した5個のアミノ酸のみが完全に一致している場合も「相同」と言うことが できますし,数百個のアミノ酸のうち20%程度が一致している場合も「相同」と呼ぶことができます。そこで,前者の例を局地的相同性(local homology),後者の例を全体的相同性(global homology) と呼んで区別します。つまり,局地的相同性は短い配列部分が類似していることで,全体的相同性は比較的長い領域,あるいは配列全体にわたって類似している ことです。また,相同性には程度の差があります。配列の90%が一致しているような相同性の高い配列もあれば,10%程度が一致しているに過ぎない相同性 の低い配列もあります。BLASTの 検索によって発見できるのは,高い局地的相同性を持つ配列です。高い全体的相同性を持つ配列も,問題なく発見できます。低い局地的相同性を持つ配列を発見 できるかどうかは,その相同性の程度と,プログラムのパラメータの設定に依存します。低い全体的相同性を持つ配列を発見することは困難で,たとえばFASTAなどの他のプログラムの方が優れています。また,BLASTでは,たとえ局地的相同性が高くても相同な部分にギャップが入っていると,その相同性を発見できないことがあります。
* 配列解析モチーフ検索→MOTIF(蛋白質と核酸のモチーフを統合的に検索するツール。蛋白質のモチーフデータベースとして、Prosite、BLOCKS、ProDom、PRINTS、Pfamなどを利用。核酸のモチーフ検索はTFSEARCHを利用。Genome Net提供)。
* 配列解析マルチプルアラインメント→PAPIA、Clustalwプログラム(EMBLによって開発されたもっとも標準的なマルチプルアラインメントツール)、T-Coffee(蛋白質、DNAのマルチアラインメントツール。相同性が30%以下の場合にClustalWより精度の高いアラインメントが出来る。)などがある。MAP。
* 配列解析系統樹作成→分子系統樹の作成(分子系統樹作成のためのチュートリアル。分子系統樹の知識が全くない人向けの解説のページもある。京大大学院理学研究科DNA情報学講座提供。)、系統樹の描き方(ClustalWと TreeViewPPCを使って、系統樹を作る方法。)などがある。
* 配列解析遺伝子予測→GeneMark(原核生物に対し、最も頻繁に利用されている遺伝子予測プログラム)、GRAIL(原核生物、真核生物共に利用できる遺伝子予測プログラム)がある。両プログラムとも遺伝子予測を行うソフトウェアであるGenScanである。
* 配列解析スプライス部位予測→Splice Site Prediction、NetGene
* 配列解析プロモータ部位予測→Neural Network Promoter Prediction 、 PROSCAN、 McPromoter V3、 CorePromoter。
* 配列解析プライマー設計・制限酵素地図作成→WebCutter 、WWWtagc、Primer3。
* 配列解析膜貫通領域予測→SOSUI 、TMHMM、DAS 、HMMTOP 、PHDhtm、 TopPred MEMSAT、SPLIT、TSEG、TMpred、PRED-TMR、TMAP


Comments:0

コメント欄

Trackback:0

この記事へのTrackBack URL
http://bioinformatics.blog7.fc2.com/tb.php/2-bfdf975a
バイオインフォマティクス用語集 from バイオ やばいぉ・・・

Home > バイオインフォマティクス用語集 > バイオインフォマティクス用語集

あわせて読みたいブログパーツ

Page Top

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。