カンキツ発現遺伝子の機能推定のための自動処理システム

タイトル	カンキツ発現遺伝子の機能推定のための自動処理システム
担当機関	（独）農業・生物系特定産業技術研究機構果樹研究所
研究期間	2003～2004
研究担当者	藤井　浩清水徳朗島田武彦遠藤朋子大村三男（静岡大）
発行年度	2004
要約	コンピュータ・システム（パイプライン）によりカンキツで発現する大量の遺伝子の塩基配列を配列の類似性に基づいて分類し、既知の遺伝子配列との類似性から遺伝子機能を推定する作業（アノテーション）を自動的かつ連続的に実行することができる。
キーワード	カンキツ、ゲノム、塩基配列、発現遺伝子、アノテーション、パイプライン
背景・ねらい	発現遺伝子の解析は、遺伝子の単離やDNAマーカーの作成、マイクロアレイの設計など広範に利用できるため、重要なゲノム解析手法である。また、近年、塩基配列解読のコストが下がり、発現遺伝子の解読が進み、公共データベースにも多数のEST(発現遺伝子の断片的な塩基配列)情報が公開されている。そこで、大量の発現遺伝子の塩基配列を自動的かつ連続的に処理し、遺伝子機能を迅速に推定するためのアノテーション・パイプラインが不可欠である。
成果の内容・特徴	1. 本システムは、シーケンサから出力された波形データから塩基配列情報を読み取り、クラスタリング及びアノテーションまでを自動的に行う。（図１）。 2. サーバは、以下の５つである。 (1) 塩基配列前処理サーバ：シーケンサから出力される波形データを読み取り、不要配列の除去、配列の類似性の検定、ローカルの相同性検索サーバに対する相同性検索といった波形データ処理の一連の作業を連続的・自動的に行う。 (2) 相同性検索実行サーバ：相同性検索サーバを制御して相同性検索を自動的かつ連続的に行う。 (3) 相同性検索サーバ:主要な９つの遺伝子データベース(SWISS-PROT等)をサーバにダウンロードし、これらに対してBLASTとFASTAを用いて検索を実行する。 (4) クラスタリングサーバ：10万のオーダーの塩基配列を類似性に基づいて分類する。 (5) アノテーションサーバ：発現遺伝子の塩基配列に対して、自動的に３つの遺伝子データベース（PIR、Pfam、Gene Ontology）によるアノテーションを行う。 3. クラスタリングサーバ及びアノテーションサーバの計算結果をWeb経由でブラウザによって閲覧できる。また、双方の計算結果は塩基配列名をキーにしてリンクされている。
成果の活用面・留意点	1. 本システムは、他の果樹の発現遺伝子データも処理可能である。
図表1
カテゴリ	コストデータベース DNAマーカーその他のかんきつ