Vol.2 No.4 2009
44/92
研究論文:循環発展的なプロジェクト構造を生むバイオインフォマティクス戦略(諏訪ほか)−304−Synthesiology Vol.2 No.4(2009)ラメータと最適な判別平面を決定した。最適化パラメータ[9]と判別平面を用いて、リガンド分子量とGPCRを入力すると最初にGs結合タイプを選別後、残りからGi/oかGq/11かの2者判別を行うという階層判別のプログラム(GRIFFIN)にしたが、85 %以上の感度、選択性で予測可能となった[10]。以上を使えば、GPCRに結合するリガンドデータベースを基に、特定のペプチド性リガンドが結合した受容体がシグナル伝達下流で活性化させるGタンパク質種を予測できるので、受容体を発現させる評価系の設計にも役立つ。GRIFFINは、SEVENSの機能解析段階において、機能未知GPCR予測用に利用していくことなった。4.4 再ホップ:研究のスケールアップのため第1種基礎研究これまではヒトゲノムだけを扱った内容だったが、原理的には他の生物ゲノムでも応用可能である。2005年から、文部科学省の特定領域研究に参加し、本格的に比較ゲノム研究を開始したが、それにはSEVENSパイプラインを他の生物用に改良する必要があった。当時、入手できた200を超える原核生物ゲノム、十数種の真核生物ゲノム配列を基に、既知遺伝子をゲノム配列にマップする際の類似期待値スコア(E値)や遺伝子候補領域の上/下流への付加伸展長等を調査した。改良パイプラインを用いたところ、GPCRは原核生物からは殆ど同定されない一方、真核生物種では酵母で数個、植物で十数個、昆虫で約200、魚類、鳥類では約数100、哺乳類では約数100~数1,000見出された。昆虫、線形動物、脊椎動物間で、神経伝達や細胞間相互作用等生命活動に最低限必要な受容体は全生物に保存されていたが、脊椎動物ではより複雑な機能に関連する受容体の種類が急増していた。また外界の化学物質の受容体は、水中、空気中など環境に対応して生物種ごとに特有な分布をみせた。例えば哺乳類ではGPCR遺伝子のうち嗅覚受容体の割合が多く7割程度にも及んだ。これらは高密度な遺伝子重複を繰り返して急増したことを示唆している[11]。多生物種用SEVENSパイプラインはこの時点でほぼ自動化し、生物の種類が増える度に解析し続けることが可能になった。4.5 再ステップ:新規プロトコルを導入したパイプラインの活用様々な生物種からGPCRを同定、公開していることが評価され、2007年から日中共同研究によるカイコゲノムプロジェクトに参加するようになった。カイコゲノムは鱗翅目昆虫で最初に完成した配列で、解析により医療用タンパク質等や新機能絹糸の生産技術開発を加速することで、新しい農薬開発等、昆虫産業の展開に貢献する可能性がある。 私たちは、東京大学、京都工芸繊維大グループと共同し、カイコゲノムから7本膜貫通へリックス型受容体を同定し、ファミリー分布を明らかにした。特に嗅覚、味覚受容体に関しては他の昆虫(ショウジョウバエ、ハマダラカ、ミツバチ)と比べてカイコ特有の性質をいくつか見出した[12]。ここでも、SEVENSパイプラインを昆虫用に改良することから始める必要があった。すなわち、既知遺伝子をゲノムに貼る際の配列類似度スコア、上流、下流へ広げる付加伸展長の調査、および昆虫嗅覚受容体のみに見られる共通配列の隠れマルコフモデル化等を行った。また同定遺伝子数をできる限り最大化することを目指したため、新しいプロトコルを導入した。通常のパイプラインでは、既知遺伝子を種にすると、それよりも多い数の新規遺伝子を含めた遺伝子候補が釣れてくる。そこで、これら新規遺伝子を改めてパイプラインの最初の種にすれば、さらに新規の数が増えていく。こうして予測遺伝子数が収束するまで逐次的に繰り返す(再帰計算)というものである。これを応用し、嗅覚受容体を66個同定したが、この中に含まれる新規受容体18個の発現、機能解析実験により、カイコが桑の葉に強くひき寄せられる要因となる匂い物質(シスジャスモン)とその受容体を世界で初めて同定することができた。これは生物学分野で世界的成果となり、Current Biology誌に掲載された[13]。昆虫用のパイプラインや再帰計算プロトコルは、現在のSEVENSに反映している。4.6 現在の成果 SEVENSとGRIFFIN2009年現在、SEVENSは科学研究費補助金(研究成果公開促進費)の支援のもと、43種の真核生物種に対し24,545遺伝子を収納しており、様々な機能・構造情報を階層的にまとめ、視覚的に表現した総合DBになっている。これまでの共同研究で改良された技術がその都度フィードバックされ、現在は情報量がとても豊富になっている。図4に現在のSEVENSのWEB画面(http://sevens.cbrc.jp)を示す。トップページには真核生物のリストが表示され、生物種を指定すると、検索画面が表示される。ここでの染色体マップ、系統樹アイコン、検索条件入力フォームのいずれからもGPCR詳細解析画面に移動できる。詳細解析画面では選択したGPCRの座標やエクソン配列、配列類似性検索、遺伝子発現パターン、リガンド結合、Gタンパク質結合、アミノ酸配列の組成、予測膜貫通ヘリックス領域、機能モチーフ領域、ドメイン領域、不定形な構造になると予測した領域(ディスオーダー領域)、エクソンーイントロン境界、偽遺伝子、新規遺伝子、立体構造モデリング等の情報が閲覧できる。一方、機能予測のために開発したGRIFFINはWEBで
元のページ