Vol.2 No.4 2009
43/92
研究論文:循環発展的なプロジェクト構造を生むバイオインフォマティクス戦略(諏訪ほか)−303−Synthesiology Vol.2 No.4(2009)しくないものを予測してしまう場合)が含まれる可能性が高い一方で、新規GPCRを含む可能性が高くなる。興味深いことに11番染色体上にGPCRの大部分が集中し、嗅覚受容体がそのほとんどを占めることや、3番染色体にケモカイン受容体が集中することなどが分かったが、これは網羅的な遺伝子同定により初めて可能になったわけである。これらの中で新規と判定した数百の配列について2002年に特許を出願したが、それに対してある製薬企業から内容開示請求があり、開示料収入を得た。つまり製品化研究としての成果が上がったのである。計算手法で構造・機能情報が付加されたGPCR配列は、2003年にデータベースに収めて公開した(SEVENS[7]http;//sevens.cbrc.jp/1.20/、一番最初のバージョン)。この時点では、コア技術が一応完成し、白紙状態からの最初のサイクルとしてのプロジェクトは一度区切りをむかえた。4 循環的な発展を遂げるプロジェクト4.1 ホップ:プロジェクト全体のコア技術開発2000年に始まった本プロジェクトは、要素技術の解析、システム化、製品化と一巡し、WEB公開した後でも続いている。前節の“一順目の本格研究“が、跳躍でいうところのホップの段階だとすると、この後、ステップ、ジャンプと段階が上がっていく過程になる。以下に、その後の共同研究への展開と、それを通じての技術開発の進展を示す。4.2 ステップ:産学との連携からコア技術へのフィードバック2002年、企業と共同しSEVENS中の新規GPCRに関して、ヒトの複数の組織において多くの配列の発現を実験的に確認し、特に重要な配列に対し特許を出願した。計算手法で予測した遺伝子であっても発現が確認できたということは私たちの方針の妥当性を示すことになった。しかし一方で課題も残った。遺伝子の発現確認には、微量な核酸配列サンプルを短時間に急増幅できるポリメラーゼ連鎖反応(PCR反応)という方法を用いたが、この反応解析を行うための配列は、その両末端部分が正確な完全長であることが望ましい。しかし、予測遺伝子には開始(または終止)エクソンの同定に失敗して両末端が欠けていた例が多いことが分かった。このほとんどが、多くのエクソンからなる長い遺伝子で、非常に広い領域に広がっていたため、遺伝子領域周辺の付加伸展長のパラメータが、3.1節で定めた値(1,000塩基)では十分ではなかったのだ。そこで改めて遺伝子存在領域を、常識的な想定範囲よりはるかに広げて検討したところ、驚くことに任意のエクソンの上流、下流140,000塩基までは考慮する必要があることが判明した。SEVENS パイプラインの対象はGPCRだが、各段階のパラメータを替えれば、別の種類のタンパク質に対しても応用可能である。2002年から東京大学のベンチャー研究所と始めた共同研究ではこれを狙った。慢性関節リウマチや多発性硬化症など難治性炎症疾患では、慢性的炎症個所に免疫細胞が過度に集積して組織を破壊する。これはケモカインというタンパク質がその受容体のGPCR(CCR2)と結合することで免疫細胞の遊走を誘発するためなので、ケモカインの結合を阻害する分子(アンタゴニスト)の探索競争になっていた。しかしCCR2と構造が類似し、臓器形成や細胞の分化・増殖時に作用するような別のサブタイプのケモカイン受容体同士でアンタゴニストが交差した際に起きると危惧される副作用を回避するため、アンタゴニストとは別ルートでCCR2を制御する分子を探索することが望まれていた。実験的研究からは、既にCCR2の細胞内C末端に特異的に会合する新規遺伝子(FROUNT)がその候補であることを示していた。一方私たちは、これが複数のヘリックスが繰り返し現れる構造からなる600残基の長いタンパク質であることと、短く弱いモチーフを複数持つという特徴を入れてゲノム中から探索した結果、この新規遺伝子自体と完全一致する領域は2か所しか存在しないが、弱いスコアながら一致を示す領域であれば複数存在することが分かった。この研究はNature Immunology[8]に掲載された。以上、二つの共同研究で再検討した技術をSEVENSパイプラインに反映していくことになった。4.3 ジャンプ:新たな機能予測プログラムの開発2004年から、製薬企業との共同研究が始まった。ここでは、選択的にGタンパク質の活性化を制御できるリガンドを効率的かつ網羅的にスクリーニングする計算機システムを構築し、最終的に結合リガンドが不明なオーファン受容体のリガンドスクリーニングに応用することをめざした。まず、SEVENSのレベルAデータセットから108本のヒトの新規のGPCRを選び出したが、これらはオーファン受容体でもある。次に、スクリーニングする側のリガンドについては、遺伝子同定パイプラインをペプチド性リガンド探索用に最適化してから、既知ペプチド性リガンドを基にしてヒトゲノムから網羅的に同定した。一方で、Gタンパク質活性化をモニターできるプログラムを開発した。まず結合リガンドと共役Gタンパク質が既知の配列(Gi/o型:61、Gq/11型:47、Gs型:23)を用い、認識性能が最も高いとされている機械学習手法のSupport Vector Machine(SVM)法により、リガンド、GPCR、Gタンパク質の様々な部位の物理化学的パラメータから、共役Gタンパク質の種類を判別分類するのに効果的に効くパ
元のページ