発表・掲載日:2004/04/20

完全長ヒトcDNAに基づくヒト遺伝子統合データベースを全世界に一斉同時公開

-世界最大のヒト遺伝子カタログ 国際協同の下でミレニアムプロジェクトの成果を結集-


概要

 この度、社団法人バイオ産業情報化コンソーシアム(JBIC、中央区八丁堀、会長:平田正)、独立行政法人産業技術総合研究所(AIST、千代田区霞ヶ関、理事長:吉川弘之)生物情報解析研究センター(BIRC/AIST、江東区青海、センター長:渡辺公綱)、国立遺伝学研究所生命情報・DDBJ*1研究センター(CIB-DDBJ/NIG、静岡県三島市、センター長:五條堀孝)は、完全長ヒトcDNAに基づくヒト遺伝子統合データベース[H-Invitational Databasehttp://www.h-invitational.jp]を全世界に一斉同時公開致します。このデータベースは4月16日午前11時から試験公開を開始し、4月20日午前0時から本運用を開始しました。

 このデータベースは、「精査されたヒト遺伝子の世界最大のデータベース」であり、国際標準化を実質的に果たした「ヒト遺伝子の機能情報カタログ」とも言うべき存在です。従来のゲノムプロジェクトにみられる予測された遺伝子配列に加えて、遺伝子発現が実験的に確認されているmRNAから作成された完全長ヒトcDNA配列の情報に基づいて作成されたデータベースであるため、信頼性の高い多様な情報が含まれています。それゆえ、このプロジェクトは、「もうひとつのゲノムプロジェクト」と呼ばれています。

 このデータベースは、遺伝子の伝えるもの、すなわち、生命の仕組みを理解するのに役立つことはもちろん、その波及効果として、病因解明とその対策、創薬といった我々の健康増進や産業化に役立つことも期待されます。

 本研究成果は、4月20日に国際学術雑誌PLoS Biologyホームページ (www.plos.org)においても発表されました。

*1日本DNAデータバンクの略

H-Invitational Databaseのサンプル画面の図
H-Invitational Databaseのサンプル画面。遺伝子構造や機能予測などの有用な情報だけでなく、外部のデータベースへのリンク(黒で表示)も多数用意されています。


研究の内容

 完全長ヒトcDNAは、コンピュータ予測だけでは確定しないゲノム上のヒト遺伝子を実験的に同定する効率的な方法として知られています。わが国では、かずさDNA研究所の先導的でユニークな長鎖cDNAプロジェクト、および経済産業省主導で行われた国家プロジェクトである完全長ヒトcDNAプロジェクト(FLプロジェクトと略称される。FLプロジェクトはバイオテクノロジー開発技術研究組合受託のNEDO事業として実施された。FLプロジェクトでは、東京大学医科学研究所・へリックス研究所・かずさDNA研究所がcDNA資源を提供し、バイオテクノロジー開発技術研究組合に集う10数社の企業が分担して解析を行った)により、世界中のこの種のデータの約60%以上を占めるという高い貢献率を誇っています。2002年には、五條堀孝、今西規、菅野純夫(東京大学医科学研究所教授)、野村信夫(生物情報解析研究センター副センター長)らが、わが国におけるこれらの貢献率とバイオインフォマティクス技術の先進性を背景に、世界の他の大量データ生成拠点である米国保健研究センター(NIH)・エネルギー省(DOE),ドイツがんセンターDKFZ、中国上海ゲノムセンターに対し、完全長ヒトcDNAの配列情報とヒトゲノム配列との対応や機能予測などの有用情報の付加、全ヒト遺伝子の同定、およびその国際的標準化を目指して、超大型のアノテーション・ジャンボリーといわれるワークショップをわが国主導で開催することを呼びかけました。その結果、世界中のほぼすべてにあたる約42,000本にのぼる完全長ヒトcDNAの配列情報収集に成功しました。これらの完全長ヒトcDNAの配列情報に対し、国内外、計44の著名な研究機関から約120名の研究者が東京・臨海副都心に結集し、2002年の8月末から9月初めにかけ10日間にわたって、研究史上世界最大のヒト遺伝子「アノテーション・ジャンボリー大会(H-インビテーショナル)」を行うことができました。この大会の成果を、生物情報解析研究センターと国立遺伝学研究所DDBJの研究者が1年以上もかけて精査するとともに、更新を適宜できるようにして、この度、ついにわが国から世界中に発信公開することにこぎつけました。これらの成果は学術論文にもまとめられ、著者158名による大論文として4月20日に、新しい大型の国際学術雑誌PLoS Biology (www.plos.org)に掲載されました。

 我々は、このデータベース構築とその研究の過程において、現在世界で流通している最大のヒト遺伝子カタログ(RefSeq)に含まれない5,155個もの新規ヒト遺伝子候補、および数多くのヒト機能性RNAの同定に成功する等、種々の新発見を見い出しております。この世界最大のヒト遺伝子統合データベースは、生命の仕組みを理解するのに役立つことはもちろんのこと、がんなどの病因解明とその対策、創薬に向けての産業化や健康増進ための基礎情報の提供などに幅広く役立つことが期待されます。

 このデータベースは、日本政府国家プロジェクトのミレニアムゲノムプロジェクトの一環として、国立遺伝学研究所 生命情報・DDBJ研究センターの協力のもと、社団法人バイオ産業情報化コンソーシアムと独立行政法人産業技術総合研究所の生物情報解析研究センター統合データベース解析グループにおいて2000年度より24.6億円を投じて構築されています。また、当研究チームでは、機能アノテーションを付与した今回の約4万2千の完全長ヒトcDNAクローンについて、その塩基配列及び機能アノテーション情報の公開だけでなく、完全長ヒトcDNAクローンそのものについても、国内外の希望者が利用できるように体制を整えています。

H-Invitational 参加機関

全44機関、12カ国 (順不同)  

日本 (19)
産業技術総合研究所・生物情報解析研究センター
(社)バイオ産業情報化コンソーシアム・生物情報解析研究センター
(財)かずさDNA研究所#
日本原子力研究所
理化学研究所
産業技術総合研究所・生命情報科学研究センター
国立遺伝学研究所
国立感染症研究所
東京大学#
京都大学
東京医科歯科大学
大阪大学
慶応大学
東京工業大学
名古屋大学
九州大学
(株)リバース・プロテオミクス研究所
(株)日立製作所・中央研究所
大正製薬(株)
アメリカ (9)
Department of Energy
The Institute for Genomic Research
Medical College of Wisconsin
Lawrence Berkeley National Laboratory
National Cancer Institute#
National Center for Biotechnology Information
The Pennsylvania State University
University of Cincinnati
University of Iowa
英国 (4)
European Bioinformatics Institute
The Human Genome Organisation Gene Nomenclature Committee
Sanger Institute
University College London
ドイツ (3)
Deutsche Krebsforschungszentrum#
German Resource Center for Genome Research
Munich Information Center for Protein Sequences
スウェーデン (2)
Karolinska Institute
Royal Institute of Technology
フランス (1)
Centre National De La Recherche Scientifique
中国 (1)
Chinese National Human Genome Center#
韓国 (1) Korea Research Institute of Bioscience and Biotechnology
ブラジル (1) Ludwig Institute of Cancer Research
オーストラリア (1) Murdoch University
南アフリカ共和国 (1) South African Bioinformatics Institute
スイス (1) Swiss Institute of Bioinformatics

#完全長ヒトcDNA資源提供機関。この他に、旧へリックス研究所からも、完全長ヒトcDNA配列情報が提供された。

年表

年代
世界の動き
ゲノムサイエンス
大規模国際会議
完全長cDNAプロジェクト
ヒト遺伝子発現解析
1986 ヒトゲノム計画準備活動開始 米国DOE及びNIHが相次いでヒトゲノム計画の推進準備を開始      
1990 ヒトゲノム計画が本格的に開始 米国NIH-DOE共同ヒトゲノム計画第1期開始
このころ、各国のヒトゲノム計画発足
     
1991   文部省創成的基礎研究「ヒトゲノム解析研究」及び重点領域研究「ゲノム情報」発足
東大医科研ヒトゲノム解析センター設置
    発現タグ
(EST)解析の提唱(Adams & Venter
1992 地球サミットでリオ宣言、アジェンダ21を採択
生物多様性条約、温暖化防止条約採択
農水省「イネゲノム計画」発足     ”ボディマップ”提唱(Okubo & Matsubara
1993 『アルバカーキー・トリビューン』がプルトニウム人体実験を報道 神戸でヒトゲノム国際会議「HGM93’」開催      
1994 生命倫理法(仏)
WTO設立、TRIPS(知的所有権の貿易的側面に関する協定)を定め生物特許も容認
国連国際人口・開発会議(カイロ会議)、リプロダクティブ・ヘルス/ライツの推進採択
    ヒト長鎖cDNA解析開始(かずさDNA研究所)

オリゴ・キャッピング法(Maruyama & Sugano)
 
1995 地下鉄サリン事件(オウム真理教、バイオテロも計画)(日) インフルエンザの全ゲノム配列決定
日本科学技術情報センターのヒトゲノムシークエンス事業開始
    Genexpress Index (EST解析)(Auffray, C.
1996 体細胞クローン羊(ドリー)誕生(英)
らい予防法廃止、優生保護法を母体保護法に改正
文部省重点領域研究「ゲノムサイエンス」発足
ヒトゲノムの高精度連鎖地図公表(Genethon)
かずさDNA研究所らん藻の全ゲノム配列決定
パン酵母の全ゲノム配列決定
  ヒト完全長cDNA解析開始(ヘリックス研究所、東大・医科研) IMAGEコンソーシアム(Lennon, Auffray, Polymeropoulas & Soares)
1997 臓器移植法成立(日)
ユネスコ「ヒトゲノム及び人権に関する世界宣言」
大腸菌の全ゲノム配列決定     CGAP(EST解析) (Strausberg, R.)
1998 ヒトES細胞の樹立(米)
アイスランドで保健部門データベース法成立(国民の遺伝情報データベース構築)
    FLプロジェクト開始(通産省・NEDO・バイオ組合?東大医科研・ヘリックス研究所・かずさDNA研究所) :
ドイツcDNA解析プロジェクト開始(Wiemann, S.)
 
1999       MGCプロジェクト開始(米国 NIH)
「戦略的ヒトcDNAゲノム応用技術」プロジェクト(バイオ組合)
iAFLP法(Okubo, K.)
2000 生物多様性条約特別締約国会合でバイオセイフティ議定書採択(生きた改変生物の輸出入規制)
「ヒトに関するクローン技術等の規制に関する法律」公布(日)
ショウジョウバエゲノム発表(Adams MD   中国cDNAプロジェクト開始(Chinese National Human Genome Center)

「完全長cDNA構造解析」プロジェクト(バイオ組合)
 
2001 ヒトゲノム概要版発表
炭疽菌テロ事件(米)
WTO閣僚会議(ドーハ)で最貧国によるエイズ薬等の類似医薬品の生産を容認
ヒトゲノム概要版発表(Lander ES; Venter JC
マウスゲノム概要版発表(Mouse Genome Sequencing Consortium
ラットゲノム概要版発表(Marshall E
Flybase(ショウジョウバエ、The Gene-Ontology-Consortium
FANTOM(マウス)
大規模EST解析(Simpson, A.
2002 新型肺炎の重症急性呼吸器症候群(SARS=サーズ)が中国広東省・香港あたりで発生し、世界に拡散   FANTOM2(マウス)
RAFL(シロイヌナズナ)
H-Invitational(ヒト)
  大規模発現タグ(Long SAGE)解析(Kinzler & Velculescu
2003 ヒトゲノムの解読が完了したと、日米英独仏中6か国政府が宣言   H-Invitational 2 (ヒト)    
2004     H-InvDB公開(ヒト)    


用語の説明

◆完全長cDNA
cDNAとは、ゲノムDNAの中から不要な配列を除き、タンパク質をコードする配列のみに整理された遺伝情報物質であるmRNA(メッセンジャーRNA)を鋳型にして作られたDNAのこと。完全長cDNAは、断片cDNAと異なり、全長のタンパク質を合成するための設計情報を有しているため、完全長のタンパク質を合成することができる。この完全長cDNAを効率的に合成するためには、非常に高い技術を必要とし、わが国が世界に先んじている(mRNAについては、注5を参照のこと)。[参照元へ戻る]
H-Invitational(H-インビテーショナル)
本文中にも記載があるが、国内外の44機関が参加し、ヒトの全ての遺伝子に対してアノテーションを行うという国際共同研究プロジェクト。オープンではなく、資格を有する限られた者のみを招待したところからinvitational(インビテーショナル)は来ている。[参照元へ戻る]
◆ヒトゲノムプロジェクト
ヒトを始めとした様々な生物の遺伝情報を全て、すなわちゲノムDNAの文字配列を全て明らかにする国際的なプロジェクトである。
注4) mRNA(メッセンジャーRNA):ゲノムの情報がアミノ酸(タンパク質)に翻訳されるためには、一旦RNAに写し取られる必要があり、それをmRNAと呼ぶ。メッセンジャー、すなわちゲノムの情報をタンパク質に伝えるものである。[参照元へ戻る]
◆mRNA(メッセンジャーRNA)
ゲノムの情報がアミノ酸(タンパク質)に翻訳されるためには、一旦RNAに写し取られる必要があり、それをmRNAと呼ぶ。メッセンジャー、すなわちゲノムの情報をタンパク質に伝えるものである。[参照元へ戻る]
◆バイオインフォマティックス
生物情報学とも訳される。 生命現象を情報の流れとして捉え、情報解析の手法を用いることによって生命現象を解析するという立場の生物学分野。[参照元へ戻る]
◆アノテーション(Annotation
自由な様式あるいは、統一された用語による解説、注釈、参照、引用などの組合せのこと。これらの総合により、遺伝子やタンパク質に関する実験に基づく情報又は文献等から推論された情報のすべてが記述された付注。[参照元へ戻る]
◆機能性RNA分子
元来、RNAはゲノムの情報をアミノ酸へ伝える役割を担い(前述のmRNA)、タンパク質が生体内の機能を司るものと考えられてきた。しかし酵素(タンパク質)と同じ働きを持つRNAが発見されたことで、いろいろな機能を持つRNAが生体内で作られていることが現在発見されている。そのようなRNAを総称して機能性RNAと呼び、昨今、重要視されている。われわれは、このデータベースにおいて、ORFが予測されなかったcDNAに関してアノテーションを行い、機能性RNA分子の候補を公開している。[参照元へ戻る]
◆ORF
Open Reading Frameの略。タンパク質をコードしている可能性のあるDNA領域。オープン・リーディング・フレームは開始コドンから始まり、終止コドンで終わる。開始部位から停止部位の間に終止コドンが存在することはない。通常、ORFとみなすためには隣接アミノ酸100個以上の長さが必要である。ORFの同定は、DNAセグメントが機能遺伝子の一部である可能性を最初に示すものである。[参照元へ戻る]


お問い合わせ

お問い合わせフォーム