発表・掲載日:2013/01/15

全ゲノム配列を用いてヒトの進化を再構築

-ヒトとチンパンジーの異種間交雑は過去に起こらなかった-

ポイント

  • 過去に提唱された「祖先におけるヒト-チンパンジー間の異種間交雑」仮説を否定した。
  • ヒトとチンパンジーの種が分岐した年代は600~760万年前と推定された。
  • 全ゲノム配列を用いた進化の解明は、化石記録の理解や遺伝性疾患の原因解明に役立つ。

概要

 独立行政法人 産業技術総合研究所【理事長 野間口 有】(以下「産総研」という)バイオメディシナル情報研究センター【研究センター長 嶋田 一夫】分子システム情報統合チーム 今西 規 招聘研究員らは、国立大学法人 総合研究大学院大学先導科学研究科 颯田 葉子 教授と共同で、ヒトおよび類人猿の進化の歴史を、全ゲノム配列情報を用いて解明した。

 生物種のゲノム配列同士を比較し、配列間の違いの程度を集団遺伝学理論に基づき解析することによって、生物種がどのように進化してきたかを再構築することができる。本研究は、ヒト、チンパンジー、ゴリラ、オランウータンの全ゲノム配列を解析し、ヒトとチンパンジーの種が分岐したのは一度のみ起きたことを示し、「祖先におけるヒトとチンパンジーの交雑」仮説を否定した。また、ヒト系統とチンパンジー、ゴリラの種分岐年代はそれぞれ600~760万年前、760~970万年前と推定され、近年考えられていた分岐年代より古いことがわかった。これらの種分岐年代は、ヒトの進化研究においてゲノム配列および化石記録を統合して理解していく上で、決定的な指標になると期待される。この研究には膨大な計算量を要したため、2011年に産総研に導入された大型計算機AIST Super Cloudを用いた。

 なお、この研究成果は、2012年9月12 日にGenome Biology and Evolutionにオンライン掲載され、同誌2012年11月号に掲載された。(Genome Biology and Evolution. 4:1133-1145, 2012)

ヒトと類人猿の進化の歴史の図
図1 ヒトと類人猿の進化の歴史

研究の社会的背景

 最初のヒトゲノム解読から11年経った2012年、ヒトゲノムが持つ機能を網羅的に調べ上げるプロジェクトENCODEの成果が発表された。今後は、ヒトゲノムを中心としたヒト疾患研究や創薬研究が加速されていくと期待される。

 このようにヒトゲノムを産業的に活用することの基礎的な背景となるのが、「ヒトらしさ」の特徴の解明である。「ヒトらしさ」をかたちづくる遺伝的な特徴は、進化においてヒトの系統特異的に起きたゲノム上の変異により生じた。生活習慣病など多くの疾病に関する遺伝的変異がヒト系統に特異的に起きたことが知られているため、疾病がどのように生じたかを明らかにするにはヒト特異的なゲノムの変異とヒトに特有の特徴における変化の関係を明らかにする必要がある。

 この「ヒトらしさ」をゲノムから理解するためには、ヒトの進化的な歴史をはじめに知らなければならない。遺伝的変異が起きた系統の特徴を明らかにすることにより、その変異がヒトにのみ起こったことかどうかが判断できるからである。しかしながら、ヒトと類人猿の種が分かれた過程については未だ統一見解が得られていない。古生物学および集団遺伝学では、ヒトと最も近縁種であるチンパンジーの間に種が分岐した後に交雑が起きたかについて長く論争になっており、2006年にはパターソン(Patterson)らが限られたゲノム配列を用いて交雑仮説を提唱している。一方で交雑を反証する論文も多く存在する。近年、ヒトゲノムだけではなく類人猿のゲノムも全長が解読され、網羅的なゲノムデータを用いてヒトとチンパンジーの種分岐問題を再検討できる条件が整って来ていた。

研究の経緯

 産総研では、ヒト完全長cDNAに基づくヒト遺伝子データベースH-InvDBを2004年に開発した。H-InvDBはヒト遺伝子研究において最初に参照すべきデータベースとして研究者間で長く支持されている。また、H-InvDBにはヒト遺伝子に関する様々な副次的なデータベースがあり、比較ゲノムデータベースG-compassや分子進化データベースEvolaでは、H-InvDBの成果をもとに解析、注釈づけされたゲノムおよび遺伝子の進化情報を公開している。本研究ではこれらのデータベースおよびデータ作成ツールを活用した。

 なお、本研究はJSPS科研費(24657168)による支援を受けて行われた。

研究の内容

 ゲノム配列は生物が持つ遺伝情報の全てであり、細胞内ではDNAとして存在し「生命の設計図」ともいわれる。広辞苑200冊分の情報(約30億文字)を持つヒトゲノム配列は、DNA複製においてごくまれに起きるエラーにより、親から子へ伝わる際に数十か所の「誤記」が生じる。このような誤記を突然変異と呼ぶ。長い年月の後に変異を持つ系統が途絶えてしまうこともあるが、ごくまれに集団が特定の変異を持つ子孫のみで構成されるようになることがある(固定という)(図2)。動物ゲノムにおける突然変異の大部分はゲノムが持つ生物としての機能には影響を与えないため、突然変異がその集団に固定するかどうかは偶然に決まることになる。一方、時々生じる有害な変異は、遺伝子の機能に支障をきたし子孫を残すことに不利になるため速やかに途絶えてしまい、さらにごくまれに生じる生存に有利な変異は集団に固定されやすい(これらを自然選択という)。変異と固定の過程を繰り返してゲノムそして生物は進化していく。

 一方、共通祖先から進化してきたと考えられている現生生物種のゲノムは、共通祖先のゲノムに変異が蓄積された結果であると考えられる。従って、現生生物種間でゲノム配列を比較し、互いに異なるゲノム領域を判定することにより、それぞれの種が共通祖先から進化してきた歴史を推定できる。たとえば、ゲノム配列の差異が大きい種同士は古くに分かれ、差異が小さい種同士は近縁で、新しい時期に分かれたことがわかる。ゲノム配列の差異と分岐した時間の関係について統計モデルに当てはめることにより(図2)、種間の種分岐年代を推定することが可能になる。これまで長く用いられてきた骨や歯などの古代生物の化石記録から生物の進化を探る方法とは大きく異なり、ゲノム配列を用いて進化を推定する方法は、大量の情報と定量性に裏付けられる。

変異が集団に固定する過程の図
図2 変異が集団に固定する過程
丸が集団中の個体、線が遺伝子の系統を意味する。濃色の系統が集団中に固定される。大部分を占める淡色の系統は途中で集団から消え集団には固定されない。この図を時間に対し逆にたどると、集団内の個体が持つ遺伝子は共通祖先を有していることがわかる。一方小さい集団(右図)では、変異が集団に広まる時間(あるいは現在から共通祖先までさかのぼる時間)は短くなる。

 パターソン(Patterson)らは2006年にヒトとチンパンジーのゲノムの部分領域を用いた解析から、性染色体であるX染色体における種分岐年代は常染色体より新しいと推定し、その理由をヒトとチンパンジーが祖先において交雑したからであると発表した(図3)。交雑によりチンパンジーゲノムがヒトゲノムに混じると、そのゲノム領域の分岐年代は、最初に種が分岐した時期ではなく、交雑が起きた時期として推定される。このような交雑の痕跡はX染色体だけでなく全ての染色体に見られるはずであるが、パターソンらの研究は、交雑の痕跡がX染色体の全域に見られる一方常染色体には存在しないことを示している。パターソンらは、交雑が起きたヒトの祖先では、チンパンジーの祖先から受け継いだX染色体が生存に大きく有利にはたらき、チンパンジーの祖先のX染色体全域を持つ個体のみが生き残った(選択された)と説明した。

交雑の有無に基づく種分岐のモデル図
図3 交雑の有無に基づく種分岐のモデル
交雑が無い場合には一回だけ種分岐が起きた(左図)。種分岐直前の集団にも図2のような系統関係が成り立っており、すなわち遺伝子(茶線)は種分岐に先駆けて(あるいは同時に)分岐したことを意味する。交雑がある場合(右図)には、種分岐の後に遺伝子の混入が起き(紫線)種分岐より新しい遺伝子の分岐が一部に観察される。

 パターソンらの仮説には2つの疑問が残った。1つは、上記のように交雑の説明があまりにも複雑であること。もう1つは、常染色体とX染色体における突然変異率の差を十分に考慮していないということである。X染色体の突然変異率は常染色体より小さいことが知られている。体内で生成されるオスの精子の数はメスの卵子より多く、細胞分裂にともなってDNAの複製エラーすなわち突然変異が起きる機会が精子に多くなる。父からのみ子に受け継がれるY染色体は突然変異率が高くなり、母から受け継がれる割合が高いX染色体は突然変異率が低くなる。父母から均等に受け継がれる常染色体の突然変異率はそれらの間に位置する。従ってX染色体と常染色体の突然変異率の差を正しく見積もっていない場合には、X染色体と常染色体の種分岐年代を誤って推定してしまう可能性がある。

 ヒトとチンパンジーの種の分岐問題に決着をつけるために網羅的ゲノムデータを用いて解析を行った。ヒト、チンパンジー、ゴリラ、オランウータンの1.9 Gb (19億塩基対) にわたるゲノムアラインメントを作成し、集団遺伝学的モデルに基づいてヒトと類人猿の祖先における種分岐年代および集団サイズを推定した。種分岐年代は、まず「種分岐年代と(1年ごとの)突然変異率の積」として推定され、後述するように適切な突然変異率を代入することにより種分岐年代自体が推定される。ヒト-チンパンジーにおける「種分岐年代と突然変異率の積」は染色体ごとにばらつき、X染色体では小さく推定された。さらに、ヒト-チンパンジーより古いヒト系統-ゴリラの種分岐についても同様に「種分岐年代と突然変異率の積」は染色体ごとにばらつくこと、またこれら別々に起こった分岐において、染色体ごとのこの値の分布は強く相関することがわかった(図4)。この相関は、「染色体間で分岐年代が異なる」か「染色体間で突然変異率が異なる」のいずれかで説明できる。

 「染色体間で分岐年代が異なる」という仮説を説明するには、複雑な仮定を置く必要がある。ヒト-チンパンジーの種分岐とヒト系統-ゴリラの種分岐は時を隔てて別々に起きた出来事であるにもかかわらず、2つの種分岐年代が染色体間で相関するという現象を説明しなければならない。一方、「染色体間で突然変異率が異なる」という仮説は、染色体ごとの進化メカニズムの差異としてよりシンプルに説明できる。このことから、ヒト-チンパンジーの種分岐年代は染色体間で単一である、すなわち、ヒトとチンパンジーの種の分岐は交雑を考慮せずとも1回の種分岐として説明できることが示された。この研究結果は、パターソンらが2006年に提唱した「ヒトとチンパンジーは祖先において交雑し、その痕跡がX染色体に残る」という仮説を強く否定するものである。この解析には膨大な計算量を要した。一般的なパーソナルコンピュータでは数カ月かかる計算を、2011年に産総研に導入された大型計算機AIST Super Cloudを用いたことにより数日で解析できた。
染色体ごとに推定した「種分岐年代と突然変異率の積」における相関図
図4 染色体ごとに推定した「種分岐年代と突然変異率の積」における相関
ヒト-チンパンジー種分岐およびヒト系統-ゴリラの種分岐において染色体ごとに種分岐年代と突然変異率の積を推定しプロットしたところ、これら種分岐に関する2つの値に強い相関が示された。このことは、染色体ごとの推定値のばらつきが種分岐年代ではなく突然変異率の違いによることを示している。

 種分岐年代と突然変異率の積の推定値に適切な突然変異率を代入することにより、種分岐年代を推定することができる。近年のヒト親子ゲノム解析により明らかになった突然変異率を用いると、ヒト系統とチンパンジー、ゴリラ、オランウータンとの種分岐年代はそれぞれ600-760万年前、760-970万年前、1500-1900万年前と推定された。同様にそれらの種分岐に対応する祖先の系統における有効集団サイズ(個体数)は、59,300~75,600、 51,400~66,000、 159,000~203,000であった。これらのゲノム配列から推定された分岐年代は、これまで知られてきたヒト祖先の化石の年代とよく合致している(図1)。最古の人類と考えられるアルディピテクス・カダッパ(520-580万年前)は、ヒト-チンパンジー種分岐直後のヒト系統に属する種と考えられ、約1000万年前のアフリカに暮らしていた大型類人猿、チョローラピテクスナカリピテクスはヒト、チンパンジー、ゴリラの共通祖先であると示唆された。

今後の予定

 本研究の発見から、ゲノム解析に基づく種の分岐の情報と化石記録を統合することにより、ヒトの進化の歴史を詳細に理解できるようになると期待される。さらに本研究の成果は、ヒトゲノムの産業的活用における基礎となる。本研究の発見をもとにヒトゲノムにおけるヒト特異的な性質を同定でき、これらの性質はヒト遺伝性疾患の解明およびヒトゲノムを中心とした創薬・治療法の確立に有用な情報となると期待される。

 また、本研究では新たな課題も発見された。本研究の解析結果からは、染色体ごとに異なる突然変異率が同定されたが、その原因は謎のままである。ゲノムの進化メカニズムの解明は医学・生物学の広い分野に影響を及ぼす重要分野であり、さらなる研究を行っていきたい。

問い合わせ

独立行政法人 産業技術総合研究所
バイオメディシナル情報研究センター 分子システム情報統合チーム
招聘研究員  今西 規  E-mail:t.imanishi*aist.go.jp(*を@に変更して送信下さい。)



用語の説明

◆ゲノム
生物をかたちづくる全遺伝情報。染色体ごとに分かれたDNA配列によって構成される。[参照元に戻る]
◆集団遺伝学
生物集団における遺伝子の構成や頻度に着目し、統計的手法を用いて集団の分岐や適応を調べる研究分野。[参照元に戻る]
◆交雑
異なる種や亜種を親として子を残すこと。[参照元に戻る]
◆種分岐時間(種分岐年代)
2つの種の共通祖先において、それぞれの種の祖先となる集団が分離した年代(時間)。[参照元に戻る]
◆古生物学
生物の化石とその化石を含む地質の特徴から、過去に生息していた生物の形態や生態を解明する研究分野。[参照元に戻る]
◆完全長cDNA(complementary DNA, 相補的DNA)
真核生物ではゲノムの遺伝子領域がmRNA(メッセンジャーRNA)に転写され、mRNAからタンパクが翻訳される。mRNAは転写後にタンパクの翻訳に不必要な領域を切り落とす(スプライシングという)。完全長cDNAは、タンパク作成に必要十分な情報全てを持つスプライシングされたmRNAを鋳型にし、より安定な構造を持つDNA配列に複写したものである。[参照元に戻る]
◆DNA複製
細胞にあるDNA分子を鋳型にして同じ配列を持つ新しいDNA分子が合成されること。2倍になったDNAは、細胞分裂においてそれぞれの細胞に分配される。[参照元に戻る]
◆突然変異
ゲノムを構成するDNAに生じる化学変化。DNAにおける1つのヌクレオチドの塩基が別の塩基に置き換わることを点突然変異という。DNA鎖の一部が欠落することを欠失、新たなDNA鎖が加わることを挿入という。[参照元に戻る]
◆自然選択
生息環境において自身の生存や残せる子の数に対し有利にはたらく遺伝子を持つ個体が、ふるい分けられ生き残ること。不利にはたらく遺伝子を持つ個体は、生存あるいは子孫を残すことが困難になり集団から除外される。[参照元に戻る]
◆性染色体
雌雄で構成が異なる染色体で、細胞核に存在する。哺乳類では一般的にX、Y染色体を指し、これらは性別の決定に大きく関わっている。哺乳類のメスは父母からそれぞれ受け継いだ2本のX染色体を持ち、一方オスは父から受け継いだY染色体、母から受け継いだX染色体をそれぞれ1本ずつ持つ。[参照元に戻る]
◆常染色体
細胞核に存在する性染色体以外の染色体の総称。ヒトでは1~22番染色体のことであり、生物種によって常染色体の数は大きく異なる。それぞれの常染色体は、オス・メスともに父母から1本ずつ受け継いで2つ存在する。[参照元に戻る]
◆突然変異率
単位時間ごとにある1塩基に点突然変異が起きる頻度。単位時間には1年、もしくは1世代が用いられる。[参照元に戻る]
◆ゲノムアラインメント
ゲノムを構成する塩基配列を生物種間で比較できるようにするために、祖先を同一にする塩基が列として並ぶように成形した配列データ。[参照元に戻る]
◆(有効)集団サイズ
集団の遺伝的多様性の指標。任意に交配する理想的な集団モデルに当てはめた場合の集団の個体数で、実際の集団の個体数より少ない。[参照元に戻る]
◆アルディピテクス・カダッバ
約580-520万年前にエチオピアに生息していた猿人。足指の特徴から二足歩行していたと考えられる。近縁種に、約440万年前に生息していたアルディピテクス・ラミダスがいる。[参照元に戻る]
◆チョローラピテクス
チョローラピテクス・アビシニクス。1000万年前のエチオピアに生息していた古代類人猿。形態的性質からはゴリラの祖先と推定されているが、本研究の結果は、ヒト、チンパンジー、ゴリラの共通祖先に近縁であることを示唆している。[参照元に戻る]
◆ナカリピテクス
ナカリピテクス・ナカヤマイ。1000万年前のケニア中部に生息していた古代類人猿。形態的性質からヒト、チンパンジー、ゴリラの共通祖先に近縁であると推定され、本研究の結果もそのことを支持している。[参照元に戻る]