発表・掲載日:2008/12/18

RNA二次構造を予測する最高精度のソフトウェアを開発

-RNA医薬品開発、新機能性RNA発見へのツール-

ポイント

  • RNAの二次構造予測で現時点での世界最高精度を達成
  • 機能性RNAの発見や機能解析の効率化に貢献することが期待される
  • バイオインダストリーやRNA医薬品開発のツールとして全世界で利用に期待

概要

 独立行政法人 産業技術総合研究所【理事長 吉川 弘之】(以下「産総研」という)生命情報工学研究センター RNA情報工学チーム 光山 統泰 研究チーム長、木立 尚孝 産総研特別研究員、みずほ情報総研 株式会社【代表取締役社長 小原之夫】(以下「みずほ情報総研」という)浜田 道昭、社団法人 バイオ産業情報化コンソーシアム【会長 秋草 直之】(以下「JBIC」という)佐藤 健吾 研究員、国立大学法人 東京大学【総長 小宮山 宏】(以下「東大」という)浅井 潔 教授らによる共同研究チームは、遺伝子の発現制御で重要な役割をしているRNAの二次構造を予測するソフトウェア「CentroidFold」を開発した。

 RNAは遺伝子DNAからタンパク質が合成される際の中継ぎとしての役割が古くから知られているが、近年そのような役割をしないRNAが遺伝子の発現制御や細胞のガン化などで重要な役割を果たしていることが分かってきた。このようなRNAを機能性RNAというが、機能を発現するには長い1本鎖であるRNA分子が部分的に2本鎖を形成して二次構造と呼ばれる特異的な構造をつくる。

 今回、開発したRNA二次構造予測手法は予測精度の期待値が最大になることを理論的に証明し、ベンチマークテストでも世界最高の精度で二次構造を予測できることを実証した。今後、機能性RNAの発見や、機能解明に貢献することが期待される。「CentroidFold」はフリーソフトウェアとして無償で提供される。

 なお、本研究は、近くイギリスの論文誌Bioinformatics誌に掲載される予定。

RNA二次構造予測手法の概要図

開発の社会的背景

 従来RNAはDNA配列を元にタンパク質を合成するための中間物質と考えられていたが、近年RNAが生体内で様々な機能を担っていることが明らかになり、生命の機能を解明するための重要な物質として位置づけられてきた。このようなRNAを機能性RNAというが、機能性RNAを利用した医薬品の開発も進んでいる。

 RNAが機能を発現するのは1本鎖の長い分子であるRNA分子が、部分的に2本鎖を形成して特異的な構造を形成することに由来する。2本鎖を形成するのは、RNAを構成する4種の塩基(A、G、C、U)のうち、AとU、GとCがお互いに引き合うためである。1本鎖RNAにおける塩基対形成の様子を二次構造とよぶ。(立体構造は三次構造ともよぶ)。

 RNAの二次構造を解明することはRNAの機能解明の重要な手がかりとなる。しかし、二次構造の実験における観測は手間とコストの面で現実的ではなく、計算機による二次構造予測がRNA研究における重要な手段となっている。

 二次構造予測の技術は、生物学実験では欠かせないDNA増幅(PCR)に用いるプライマーの設計や、近年医薬品としての用途を開拓しつつあるRNA干渉に用いるsiRNAの設計、さらにはマイクロアレイに用いるプローブの設計など、バイオテクノロジー産業に広く影響を与える基盤技術である。

 二次構造予測がより正確になることによって、より高い精度のsiRNA設計が可能になったり、生体内におけるRNA分子の機能解明をより正確に推定したりすることが可能になるなど、RNA医薬品開発のための技術水準を一段高めることになる。

研究の経緯

 産総研では将来のゲノム創薬支援技術を目指した基盤技術構築の一環として、機能性RNAの網羅的予測の研究に取り組んでいる。そのために、みずほ情報総研、JBIC、東大と共同でRNAの機能を解明するのに不可欠な二次構造を計算機上で効率よく扱うための基盤技術の開発に取り組んできた。今回、RNA二次構造予測に関する新理論に基づく、世界最高の予測精度を有するソフトウェア「CentroidFold」を開発した。

 本研究は、独立行政法人 新エネルギー技術総合開発機構(NEDO)の「機能性RNAプロジェクト」によって行われた。

研究の内容

 1本の長いRNA鎖がとる塩基対(AとU、GとC)の組み合わせは膨大な数になるが、RNAを安定な状態にする塩基対の組み合わせは限られており、その数は1つではない。従来の予測では最も安定な二次構造を正しい二次構造として求める方法がとられてきたが、最も安定な二次構造が必ずしも正しい二次構造であるとは限らない場合が多々あることが経験的にわかってきた。

 細胞内の物質は1つの構造に固定されているのではなく、熱のエネルギーによって常に形を変化させながらゆらいでおり、RNAもまたゆらいでいると考えられる。従来の二次構造予測では、理論上最も安定な二次構造だとしても、ゆらぎの影響を受けやすいものが含まれている。このことが、従来の予測方法で正しい二次構造を予測できない原因ではないかということが、最近の研究からわかってきた。

 共同研究チームでは、上記の知見に触発され、予測精度の期待値を最大化する独自手法を用い、ゆらぎの影響を受けにくい二次構造予測技術の開発に成功し、RNA二次構造予測を行うソフトウェア「CentroidFold」として実装した。

「CentroidFold」概要図

 「CentroidFold」は、RNAの二次構造予測の精度を評価するために広く用いられているベンチマークデータセット(構造がわかっているRNA)を用いた計算機予測実験によって、従来のRNA二次構造予測手法より高精度であることが実証された。

 「CentroidFold」はフリーソフトウェアとして無償で提供されるほか、インターネットを通じて、二次構造予測サービスが12月18日より公開される。(http://www.ncrna.org

今後の予定

 「CentroidFold」は、二次構造予測の標準的なソフトウェアのひとつとして、生物学におけるRNAの機能解明や、新しい機能性RNA発見のための一助となる一方、バイオテクノロジー産業において、より品質の高いPCRプライマーやsiRNA、マイクロアレイプローブの設計のための一助となることが期待される。


用語の説明

◆RNA
リボ核酸の略称。生命活動に不可欠な物質の一種で、遺伝情報を読み取る役割を担っている。遺伝情報はDNAからRNAに写し取られタンパク質が合成されるが、そのためRNAは中間的な存在と考えられてきた。[参照元へ戻る]
◆機能性RNA
タンパク質に翻訳されることなく、自身が生体内で活性を持ち、転写/翻訳制御などの機能を有するRNA全般を指す。機能性RNAの機能と二次構造(さらには、立体構造)との間には関連がある場合が多いことが知られている。[参照元へ戻る]
◆予測精度の期待値
RNAの二次構造はそのエネルギーが低いほどその構造をとりやすい性質がある。二次構造ごとに熱力学的に計算された構造のとりやすさ(確率)から、二次構造予測の精度の確率的な期待値を求めることができる。[参照元へ戻る]
◆PCR
細胞抽出液などの試料に含まれる特定のDNAを増幅するのに広く用いられる実験方法。標的DNAの選別には特定の塩基配列を持ったプライマーとよばれる低分子のDNA配列が用いられる。プライマーは標的DNAに特異的に結合する配列である必要がある。標的DNA(RNA)が二次構造を形成する可能性があると、正常なPCR反応を妨げてしまう可能性があるため、プライマー設計には標的DNA(RNA)の二次構造を考慮する場合がある。[参照元へ戻る]
◆RNA干渉(RNA interference:RNAi)
siRNAを細胞へ導入することにより、相補的な塩基配列をもつメッセンジャーRNA(mRNA)が分解され、遺伝子の発現が抑制される現象。これまで治療が困難であったがんや遺伝子疾患、感染症など、さまざまな疾患の治療を可能とする医薬品開発技術として期待されている。[参照元へ戻る]
◆siRNA (small interfering RNA)
RNA干渉において、標的遺伝子のmRNAと相補的に結合する20~22塩基程度の短いRNA分子。siRNAがmRNAに相補的に結合することによって、当該mRNAの翻訳が阻害されることで、遺伝子の発現を抑制することができる。標的mRNA配列が二次構造を形成する可能性があると、siRNAが効果を示さない場合がある。従って、siRNA設計には標的mRNAの二次構造を考慮する場合がある。[参照元へ戻る]

関連記事


お問い合わせ

お問い合わせフォーム