発表・掲載日:2003/06/11

クロック調整により高速LSIの消費電力を半減することに成功

-遺伝的アルゴリズムを用いたクロック調整により、クロック周波数の向上と設計工数の低減も合わせて実現-

ポイント

  • 遺伝的アルゴリズム(GA)を用いたクロック調整により、ギガヘルツ・デジタルLSIの電源電圧を3分の2に低下させることで消費電力を54%削減
  • クロック調整により、動作クロック周波数が最大25%向上
  • 調整時間は1秒未満なので、大量生産にも適用可能な手法
  • クロック調整を前提とした設計手法を用いることで、設計工数を20%削減

概要

 半導体MIRAIプロジェクトを構成する独立行政法人 産業技術総合研究所【理事長 吉川 弘之】(以下「産総研」という)次世代半導体研究センター【センター長 廣瀬 全孝】及び、技術研究組合 超先端電子技術開発機構【理事長 佐々木 元】(以下「ASET」という)は、遺伝的アルゴリズムに基づくクロック調整方式を開発することにより、ギガヘルツ以上の高速動作LSIにおいて、動作クロック周波数を向上させ、消費電力を半減することに成功した。

 一般にギガヘルツを超える高速動作LSIでは、クロックスキュー(クロック信号の伝播時間のずれ)によって、設計どおりのスペックで動作できるLSIの比率(動作歩留)が低下し、価格の上昇を招いている。また高速なクロック動作による消費電力の大きさも問題とされてきた。

 このような背景において、本方式は、目標設計値よりも高いクロック周波数(最大25%向上)でLSI(1GHzALUを含むメモリテストパターン生成器と1GHz乗算器の2種類の回路を実装)を動作させ、電源電圧を標準の1.2Vから0.8Vに下げることで消費電力を54%低減することに成功した。クロック調整は電源電圧の低下によって正しいタイミングで動作できないLSIに対しても有効に働くことが示された。

 また本方式を前提とした回路設計を行うことで、タイミング設計がより簡単となり、その結果、従来よりも設計工数を20%低減できることも明らかになった(高速メモリDDR-SDRAMのコントローラの設計工程を対象として評価)。

 今後は、本クロック調整方式の実用化をさらに進めるために、3ギガヘルツ動作を目標とした実用的LSIチップの開発と、数百メガヘルツ程度のモバイルコンピュータにおける低消費電力化の実験を予定している。

 なお本研究成果の詳細は、2003年6月12~14日に、京都(リーガロイヤルホテル京都)において開催される ”2003 Symposium on VLSI Circuits” において発表される。また、本研究に関連した特許を数件出願中である。



研究の背景

 LSIの微細化と高集積化が進むにつれてクロックスキューの問題は深刻化している。しかしこれについての抜本的な解決策は与えられていない。一方、LSIに対して調整を施すというアプローチは従来付加的な手段であり、主体的に導入されることはなかった。しかし、LSIの微細化によりいよいよ歩留の問題が深刻化したため、従来のように、設計段階で性能を追い込むことの限界が昨今叫ばれ始めている(図1)。

本研究の背景と位置付けの図

図1 本研究の背景と位置付け

 

研究の経緯

 半導体MIRAIプロジェクトで回路システム技術開発を遂行する産総研次世代半導体研究センターの回路システム技術グループは、MIRAIスタート以来、LSIの製造後の調整を重視した回路設計・調整方式として、ポストファブリケーション調整を提唱している。図2のように、ポストファブリケーション調整は「調整回路用いた回路構成」と遺伝的アルゴリズムを用いた「高速調整ソフトウェア」の2つから構成される汎用性の高い技術である。

本研究のアプローチの図

図2 本研究のアプローチ

 

研究の内容

○クロックスキューのために、高速デジタルLSIの動作歩留は低下し、価格は上昇

 クロックは、デジタルLSIの内部動作を制御するための同期信号であり、ある一定周期で発生するパルス信号を用いて、例えばLSI内各部でのデータの取り込み等を行っている。図3はクロックによるデジタルLSIの動作の一例である。 図3(1)において、“+1”と示したのは、入力データを1だけ増加する回路であり、これらがレジスタをはさんで縦列に接続され、クロックが入力されるたびにデータが1ずつ加算されて、LSI内部を転送される様子を示している。入力データは、クロックが入力されるたびにデータが1ずつ加算されて、LSI内部を転送される。例えば、”5”というデータが初段のレジスタに入力された場合(図3(1)の(1)-a)、次のクロックでは2段目のレジスタには”6”というデータが入り((1)-b)、3段目には”7”というデータが入って、”7”が出力される((1)-c)。

 最近のLSIの微細化、高集積化に伴って、本来全く同時にLSIの各部に伝達されるべきクロック信号が、配線の状況等によってそうならないケースが多くなっている。このような本来のクロックタイミングからのずれのことを、クロックスキューと呼んでいる。例えば図3(2)ではレジスタ2へのクロック信号が本来あるべきタイミングよりも早く到着するために、正しい値がレジスタに取り込まれない例を示している(図3(2)の(2)-b)。

 このようなクロックスキューはクロックの高速化、トランジスタの微細化が進むほど、その影響が顕著となるが、これまでのところ抜本的な解決策は与えられていない。

○遺伝的アルゴリズムによるクロック調整方式を提案

 このようなクロックスキューの問題を制御するアプローチをとることで、低消費電力化、クロック周波数向上、設計工数の低減の3つの利点を達成している。

 図3(3)に、本方式の基本アイデアを述べる。先の図3(2)においてクロックの到着が早すぎて誤動作する例を示したが、その誤動作部分のクロック信号線にプログラマブルな遅延素子(以下、「プログラマブル遅延素子」という。)を挿入したのが図3(3)の状態(3)-aと状態(3)-bである。このプログラマブル遅延素子の値を最適な値に設定することにより、正しい演算結果である6をレジスタに取り込めることを示している。このような調整箇所は、LSI全体では多数にのぼるため、もはや人手で発見、調整することは不可能である。そこで遺伝的アルゴリズムを用いたクロック調整方式を考案した。

 遺伝的アルゴリズムは、図4に示すように多数のパラメータの最適値を高速に決定することができる人工知能の探索アルゴリズムである。このクロック調整の場合のパラメータとは、多数のプログラマブル遅延素子の各々における遅延値である。

 クロック、クロックスキュー、クロック調整図
 クロック、クロックスキュー、クロック調整図(1)
 クロック、クロックスキュー、クロック調整図(2)
 クロック、クロックスキュー、クロック調整図(3)
図3 クロック、クロックスキュー、クロック調整


遺伝的アルゴリズムについての図

図4 遺伝的アルゴリズムについて

○タイミングの余裕が少ない回路部分にプログラマブル遅延素子を設計段階から挿入し、LSI製造後にテスタで各チップごとにプログラマブル遅延素子を調整して出荷

 本クロック調整方式が、LSIの開発全体の流れの中で、どのように位置付けられるのかを示したのが図5である。タイミングの余裕が少ないことが設計段階でわかっている場合、その部分にあらかじめプログラマブル遅延素子を挿入した(図5の「1.設計」)上で、LSIを製造する(図5の「2.製造」)。製造後に、遺伝的アルゴリズムを用いた調整ソフトウェアを搭載したテスタによって、各LSIごとに最適な遅延値を遺伝的アルゴリズムによって求め(図5の「3.調整」)、その遅延値をLSIに書き込んで出荷する(図5の「4.出荷」)。

 従来のLSI開発では、調整は最小限にとどめるのが常であるが、本方式は、LSIの製造後での調整を主眼とするため、この回路設計・調整方式を、ポストファブリケーション調整技術と名づけている。

 プログラマブル遅延素子を挿入する部分には、いろいろな階層が考えられる。第一はクロックドメインと呼ばれる、ある程度大きな回路ブロック間でのクロックスキューの解消のためにプログラマブル遅延素子を入れる場合がある。第二は、各ドメインの中でタイミングの余裕が少ない箇所にプログラマブル遅延素子を入れる場合である。

 このようにプログラマブル遅延素子は、必要に応じてLSIの各階層に挿入可能であり、その総数は数百箇所程度までは十分に遺伝的アルゴリズムで扱うことができ、1秒程度の調整時間で各LSIの最適な遅延値を設定可能である。

ポストファブリケーション調整の図

図5 ポストファブリケーション調整(製造後調整)

○クロック調整により電源電圧を下げたLSIでも動作可能

 図6(1)に、クロック調整により、電源電圧の低減が可能な仕組みを示している。LSIの電源電圧を下げると、トランジスタの駆動能力が低下するため、回路ブロックの動作速度も落ちてその結果、クロックによるデータ取り込みのタイミングに間に合わない箇所がいくつも出てくる。図6(1)において水色で示した回路ブロックがそのような遅くなった回路ブロックの例である。そこでこれらの回路ブロックの出力を取り込むクロック信号線に、プログラマブル遅延素子を挿入し、適切な遅延値を与えることで、電源電圧を下げた状態でも、正常な論理動作を実現することができる。本開発では、電源電圧を標準電圧である1.2Vから0.8Vに低下させたが、その状態においてクロック調整を行うことで、全LSIにおいて正常動作を再現した。消費電力は電源電圧の自乗に比例するため、電源電圧が3分の2になったことで、消費電力は54%減となる。

○クロック調整によりクロック動作周波数を最大25%向上

 製造プロセスのバラツキにより、各回路ブロックの動作速度のズレが生じるが、このズレをクロック調整では積極的に生かすことで、最大動作クロック周波数を高めることが可能である。本開発では、消費電力を半減し、クロック周波数の最大25%の向上を実現した。その仕組みを図6(2)で説明する。

 図6(2)の上部では、60ピコ周期で動作するように設計、製作されたLSIでの実行が示されているが、製造バラツキにより、本来の設計よりも早く動く、40ピコ秒や50ピコ秒の回路ブロックが含まれていることがわかる。このような速度のバラツキは、今後LSIの微細化が進むほど発生するので、これを逆に利用することで、クロック周波数の向上が可能である。すなわち、中央の回路ブロックは60ピコ秒でしか動けないが、続く回路ブロックは40ピコ秒で動作する。そこで、プログラマブル遅延素子を挿入し、10ピコ秒の遅延を意図的に入れることで、この二つの回路ブロックの間でタイミングの貸し借りが行われ、50ピコ秒周期での実行が可能となる。つまり、60ピコ秒周期から50ピコ秒周期へのクロック周波数向上が行われるわけで、この例だと20%の向上であるが、実際の実験では25%向上を果たしている。

 図7に、本技術の基本的な測定結果を示す。2種類の中規模回路(メモリテストパターン生成回路と乗算器)において、クロック調整の前後で動作歩留が最大で15%から90%まで向上している様子が示されている。また、動作するチップの分布が高速側にシフトしていると理解することもできる。

クロック調整による電源電圧の低下とクロック周波数の高速化の図(1)
 

クロック調整による電源電圧の低下とクロック周波数の高速化の図(2)
図6 クロック調整による電源電圧の低下とクロック周波数の高速化


ポストファブリケーション・クロック調整の効果の図
図7 ポストファブリケーション・クロック調整の効果

○2種の1GHzデジタル回路を試作して実証。設計実験での検証も達成

 本研究開発では、まずプログラマブル遅延素子のLSI回路を作成した。このプログラマブル遅延素子は、最短で30ピコ秒のクロックスキューを調整することができる。30ピコ秒は、1Ghzのクロック周波数では3%の誤差に相当する値である。これを用いて、2種の1GHzデジタル回路(1GHzALUを含むメモリテストパターン生成器、1GHz乗算器)を作成し、クロック調整実験を行った。その結果は、すでに述べたように、全チップにおいて最大25%のクロック周波数の向上と0.8V動作(54%の低消費電力化)が実現した。

 さらに、高速メモリDDR-SDRAM用コントローラの設計工程を評価対象として、クロック調整方式の適用を前提とした回路設計を行い、表1に示すように、従来手法に比較して、回路設計の種々の段階での工数低減、トータルで20%の低減が可能なことを実証した。

表1 クロック調整・前提設計による設計工数の低減
設計ステージ
従来の方法 [人日] 本手法 [人日]
機能設計 12.0 1.5
ロジック設計 30.0 30.0
フロアプランニング 7.0 2.0
検証(1) 5.0 5.0
レイアウト 7.0 1.5
検証(2) 6.0 4.0
ライブラリ設計 42.0 42.0
合計
109.0 86.0
DDR-SDRAMインタフェースの設計実験で、設計工数2割削減

今後の予定

 本クロック調整方式の実用化をさらに進めるために、3ギガヘルツ動作を目標とした実用的LSIチップの開発と、数百メガヘルツ程度のモバイルコンピュータにおける低消費電力化の実験を予定している。



用語の説明

◆MIRAIプロジェクト
新エネルギー・産業技術総合開発機構(NEDO)が、「次世代半導体デバイスプロセス等基盤技術プログラム」の一環として、我国半導体産業の競争力強化と持続的発展に必要な「次世代半導体材料・プロセス基盤技術開発」を推進するために委託実施する、2001年度~2007年度の7年間プロジェクト。
産総研次世代半導体研究センター(Advanced Semiconductor Research Center: ASRC)と技術研究組合超先端電子技術開発機構(Association of Super-Advanced Electronics Technologies: ASET)が受託し、産学官連携で研究開発を実施している。参加している企業は、国内・海外をあわせて24社、大学からも20の研究室が参画している。[参照元へ戻る]
◆遺伝的アルゴリズム
非常に頑健で、かつ効率的な探索アルゴリズム。広大な探索空間で最適解の探索を行う場合には、問題に対する事前知識がないと、なかなか効率的な探索が行えないが、遺伝的アルゴリズムを用いることにより、事前知識なしに効率良く最適状態を探し出すことが出来る。ポイントは、探索にさきだって解の候補を2進ビット列の形で表現し、複数候補を用意する。これら候補を遺伝子とみなし、淘汰、交叉、突然変異といったアルゴリズムを繰り返すうちに、次第により良い解が求まっていく。方程式などを用いて解析的に解を求めることが困難な問題に対して特に有効な探索手法である。[参照元へ戻る]
◆DDR-SDRAM
パソコン等の主記憶として用いられる大容量メモリ(DRAM)は、現在、SDRAM(シンクロナスDRAM)と呼ばれる、メモリデータのアクセスをクロック信号に同期して行うタイプが主流となっている。中でも高速アクセス用に普及しているのが、DDR-SDRAM(ダブルデータレート-SDRAM)である。DDR-SDRAMでは、クロック信号の両エッジに同期してデータの転送を行うため、従来のSDRAMの2倍の転送レートを実現していると共に、駆動電圧の点でも従来のSDRAMが3.3Vであったのに対し、DDR-SDRAMは2.5Vであり消費電力が低くなっている。[参照元へ戻る]
◆消費電力は電源電圧の自乗に比例
東大の桜井教授によれば、CMOSチップの消費電力P P= α・f・Vdd 2+β・Vdd と近似することが可能である。ここで、は動作クロック周波数、Vdd は電源電圧であり、α、βは回路毎に決まるある定数である。この式によれば、動作クロック周波数が高い領域ではVdd の2次の項が支配的となり、消費電力が電源電圧の自乗にほぼ比例することが分かる。[参照元へ戻る]



お問い合わせ

お問い合わせフォーム