産総研マガジンは、企業、大学、研究機関などの皆さまと産総研をつなぎ、 時代を切り拓く先端情報を紹介するコミュニケーション・マガジンです。

LINK for Innovation

世界初 シリコン光集積回路のみでニューラルネットワーク演算に成功

2023/09/13

世界初シリコン光集積回路のみでニューラルネットワーク演算に成功 低遅延、省電力AI演算回路実現に向け大きな一歩

研究者の写真
    KeyPoint 今やさまざまな場面で欠かせない技術となった人工知能(AI)システム。「ニューラルネットワーク」は、そのAIシステムのもっとも基本的な数理モデルのひとつだ。デジタルプロセッサを用いて構築されているAIシステムは大規模化が進んでおり、演算処理の遅延や消費電力が著しく増加している。その解決のために、電子に代わって光を使う「光集積回路」が注目されている。ところが「光集積回路」はその特性から従来的な非線形関数を扱えないため、これまで光のみでニューラルネットワーク演算を行うことは難しかった。それを解決する「非線形写像型ニューラルネットワーク演算のできるシリコン光集積回路」を試作し、世界で初めて光集積回路のみでのニューラルネットワーク演算を成功させたのが、プラットフォームフォトニクス研究センターのコングアンウエイだ。(2022/6/30プレスリリース)低遅延、低消費電力な光によるニューラルネットワーク演算が可能になり、「シリコン光集積回路」を、従来の電子回路を補完する光によるAI演算用集積回路として応用する道が開かれようとしている。
    Contents

    スピードが強みの光集積回路

     今や高度な情報処理にはAIが欠かせない。その情報処理のもっとも基本的な数理モデルのひとつである「ニューラルネットワーク」は、人間の脳神経回路を模した階層性をもつ数理モデルで、入力層、隠れ層、出力層のニューロンがそれぞれ結合した構造をしている。

     画像などのデータをモデルに学習させた後、入力層にテスト用データを与えると、隠れ層での演算(重みづけや変換など)を経て、出力層で学習結果に応じた解答が得られる。隠れ層の深さ(層の数)と幅(各層のニューロン数)などのニューラルネットワークの構造はさまざまに設計されるが、近年のモデルは巨大になる一方だ。

    一般的なニューラルネットワークのイメージ
    入力層・隠れ層・出力層のニューロンが結合し、学習結果に応じた解答を得られる。

     AIの演算は普通、電子集積回路上のトランジスタをオン・オフさせることで行われている。このオン・オフを行うために必要な電力や処理時間が、最近のAIモデルの巨大化により大きく、長くなっている。AIをさまざまな場面で活用するためには、演算処理の遅延や消費電力の増加は大きな課題だ。

     「電子回路ではトランジスタのオン・オフ1回につき1ナノ秒(1ナノ秒は10−9秒)程度の時間を要します。これが積み重なると膨大な時間になり、瞬時の処理が必要な場面で演算処理の遅延につながります。電子の集積回路に対して、光集積回路の中を光が通るスピードは、電子回路の千分の1ほどの時間です。私たちがつくったシリコン光集積回路のニューラルネットワークなら光を伝搬させるだけで演算ができるため、100ピコ秒(1ピコ秒は10−12秒)以下で演算が完了でき、なおかつ低消費電力化ができるんです」と語るのは、プラットフォームフォトニクス研究センターの上級主任研究員コングアンウエイだ。

     光をつかった集積回路の最大の特徴はそのスピードだ。しかし光は電子より制御が難しいために、今まで光集積回路の演算応用は進んでこなかった。

    シリコン光集積回路でニューラルネットワーク演算を可能に

     繊細な制御が難しい光集積回路。だが、コンは光集積回路でニューラルネットワーク演算に挑もうと考えるようになっていた。2017年ごろのことだ。

     提案を受けたときのことを、上司のプラットフォームフォトニクス研究センター統括研究主幹の山田浩治は振り返る。「長年、シリコン光集積回路の研究をしてきましたが、それをどう使うのかといったアプリケーションまで考える余裕がありませんでした。すでに、光通信には使われているので、違ったアプリケーションを探したいと思っていたところでした」

     光を制御してニューラルネットワークの演算ができる集積回路を作るという新たな挑戦は困難が続き、最初の2、3年は手探り状態だったという。それが徐々に方向性が絞られ軌道に乗り、成果をまとめて発表することができたのが2022年6月のことだ。(2022/6/30プレスリリース

    繊細な配線がつながるシリコン光集積回路
    繊細な配線がつながるシリコン光集積回路

     光集積回路でニューラルネットワーク演算を行うに当たって大きな障壁となったのは、光集積回路はその特性から非線形関数を扱えないことだ。ニューラルネットワークの演算を始めとする高度な演算には、非線形関数の演算が不可欠だ。従来は、高度な演算を行う部分は電子回路を使い、それ以外の情報を伝達する部分に光を使うといった、光と電子のハイブリッドという形がとられていた。しかし、これでは光集積回路のメリットを十分に引き出すことができなかった。

     コンが開発した手法によって「非線形写像」ができるようになり、従来の線形関数しか扱えない光集積回路ではできなかった演算ができるようになったのだ。

     「例えば下図左側のように円形に分布した2種類のデータを分類したい場合、そのままでは線形関数を使って分類できませんが、『高次元複素空間に非線形写像する』という前処理をすれば、線形関数を使った分類面で分けられるという計算の手法があります。シリコン光集積回路でも、高次元複素空間への非線形写像ができるようになれば、より高度な演算ができると考えました。そこで、データ入力部分に『高次元複素空間に非線形写像』する機能をもたせたのです」

    「高次元複素空間に非線形写像する」前処理をおこなうイメージ図
    データを線形関数を使った分類面で分けられるように、「高次元複素空間に非線形写像する」前処理をおこなうイメージ

     非線形写像を用いた分類演算のイメージは上図のようになっている。例えば二次元の左にデータをプロットした左側の図で黒丸と青四角を分ける線を引くには、楕円型など複雑な非線形関数の演算が必要だが、右図のようにいったん高次元複素空間に非線形写像すれば、線形の分離面で簡単に分けることができる。これにより従来の非線形関数の演算を回避することができるのだ。

     今回開発したシリコン光集積回路の構造を詳しくみると、次の図のようになっている。シリコンの基板上にシリコン光導波路、金属配線などが配されている。ここには40個のマッハ・ツェンダー干渉計と光位相器が集積されており、光を制御し演算を実行する。

    シリコン光集積回路の詳細構造
    シリコン光集積回路の詳細構造。図左側から光が入力され、マッハ・ツェンダー干渉計を通した演算を経て8つのポートに結果が出力される。

     解析したいデータは、電気信号として入力部にあるマッハ・ツェンダー干渉計に送り込まれ、光信号に変換される。この際に、コンが発明した方法によって高次元複素空間に非線形写像される。その後、光信号はマッハ・ツェンダー干渉計と光位相シフタを次々に通りながら、経路を変えたり分かれたりして進む(演算に相当)。

     最後に、演算結果が出力ポートで検出される。検出された光の強度が演算結果を示し、ニューラルネットワーク演算が完了したことになる。出力ポートの光信号は再び、電気信号に戻される仕組みになっている。データの入力と出力の後には電子回路が関わっているものの、演算部分は光伝搬のみで行われる。これによって電子回路の千分の1の遅延時間と数十分の1の消費電力を実現した。

    「アヤメ分類問題」をシリコン光集積回路をつかって解く

     開発した「シリコン光集積回路」でのニューラルネットワーク演算がうまく行くかは、AIを使った分類の基本的なベンチマーク問題を用いて検証した。この問題では、アヤメの花弁のサイズから、3種類のアヤメを分類しその正答率を測る。

     まず、学習用データで光ニューラルネットワーク演算のモデルを調整する。コンの開発した手法で「学習」させるとは、入力に対して正しい出力が得られるように、シリコン光集積回路の状態を調整することだ。今回の学習では、8カ所ある出力ポートのうち、入力データのアヤメの種類に応じて、それぞれ異なる出力ポートが最大光パワーを示すように調整した。その結果、学習後の正答率は約94 %となり、学習済みのシリコン光集積回路の状態をそのままにして、学習に用いていないテストデータで分類したところ約97 %の正答率で分類することができた。

    アヤメの分類演算のベンチマーク結果
    アヤメの分類演算の結果。学習後のシリコン光集積回路の演算結果では、3種類のアヤメの分類に応じて出力ポートの光パワー分布が変わったことがわかる。

     「重要なことは、シリコン光集積回路を直接学習させるオンチップ学習ができた点です。ほかのコンピュータで学習して得られたパラメーターを使ってシリコン光集積回路を調整することは今までもされていました。ですが、それではモデルを学習させる段階で光を使った高速化や省電力化のメリットが得られません。また、一度問題に対して学習をさせてシリコン光集積回路の状態を決めてしまえば、あとは、ただ光が通るだけで演算結果が得られます。電子回路と違い演算する度にトランジスタのスイッチを切り替える必要がありませんから、ここでも高速かつ省電力なのです」と、コンはこの成果の魅力を語る。

    光の不得意を克服し、得意を生かすために

    研究者2人の写真

     注目の集まる「光だけのニューラルネットワーク演算」。AIの高速処理に特化した演算回路としてシリコン光集積回路が利用できることが見えてきたが、今後はどのような展開が見込まれているのだろうか。

     「アヤメ分類の問題については、モデルの大きさを示すパラメータ数が電子回路より6分の1程度の少なさでもシリコン光集積回路は電子回路と同等の正答率が得られることがわかりました。私たちが提案する方式を使えば、ニューラルネットワーク演算自体の規模を小さくできるのではないかと考えて検証を始めています」とコン。

     光には得意不得意があり、電子回路のすべてを置き換えられるものではないことがわかっている。コンらが狙うのは、電子回路と組み合わせたときにどういった力を発揮できるかを探っていくことだ。「電子回路と組み合わせてループをさせることでRNN(Recurrent Neural Network)をつくり、時間序列を認識できるようにしたいのです。そうすれば音声認識ができるようになります。さらに多層化・高性能化して今あるコンピュータの機能の一部を担えるようになればいいとも考えています」

     山田も「光回路は電子回路ほど小さくなりませんし、デジタル演算はあまり得意ではありませんが。しかし、その伝搬の速さは圧倒的ですし、AIのようなアナログ演算は得意です。データ処理の遅延が許されない場面での応用を考えると、自動運転に適しているのではないでしょうか」と話し、2人とも今回の成果で光の可能性が大きく開かれたと感じている。

     「足は速いけれど、電気ほど人の役には立たない」と言われてきた光が、その足の速さを生かすための助走に入ったようだ。

    プラットフォームフォトニクス
    研究センター
    シリコンフォトニクス研究チーム
    上級主任研究員

    Cong Guangwei

    Cong Guangwei

    Cong上級主任研究員の写真

    プラットフォームフォトニクス
    研究センター
    総括研究主幹

    山田 浩治

    Yamada Koji

    山田総括研究主幹の写真
    産総研
    エレクトロニクス・製造領域
    プラットフォームフォトニクス研究センター
    • 〒305-8568 茨城県つくば市梅園1-1-1 中央第2
    • M-contact-pprc-ml*aist.go.jp
      (*を@に変更して送信してください)
    • https://unit.aist.go.jp/pprc/

    この記事へのリアクション

    •  

    •  

    •  

    この記事をシェア

    • Xでシェア
    • facebookでシェア
    • LINEでシェア

    掲載記事・産総研との連携・紹介技術・研究成果など にご興味をお持ちの方へ

    産総研マガジンでご紹介している事例や成果、トピックスは、産総研で行われている研究や連携成果の一部です。
    掲載記事に関するお問い合わせのほか、産総研の研究内容・技術サポート・連携・コラボレーションなどに興味をお持ちの方は、下記の連絡先へお気軽にご連絡ください。

    産総研マガジン総合問い合わせ窓口

    メール:M-aist_magazine-ml*aist.go.jp(*を@に変更して送信してください)

    ※すべてのメッセージには返信できない場合があります。ご了承ください。

    国立研究開発法人産業技術総合研究所

    Copyright © National Institute of Advanced Industrial Science and Technology (AIST)
    (Japan Corporate Number 7010005005425). All rights reserved.