発表・掲載日:2024/03/04

スピン波を用いた物理リザバー計算機の高性能化の条件を理論的に解明

-省エネルギーなAIハードウェア開発に新しい視点-

発表のポイント

  • スピン波を用いた物理リザバー計算機において、高い学習性能を実現するための波の速度と素子サイズとの関係を数理的に解明しました。
  • 少ない入出力ノード数でも従来の最高性能に匹敵する性能を引き出せることを物理シミュレーションと理論計算によって実証しました。
  • 磁気素子を用いたAIハードウェアの開発に新しい視点を与える成果です。

概要

近年社会におけるAI技術を用いた情報処理の需要は急速に増加しています。現在は、ニューラルネットワーク(注1)による情報処理の計算を、電子計算機上で膨大な数のCPU(中央演算処理装置)やGPU(画像処理装置)を用いることによって行っているため、高い消費電力が問題となっています。一方、人間は低消費電力で情報処理を行っていることから、リザバー計算(注2)や量子計算技術など、従来とは異なる概念に基づいた科学技術による情報処理の研究が世界各国で進んでいます。

東北大学材料科学高等研究所(WPI-AIMR)兼産業技術総合研究所 産総研・東北大 数理先端材料モデリングオープンイノベーションラボラトリ 副ラボ長の義永那津人准教授は、同大学学際科学フロンティア研究所の飯浜賢志助教、WPI-AIMR兼同大学先端スピントロニクス研究開発センターの水上成美教授、同大学大学院工学研究科の小池雄也大学院生(研究当時)とともに、強磁性体(注3)薄膜中のスピン波(注4)を用いて従来のリザバー計算機よりも低消費電力で高い学習性能が期待される物理リザバー計算(注5)を実行できる装置を実現するための機構を解明しました。

スピン波を情報の担体とするAIハードウェアの研究が世界的に進展しており、ナノメートル、ギガヘルツかつ高エネルギー効率で高い学習性能を実現することは重要な課題の一つです。本研究グループでは、金属ナノ薄膜の強磁性体中を伝わるスピン波を研究しました。時系列データに比例した大きさで磁性体の入力ノードの位置を励起することでスピン波を発生させ、伝播したスピン波を出力ノードの位置で読み出すことで、短期記憶と非線形変換能力を持った学習やカオス時系列(注6)の予測が可能であることを示しました。また、数理的な解析によって学習性能を最適にするスピン波の速度と素子のサイズとの関係を明らかにしました。本結果は、磁気ナノテクノロジーを用いた低消費電力な情報処理素子の開発に新しい視点を与えるものです。

本研究は3月1日(英国時間)に、スピントロニクス分野の専門誌npj Spintronicsの電子版に掲載されました。


詳細な説明

研究の背景

近年社会におけるAI技術を用いた情報処理の需要は急速に増加しています。現在は、ニューラルネットワークによる情報処理の計算を、電子計算機上で膨大な数のCPU(中央演算処理装置)やGPU(画像処理装置)を用いることによって行っているため、高い消費電力が問題となっています。

一方、人間は低消費電力で情報処理を行っていることから、リザバー計算や量子計算技術など、従来とは異なる概念に基づいた科学技術による情報処理の研究が世界各国で進んでいます。磁気のナノテクノロジーを用いた物理リザバー計算もその一つです(図1)。ナノメートルサイズの磁石が発する磁気の振動や波動であるスピン波を情報の担体とし、それらの重ね合わせを演算に用いる物理リザバー計算は、ナノメートルサイズ、ギガヘルツの周波数で動作し、低消費電力で効率的に情報処理できることが期待されています。これまでの研究では、磁気ナノテクノロジーや光レーザーを用いた物理リザバーの研究が進められてきました。しかし、ナノメートルサイズで高い学習性能を実現するためには、新しい原理で動作する物理リザバーの研究が重要でした。

今回の取り組み

本研究では、4ナノメートルの厚みを持つ強磁性体薄膜の中を伝わるスピン波に着目しました。磁性体に微弱な電流を流すとスピン注入トルク(注7)によってスピン波が発生します。これは水面に石を落とした時に波が広がる現象と類似しています。波の振幅は流した電流の大きさに比例するため、情報処理させる入力の時系列を電流として流すと、その情報が波の振幅として空間全体に広がります(図1)。波は光と比べてずっと遅い速度で伝わるので、別の場所で波の振幅を測定することにより過去の入力情報を読み出すことができます。

この性質を利用し、マイクロマグネティックシミュレーション(注8)により、線形および非線形短期記憶容量(注9)非線形自己回帰移動平均モデル(注10)の予測などのタスクの学習性能の解析を行いました。その結果、従来と比較して少ない物理ノードの数でも高い学習性能が実現できることが分かりました(図2)。

この結果は、磁性体の時間遅れを持った応答を記述した数理モデルによって理解できることも明らかにしました。数理モデルの解析によると、スピン波の伝播速度と磁性体のサイズとが比例関係を満たす時に高い学習性能が実現し、この条件を満たさないと学習性能が大幅に悪くなることが示唆されました(図3)。さらに、スピン波による物理リザバー計算によって、非常に複雑な時間変化を示し予測が困難とされるカオス時系列の短期予測と大域的な軌道を再現できることも分かりました(図4)。

今後の展開

本研究では、スピン波を用いた強磁性体薄膜の物理リザバー計算機は低消費電力な計算機の有用な候補になり得ることを明らかにしました。研究は端緒についたばかりであり、実際の素子の開発や集積化するための材料の性質など、AIハードウェアへの応用を目指した研究を今後進めます。また、物理リザバー計算がどのような条件で高い学習性能が実現できるのか、数理的な研究の発展にも貢献していきます。

図1

図1. 磁性体薄膜のスピンの波を利用したAIハードウェア応用、物理リザバー計算の模式図。時系列の情報処理を行うことができるデバイスで、入力時系列を出力時系列に変換することによって、入力時系列の将来のデータを予測したり、過去のデータを記憶して読み出したりすることができる。入力時系列は、物理リザバー内の物理ノード(上図の黄色点、下図の青の円筒)のダイナミックスを励起し、その時間変化を読み出すことで出力時系列を得る。スピン波によりリザバー計算では、入力時系列に比例した電流を物理ノードに流すことによってスピン波を励起させる。このスピン波の伝播を利用して学習を行う。スピン波を使うことでナノスケールの高性能リザバー計算機を実現できる。

図2

図2. 磁性体薄膜のスピン波を使った非線形自己回帰移動平均モデルと短期記憶のタスクの学習の性能評価。学習の際には、スピン波の読み出しの際の物理ノードごとの重みを調整することで、正解(青線、上左図)に近い出力(赤線、上左図)が得られる。学習した重みを用いて予測すると(赤線、上右図)、非常に小さい誤差で正解(青線、上右図)を再現できる。従来の磁気テクノロジーよりも少ない物理ノード数で同等の学習性能を達成することが可能になる。

図3

図3. 最適な学習性能を実現するためには物理リザバーのサイズと情報伝播速度との間に条件が必要であることを数理的に解明した。本研究で、物理リザバーは、スピン波を用いるためにその伝播速度によってデバイスのサイズをサブマイクロ程度にすることができる。一方、光学素子を用いた系では、光速で情報が伝播されるため物理リザバーのサイズが大きくなってしまう。

図4

図4. スピン波による物理リザバー計算を用いたカオス時系列の予測。ローレンツモデルを用いて得られたカオス時系列の軌道を左図に示している。この時系列を用いて、ある時刻までのデータがある時に次の時間のデータを予測できるのかというタスクの学習を行った(右図)。カオス時系列は初期値鋭敏性があるために短時間の予測(短期予測)しかできないが、軌道自体は再現できることから、スピン波を用いた物理リザバーがモデルの構造を学習できていることを示唆している。

謝辞

本研究は、JSTさきがけ(JPMJPR22B2)、同創発的研究支援事業(JPMJFR2140)、文部科学省 次世代X-NICS半導体創生拠点形成事業(JPJ011438)、日本学術振興会(JSPS)科学研究費助成事業基盤研究(A)(JP21H04648)の支援により実施されました。また、本研究の一部は、産総研のAI橋渡しクラウド(ABCI)、北海道大学情報基盤センターのスーパーコンピューターの計算資源の提供を受け実施しました。

 

論文情報

タイトル:Universal scaling between wave speed and size enables nanoscale high-performance reservoir computing based on propagating spin-waves
著者:S. Iihama, Y. Koike, S. Mizukami, and N. Yoshinaga
*責任著者:東北大学材料科学高等研究所 准教授 義永那津人
掲載誌:npj Spintronics
DOI:10.1038/s44306-024-00008-5


用語説明

注1. ニューラルネットワーク
機械学習モデルの一種で、入力となるデータを出力データに変換することでタスクを行うことができる。時系列データの場合は、例えば、気象予測のように、過去の気象の情報(入力データ)から未来の天候(出力データ)を予測することがタスクになる。まず、正解となる入出力データのペアを用いてニューラルネットワークの学習を行い、その後学習済みのニューラルネットワークを用いて予測などのタスクを行う。[参照元へ戻る]
注2. リザバー計算(reservoir computing)
時系列の情報処理に適した機械学習手法の一つ。リカレントニューラルネットワークの一種だと考えることができる。入力時系列を出力時系列に変換することによって、現在時刻までの時系列データから次の時間のデータを予測したり、過去のデータを記憶して取り出したりするタスクを行うことができる。時系列の入力部分、入力データを高次元空間へ変換するリザバー部分、出力時系列を読み出す部分から構成される。リザバー部分は、入力の時間変化に伴い時間変化する。リカレントニューラルネットワークでは、リザバー部分のノード間接続の重みを学習の際に更新するのに対して、リザバー計算ではリザバー部分の重みは更新せず、読み出し部分の重みだけを更新する。そのため、学習パラメータ数が少なく、学習手法も簡便であるため、高速かつ安定な学習が可能である。[参照元へ戻る]
注3. 強磁性体
物質内部の隣り合うスピンが同一の方向を向いており大きな磁化を持つ磁性体。[参照元へ戻る]
注4. スピン波
磁性体は、ミクロな棒磁石(スピン)が整然と整列しているように振る舞う。各々のスピンはコンパスが揺れるかのように、その方向を時間的に変化させ、これが磁気の振動となる。川や海の水面の波のように、磁気の振動も磁気の波を発生する。磁気の振動や波の伝播に伴うエネルギーの消費は、電気を通電する素子に比較して非常に小さく、また、ナノスケール、ナノ秒の時間スケールで動作するため、省エネルギーの情報処理装置としての利用が期待されている。[参照元へ戻る]
注5. 物理リザバー計算
リザバー計算では、リザバー部分の重みを更新しないので、この部分を物理システムに置き換えることが可能である。本研究では、この部分に強磁性体薄膜のスピン波の伝播を用いている。この場合、計算機のサイズや速度は、物理システムのサイズや速度によって決まる。従って、磁気ナノテクノロジーを用いるとナノスケール、ギガヘルツ、低消費電力で動作する計算素子の実現が期待できる。[参照元へ戻る]
注6. カオス時系列
決定論的規則に従って時間変化するにもかかわらず、不規則に見える振舞いを示す現象のこと。天体や気象、流体や生態の個体数の変化など自然界でさまざまな形で観察することができる。本研究で用いたローレンツ方程式は、気象学者のエドワード・ローレンツが1963年に提案した、気象の現象論モデルで三変数の常微分方程式で記述される。初期値のわずかな違いが時間的に指数関数的に増大することから(初期値鋭敏性)、カオス時系列は、短時間の予測でも難しく、また、長時間予測することは不可能である。しかし、状態変数の軌跡は、蝶々の羽のような特徴的な構造(アトラクター)を持つ。リザバー計算では、この構造を再現することに成功している。[参照元へ戻る]
注7. スピン注入トルク(スピントランスファートルク)
スピン偏極した電子を流すことによって、電子の持つスピン角運動量が磁性体層のスピンに作用し回転力(トルク)を与える現象のこと。トルクを加えられるとスピンの歳差運動が生じ、それが隣のスピンに伝わって波として伝播する。[参照元へ戻る]
注8. マイクロマグネティックシミュレーション
磁性体内部のスピンの向きの時空間変化をコンピューター上で数値シミュレーションする手法。[参照元へ戻る]
注9. 線形短期記憶容量(Memory Capacity)・非線形短期記憶容量(Information Processing Capacity)
時系列データにおける機械学習のタスクの一種。現在のデータからどれだけ過去のデータを復元できるのかを計算することによって、リザバー計算の記憶能力を測る。非線形短期記憶容量の場合は、過去のデータを非線形変換した値が復元できるかを計算することで、記憶能力とともに非線形変換能力を測定する。[参照元へ戻る]
注10. 非線形自己回帰移動平均モデル(NARMA)
時系列の入力データと出力データとの間の関係が時間遅れを含めた非線形差分方程式で表される数理モデル。このモデルで作られた時系列がリザバー計算の性能評価によく使われる。[参照元へ戻る]


お問い合わせ

お問い合わせフォーム