独立行政法人 産業技術総合研究所【理事長 野間口 有】(以下「産総研」という)情報技術研究部門【研究部門長 伊藤 智】後藤 真孝 上席研究員 兼 メディアインタラクション研究グループ 研究グループ長と吉井 和佳 研究員、藤原 弘将 研究員、中野 倫靖 研究員らは、インターネット上にある楽曲の中身を自動解析できる音楽理解技術を開発し、楽曲の可視化機能やサビ出し機能を使用しながら、より能動的で豊かな音楽鑑賞ができる能動的音楽鑑賞サービス「Songle (ソングル)」(http://songle.jp)を2012年8月29日に一般公開し、実証実験を開始する。
近年、デジタル化された音楽コンテンツの普及によりインターネットなどを通じて多量の楽曲にアクセスできる量的な変化は起きたが、人々が音楽をより深く理解して楽しめるような質的な変化をもたらす技術はあまり開発されていなかった。
今回産総研は独自の音楽理解技術に基づき、楽曲の中身(サビ、ビート、メロディー、コード)を自動解析して「音楽地図」を表示する可視化機能や、代表的で盛り上がるサビなどへ自在にジャンプできるサビ出し機能をもつ音楽鑑賞システムを開発し、誰でも利用できるようにウェブ上のサービスとして公開した。ユーザーは「音楽地図」によって繰り返しなどのさまざまな観点に気づくことで楽曲に対する理解を深め、サビ出し機能によって興味のある箇所を容易に見つけて楽しみながら鑑賞することができる。さらに、自動解析の誤りをユーザーが自発的に訂正できるインタフェースも提供することで、ユーザーの訂正協力によってより正確な「音楽地図」を共有して表示できる仕組みも導入した。
なお、本研究は独立行政法人 科学技術振興機構(JST) 戦略的創造研究推進事業チーム型研究(CREST)の研究課題(研究代表者 後藤 真孝)の一環として行われた。この成果は、2012年10月25日〜26日に産総研つくばセンターで開催する「産総研オープンラボ」にて展示される。
![]() |
| 産総研独自の音楽理解技術を活用した能動的音楽鑑賞サービス「Songle(ソングル)」 |
音楽配信やオンラインストレージなどの普及により、インターネット上の膨大な楽曲はいつでもどこでも視聴できるようになった。そして、曲名やアーティスト名などの書誌情報に基づく音楽情報検索や、過去の視聴履歴などからユーザーの嗜好を分析する協調フィルタリングに基づく音楽推薦が実用化された。こうして多量の楽曲にアクセスできる量的な変化は起きたが、これまでは、単にさまざまな楽曲をいつでもどこでも視聴できるという楽しみ方が中心であり、人々が楽曲をより深く理解して楽しめるような質的な変化をもたらす技術はあまり開発されていなかった。
産業・文化の重要な担い手の一つである音楽を情報処理研究の対象とする音楽情報処理分野は、国内外で活発に研究されている。産総研でも、音楽を自動的に解析できる音楽理解技術や、それを応用した音楽インタフェースなどの幅広い研究を実施してきた。これまでに、従来の受動的な鑑賞とは違う、能動的な音楽鑑賞を可能にする音楽インタフェースの研究に取り組み、それを「能動的音楽鑑賞インタフェース」と名付けて、音楽理解技術によって音楽の聴き方をどのようにより豊かで深くできるかをさまざまな事例により明らかにしてきた。こうした産総研の研究成果の蓄積から、「インターネット上の楽曲の中身を自動解析する音楽鑑賞システム」というアイデアが生まれた。このアイデアに基づくシステムをベータ版として2012年2月より研究者向けに試験公開してきたが、この度、可視化機能、コード進行検索機能、外部埋め込みプレーヤー機能などの諸機能が完成したので、実証実験のために一般公開を開始することとした。
この研究は独立行政法人 科学技術振興機構(JST) 戦略的創造研究推進事業(CREST)「共生社会に向けた人間調和型情報技術の構築」研究領域における研究課題「コンテンツ共生社会のための類似度を可知化する情報環境の実現(研究代表者 後藤 真孝)」の一環として行われた。
人々が音楽理解技術の力でポピュラー音楽をより深く理解して楽しめるようにするシステムを開発し、能動的音楽鑑賞サービス「Songle (ソングル)」(http://songle.jp)として公開する。Songleは、以下の3つの特長をもつ。
![]() |
| 図1 楽曲の中身を自動解析して「音楽地図」として可視化した詳細画面の表示例 |
| 「音楽地図」は横軸が時間であり、上部の大局的な表示部には、楽曲中の繰り返し構造を可視化した楽曲構造が表示され、最上段にサビ区間、その下の5段にさまざまな長さの繰り返し区間が表示されている。各段の中で、着色されている区間同士が似ている(繰り返しである)ことを表している。下部の局所的な表示部は、上部で選択した区間の拡大表示である。最下部では、小さい三角形が各拍(四分音符に対応するビート)の位置を、大きい三角形が小節の先頭を示す。そのビート構造の上には、メロディーの歌声の音高がピアノロール状に表示されている。その上には、それぞれのコード名がテキストで表示されている(例えば、コード名Ebmは、根音がEbであり、その構成音を示すコードタイプがmであることを意味する)。 |
![]() |
| 図2 楽曲の進行に合わせて解析結果をアニメーション表示するビジュアライザ画面の表示例 |
| 4つの代表的な音楽的要素(楽曲構造、ビート構造、メロディー、コード)に密接に連動して表示内容が動的に変わる。図の左上の幾何学模様が連動して大きく動く表示、右上のピアノロール状の表示、左下の半円状に描かれた音楽的要素の表示、右下の全体を俯瞰した円盤状の表示の4種類の形式を切り替えられる。詳細画面が音楽的要素を把握するためのインタフェースであるのに対し、ビジュアライザ画面は音楽的要素に基づいて動的に生成される表示を楽しんでもらうためのインタフェースとなっている。 |
![]() |
| 図3 サビ出し機能の使用例 |
| 楽曲中の興味のある箇所を容易に見つけて聴くことができるサビ出し機能では、楽曲構造に対応した4種類のボタン「次のサビ区間の頭出し」、「前のサビ区間の頭出し」、「次の繰り返し区間の頭出し」、「前の繰り返し区間の頭出し」で再生位置のジャンプができる。 |
![]() |
| 図4 Songleの外部埋め込みプレーヤーとそれを別のウェブページに埋め込んだ例 |
| 外部のウェブページ内にSongleの小型プレーヤー(図の上部)を埋め込んで、Songle上の楽曲を紹介することができる。これは楽曲構造の可視化機能とサビ出し機能を備えており、サビを手軽に試聴可能である。さらに、埋め込み先のウェブページの背景に、楽曲の再生に連動して変化する視覚的効果(図の下部の背景図形)を付与するオプション機能も埋め込み時に選択できる。 |
![]() |
| 図5 自動解析の誤りを訂正できるインタフェースの画面例 |
| 詳細画面で下のタブを切り替えることで、4つの代表的な音楽的要素の自動解析結果を訂正できる。図の左上のサビ編集では、サビ区間と繰り返し区間の、追加や削除、移動、区間長の修正ができる。右上のビート編集では、拍と小節先頭で異なるクリック音が再生され、誤っていたら候補から選択するか、直接指定して訂正できる。左下のメロディーの編集では、メロディーの音高の合成音が再生されるので、誤っていたらピアノロール上で半音単位の線を引くことで訂正できる。右下のコードの編集では、コードの合成音が再生されるので、誤っていたらコード名をクリックして表示される候補から選択するか、直接コード名をタイプして訂正できる。また、コードの境界も変更できる。以上のように訂正時には解析結果のビート、メロディー、コードが楽曲と共に再生されて可聴化される。こうした可聴化の音自体も、可視化と併せて音楽の理解を深める効果がある。 |
誰でもウェブブラウザから利用できる能動的音楽鑑賞サービス「Songle (ソングル)」の持続的な研究開発・運用を進めていく。今回開発した、楽曲の中身を音楽理解技術で自動解析する音楽鑑賞システムを、産業界と連携して実用化し、音楽情報検索や音楽推薦、音楽配信サービスなど、さまざまな応用に展開していく予定である。現状では、高度な音楽理解技術の存在自体がまだ広く知られておらず、Songleにより認知が広がることが期待される。Songleは歌声を伴うポピュラー音楽であれば任意のウェブサイト上の楽曲(MP3形式の音響信号ファイル)に対応できるが、今後、多数の楽曲を保有するウェブサイトとの連携も進めていく予定である。
楽曲の中身を自動的に解析することができる技術である。インターネット上の楽曲の多くは、音響信号で表現されている。音響信号は、音楽演奏の音波を記録した信号であるため、音符が並ぶ楽譜とは違って、いつどんな高さの音が鳴っているかは記号で記録されていない。そこで、従来は中身が全くわからない状態のまま、ただの波形として音楽配信や音楽鑑賞のサービスで扱われることが多かった。それに対し、Songleの音楽理解技術は、楽曲の音響信号の主要な中身であるサビ、ビート、メロディー、コードを自動的に解析することを可能にする。[参照元へ戻る]
独立行政法人 産業技術総合研究所 広報部 報道室