独立行政法人産業技術総合研究所
現在位置広報活動 > 出版物 > 産総研 TODAY Vol.10(2010) 一覧 > Vol.10 No.06 > ユーザーの歌い方を真似る歌声合成技術

ユーザーの歌い方を真似る歌声合成技術

[ PDF:1.4MB
歌うことで、より自然なニュアンスで歌声合成できるVocaListener

中野 倫靖と後藤 真孝の写真
中野 倫靖 なかの ともやす(右)
中野連絡先
情報技術研究部門
メディアインタラクション研究グループ
研究員
(つくばセンター)
計算機による歌声の分析と合成、それに基づくインターフェース構築に関する研究に取り組んでいます。今後、歌声をはじめ、音楽・音声・動画などのメディアコンテンツを対象に、新しい楽しみ方を提供できる先進的な技術開発とその実用化を目指し、社会へ貢献できるよう頑張りたいと思います。
後藤 真孝 ごとう まさたか(左)
後藤連絡先
(所属は同上)
研究グループ長
(つくばセンター)
計算機によって音楽・音声コンテンツを自在に扱える技術の確立を目指し、音楽・音声の音響信号の自動理解と、それに基づくユーザーインターフェースの研究を中心に、さまざまな研究課題に取り組んでいます。これからもVocaListenerのような、研究として面白くかつ世の中へのインパクトが大きい技術開発を頑張ります。

開発の背景

 パソコンなどを用いて人間のような歌声を人工的に生成できる歌声合成ソフトウエアは、多様な歌声での合成が容易に行え、歌唱の表現をマウスやキーボードなどで自在にコントロールできることから、歌唱付き楽曲の制作における可能性を広げる重要なツールです。しかし、高品質で人間らしい自然な歌声を合成するためには、適切な知識や楽譜を入力した後に時間をかけた調整が必要であり、誰でも容易に使いこなせるものではありませんでした。しかも、その結果は別の歌声合成ソフトウエアや別の音源(歌手の声)にそのまま適用できないために、再調整が必要という問題もありました。

お手本を歌うだけで誰もが手軽に歌声合成できるシステム

 私たちは、市販の歌声合成ソフトウエアでの楽譜入力や歌い方の調整を、マウスやキーボードではなく「歌って」行える技術VocaListener(略して「ぼかりす」)を開発しました。ユーザーの歌声とその歌詞をお手本として与えるだけで、その歌い方を真似た別の歌声を自動で合成します。これにより調整時間が大幅に減少し、調整に関する知識をもたないユーザーでも自然な歌声を合成することが容易になりました。また、別の歌声合成ソフトウエアや音源に切り替える場合にも自動で再調整するため、多様な歌声での合成が簡単に行えます。

 VocaListenerによる合成結果の具体例は、ホームページ(http://staff.aist.go.jp/t.nakano/VocaListener/index-j.html)や、動画共有サービス『ニコニコ動画』(http://www.nicovideo.jp/mylist/7012071)上で視聴できます。

 VocaListenerでは、歌声合成パラメーター(歌い方)の高精度な推定機能をもっています。人が何度も発声練習して上達するかのように「歌声の合成」「合成音の分析」「パラメーターの更新」の処理を自動反復し、ユーザーの歌い方を高精度に真似る歌声合成を可能にしました。また、歌詞と歌声の高精度な自動対応付け技術も実現し、楽譜を入力しなくても歌詞を歌うだけで合成が可能になりました。さらに、歌詞と歌声の対応付けの誤り箇所を指摘するだけで訂正できる機能(ダメ出しインタラクション)や、高さ(音域)を変えたりユーザーの歌唱力を補正したりして合成する機能も実現しました。


図
VocaListenerによるユーザーの歌声とその歌詞からの歌声合成パラメーター推定の概要

今後の展開

 今後は、産業界と連携してVocaListenerを実用化するなど、歌声合成を用いた音楽制作の幅広い支援や、この技術を今後の歌声情報処理研究の基本ツールの一つとして活用し「人間らしい歌唱」や「声の個人性」などの解明を目指していきます。


関連情報:

戻る産総研 TODAY Vol.10 No.06に戻る