産総研マガジンは、企業、大学、研究機関などの皆さまと産総研をつなぎ、 時代を切り拓く先端情報を紹介するコミュニケーション・マガジンです。

産総研マガジン:LINK for Business

音声認識で音声情報をビッグデータに

2019/07/31

音声認識で音声情報をビッグデータに 産総研ベンチャーがコールセンターで実用化

研究者たちの写真
    KeyPoint 産総研がweb上の膨大な音声コンテンツの検索を目的に開発した音声情報検索システム「PodCastle」。このシステムはAIを活用することにより進化し、音声情報をビッグデータとして利用することが可能となった。現在は産総研ベンチャーが事業化し、企業のコールセンターでの業務の効率化だけでなく、お客様の声という宝の山を自社のビジネスに生かす動きが始まっている。音声を正確に認識し、得た情報をビッグデータとして活用できるこの技術は、他の分野でも広く使われる大きな可能性を秘めている。
    Contents

    音声情報がビッグデータとしてビジネスに使える!

    三本 2012年、私は新しいビジネスにチャレンジしたいと思い立ち、26年勤めたソフトウェア開発会社から独立しました。当初は自分がやるべきことがなかなか見つかりませんでしたが、2013年にフィリピン視察に行ったことが転機となりました。そこで見たのは、20階以上ある高層ビルの全フロアがコールセンターで、どのフロアにもオペレーターが何百人も並んで電話を取っているという、驚くような光景でした。コールセンターをアウトソーシングしていたのです。

     よく見るとあるフロアでは数百人のオペレーターが、ユーザーからの電話の内容をひたすら文字起こしをしていました。ユーザーの声は市場のニーズや自社製品の課題などが埋もれている情報の宝庫です。その企業は、“ユーザーの声”という情報を集め、話の内容を分析し、ビッグデータとして課題の発見などに使っていました。当時日本では、コールセンターは多くの人員が必要なコストのかかるセクションで効率化が必須と考えられていました。そのうえ、クレーマーに長時間拘束されたり、時には罵声を浴びせられたりすることもあって離職率は高く、課題の多い職場でした。私はフィリピンで見た仕組みを今後日本も取り入れるだろう、そしてそのときには、自分がビジネスチャンスにできるのではないか、と直感したのです。

     では、音声情報のビッグデータ化という新ビジネスを、どのようにやっていけばよいのか。フィリピンのように人海戦術という方法もありますが、私はソフトウェアによる音声認識技術でコールセンター業務を効率化するだけでなく、情報そのものをビッグデータとして生かすことができないかと考えたのです。

     ただ、2005年に音声認識の関連技術に触れたときには「まだまだ使い物にならないな」という印象がありました。

    緒方 2011年頃になると、すでに音声認識技術が携帯電話に実装されており、少しずつ使われ始めていました。また、多くはありませんがコールセンターにも導入されつつあったかと思います。

    三本 はい、その頃になると、技術はだいぶ進化していることが感じられました。そこで知人を通じて産総研の方と会い、産総研独自の音声認識技術が実用の一歩手前まできていることを教えていただいたのです。その後、緒方さんとお会いして説明を伺い、「これだ!」と思いました。

    2014年、「産総研技術移転ベンチャー」としてスタート

    三本 そこで産総研に相談したわけですが、産総研の技術を移転してもらうには多くのプロセスが必要で、技術使用料もとても高額だとわかりました。ちょっと手が出ない金額で、もはやこれまで……と諦めかけたとき、「産総研技術移転ベンチャー」という制度の存在を教えていただいたのです。

     産総研技術移転ベンチャー制度は費用面の負担は少ないですが、事業化するためにはいくつかの課題をクリアしなければなりません。まず、社会実装するためのしっかりした事業計画が必要でした。そして難問だったのは、産総研の研究者が社内での研究開発にかかわるという条件です。緒方さんから最初はよいお返事がいただけませんでしたが、何回もつくばに通い、技術顧問になっていただけるようお願いしました。

    緒方 最終的に引き受ける決心をした理由は、三本さんなら信頼できると思えたこと、それから、10年以上音声認識技術の研究をしてきて「PodCastle」という一つのシステムをつくり、この分野の研究が自分自身の中で一区切りついていたこと。そしてこの技術を、やはりビジネスとして発展させたいという思いがあり、よいタイミングだと考えるようになりました。

    音声情報検索システム(PodCastle)の概要
    音声情報検索システム(PodCastle)の概要

    三本 緒方さんに技術顧問になっていただき、2014年秋、当社は産総研技術移転ベンチャーとして事業活動をスタートさせました。

    緒方 このシステムはweb上で多くのユーザーに使われ、音声データを賢くしていく性能の高さは実証されていました。しかし、音声認識技術に完成形はありません。音声データにはさまざまなコンテンツがあり、さまざまな話し方、さまざまな専門用語があり、さらに新しい言葉も日々生まれていくので、とにかく成長させ続けなくては現場で使い物にならないのです。

     そこで三本さんは機械に学習させるためにコールセンターの音声データを収集し、現場で実際に使えるものとしてブラッシュアップしていきました。現在でも、現場でのデータ収集を行って、音声認識の精度を向上させ続けています。

     また、今は、当初は実装していなかったディープラーニングを利用した音声認識技術を開発し、それを中心に事業を発展させています。

    ライセンス事業からソリューション事業へ

    三本 もちろん最初からうまくいったわけではありません。このシステムを企業にライセンス提供するところから始めましたが、当初は、音声認識をどう使い、どう現場を効率化させていくかという答えを持っている企業は少なかったのです。現在はスマホやAIスピーカーへの音声入力を通じて音声認識技術に対する認知は広がり、期待も大きくなっています。しかし、当時は音声認識の実装例といえばロボットの声くらいしかなく、具体的な用途をイメージしにくかったのだと思います。

     そのような中でライセンス事業は難しく、より具体的な使い方までを提案するワンストップ・ソリューションとしてつくり込んでいくしかないと気がつきました。そこで金融機関の営業支援のための顧客関係管理ソリューション「VCRM」や、コールセンター向けにカスタマイズしたソリューション「VContact」など、お客様の具体的な課題を解決するソリューションとして音声認識技術を組み込んだ商品を開発しました。

    緒方 2016年に銀行が「VCRM」を採用したことが飛躍のきっかけになりましたね。私も何度も三本さんと一緒に銀行へ足を運び、この技術の優位性や可能性について説明しました。

    三本 当社にはまだ実績がなかったので、産総研技術移転ベンチャーという肩書はもちろん、産総研の研究者である緒方さんが技術的な説明をしてくれたことは、クライアントにとって大きな安心感につながったと思います。タイミングよく、社会的にオープンイノベーションの波も来ており、外部の技術を積極的に採用する雰囲気が企業側にもあり、「VCRM」を採用していただけました。緒方 銀行での導入についてプレスリリースを出し、それが呼び水となってプロバイダのコールセンターへの「VContact」の導入も決まりました。

    三本 コールセンターの会話の音声認識は簡単ではありません。オペレーターの側の音声はマイクが口元にあり、きれいに音を拾えますが、通話相手の環境はさまざまです。通話品質の違いもあれば、背後で音楽が流れることもあるわけです。そうなると音声認識精度は下がってしまうので、導入にあたっては実際のコールセンターで実証実験を行い、クライアントと一緒に音響モデル(音声認識システムの性能を左右する重要パーツ)もつくりながら最適化を図っていきました。

    産総研と一緒に開発していることが信頼につながった

    三本 現在、「VContact」を使うと通話中に音声認識してテキスト化を行い、通話終了の時点では内容の書き起こしが完成しています。会話内容をもとに通話中に適切なFAQを表示することもできますし、通話内容の要約も自動的に作成でき、オペレーターの作業効率を大幅に向上させています。

     また、トラブルがあると、これまでは上司が録音した音声でやりとりを確認していましたが、現在はテキストで確認できるので、やはり作業時間が短縮できています。今後もコールセンターの徹底的な効率化を進め、将来的には3〜5割程度の人員を削減できるようにしたいと考えています。

     さらに現在は、オペレーターの自動化にもチャレンジしています。ユーザー側の入力操作を必要とせず、「欲しい色はどれですか」「赤です」「赤ですね」などと、自然な対話で応答できるようにしたいと考えています。機械だけで電話注文に応対するには、ユーザーの声を正しく認識して正しく返答するだけでなく、名前や住所、電話番号なども正確に認識する必要があります。精度向上のためにやるべきことはまだまだあります。

    緒方 現在、Hmcommは社員も増え、学生インターンも何人も働いています。まさか数年でこんなに大きくなるとは思っていませんでした。やはり三本さんが音声認識サービスの事業化という風穴を開けたことが大きかったのでしょう。今は産総研の技術とは別に、独自技術も展開できていますね。

    三本 最近、「音」の技術の応用として、畜産分野で豚の咳から病気を見つけたり、鳴き声の変化から発情期を知ったりすることに用いはじめました。熊本にも拠点を作り、これから伸びていく分野ではないかと感じています。

     社会実装にあたっては弊社の技術とクライアントの事業のマッチングが重要ですが、産総研の全面的な協力があったからこそ、クライアントは当社を信頼してくださったと思います。

     産総研の技術に関心があり、それを事業化してみたいという人は、まずは相談するとよいと思います。個人では時間と費用がかかるベンチャー設立時の法的な部分の支援もしていただいています。

    緒方 自分の研究がどのように事業化され、どう社会に役に立つのか、研究者にはわからないところがあります。三本さんが私の培った技術をビジネスとして発展させてくれて、嬉しく思っています。産総研には事業にできる可能性を秘めた技術がたくさん揃っていますので、何かやりたいことがある方は、ぜひ産総研の技術を探してみてください。

    Hmcomm株式会社
    代表取締役CEO

    三本 幸司

    Mitsumoto Koji

    三本 幸司 代表取締役CEOの写真

    情報・人間工学領域
    人工知能研究センター
    人工知能応用研究チーム
    主任研究員

    緒方 淳

    Ogata Jun

    緒方 淳さんの写真

    「技術を社会に」産総研の技術をあなたの事業に活用してみませんか。

    産総研
    イノベーション推進本部
    ベンチャー開発・技術移転センター

    音声情報をデータ化できればいろいろなことが効率化できます!お気軽にご連絡を。

    Hmcomm株式会社

    この記事へのリアクション

    •  

    •  

    •  

    この記事をシェア

    • Xでシェア
    • facebookでシェア
    • LINEでシェア

    掲載記事・産総研との連携・紹介技術・研究成果など にご興味をお持ちの方へ

    産総研マガジンでご紹介している事例や成果、トピックスは、産総研で行われている研究や連携成果の一部です。
    掲載記事に関するお問い合わせのほか、産総研の研究内容・技術サポート・連携・コラボレーションなどに興味をお持ちの方は、下記の連絡先へお気軽にご連絡ください。

    産総研マガジン総合問い合わせ窓口

    メール:M-aist_magazine-ml*aist.go.jp(*を@に変更して送信してください)

    ※すべてのメッセージには返信できない場合があります。ご了承ください。

    国立研究開発法人産業技術総合研究所

    Copyright © National Institute of Advanced Industrial Science and Technology (AIST)
    (Japan Corporate Number 7010005005425). All rights reserved.