独立行政法人産業技術総合研究所
現在位置広報活動 > 出版物 > 産総研 TODAY Vol.6(2006) 一覧 > VOL.6 No.7

きらりと光る産総研オリジナルソフトウェア
最近のソフトウェア

大量データから知識をモデル化し身近な I Tを賢くする「BayoNet」

 最近は、音楽や番組の視聴、買い物などもインターネットや携帯電話を介して行うことが普通になり、生活行動のかなりの部分が電子化されたデータとして大量に蓄積されてきています。こうしたデータを使ってインターネット書籍通販での商品推奨などが既に行われていますが、このようなデータを単なる購買履歴ではなく、さらに幅広く再利用できる知識としてモデル化することができれば、ニーズにマッチしたサービスの最適化や、製品開発のためのマーケティングなどに活用することができます。

 こうした知識をモデル化するための情報技術として、大量のデータから確率モデル(ベイジアンネット)の構築と推論を行うソフトウェアBayoNetの研究開発を行ってきました。

 2002年からはライセンス提供と製品販売も開始され、さらに高速化、高機能化と、より具体的な問題への応用研究を進めたことで、次のような具体的な応用が見えはじめています。

BayoNetの応用

 産総研とインターネットプロバイダ企業ニフティ(株)との共同研究では、数百万人におよぶ会員からのコールセンターへの問い合わせを円滑に進めるために、熟練オペレーターの理想的な対話を知識としてモデル化し、初心者オペレーターを補助する案内システムの開発研究を進めています。また金融分野においては、これまでは預金や投信のような金融商品は単に金利でしか差別化できませんでしたが、近年の制度の自由化、顧客の多様化を背景として、個人の人生設計に応じたサービス提供が必要になっています。そこで潜在的な要望を探るマーケティングのため、生活意識に関する、1万人規模のアンケート調査のデータをBayoNetを用いて分析、モデル化し、顧客案内、窓口支援システムを自動的に制御する研究も(株)野村総合研究所と共同で進めています。大手の通販会社では約600万人分の購買履歴があり、これを統計として分析するだけではなく、次に活かす知識として活用することが望まれており、産総研技術移転ベンチャー(モデライズ(株))ではBayoNetを用いて、ある商品が売れる理由を次の商品の販売のための知識モデルとして構築し、これを使って顧客にとって最適な指示や商品を提示することで、電話オペレーターを支援するシステムの開発を進めています。

デジタルヒューマン研究センター
本村 陽一

図4(上)


図4 BayoNetでユーザの嗜好性を予測してシステムを制御し、新たな履歴データを生み出す知識循環型サービス
(右は、BayoNet画面のスナップショット)

図4(右)

KNOPPIX日本語版の発展

KNOPPIX日本語版の活用状況

 KNOPPIXはドイツのKlaus Knopper さんが作成し、私たちが日本語版をメンテナンスしている「1枚のCDで起動するLinuxディストリビューション」です。ハードディスクを必要としないため、Windowsプレインストールパソコンでも手軽にLinuxアプリケーションを体験できます。KNOPPIXはパソコンに接続してあるデバイスの自動認識に優れており、ネットワーク、ビデオデバイスなどの設定が起動時に自動的に行われ、初心者でも簡単にLinuxを試すことができます。この利便性を生かして、オープンソースを活用する財団法人コンピュータ開発センター(CEC)のOpen School Platform プロジェクト(京都府京田辺市)*3 や独立行政法人情報処理推進機構(IPA)の電子自治体実証実験(大分県津久見市)*4 でも活用されています。

 KNOPPIXはCD1枚で利用できる便利さの反面、アプリケーションの更新があったときにCDをもう一度作成しなければならないことや、新しいバージョンが出た場合に行うダウンロードが(CD丸ごとのイメージなので)非常に大きい(700MB程度)などの問題をかかえていました。この問題を解決するために私たちは、Internet上の仮想的なCDイメージから直接起動できるHTTP−FUSE KNOPPIXを開発しました。

 HTTP−FUSE KNOPPIXでは、仮想CDを、細かく分割したファイル(ブロックファイル)にすることで、必要なファイルのみを必要なときダウンロードすればよくなります。また、アプリケーションの更新があった場合も、CD内で変更があった箇所に該当するブロックファイルだけを入れれば新しいKNOPPIXが利用可能になります。ブロックファイルはHTTPベースで配信されるので、手元のHTTPプロキシにキャッシュすることも可能になり、ネットワークのトラフィック低減や、サーバの負荷分散にも貢献します(図5)。

 さらにネットワーク起動とHTTPプロキシの機能を、市販の小型ルータに組み込むことも可能です。この機能を含んだルータさえあれば、CDを作成することなくKNOPPIXが利用できます。 性能的にもCDの読み出しよりネットワークの方がバンド幅が太いので高速起動が可能になります。また、このルータから複数のPCを起動することも可能なので、学校の計算機室等での活用にも期待しています。

今後の発展 −高信頼起動と仮想化−

 今後は、セキュリティにも考慮してセキュアチップであるTPM(Trusted Platform Module)を活用して高信頼起動を図ることや、オープンソースの仮想計算モニタ Xenを組み込んだ Xeonppix*5にも適用して、OpenSolarisや Darwinなどの色々なOSを起動可能にしていくことを予定しています。

情報技術研究部門
須崎 有康

図5

図5 Internetから起動するHTTP-FUSE KNOPPIXの仕組み

図6

図6 ネットワーク起動機能を入れたルータ(右の青箱)とそれを使ってネットワーク起動したKNOPPIX


*3 CEC Open School Platformプロジェクト http://www.cec.or.jp/e2e/osp/index.html
*4 IPA自治体におけるオープンソースソフトウェア活用に向けての導入実証 http://www.ipa.go.jp/software/open/2005/stc/jichitaikekka.html
*5 http://unit.aist.go.jp/itri/knoppix/xen/


qwikWeb
メーリングリストとWikiを統合したコミュニケーション・システム

 qwikWeb*6はメーリングリストとWikiWikiWeb(Wiki)という2つのコミュニケーション手段を組み合わせた、小規模なグループにおけるコミュニケーションを促進するための情報共有システムです。普段の情報のやりとりにメールだけを使っているようなユーザーが、Web上のコミュニケーション・システムをシームレスに使えるようにすることを目標にして設計したソフトウェアです。

 qwikWebは、簡単に使えるメーリングリスト管理システムQuickMLに、独自の実装によるWikiを統合したシステムです。オブジェクト指向スクリプト言語であるRubyで書かれていて、プラグインによるモジュール構造を採用することによって、容易にカスタマイズして使えるようにしています。2003年8月からインターネット上で試用環境の公開を継続していますが、長年に渡って安定した動作が確認されています。

 ユーザーはまずシステムにメールを送ることによってメーリングリストを作成し、同時にメーリングリストのメンバーだけがアクセスできるWikiサイトが作成されます。送信したメールは題名毎にまとめてWiki上に保存され、後から容易に見返すことができます。メールのフッタには対応するWikiページのURLが追記され、クリックするだけで対応するWikiページにアクセスできるようになっています。

 qwikWebは、メールによる手軽なコミュニケーションを入口として、徐々に高度な使い方ができるように設計されています。ぜひ一度実際に使ってみて、メールとWebの連携の威力を体験してみてください。qwikWebホームページより、実際に自分のWikiを作って、実際に試していただくことができます。

Wiki普及の背景

 WikiWikiWebは、1995年にWard Cunninghamによって始められたWeb上のコラボレーション・システムです。ネット上の共同作業で百科事典を作るWikipediaなどが有名です。現在ではWikiについての会社が三社(Socialtext社、Atlassian社(Confluence)、JotSpot社)登場し、企業への導入も進んできています。

 昨年OOPSLA*7の併催で第一回国際Wikiシンポジウム(WikiSym 2005)が開催されました。またWikipediaをテーマとした国際的カンファレンスWikimaniaが開催されるなど、学術分野においてもWikiが取り上げられるようになってきました。WikiSym2005では、私もqwikWebについての発表を行い、好評を得ました。

qwikWebの普及

 現在qwikWebは、Ruby開発者が所属するネットワーク応用通信研究所、オープンソース専門家によるIPA CODE blogプロジェクト*8などで設置・利用されています。また2006年度からは情報技術研究部門内部のコミュニケーションにも利用されることになりました。qwikWebは、オープンソースの玄人が選ぶシステムとして利用されるようになってきています。「Software Design」 2006年5月号には「qwikWeb徹底解説」として使い方からインストール方法までの解説記事が私の執筆で掲載されています。今後の普及がさらに進むことを期待しています。

情報技術研究部門
江渡 浩一郎

図7

図7 qwik.jp トップページ


*6 http://qwik.jp/
*7 Conference on Object-Oriented Programming Systems, Languages, and Applications、
  オブジェクト指向技術に関する最大規模のカンファレンス
*8 https://www.codeblog.org/


CCFinderX  http://www.ccfinder.net/

 CCFinderXは、コードクローン(プログラムのソースコード中の重複部分)を検出して、いろいろな図やグラフを用いて分析することができるツールです。

 コードクローンは、典型的には、ソフトウェア開発者がソースコードをコピー&ペーストすることで作り込まれます。コードクローンがいったん作られてしまうと、バグ修正や機能拡張のためにソースコードを修正する際には、そのコピーすべてについて同じ修正が必要になります。そのため、ソフトウェアの開発の現場、特に大規模で長期間保守されるソフトウェアを抱えた企業では、コードクローンの存在は生産性を低下させる大きな問題になっています。

 CCFinderXは、2000年に開発されたCCFinderを作り直したもので、2004年度のIPA未踏ソフトウェア創造事業での採択を受けました。

 最初のリリースから現在までの約半年あまりの間に、評価ライセンス版が、世界17カ国、100以上の企業や大学に配布されており、他の手法の研究発表の際に比較対象とされるなど、世界標準としての地位を築きつつあります。

情報技術研究部門
神谷 年洋

図8

図8 CCFinderXの配布パッケージに含まれるGUIツールGemXのスナップショット


前頁

戻る産総研 TODAY Vol.6 No.7に戻る