対話型インターフェースの未来

Vol.86
iNAGO株式会社 代表取締役  ロン・ディカールアントニオさん
コンピューターに向かって話しかけると、的確な答えが返ってきて、人間同士のように会話ができる…そんな「夢」の話が、現実に近づいてきています。iPhoneの発売から一気に普及したスマートフォンでは、様々な音声認識を活用したアプリケーションがサービスを開始。そこで、今回のクリエイティブ好奇心では「音声認識」「自動対話」の分野に注目しました。10年以上前から対話型インターフェースを実現するソフトウェア「NetPeople(ネットピープル)」の開発に着手し、2012年6月に音声での情報検索やスマートフォンの操作をを手伝うアプリケーション「mia(ミア)」(http://www.mia-netpeople.jp/)をリリースしたiNAGO株式会社のロン・ディカールアントニオ代表取締役を直撃!miaの特徴や競合サービスとの違い、さらには対話型インターフェースの未来や方向性について、熱くアツく語っていただきました!

対話しながら「検索」「提案」してくれるお出かけアシスタント「mia」

mia

6月に「mia(ミア)」のAndroid版がリリースされました。このアプリの特徴を教えてください。

「mia」は、iNAGOが10年以上前から開発し、サービス提供してきた「NetPeople(ネットピープル)」というソフトウェアを使ったアプリケーションです。よく間違われるのですが、NetPeopleは音声認識ソフトではありません!単純に音声を命令として認識して行動を起こすソフトウェアとは異なり、NetPeopleは対話しながら問題を解決に導いていくソフトウェアです。まず、インプットされた言葉から意味を読み取ります。意味を読み取ってから、最善と判断した反応を対話でアウトプットしていくのですが、この時に「××はどうですか?」と「提案」できるのがNetPeopleであり、miaです。miaは「お出かけアシスタント」として役立つような機能を充実して作っているので、店舗検索や地域情報などに強みがあります。

現在は、スマートフォンでの音声対応アプリが増えていますよね。

知られているのは、アップル社の「Siri(シリ)」と、NTTドコモが提供している「しゃべってコンシェル」でしょうか。この2サービスのおかげで、音声対応のアプリがグッと身近になったので、弊社としては期せずして注目していただけるようになり、ラッキーでした(笑)

会話の流れを読んで提案!まるで「人」と対話しているようなmia

この2サービスとmiaの違いは?

しゃべってコンシェルは、言語認識においては文章や会話としての意味は考えずに、拾うことができたキーワードのみを認識します。たとえば「渋谷でイタリア料理が食べたい」と相談すれば、瞬時に“渋谷”“イタリア料理”のキーワードで検索してくれます。小さなキーボードでGoogleの検索ウィンドウに必死に打ち込むより、ずっと楽ですね。しかし、一度検索した後で「クルマで移動したいな」と考え、「駐車場のあるところ」と追加の情報を入れても、“駐車場あり”だけの単独キーワードとして検索してしまいます。

Siriの場合、英語版であれば、ユーザーが入力した文章や会話の文脈を理解することが可能であるため、追加で「駐車場のあるところ」とインプットすれば、“渋谷”“イタリア料理” の検索結果をキープしたまま“駐車場あり”を追加条件として認識し、絞り込み検索ができます。ただし、ユーザーが自分で追加条件をインプットしないかぎり、絞り込み検索は行いません。多くのユーザーにとって、ここまで使いこなすことはまだまだ難しいのではないかと思います。また、これはあくまで英語版の話で、iPhone 4Sに搭載されている日本語版Siriではまだ対応されていません。

miaは、iNAGOが独自開発した「Context-Aware」(文脈認識)技術により、ユーザーが入力した文章や会話の文脈を理解し、音声で対応することはもちろん、「駐車場のあるところ」のような追加条件の検索だけでなく、検索結果が多かった場合はmiaのほうから動的に、「ご予算はおいくらですか?」と絞り込み項目を提案することができるんですよ。

これまで話した内容に基づいて話してくれるので、本当に「人」と会話しているみたいですね!

「やっぱり中国料理で」というように検索条件を変更したり、「フランス料理も探して」と検索結果を増やすことも可能です。また、見つからなかった場合は地域や予算を広げて検索することを提案します。

デバイスの環境変化と他サービスの登場でBtoBからBtoCへビジネスを拡大

SF映画の世界が身近になったようでワクワクしますね(笑)iNAGO株式会社にとっては、miaのような一般ユーザー向けのアプリケーションを提供するのは初めての試みだそうですが、これまではどのようなビジネスを展開してきたのですか?

弊社は2000年の6月に日本法人を開設し、長く企業向けのBtoBビジネスを展開してきました。NetPeopleはプラットフォームとなるソフトウェアとしてどんなデバイスにも組み込むことができるので、対話型のインターフェースを開発したい、と考えている企業のパートナーとなり、様々な次世代開発に関わってきました。NetPeopleの技術を使って対話型のお問い合わせサービスを提供したり、デモンストレーション用のシステムやロボットにNetPeopleを組み込んで、会話ができるようにしたり、カスタマーサービスのシステムに導入されるなど、現在も多くの企業にNetPeopleを使っていただいています。

なぜBtoBだけでなくBtoCの領域へ?

ふたつの環境の変化が理由です。ひとつは、やはりデバイスの環境変化、スマートフォンの普及ですね。スマートフォンの登場で、今までパソコンで行っていたweb検索などが外出先などで簡単にできるようになりました。でも、パソコンでのWeb検索からの名残で、現在もキーボード入力の検索がスタンダードです。日本人は器用ですけど、スマートフォンで文字をキーボード入力するのはやはり面倒くさい。(笑)音声入力のほうが明らかに楽ですよね。 そして、この変化に対応したアップル社のSiriの登場により、言語認識のアプリケーションが一般コンシューマーに身近になったことが、もうひとつの理由です。ある意味、Siriのお蔭で、この新しい対話型インターフェースを素早く一般コンシューマーに知ってもらうことができたので、大変助かりました。(笑) 検索のやり方、コミュニケーションが大きく変わる。さまざまな企業が「次世代開発」として取り組んできた未来の世界が、とうとう現実の世界になりつつある。今こそ私たちの出番だ、ということで、私たちが2000年からBtoBビジネスで培ってきた技術をアプリで提供し、より多くのユーザーにたくさん使ってもらうことで、私たちもさらに次の世界に前進できると考え、BtoCにも事業を拡大しました。

いつでもNetPeopleとつながりコンピュータと対話する時代へ

iNAGO株式会社 代表取締役 ロン・ディカールアントニオさん

【インタビュー対象者】
iNAGO株式会社
代表取締役 ロン・ディカールアントニオさん

miaには多くのコンテンツプロバイダが情報を提供しているので、検索結果も充実していますね。

miaは頼りになる「お出かけアシスタント」を目指しているので、より多くのコンテンツパートナーと提携したいと考えています。キーボード入力の検索がスタンダードだったコンテンツの世界も、音声入力に対応していかなければならない時代です。我々のプラットフォームであるNetPeopleを使って音声対応していきたい、と考えるコンテンツプロバイダの皆さんと、いい関係を築いて一緒にやっていきたいですね。

今後のBtoBのビジネスは?

従来通り、多くの企業にどんどんNetPeopleを使ってもらいたいですね。今後もOEM提供をしていきますし、おかげさまでいろいろな企業から話をいただいています。スマートフォンアプリのmiaは、多くのユーザーにNetPeopleの対話型インターフェースを体験してもらい、この技術を広めていくショーケース的な役割も担っており、すでにmiaをきっかけに新たなビジネスのチャンスが生まれています。また、さらに新しい環境でのmiaの活用も計画されていますので、ご期待ください。

今後はスマートフォン以外への展開も考えているのでしょうか?

もちろん!タブレットやテレビ、カーナビも、あらゆるデバイスがインターネットにつながってきていますが、これらはすべてキーボードがない。そうなると、音声入力、対話型インターフェースの出番です。NetPeopleを開発し続けてきた私たちだからこそ、できることが多くあります。英語版も作っていますし、他の言語も準備を進めています。最終的には、世界中いつでもどこでもNetPeopleとつながって、コンピュータと対話しながら生活している、そんな環境を目指しています。

取材/2012年8月28日 取材・文/植松

 

続きを読む

クリエイティブ好奇心をもっと見る

TOP