先日、eLV勉強会にてVUIについて講演をさせて頂きました。
スマートスピーカーのスキル開発ではなく、スマホアプリを独自開発したという、ちょっと珍しい取り組みです。
残念ながら、小生の力不足で少人数での開催となりましたが、満足度71.4%(NPS値:非常に満足からネガティブ評価を引いた値)と高いスコアを頂きました!
当日の下記発表内容をサイトなどを通じて順次公開して行く予定です。
- VUIアプリをスマートスピーカーではなくスマホアプリ(iOS&Android)で独自開発
- iPhoneアプリで1.1秒のレスポンスを実現(某Alexaスキルの5.0秒に対して4倍の性能を達成)
- 30分以上の待機時間を実現(技術&地道かつ長期間の検証で達成)
- 認知心理学を応用した独自のVUIガイドライン
ポイントとなるのは、我々のFamCookはスマートスピーカーが前提とする、「対話型のVUIアプリ」ではなく、「コマンド型のVUIアプリ」の開発であった点です。
「対話型」のVUIアプリ
スマートスピーカーは「対話型の音声操作に対応したAIアシスタント機能を持つスピーカー」と定義されています。
対話型とは、人が話しかけた内容に対して、不足している情報を聞き返すなどの対話をする事で、目標を達成させます。
例えば、
「Alexa、リマインダーセットして」
「なんのリマインダーですか?」
「外出」
「いつリマインドしましょうか?」
「3時半」
「はい、では午後3時30分に、リマインダーをセットします」
このように、ユーザが「今日、午後3時30分に外出のリマインダーセットして」と1回で完結しなくても、対話形式で目標を達成させることが特徴です。
コンピュータに例えると、キーボードでWeb検索画面でテキストを入力し、結果を見ながら追加のテキストを入力して絞り込んで行く検索UIに近いものがあります。
ユーザが多様な入力ができるという自由度がある一方で、ユーザが操作方法を覚えきれないという側面もあります。
「コマンド型」のVUIアプリ
一方、我々のFamCookは、コマンド型の音声操作です。
ユーザが何を喋ってもいいわけではなく、決められたコマンドを喋らないと操作できません。
(GUIで「にんじんしりしり」の音声ナビスタート)
「人参を千切りにしてください」
「詳しく」
「人参をよく洗ってください」
「次」
「人参を斜めに持ち、薄切りにしてください」
「次」、「もう一回」、「戻る」などの音声コマンドで操作します。
コンピュータに例えると、テレビゲームのリモコンで、十字ボタンとABボタンで操作するような感覚です。
操作方法が限定される一方で、ユーザが操作を覚え易いという側面もあります。
アプリ開発の観点では、この2種類の音声操作アプリは「音声認識」と「音声合成」の二つの技術を使う事は共通していますが、詳細機能においては要件が異なり、レスポンスに大きく影響するというのが重要な点です。
この辺りについて随時公開して行く予定です。
我々の事例を通じて、VUIアプリ開発の選択肢はスマートスピーカー以外の選択肢もある事、VUIアプリはより身近なサービスになりつつある事を知っていただければと思います。
よろしければ、実際にFamCookをインストールして、お試しください!
コメント