はじめに
VUI(Voice User Interface)の体験において、音で演出することはとても大切です。ユーザーの楽しさを高めるのはもちろん、メッセージの区切れをわかりやすくすることや、サービスの世界観を伝えるという観点においても、発話以外の「音」を意識することがクオリティーの高さにつながります。
ユーザー体験の良いVUIのスキル(機能)を開発することに少しでも役に立てるよう「効果音」に焦点を当てて取り組みを紹介します。

初めまして。Clovaでプラットフォーム機能やサービスのプランニングを担当している高本です。
効果音についての取り組みを紹介するにあたって、Clova Developer Centerで提供を開始したSound Libraryと、その提供と並行して検証した、Clovaスキルにおける「効果音」の活用効果についてお伝えしたいと思います。
効果音に着目した経緯
Clovaには私たちが企画開発したスキルだけでなく、Clova Extensions Kitを通して公開された多くのスキルがあります。スキルストアの公開後、多くの方がClovaスキルを開発してくださいました。それらのスキルに触れる中で、クイズの正解音、道を歩く音、感情を表すBGM、人が笑う声など、言語的なコミュニケーションとは別の「効果音」は演出においてとても良い効果を持つのを感じていました。
また、過去にも紹介していますが、スキル開発者の方からも「効果音」や「音」にこだわることの重要性はたびたび取り上げられています。
これらのことから、効果音や音声コンテンツをサウンド素材集として提供し、スキル内での効果音の活用を促したいと考えました。
そこで、サウンドの制作・公開と並行しつつ、効果音を使用したスキルと、そうではないスキルはユーザーアクションにどのような差があるのか調査を開始しました。
事前調査とA/Bテストの概要
はじめに、すでにスキルストア上に公開されているスキルの観察をしました。
主に観察した観点は2つです。
- 効果音やBGMが使われているスキル(サウンドありのスキル)の特定
- サウンドありのスキル群とサウンドなしのスキル群の平均DAU(Daily Active User)の比較
まず、サウンドありのスキルの特定です。ここで言うサウンドとは、スキル内の「演出」のために使用されている効果音やBGMを指しています。
そのため、特定の音声や曲を再生することが目的のスキルについては、サウンドありのスキル群には含まず、サウンドなしのスキル群に含めています。
計測時点でのスキルの個数は以下のようになっていました。
- サウンドありスキル: 45個
- サウンドなしスキル: 152個
次に、サウンドありスキル群とサウンドなしスキル群の平均DAUの比較です。
結果、計測した期間においてという条件付きではありますが、サウンドありのスキル群のほうがサウンドなしのスキル群に対して、平均DAUがおよそ2.3倍高いことがわかりました。

直感とも相違のない結果ですし、現状の観察としてはこれで十分です。
次に実際にスキルを活用したA/Bテストを行いました。対象にしたのは、LINE株式会社として出している「みんなでクイズ」、社内で協力を得て作成した「激むず早口言葉」の2つです。
今回Sound Libraryで提供を開始した効果音は、ゲームやクイズなどのスキルで活用しやすいものがほとんどです。そこで、そういったエンターテインメント系のスキルに限定してA/Bテストを行いました。
実施したA/Bテストの内容は、
- スキル内のいくつかのポイントで効果音を実装する
- ユーザーごとに効果音ありのスキルと効果音なしのスキルを出し分ける
- それぞれのユーザー群を比較したときにユーザーアクションのどこに差が出るかを見る
というシンプルなものです。「効果音を活用した際に感じる楽しさは、ユーザーアクションのどの部分に出るか」の参考として見てもらえればと思います。
まずは、効果音のあるスキルと効果音のないスキルがそれぞれどんなものかご確認ください。
効果音ありの動画には出題音と正解音(成功音)が入っていました。
シンプルな差ではありますが、効果音によって以下のような効果が生まれているように思います。
- 「今から出題される」ということがわかりやすくなり、出題前に緊張感や高揚感が生まれる
- 「成功」したことが明確になることで、緊張状態からの安堵感が増し、成功に楽しさを感じる
上記のような観点で、効果音のあるほうが良い体験に感じました。楽しさやワクワク感が強く感じられるように思います。
A/Bテストの結果について
それでは、A/Bテストの結果も見てみます。
今回のA/Bテストでは、それぞれのスキルでユーザー数が均等にならなかったので、「1ユーザーあたり」で見ることができる指標を参考にします。
また、A/Bテストの実施時期にズレが起きてしまったため、「みんなでクイズ」と「激むず早口言葉」では異なる期間で計測したデータを参照しています。
1ユーザーあたりの試行回数

「みんなでクイズ」「激むず早口言葉」共に、1ユーザーあたりの対象期間内での合計試行回数に差が出ているのが見受けられました。効果音ありのユーザー群のほうが計測した期間においてより多く遊んでくれていることがわかります。
また、「みんなでクイズ」に関しては顕著に試行回数に差が出ています。

計測したどの週においても、1ユーザーあたりの試行回数が高くなっていました。ここまででわかるのは、効果音ありのスキルの方が試行回数が多くなる傾向がありそうということ、つまり「より楽しんでくれているのではないか」ということです。
では、仮に楽しんでくれているとして、それは他のユーザーアクションにどう影響するのか見てみます。
後日利用率

計測期間中に遊んでくれたユーザーが最初に遊んでくれた日を初日として、当月中に後日再度遊んでくれる割合を「初日利用後の後日再利用率」として調べたところ、効果音ありのユーザー群の方が後日再利用率に高い傾向が見受けられました。
また、「激むず早口言葉」に関しては、後日再利用するまでの日数にも差が見えました。

効果音ありのユーザー群のほうが後日再利用率が高く、かつ後日再度遊んでくれるまでの日数も顕著に短いという結果が出ています。
効果音を使用したスキルはユーザーアクションにどのような効果を生むか
これらの結果から、効果音を使用したスキルと、そうではないスキルのユーザーアクションの差について以下のように考えています。
- 遊んでくれる回数が多くなる傾向がある
- その結果、また次に使ってくれるユーザーが増える
- すべての項目で傾向が同じにはならないが、エンターテインメント系のスキルにおいて効果音はユーザーアクションに差を生む要素になる
まだまだ断片的な調査であり、確実な答えとは言い切れませんが、それでも効果音のあるスキルを触ったときに感じる「楽しさ」は、こういったユーザーアクションに現れるのではないかという仮説と、数値的な目安を持つことができるようになりました。
今後もSound Libraryの利用実態や効果音を活用したスキルを継続的に観察していきたいと思います。
最後にSound Libraryについて簡単に紹介させていただきます。
Sound Libraryについて
Clovaスキルの開発者向けに用意されたClova Developer Centerにて、Clovaスキル内で使用できる音声ファイル集「Sound Library」の提供を開始しました。
この音声ファイルを効果音や演出音として使用し、Clovaスキルのユーザー体験向上に役立てることができます。今後も随時カテゴリーやサウンドを追加する予定ですが、初回は「クイズ」や「ゲーム」など、エンターテインメント系スキルに活用できるようなサウンドを提供しています。
なお、音声ファイルのアドレスを公開しています。
ドキュメント内の「リソース」にて掲載しておりますので、ぜひご試聴、ご活用ください。
さいごに
VUIや空間を共有するデバイス、バーチャルアシスタント、そのどれもが今までの生活にはなかった未知のものです。私たち企画者も常に想像し、試行錯誤し、ひとつひとつわからなかったことに答えを出しながら進んでいます。
Clovaでは、未知への挑戦や壮大なビジョンを楽しんでくれる仲間を募集しています。もし興味がある方がいらっしゃいましたら、お気軽にご応募ください。
「Clova」と検索してください! https://linecorp.com/ja/career/ja/all
では、今後ともClovaにご注目ください!