LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog

Blog


Developer of the Month 2018.08 VoiceApp Lab様インタビュー

Clova Extensions Kit&Clovaスキルストアの公開に合わせてスタートした「Developer of the Month」。毎月一度LINEのAPIを利用して素晴らしい作品を開発していただいた開発者の皆様を新宿ミライナタワーオフィスにご招待し、インタビューと副賞の贈呈を行います。

第1回の「Developer of the Month」に輝いたのは数々のヒットスキルを開発してきたVoiceAppLabの3名。今回はVUIだからこその面白さやアイディアの源泉を聞きました。

VoiceAppLabのメンバー。左から、池田大介氏、コバヤシトール氏、捧隆二氏。

プロフィール

VoiceAppLab(ボイスアップラボ)。2017年10月にコバヤシトール氏と池田大介(いけだだいすけ)氏がVUIスキル開発を京都ではじめ、2018年1月に捧隆二(ささげりゅうじ)氏が参加。サウンドや演出に凝ったスキルを複数のスマートスピーカー向けに延べ30以上リリース。現在は大手企業のスキル開発も手がける。

スキル開発に“ハマって”しまった経緯は?

ーー短い期間でたくさんのスキルを出されています。どれもVoiceAppLabさんのだとすぐにわかるようなユニークなスキルばかりですが、どういう経緯で始められたのでしょうか?

コバヤシトール氏(以下、コバヤシ氏):昨年2017年の10月にGoogle Homeが日本で発売される前に、アメリカで盛り上がっているのを見て注目していました。それで発売と同時に池田さんと京都で開発を始めたのが最初です。

池田大介氏(以下、池田氏):始めたら面白かったので、これはやっていこうよ、と。

コバヤシ氏:そもそも声だけでスキルをつくるって、面白そうだけどイメージはできないし、なおかつ誰もやったことがない。これはもうチャレンジするしかないだろう、と飛びつきました。

池田氏:僕は声でコンピュータと話せることに完全に未来を感じました。そこにハマっちゃいましたね。今の段階では(性能的には)まだ厳しいと思いますよ。でもSFじゃないですけど、楽しい未来しか想像できなかった。

ーー未来も感じますよね。捧さんはいかがでしたか?

捧隆二氏(以下、捧氏):2017年の夏に会社の業務としてAlexaのスキル開発を先行してやっていて、その時にこれは「VUIの時代が来る」と思いました。もともとコバヤシさんと池田さんとは知り合いで、2人がスキル開発をしているのをFacebookで知ったんです。

コバヤシ氏:捧さんがスキルを出したと聞いたので、一本釣りしました(笑)

ーーそうするとVoiceAppLabさんはユニットみたいな感じで、それぞれ本業を別にされていますよね?

コバヤシ氏:そうですね。僕と池田さんはフリーのエンジニアです。

捧氏:僕はフィンテック系のスタートアップに勤めています。

多くの経験を経た今だからこそ言える「スキルを開発する上で大事なこと」

ーーこれまでたくさんのスキルを開発されていらっしゃいます。そうした経験を踏まえて、スキル開発において大事にされていることを教えていただけますか?

コバヤシ氏:VUIはスキル自体のサイズがすごく小さいのが特徴だと思うんです。スマートフォンのアプリの場合は、制作に割と資金もかかりますし、使うのもユーザーがインストールしてヘヴィーに使うことが多い。でもVUIスキルは一期一会で、その時やってそれで終わりといいますか。つくる側のも使う側もサイズが小さい。

サイズが小さいということは、できることも少ない。つまり「機能」で勝負することが難しいんですよね。そこでスキルの魅力をもっとアピールできる方法ないかと考えたんです。で、思いついたのは、スキルを「アトラクション」のようにしてしまうやりかたです。

ーーアトラクションってテーマパークにあるやつですよね?

コバヤシ氏:はい。アトラクションの機能って端的に言えば、乗り物がブルブル震えたり、ジェットコースターのようにシューっと滑り降りる、という要素だと思うんです。でもそれだけだと広がりがない。だからライドに乗るまでに「ハリー・ポッター」や「ジュラシック・パーク」のようなワクワクする「ストーリー」があるわけです。これがあるからお客さんはシンプルな機能を何倍も楽しむことができる。

スキル開発においても「機能」に「ストーリー」を載せたら、アトラクションのような体験にできるのではないか、と思うようになりました。

僕がつくるスキルは特にオープニングや演出に凝っています。ストーリーに偏り過ぎるとネタスキルになってしまうので、バランスは大事ですが、機能にうまくストーリーを絡めることができればユーザーの記憶に残り繰り返し使ってもらえます。なので今は、機能とストーリーをいかに融合するかを心がけています。

捧氏:僕も最初は機能前提でスキルをつくり始めていたので、トールさんには影響を受けましたね。

池田氏:もともとはみんな機能前提でスキルをつくり始めていると思うんですよね。僕も最初はそれでいろいろつくったんですけどリリースした後に「あれ?ユーザーに使われてないな」と。「スマートスピーカーって未来あるのかな?」と心配になりました(笑)

ーー心配になりますよね。

池田氏:そこで僕が思ったのは「スキル開発者もスマートスピーカーの普及に一役買わないといけない」ということです。そのためには習慣化だと思いました。使うのが習慣になるようなスキルをつくることが大事だ、と。

ーー生活の中に溶け込むようなスキルですよね。

池田氏:そうです。いかに生活の中に溶け込ませるか。習慣化にフォーカスして、さらにトールさんにインスパイアされてできたのが「歯みがきくん」です。歯みがきくんはデフォルトの声ではユーザーさんに届かないし、あたたか味もありません。

そこで実際に歯科で働いている方にお願いをして音声をつくりました。そこまでやると子ども達にも届くようになるんです。だから、習慣化プラスエンターテイメントのスキルをつくろうとしています。

コバヤシ氏:歯みがきくんは池田さんがサウンドからつくってますからね。すごいですよ。

池田氏:正直なところ、まだまだスキルは習慣的に使われていないと思うので、今後も習慣化をテーマにしていきます。

ーー便利だから使われるのかというとそうではないですよね。既にスマートフォンもあるわけですし。それを考えるとユーザーに体験として提供していかないとスマートスピーカーの良さを活かせないと思います。

池田氏:習慣的に話しかけたくなるかどうかは、スマートスピーカーの反応次第ですよね。

ーーそうですよね、最初に返ってくる反応に「おっ!?」というものがあると、ワクワクするというか何度も使いたくなって生活に溶け込んでいくようになると思います。

捧氏:僕も習慣化を大事にしています。最初にスキルを使った時に、1回しか使われないだろうなと思ったので、いかに繰り返し使ってもらえるかというのは考えていますね。これから画面付きのスマートスピーカーも出てくると思うので、つくり方もどんどん変えていかないといけないですよね。

スキル開発のフロー。機能が先かストーリーが先か

ーー機能にストーリーをのせるということですが、実際にスキルを開発するときはどういうフローで進めていらっしゃるんですか?

コバヤシ氏:機能にストーリーをつけるという考え方になってからは、それぞれ別に考えています。

平凡なスキルでもストーリーを被せたらどうなるんだろうという風に考えます。たとえば、「ToDo」スキルと「ゾンビ映画」を掛け合わせるとしますよね。「ToDo」スキルは項目を言うと「完了」とか「期限切れ」とか返ってくるだけのスキルなんですけど、そこに「ゾンビ映画」を被せると……。多分そう聞いてもピンと来ないと思うんです。

ーーはい(笑)今頑張ってますけど、イメージできません。

コバヤシ氏:そうですよね、でも音を聞くとちょっとピンと来るはずなんですよ。たとえばこんなBGMで(ホラーのBGMが流れる)ここで、タスク完了!と言ったら(切り裂かれる音)ゾンビがやっつけられる音がする。期限に遅れると(ムシャムシャという音)ゾンビに食べられちゃうんです。

ーーなるほど。面白いですね。

コバヤシ氏:演出って考えると難しいじゃないですか。でも「音だけ」に絞ってしまえば世界観をつくるのは割と簡単なんですよ。なのでイメージをしたら、すぐに音素材を探します。いい素材さえあれば、結構いいものができますよ。

ーー機能から考えますか?それともストーリーから考えていますか?

コバヤシ氏:どちらのパターンもあります。ただストーリーを考えても素材と出会わなわいと形にはならないです。逆に「いい音」に巡り合うことでパーンと思いつくこともあります。

ーー音から思いつくんですか! いつも耳を澄ましておかないといけないですね。

アイディアの源泉はどこ?

ーーたくさんスキルを出されていらっしゃいますが、アイディアはどこから出てくるのでしょうか? 先ほどおっしゃったようにいい音に出会ってアイディアが湧くこともあると思うのですが。

コバヤシ氏:音からだとユーザーさんをイメージしやすいですね。その発想でつくったのが「学校あるあるニュース」。このスキルでは最初に「緊急速報の音」が流れます。テレビで聞いたことがあるあの音です。あの音だけ聞くと家の中でも一瞬みんなビクッとしますよ。でもそのあとに「3組のYくんが、先生に向かって、お母さんと言いました。」みたいなニュースが流れるんです。ズコーッと(笑)みんなが共有している音を意外な展開に持って行くと面白いんですよね。

ーー緊張感のある音の後のゆるい内容の落差が面白いですね。

コバヤシ氏:みんなが共有している音、学校のチャイムとか駅のホームの音とかCMで良く聞く音とか。素材は山ほどあると思うんですよね。

ーーその視点で聞いてみるとたくさんありそうですね。普段、ストーリーや機能などのアイディアは書き溜めていらっしゃいますか?

コバヤシ氏:ストーリーのアイディアをいくつかストックしています。アイディアだけだと形にならないので、素材を調べたり機能を調べたりして、ドンピシャのものがあったらそれをハメて進めますね。アイディアは寝かしておかないと、アイディア同士のつながりが生まれないんですよね。

ーー寝かしたものが、ふとしたタイミングで組み合わさりますか?

コバヤシ氏:そうですね。たとえば「キャプテン九九」は、3ヶ月前はこの声ができるとは思っていなかったんですよね。それがGarageBand(iOS用の音楽編集アプリ)でいいエフェクトを見つけて、「これいけるじゃん」となってできました。ちょっとしたきっかけでできたりしますね。

ユーザーとの距離感をもっと縮めたい

ーー先ほど池田さんが、スキル開発をしてもユーザーに使われている手応えがなかったとおっしゃっていました。これは多くのスキル開発者が感じていることだとも思います。どうやって、モチベーション維持をしていますか?

コバヤシ氏:もともと僕はUSJ(ユニバーサルスタジオジャパン)とか任天堂とかのCMが大好きなんです。どちらの企業のCMも利用客の笑顔が中心に描かれてて、とくに最近のUSJのCMは、お客さんが心底楽しんでいる姿がうまく表現されててお気に入りです。そういう動画をたまにYoutubeで見ながら、ユーザーをイメージしてつくっています。

ーーそれはとてもいい話ですよね。

コバヤシ氏:最近は多くの人がスキルをつくるようになったので、新しいスキルをリリースしても新着にのる時間が短くなっています。本当に気に入って使ってくれるユーザーに知ってもらうのが難しくなってきて、開発側がモチベーションを維持するのも大変になってきましたよね。

池田氏:YouTubeのチャンネル登録のようなものがVUIにはないですよね。

ーーないですね。VoiceAppLabがスキルをリリースしたらお知らせがいくような仕組みがあるといいですよね。

コバヤシ氏:それで応援してもらえると嬉しいですね。星の評価だとどうしてもマイナスに目が向きがちなので、ユーザーさんから直接応援されている感じがあるとやる気がでますね。

スキル開発の未来。エンジニアの枠を飛び越える人が次の時代を牽引する

ーー音に対するこだわりが強いと思うのですが、作業時間としてはサウンドをつくっている時間が長いのでしょうか?

コバヤシ氏:たしかに最近は音楽編集の時間が長くなっていますね。池田さんは長いですよね。

池田氏:僕は、VUI開発に関してはコーディング1割、9割GarageBandです(笑)。

コバヤシ氏:池田さんの変化の仕方が面白いと思うんですよ。ゴリゴリのエンジニアだったはずなのに、今はサウンドトラックをつくっていますから(笑)。

池田氏:でも実際VUIって音しかないですから(笑)そのクオリティを高めるしかないんですよ。

ーーそうするとVUIのスキル開発に向いている人は変わると思いますか?

コバヤシ氏:思いますね。ちょうどiPhoneが出た頃、エンジニアとデザイナーの区別がそこまでなかったんですよね。スマホアプリのUIをきちんとつくれるデザイナーも少なかったんですよ。

池田氏:UIデザイナーという言葉も薄かったですしね。

コバヤシ氏:だからエンジニアの中から、頑張ってグラフィックをやるという人が出てきたんですよね。そこでエンジニアとデザインの両方ができる人が出てきた。今、30代後半くらいのすごいエンジニアと言われる人たちは、結構そこを通ってきてると思います。

だから、新しいものが出てきた時にエンジニアの枠を飛び越えて、表現の枠を広げられる人が次に進んでいけるし、次の時代を引っ張っていくと思うんです。しかもVUIは「音専門」ですから、グラフィックのデザインよりもはるかに飛び越えやすいと思います。

ーー敷居は高そうですけど、実際にやってみるとできるかもしれない。

コバヤシ氏:音の編集って結構ロジカルだから。サウンドエンジニアリングと考えれば、エンジニアとの相性はいいと思います。

ーー池田さんは、ご自分で録音されていらっしゃるんですよね?

池田氏:声の録音はしています。演奏は打ち込みですが。

ーーそれをベースにBGMをのせたりしているんですよね。

池田氏:そうですね。とは言え、全くの初心者からのスタートですが(笑)

ーー本格的ですね。今後は音の専門家がVUIスキルの開発に入ってくる可能性もあるということでしょうか?

コバヤシ氏:あると思いますよ。そういう人がClovaの開発環境を学んでもそんなに難しくないので入ってくると思います。

池田氏:むしろエンジニア以外の人が入ってくることでクオリティがどんどん上がってくると思います。

今後の展望。AIと表現が融合したらすごいスキルになる

ーー2017年の10月から始められてまだ1年経っていないですが、大手企業のスキルの開発も手掛け、東京にもよくいらしてますよね。この展開は予想通りですか?それとも早かったですか?

コバヤシ氏:早かったですね。草の根でやっていたので、よく依頼が来たなと思います。

ーーでもVoiceAppLabさんくらい気配りができているスキルって希少で、すごく目立ちましたよ。

コバヤシ氏:ありがとうございます。

ーー今のご活躍を踏まえて今後の展望を教えてください。

コバヤシ氏:音声だけだとユーザーさんとのつながりが少ないと思っているので、たとえばWebやLINEもそうですけどスクリーンやテキストと一緒に楽しめるようなVUIの表現方法にトライしてみたいと思っています。表現の幅を広げたいですね。

捧氏:LINEのBOTアカウント連携にはすごい可能性を感じます。新しいユーザーにそこから入ってきてもらう可能性もありますし、今のVUIだけではできないものができるといいですよね。

池田氏:僕は最初に言った通り、スマートスピーカーと対話できることに未来を感じているので、できるだけ自然な会話をさせたいと思っています。技術的な面もありますが、ストーリーの組み立て方次第では可能というか。もちろんそこはLINEさんがClovaを頑張って育てていくところでもあると思いますが、スキル単体でも自然な会話を目指したいです。

コバヤシ氏:僕も自然な会話をするAIに興味があるのですが、よく考えると「自然な会話ができる」って、それ「普通の人間です」ってことじゃないですか。会話を楽しむためには、さらにAIの性格付けとか、キャラ付けがキモになりますよね。

池田氏:そうですよね、スキルもキャラですよね。

コバヤシ氏:自然に喋れるAIと、表現(キャラやストーリー)の部分の両方が融合したらすごいことになると思います。

ーーなるほど、それこそ本当の「キャラクターとの会話」ですね!これからのご活躍も楽しみにしています。今日は、どうもありがとうございました。

制作:SmartHacks]

VoiceAppLabのオススメClovaスキル

それぞれオススメのスキルと、開発者に見て欲しいポイントをご紹介します。

キャプテン九九 by コバヤシ氏

掛け合い漫才のような割と軽く聞けるストーリーを軸に掛け算の九九をラップ調に練習できるスキルです。「歯磨きくん」に憧れていたので「歌のコンテンツ」をつくってみたいという動機でつくりました。歌にのっかって、いつの間にか九九を口ずさむようになって欲しいです。

「歯みがきくん」by 池田氏

シンプルに歯磨きの歌で、聴きながらお子さんが歯磨きをしてくれるというスキルです。習慣化をテーマに何だったら毎日声をかけてくれるだろうと考えてつくりました。お子さん向けのスキルには、Clovaの声が一番いいんですよね。デフォルトの音声が優しいんですよ。

「コロニーを救え!」by 捧氏

機能としては、旗揚げゲームです。それだけだと普通なので、トールさんにロボットアドベンチャーのストーリーを担当してもらっています。ゲームなのでクリア設定をどの程度にするか微調整を繰り返しました。頑張ったらなんとかクリアできるように設定しています。