CodeIQ MAGAZINECodeIQ MAGAZINE

スマートスピーカーでレシピ探しを快適に!人間を音声アシスタントに見立て、AlexaのUIを徹底研究

2018.03.29 Category:インタビュー Tag: , , , ,

  • 17
  • このエントリーをはてなブックマークに追加

最先端テクノロジーを機能やサービスに活用すべく、機械学習を料理画像の解析に活用するなどの試みを行ってきたクックパッド。昨年の11月には、スマートスピーカーAmazon Echo向けの音声レシピ検索サービスをリリースした。開発したのは入社2年目の若手社員。
社内に前例がない音声分野の技術とサービスを彼はどう構築したのか。
by 馬場美由紀 (CodeIQ中の人)

「料理×IT」で自分のキャリアを広げたい

クックパッドには、様々な経歴の社員が在籍している。

例えば、研究開発部に属する入社2年目の社員、山田良明氏の場合は、管理栄養士の資格を持ったエンジニアだ。栄養学の知識を持ったエンジニアとは、どのような人なのか。

「料理が大好きなんですよね。小学生の頃から栄養士になりたくて、その資格が取れる大学に進学し、卒業後にはさらに管理栄養士の資格も取りました」

クックパッド株式会社 研究開発部 リサーチエンジニア 山田良明氏

プログラミングは学生時代に始めたが、最初はあくまでも趣味の範囲。これまで学生たちが手書きでしていた栄養価計算を効率化できないかと、栄養成分表をもとにパソコンで簡単に計算ができるプログラムを書いたりしていた。

周りにIT業界に進む学生は少なかったが、「料理×IT」を組み合わせれば、自分のキャリアが広がるはずと、2016年4月にクックパッドに入社。

半年におよぶ研修で、Webサービス開発などエンジニアとしての素養を身に付け、2016年7月からは同時期に発足した研究開発部に配属された。

現在は、先端技術の音声アシスタントを料理の分野で活かそうとしている。

スマートスピーカーが教えてくれる、1つの材料から拡がる料理の世界

そこでの山田氏が考えたのは、冷蔵庫などに残っている「食材」を1つ伝えると、その食材だけですぐに作れる料理をスマートスピーカー「Amazon Echo」が教えてくれるサービスだった。

検索窓に材料を入力したり、画面をスクロールしなくても、スマートスピーカーに話しかければ、適当なメニューを紹介してくれるのだ。

スマートスピーカーのインテリジェントなボイスインターフェイスを料理の場に活かすという発想は、クックパッドのエンジニアなら当然のことだった。

「クックパッドAmazon Echo版」では例えばこんなことができる。冷蔵庫を空けたらミニトマトがいくつか余っているとする。

「Alexa、クックパッドでミニトマトのレシピを調べて」と呼びかける。


Alexa:「ミニトマトですね。串焼き、ナムル、ごま和え、その他から、どの料理がいいか教えてください」

ユーザー:「その他」(その他の料理を選択)

Alexa:「にんにく炒め、アヒージョ、サラダ、その他からどの料理がいいか教えてください」

ユーザー:「アヒージョ」

Alexa:「アヒージョですね。簡単なレシピをMYフォルダに保存しました。使う材料は……」


と、Alexaがメニュー選択のアシスタントをしてくれるのだ。Alexaが提案した食べ方の中からユーザーが選び、そのレシピをクックパッドの「MYフォルダ」に送信するという仕組みだ。

※MYフォルダ:お気に入りのレシピが保存できる場所

材料は3つまで伝えることができるが、基本的にはひとつの材料を想定している。また実際の調理手順まではAlexaは教えてはくれない。Alexaの提案を受けると、ユーザーはスマートフォンなどで手順を確認しながら調理を始めることになる。

「メニューやレシピの引き出しがあまりない、料理初級から中級者向けのサービス。Alexaにメニューを提案してもらうことで、1つの材料だけでもいろいろな食べ方ができると、料理の発想を広げてもらえることができるはずです」

冷蔵庫の余りものからの発想だけでなく、買い物の直前、あるいは料理中に材料が余った場合のもう1品追加のメニューを考えたいときなどには十分役立つサービスだ。

人間を音声アシスタントに見立てた“Alexaごっこ”でUIを徹底研究

クックパッドに入社して半年経った頃、アメリカでAmazon Echoが注目されているというニュースを聞くと、山田氏の「Cook✕Tech」魂はすぐに反応した。

ボイスインターフェイスは料理のアシストにも使えるとすぐ思いついたのだ。しかし、当時、Echo本体まだ日本では発売されておらず、OSも日本語化されていなかった。

「それで、最初は同期の社員を音声アシスタントAlexa役に見立ててシミュレーションを行いました」

冷蔵庫に牛肉とたまねぎがある。人間役が「牛肉とたまねぎを使ったレシピを教えて」と声をかけると、Alexa役の人が料理を提案する。しかし、レシピ名を読み上げられても、それだけではイメージができない。材料名を読み上げてもらうが、今度は人間役が全部憶えきれない。

何度かの応答を経て、最終的にAlexa役は「クッパ」を提案し、人間役がそれを作ることにした。

「でも、調理担当の彼はクッパというものがどういう料理かわからなかったみたい。唐辛子を入れるのを忘れたのでスープに辛味がなく、クッパじゃなくて、つゆだくの牛丼みたいになっちゃいました(笑)」

こうした会話型の検証方法、山田氏は親しみをこめて“Alexaごっこ”と呼んでいるが、その経験を踏まえて、最短のやりとりで最終メニューに到達するために、コンテクストを絞ることの重要性を理解した。

例えば、メニューは主菜ではなく、副菜に限る。入力した材料だけで作れる料理だけを提案するというように。メニュー決定までに時間がかかったり、レシピが複雑になると、ユーザーが途中で離脱してしまう恐れがあるからだ。

料理の細かい作り方や手順は、現状ではスマートフォンやPCで閲覧したほうがいいかもしれないと山田氏は考える。

「音声でのアシストは今のところ万能とはいえない。声だけ聞いて料理を作るのって、料理に対する相当な知識がないと無理なんです。そこで調理プロセスで、音声で代替できるのはどこか、数パターンのシナリオを検証していきました。

現時点での結論は、料理における音声アシスタントは、スマホの代替を目指すのではなく、スマホと補完しあっていく関係であるということ。当面は、スマートフォンとスマートスピーカーはシーンに応じて使い分けることになると思います」

人間中心のボイスインターフェース活用のケースとして

実際の開発は、昨年の夏から。Amazon Echoで使える追加機能「Alexaスキル」を書くこと自体はさほど難しいことではなかった。

山田氏は、Amazonが提供している Alexa Skills Kit for Node.jsというスキル作成用のSDKを使ったが、「Node.jsを知っている人なら誰でも書けるはず。動くものを作るだけなら、Webアプリ開発よりも簡単」と言う。

「クックパッドAmazon Echo版」をAlexaスキルとして公開したのは昨年の11月。2018年2月に発表された「Amazon Alexa スキル」人気ランキングでは、トップ5にも入っている。

まだ基本的なことができるだけだが、開発を通して、料理分野でのボイスインターフェイス活用の課題を発見することはできた。

まず最大の課題がスキルとユーザーの接点だ。拡張機能としてのスキルは、ユーザーが意識的にインストールしなければ使えない。

「Echo端末自体には液晶画面がないし、操作スキルのアイコンも見えないので、スキルの存在が外からは見えない。つまりスキルの存在を一度忘れられてしまったら永遠に使ってもらえないというジレンマがあります。

また、困った時に助けるツールではあるが、困った時にしか使ってもらえないのでは、いずれ使われなくなる。テレビやラジオや電気のように日常的に使ってもらえるようにするにはどうすればよいか」その方法は模索中だ。

ボイスインターフェイスというUIをどう活用するかについても、まだ課題が残る。

「調理手順まで丁寧にガイドしてほしいというニーズはあると思うんですが、まずは基本機能を充実してからですね。そもそも音声アシスタントはどこまで人間の調理に介在すべきなのか。

Alexaに“次は、たまねぎをみじん切りにします”と手順を説明されて嬉しいという人もいるとは思いますが、機械に指示されながら料理するのを楽しくないと感じる人もいます。

スマートスピーカーの活用はあくまでも人間を中心にすえるべき。音声アシスタントはあくまでもその補助をするもの、という位置付けですね」

料理好きの管理栄養士、かつUIを徹底的に考えるエンジニアならではのアプローチである。

仕事から疲れて帰って来た夜、もしそこにスマートスピーカーがあって、何か作って食べたいと思ったら、まずは呼びかけてみよう。新しい驚きが料理づくりのモチベーションを倍増させてくれるはずだ。

(執筆:広重隆樹 撮影:刑部友康)

  • 17
  • このエントリーをはてなブックマークに追加

■関連記事

ロボットやIoTで、保育園や幼稚園の課題を解決――家族を笑顔にするユニファのサービスとは?... 多忙な保育士や幼稚園の先生の負担を軽減したい 女性の社会進出を支援するために欠かせない保育園や幼稚園。しかしその園を運営する側は、大きな負担がかかっている。中でも子どもを預かる時間が長い保育の現場では、事故をいかに起こさないようにするかは大きな課題である。 保育士は多忙だ。保育園によって異なるが...
メルカリが「R4D」設立で、技術基盤を強化へ――オープンイノベーションの野望はどこまで広がる?... 企業・大学研究所と連携し、8つのテーマを攻める メルカリはこれまでもフリマアプリにAIや機械学習などの技術を活用してきたが、R4Dの発足によりその技術基盤を強化すると同時に、外部の企業・教育機関と共同してさまざまなテクノロジーの社会実装・事業化を目指すとしている。 シニアフェローとしてアーティス...
プログラミング不要のチャットボット開発ツール「hachidori」の強みとは?【#Techスタートア... AIとifのハイブリッドチャットボット ――hachidoriさんのビジネスについて教えてください。 伴:プログラミング不要のチャットボットツール「hachidori」を提供しています。おかげさまで開発実績3,300件を突破し、2018年1月現在、国内最大級のチャットボットツールです。この躍進は...
Udemy人気講師、吉﨑亮介氏・堅田洋資氏が語る機械学習とデータサイエンスの最適な学習法_... AI・データサイエンスへのニーズを終わらせないためには人材育成が必須 ――お二人は機械学習やデータサイエンスという“最先端”の技術をUdemyで教えています。そもそも今これらの技術を、一般のエンジニアやビジネスパーソンが学ぶことの意義はなんだと思いますか。 堅田:ビッグデータ解析や人工知能がビジ...
LINE CTO朴イビン氏に聞く──LINEはクラウドAIプラットフォーム「Clova」で何をするの... LINEとNAVERの技術を集大成である「Clova」と「WAVE」 LINEは2017年9月28日、渋谷のヒカリエホールで「LINE DEVELOPER DAY 2017」を開催した。 コミュニケーションアプリ「LINE」をはじめ、LINEのさまざまなサービスにおける技術領域でのチャレンジや社...
テレビの視聴状況を人体認識アルゴリズムで分析──TVISION INSIGHTSが挑む「視聴質」とは... 誰が・どのようにテレビを見ているのか明らかにする「視聴質」 録画機器やデジタルデバイスの普及に伴い、テレビ番組の視聴率の定義が変わりつつある。関東地区では、2016年10月より、放送日から7日以内(168時間以内)のタイムシフト(録画)視聴率を算出するようになった。 とはいえ現状、計測しているの...

今週のPickUPレポート

新着記事

週間ランキング

CodeIQとは

CodeIQ(コードアイキュー)とは、自分の実力を知りたいITエンジニア向けの、実務スキル評価サービスです。

CodeIQご利用にあたって
関連サイト
codeiq

リクルートへ