- 「ばーちゃんとAlexa×チャットを実現した話」 発表者: まーや(Maaya)
- 「Python Boot Campで全国にPythonの環を広げよう!(2018年版)」 発表者: Ryuji Tsutsui
- 「Python x 金融のコミュニティ fin-pyの活動事例」 発表者: driller
参考:
ばーちゃんとAlexa×チャットを実現した話
――まずは自己紹介からお願いします。
石田真彩(いしだまあや)と申します。普段はPyLadies Tokyoの2代目オーガナイザーをやっています。仕事はクラウドソリューションアーキテクトなので、普段コードをゴリゴリに書いてるというわけではありません(笑)。クラウドはAzureをメインにAWS、GCP、Oracle Cloudを比較のために触っています。
――ご自身のPyCon JPとの関わり方を教えてください。
ほとんどがPyLadies Tokyo関係で、毎年何かしらポスターなりブースなりを出しています。あとは普通に参加者として楽しんでいます! PyLadies Tokyoは今年4周年なんですが、実は4年前のPyCon JPのポスターセッションで、まかび(注: PyLadies Tokyo初代オーガナイザー)が「PyLadies Tokyoたてます!」っていうポスターセッションを行って、その翌月にミートアップ#1が行われたんですよ。なのでPyCon JPのおかげでPyLadies Tokyoは発足したんです。
――そうだったんですね。PyCon JPのポスターセッションとPyLadies Tokyoにそんな関係があったなんて初めて知りました!(笑) それでは自己紹介はここら辺にして今回の発表内容について軽く説明をお願いします。
はい。タイトルは「ばーちゃんとAlexa×チャットを実現した話」です。概要としては、文字でメールをしたくないおばあちゃんとミーティングが多くチャットで連絡を取りたい自分が、お互いの要望を叶えつつ連絡をとるためのソリューションです。
おばあちゃんがAlexaに向かってしゃべって連絡するとSlackでわたしのもとにメッセージが届きます。わたしはSlackのとあるチャンネルに文字を入力すると、カタコトの音声でAlexaがしゃべります。これを作ったときのアーキテクチャの話です。
――Alexaがしゃべるんですね。
Alexaと言っているのですが、実際はAlexaにプッシュ機能がないためラズベリーパイの中にAlexaのキットを入れて、しゃべる部分はAquesTalk Piを使ってしゃべらせています。なので、半分Alexa、半分自作でそれを一緒のラズベリーパイにいれたので1つのAlexaっぽくなっているという感じです。
――なるほど。Alexaにはプッシュ機能がないんですね。
はい。ラズベリーパイの中に音声を文字に変える処理が入っています。そこからAWS Lambdaを使ってその文字をSlackに送っています。逆にSlackで文字を打ったら、それをS3にあげておくんですね。それをラズベリーパイの中のTornadoでポーリングしています。あと、一回しか喋らないと聞き逃したりしてしまうので「新しいメッセージある?」と聞くと最新のメッセージを読み上げてくれます。なので、しゃべった音を文字化する、文字を音声化する、メッセージ確認の3つの機能がついたAlexaもどきを作りました。
――Alexa自体はつかってないんですね(笑)
はい。Amazon Echoの機械自体はまったく使ってないというか実は買えなかったんです(笑)。これを作ったときはまだ抽選販売の期間で全然買えなかったんです。ただ、そもそもプッシュ機能がAmazon EchoにはないのでAmazon Echoが手に入っていたとしてもどちらにせよRaspberry Piを使わざるを得なかったのです。
――そんな裏側があったんですね。今回一番工夫した点はどこでしょうか?
技術的には自分の持っているものでできたんですが、「いかに祖母に使ってもらうか」「使いやすくするにはどうすればいいか」を一番工夫しました。特にボイスUIはこだわりましたね。例えば、スキル名を自分の名前のまぁやにして、「あれくさ、まぁやにメッセージを送って」と孫の名前を呼ばせるようにしました。また、「こういうことしたいときはこう話しかけてね」っていうポップをラズベリーパイにポップをつけたりしました。あとは、一緒にパソコンの画面を見せたり、家のなかでちょっとだけ離れて触ってもらったりしました。
――いろんな工夫をして楽しく作ったんですね。あと、今回のポスターセッションでまぁやさんが一番伝えたかったことは何でしょうか?
いまは技術が発展しているので自分が欲しいものは作れることが多いと言うこと、ボイス系のシステムは意外とご年配の方や子どもでも使いやすいと思うので発展してほしい。そして、その発展に自分も貢献したいと思って発表しました。
――なるほど。たしかにボイスUIは親しみやすいUIですよね。ここまで発表内容についていろいろお話いただいたので、最後にポスターセッションの魅力を教えてください。
ずっと貼りっぱなしにできるので発表していない時も見てもらえることはメリットがあると思います。
「この人はAWSを知らないから詳しく話してあげよう」と言うように相手に合わせて調整しながら話せることもいいところです。また、あまり難しいことはしていなくても発表しやすいカジュアルなスタイルなので、今回の発表を見て「自分でもやってみよう」と思ってもらえれば嬉しいです。
――ポスターセッションにはそういった魅力があるんですね。石田さん、ありがとうございました。
とても温かみのあるお話が聞けて面白かったです。