« 181120 今日は「たこ飯」と「蛸とダイコンのやわらか煮」 | トップページ | 181122 ディスプレイ買い換えと音声認識のテキストエディタ »

2018.11.21

181121 Google音声入力は音楽さえも聞き分ける

181121_googleongakuninshiki_04181121_googleongakuninshiki_02181121_googleongakuninshiki_03181121_googleongakuninshiki_01

 いまのスマホに買い換えたのは2016年3月ですが、少しずつ馴れてくると、これまで全く気付かなかった機能を発見して、驚くことがあります。
 その一つが、Googleの音声入力です。
 以前から検索の文字入力窓の右端にマイクのアイコンがあって、何だろうとは思ってもそれをあまり深く考えませんでした。
 9月のスマホGPS勉強会の準備の頃、ふと、このマイクのアイコンをタップすると「何かしゃべって下さい!」とメッセージが表示されるので、試しにキーパッドを使って検索キーを入力しないで、マイクに向かって「ジオグラフィカ!」と叫んだら、一瞬で「ジオグラフィカ」のインストール画面やHPのリンクが表示されたのでビックリしました。
 参考記事:「Google音声入力の精度が半端じゃない」
  http://pasokatu.com/14226

 20年も前、日本IBMが「ViaVoice」という音声認識ソフトを発売した頃は、特定個人の音声を何時間も吹き込んで認識させ、学習結果から文字に表示できるようになりましたが、当時の認識率はせいぜい80%程度でした。
 「ViaVoice」はその後ジャストシステムに引き継がれて発売を続けていたように思いますが、一時期使ってみたものの、誤認識が激しすぎて訂正にかえって手間がかかるから、早々に使うのを諦めたのを思い出します。
 当時を知る人間にとっては、現代のスマホは脅威の認識精度で、このまま進むとスマホのキーボードなんていらなくなるほど早いし、便利で、ミスもありません。
 最近は検索はほとんどしゃべって探すようになっていましたが、今日また新しい発見がありました。

 テレビでフジコ・ヘミングのDVDを見ていて、横に置いてあったスマホを見ると、「音楽を認識しています」というメッセ-ジと共にしばらくしたら、「ラ・カンパネラ フジコ・ヘミング」とずばり当たったのでビックリしました。
 その後も、他の音楽を次々と認識して、曲名を表示してくれますが、残念ながら演奏者の名前はさすがに「フジコ・ヘミング」とは出ず、他のピアニストの名前が出ることが多かったです。
 でも、少なくとも曲名は百発百中で正確ですから、曲名当てはスマホに負けます。
 
 益々便利になるスマホ。20代30代の若者は92%~97%の普及らしいですが、わずか4年前には49%~68%だったことを考えると、現在31.7%しかない60代以上の普及率も5年後には90%以上になっていることは間違いありません。
 その頃には面倒くさいタッチパネルでの文字入力なんてなくなっているでしょう。
 (久し振りにきよもりの予言です→TKNさん)
 引用記事:「20~30代のスマホ利用率は9割を超え、全世代でも7割超え」
 https://webtan.impress.co.jp/e/2017/08/02/26474

Posted on 11月 21, 2018 at 11:22 午後 |

コメント

tknさん、こんばんは!
コメント、有り難うございます。
結構マメにチェックしていただいているのですね。
お手を煩わせて、申し訳ありません。

グーグルスピーカーというのを見て、狭い家で何に使うのか?と馬鹿にしていましたが、スマホの検索マイクを試しに使ってみて、これほどまで音声認識が進んでいるとは驚くばかりでした。
実際に、Edivoiceでブログを口頭筆記?して、益々驚くばかりです。
改行、句読点、括弧だけスマホのキーを押すだけで、パソコンのキーボード以上の速度で文章が作成できるので、スマホのレベルはパソコン並みになると感心しきりです。

でも、教えていただいた勝間さんのブログを拝見して、リモートマウスというのを初めて知りましたが、きよもりには思いもつかないスマホをマウスの代わりにしてパソコンに文章を入力する人がおられるとは!驚くばかりです。
スマホでマウスやキーボードが使えたら好いのにと思っているきよもりとは全く対照的にスマホでのタッチ文字入力の方がキーボードやマウスで打つより早い方がおられるのですね。
スマホにマウスやキーボードをつなげることは、調べて判っていましたが、折角の携帯性が損なわれるから使うのをためらっているようなレベルですから、当分はEdivoiceのお世話になることにします。

機会を作って久し振りにお目にかかりたいですね!

投稿: きよもり | 2018/11/23 21:01:31

きよもりさん、ご無沙汰しております。
高齢者のスマホ移行も進んでいくでしょうね。
ただうちの親などの抵抗は強そうです。母がメールが打てるようになっただけでも驚きですがこの先は無理っぽいです。
音声認識は日本人は人前で機械に話しかけるのを恥ずかしがりますので遅れてますが、世界ではもう普通になってるんでしょうね。
僕も車とか、単身赴任先では、音楽をかけたり、電話をさせたり、タイマーをセットさせたり、天気予報を聞いたりしてます。
車でApple watchに話しかけて電話するのは助かります。
なお、音声認識でブログ等を執筆することについては、勝間さんのブログがとても詳しいです。ご参考に。
http://katsumakazuyo.hatenablog.com/archive/category/%E9%9F%B3%E5%A3%B0%E5%85%A5%E5%8A%9B

投稿: tkn | 2018/11/23 17:07:51

コメントを書く