iPhone 3GS:音声認識で電話をかけるには

今のところ、iPhone 3GSをすぐに買う予定はないのですが、3GSについて気になる記事があったのでメモをしておきます。3GSでは、3Gにない機能として音声認識が注目を浴びています。電話をかけたり、iPodで音楽を聴いたり、といった操作を声でできる近未来的な機能です。

「もうiPhone 3Gには戻れない」
http://plusd.itmedia.co.jp/mobile/articles/0906/24/news103.html

音声認識は、自然言語まではいかないものの柔軟性が高く、「**さんに電話をかける」といったつながりをもった文章でも認識する。助詞のゆらぎも認識しており、「ちゃん」や「さん」、「先生」といった敬称がついても認識できる。そのほかにも、「鈴木に電話をかける」といった場合に候補が複数いると、その候補をフルネームで読み上げて聞き返してくるなど、ある程度の対話性も持つ。認識可能な言葉の自由度という点では、かなりがんばっていると言える。
 しかし、その一方で、日本語環境ならではの注意点や条件もある。
 まず、電話での音声コントロールでは、「連絡先」の情報で、「姓」と「名」の読み仮名がきちんと登録されているのが、正確性を高める条件になる。読み仮名がなければ漢字の読みを解釈するのだが、音訓の判別が人間並みとは到底いかず、失敗率は格段に跳ね上がる。また、会社名や外国人の名前を登録している場合も、読み仮名は日本語で登録しておかないと、うまく認識しなかった。音声コントロールを活用するには、どれだけ「きちんと連絡先を登録しているか」が鍵になりそうだ。

電話をかけるためには、連絡先をきちんと登録している必要があるとのこと。

以前のエントリーで、Gmailの連絡先と同期させた場合に問題となる、「Gmailにふりがな欄がないため、iPhoneで連絡先にふりがながつかない→iPhoneで連絡先が漢字順になり、意図しない順番になる。」という状況に対処する方法を書きました。が、この方法だとどうやら音声認識には姓だけあるいは名だけで認識させることができなさそうです。

過去記事:Gmailと同期した連絡先を完璧に整理!(ソート編)

Gmailと同期した連絡先を完璧に整理!(ソート編)

例えば、「鈴木 一郎(すずき いちろう)」という名前を、名=鈴木一郎、姓=スズキイチロウと登録しました。この場合、音声認識が利用するのは、”鈴木一郎”を無理矢理読んだもの、あるいは、”スズキイチロウ”になるようです。iPhoneから見ると”スズキイチロウ”は一塊で、どこが姓でどこが名なのかはわからないので、「すずきさんに電話」は通用しないということになりそうです。「すずきいちろうに電話」と言わないとダイヤルしてくれないんですね。

こりゃ、Gmailの連絡先に早いとこふりがな対応してもらわないと困りますね。明日になったら3GSで試した報告が続々出てくるでしょう。人柱よろしくw ケケケ(`∇)