私のiphoneには3種類の読み上げアプリが入っています。
seeingAI
読み上げはiphoneのvoice overで読み上げる。
カメラをかざすと次々読み上げる。読み上げ途中でカメラを別の対象に切り替えると、読み上げを中断して新たに読み上げを始める。
また、シャッターで止めた画面の文字をまとめ読みすりこともできる。
envisionAI
読み上げはアプリの音声で読み上げる。
設定で言語の自動検出をoffにしておかないと英語、中国語混じりで読み上げてしまう。
カメラをかざすと次々読み上げるが、読み上げ途中でカメラを別の場所にかざすと、前の読み上げが終わるまで新たな読み上げが始まらないので、一旦すぐに読み上げボタンをタップして解除してから再タップし読み上げを開始させる。
sulliban+
シャッターーで画面をとめて読み上げる。かざすだけでは読み上げを開始しない。読み上げはvoice overで読み上げる。Voice overが起動していないと読み上げない。
主に郵便物や商品のラベル、ラッピングにカメラをかざして文字を読み上げさせてます。これらのアプリには他にも周りの環境(色、光)や、人、物、通貨などを音声で教えてくれる機能があります。ただ、私はテキスト読み上げ機能以外は使っていません。障害が進めばこれらの機能を頼ることになるかもしれませんが、今はあえて使おうと思いません。前もって使えるようにしておくのが良いのかもしれませんが、なかなかそれは難しいです。5年位前から私はパソコンのスクリーンリーダーやスマホのvoice overを使い始めたのですが、全然使いこなせなかったのですが、障害が進むにしたがって使えるようになってきました。
今、紙書類を読むのが大変難しくなり、この読み上げアプリをもっとうまく使えないものかと感じてます。
使いたい場所
主に自宅で、郵便物や商品のラベルの読み上げに使っているアプリうを、もっと活用してさまざまな生活の場面で使うことができないか考えてみました。すぐに思い浮かんだのは次の3つです。いずれも即時に読み上げてくれる必要があるもので、アプリの性能が試されることになります。またアプリへの習熟度も鍵となります。
買い物
どのような場面で使いたいかを考えると、まず思い浮かぶのが店内での買い物です。私は商品の形や色は手に取ってみればぎりぎり認識できるのですが、商品に触れずに表示ラベルを見て買い物をすることは難しいです。手に取って商品を確認し、ラベルの文字を自分の見える距離で時間をかけて読み取らなければなりません。店員や、他の客に迷惑がられているかとても気になります。特に食品の場合、手で触ることに引け目を感じます。もし読み上げアプリで商品に触れることなくスマホをかざすだけで商品情報を認識して買い物ができれば大変助かるでしょう。
字幕
次に思い浮かぶのは、字幕です。最近NHKの報道番組、ドキュメンタリーの外国人のインタビューでは字幕での通訳が多くなってアテレコが少なくなっているような気がします。これは大変、困っています。字幕が読めないと内容がほとんど理解できないような構成になっている番組もあります。
全てアテレコにしてくれとは言いませんが、どんな話をしたのか分かるような構成にはできると思います。公共放送であるNHKはその義務があると強く主張したいところですが、すぐにはやってくれそうにないので、このアプリを画面にかざして字幕を読んでくれれば、大変嬉しいです。
行き先表示
あと、街中に設置されている行き先表示です。初めて行く地下街ではこれを頼りに歩くことが多いので表示にスマホをかざして行き先を読み上げてくれると大変助かります。また雑居ビルの看板に表示されているテナント名を読み上げて欲しいです。
読み上げアプリ 試してみた
先に書いた記事「読み上げアプリ 使いたい場所」で書いた場所で実際にためしてみました。bluetoothのイヤフォンを使い現場で対象にスマホをかざしてみました。
結論から言うと、思ったように使えませんでした。
理由はいくつか有りますが、共通するものとして、カメラをかざして写った映像のテキストをただ読み上げるだけでは、必要とする情報を得難いということです。カメラの映像には、知りたい情報のテキストだけではなく、不必要なテキストや記号が混じりこんでいて、これをアプリが読み上げるとノイズとなり意味が不明で理解できません。必要な部分だけをカメラでとらえることができれば良いのですが、スマホと対象との距離を合わせるのはそう簡単ではありません。家の中で落ち着いてやれば、それでもできるかもしれませんが、店内や路上ではとても無理でした。字幕の場合は屋内なので落ち着いてできるかなと思ったのですが、テレビの映像には結構字幕以外のテキスト情報があり切り替わってゆく字幕と混じってうまく読み上げてくれません。envisionAI sullivan+では、カメラの映像拡大率を調整できるので、余分な部分を取り除くことができます。これを上手につかいこなせば、必要な情報だけを切り出せるかトライしてみようと思っています。
その他、障害になったことは、バッテリーの問題です。スマホのカメラを起動すると電力の消費量が大きいので読み上げアプリを起動し続けることができず、こまめにアプリを閉じたり開いたりはとても面倒でした。
読み上げアプリ 考察
スマホ等の読み上げアプリは、AIの技術が利用されて画像からテキスト情報を抽出して音声読み上げをしてくれます。手書きもじでも、縦書きでも横書きでも認識できます。さらに現在帳票認識の技術が進んできて、得られたテキスト情報を種分けすることもできるようになっています。レシート、名刺はスマホのアプリで読みとり情報整理が普通にできるようになってきました。この技術が読み上げアプリにも使われるようになれば、店内で商品ラベルを認識して商品名、価格情報を教えてくれたり、路上で行き先表示版を認識して行き先名と方向を教えてくれたりするのも近いと期待します。また映像から字幕の抽出し読み上げるのもそんなに難しいことではなさそうです。今は映画の音声ガイドは字幕を読み上げてくれず海外映画はみれないのですが、楽しむことができるようになるのも近いと思います。