スキャンした本を文字変換した文章の読み上げ音声を聴いてみました

こんにちわ。
今日のブログは昨日の続きです。
本を裁断してスキャンして文字変換して読み上げソフトで音声ファイルを合成したところまで書きました。

音声読み上げソフトを買いました

今日は、そのファイルを聴いての感想と今後の展望です。

 

 

◼️改行整理が必須
改行してあるところは、言葉が解体されたままで読みます。
音声合成前に、正しく文章を直してあげる必要があります。

「そもそも」が
「そも(改行)そも」
になっているところでは、
「そ・も・そ・も」
と全部バラバラにしたので驚きました。
AIはその文章の先も見て、一生懸命読んどるんだろうなあと思いました。

読み上げてもらう文章の編集にあたっては、悩みがあります。
何のソフトを使おうか。
昨日使ったパソコンはWindows7でした。
Windows7のメモ帳は、改行に問題があります。
Wordは勝手に番号を付けたりするので今回はノーサンキュー。
うーん。

とりあえず考えるのがめんどくさくなってきたので、文書の変更はwindows10のメモ帳で行うことにしようかと思います。

ファイルをどう共有しようか。
Onedriveか、Googleドライブか?。
それはまた後程。

◼️読ませると、長い!
今回作成した合成音声で聴くには、まる一冊はざっと計350時間かかります。
聴いてられるかー!
次は読み上げ速さを今の倍くらいに設定のうえ合成して、180時間くらいまで持っていきたいと思います。

あっ、まちがえた。
手元にある音声の合計は350分の間違いでした。そりゃそうだ。
そして、音声合成したのは本全体の一部だけだったことを思い出しました。

えーっと、1講あたり1時間だったとして、合計約30時間かあ。
まあいいかも。

やはり、読み上げの元文章が準備できたら、初期値の早さと倍速の両方で音声合成してみます。
また、大きなくくりをそれぞれ違う人(音声)で読ませても楽しいかもしれません。

◼️再生時のレジューム機能
スマホはAndroidを使っています。
標準再生ソフトの「Play Music」では、レジューム機能がなさそうです。
(一時停止とその解除はできます)
つまり一旦聴くのを中止すると、全部初めから聞き直しになるわけです。

ええー、

と、レジューム機能ありのアプリをインストールしてみました。
そして音楽ファイルを読み込もうとしましたが、あるはずの場所に音楽ファイルが見えません。

…このソフト、きっとwavの音楽ファイルの形式に対応してない。

でも読み上げソフトは、wavにしか保存できない。

いや、変換すればあっという間…。
でも面倒くさい…。

結局、
「気にせずどこからでもテキトーに聴く」
ことにしました。

◼️結局頭に入るわけではない
ブログを書きながら読み上げ音声を流してみましたが、もともと同時に2つのことが出来ない性質なのでまったく音は入ってきません。
2つの作業の間で細かく意識を切り替える訓練と思ってはみても、すぐ忘れてひとつの作業に集中してしまいます。
そもそも初めから間違ってる??

 

 

結論。
暗記をしたいなら、こんな時間をかけずにまず勉強をすればよいのです。
一種の現実逃避でありました。

でも、久しぶりにあれこれやってみて楽しかったです。
スマホがあれば何でもできる時代ですが、今回は
「たまにはパソコンを触ってみよう」
と思いました。

そして、肝心の読み上げソフトです。
無料もしくは安価に使える読み上げアプリがあったとしてどのくらい使えるのは知りませんので他との比較ではありませんが…。

かなり聴けます。

個人でこのレベルの読み上げソフトを使えるのですねー。
ちょっとした感動でした。
ただし、手放しで完璧なわけではありません。
文章全体には自然ですが、細かいところは辞書登録必至です。
まあ最近はアナウンサーさんでも
「今のイントネーションは?」
と首をかしげることもありますしね。

そして私はこっそりと、
「OCRソフトもずいぶん良くなっているのでは??」
とチェックしたい気持ちでワクワクです。

出かけなくても出かけても、散財。
ちょっとめまいがしそうな今後でーす。