こんにちわ。
先日、文字を読み上げるソフトを買いました。
時間の合間を見て、そのための文章を編集しています。
今日のテーマは、そのときに気づいた些末なあれこれです。
読ませたい文章は、一種の教科書です。
バラして、スキャンをして、スキャンから文字を読み取って得た文章を、読み上げのために編集します。
以前のブログでは、
ソフト購入から音声作成までについてはこちらに
音声を聴いてみた感想はこちらに、書きました。
今回は前回と違い、本気の原稿を作成することにしました。
Wndows7で、標準ソフトの「メモ帳」を使っての編集です。
その際に気づいたり思ったりしたことは、以下のとおりです。
◼️文章がブロックごと落ちている
スキャンして作成したPDFファイルから文字への変換は、スキャナの機械にオマケで付いていたソフトで行っています。
そのソフトではWordへの変換を選ぶくらいしか見当たらなかったので、一度Word化してからテキストファイルに変換しました。
問題は、元の本のページの中で、図が入る場所で起きています。
「右に図、左に文章」
といった場所で、周囲の文章の数~十数行を「図」として変換してしまうようです。
変換元のWordファイルを見に行くと、図になっているので文字コピーはできません。
一式の文章を自力でキーボードで入力しながら、
「有料の変換ソフト(OCRソフト)、買っちゃう?」
と首をかしげました。
◼️定番の誤変換
おそらく「あるある」だと思います。
ソフトのメーカーやグレードで違うのかは気になるところです。
・黒の◼️の中の白抜き数字
→「鰯 」など。画数が多くて黒っぽい文字
・襲来→雲来
・基本→墓本
・河口→河□
・1→I(アイ)
・2→Z
・6→ら
・7→フ、ア(特に7はほとんど誤変換)
・8→S
メモしておけばよかったー、思い出せない
誤変換はいっぱいありました。
特に、「グ」は苦手かと思いました。
マグニチュードは、「マグ、ニチユード」。
マグマも「マグ、マ」
でした。
あまりに多いので、ファイルごと一括で正しい文字に置換しました。
◼️単位は片仮名に直してしまう
読み上げソフトには、単語登録ができます。
難読の専門用語も、漢字と読み方の文字を入力できます。アクセントもある程度指定できます。
しかしアルファベットは、いろいろな読み方をします。
そこで、
「M7」は「マグニチュード7」
「4km」は「4キロメートル」と文字ごと変えてしまうことにしました。
◼️見出し数字の後ろは全角スペース
間をおいてほしいので、スペースを入れています。
◼️一文一行
Windows7のメモ帳は改行がおかしいというのは、前にも書いたとおりです。
「右端で折り返す」の表示モードで編集して保存した文章をコピーして他に貼りつけると、その右端部分に改行情報が入った状態で次に貼り付きます。
今回は、そのおかしいメモ帳を使いました。
表示モードは、折り返さないモードです。
文章は、マルが打たれたら改行して次の行へというルールで編集しました。
いくら長い文章でも、数回横にスクロールすれば読めるでしょう。
編集ソフトについては.
「多少使いにくくてもメモ帳でいいかな」
と思いました。
パソコンは、久しぶりにデスクトップを使っています。
今回ついでに気づいたのが、
「大きなキーボード打ちにくい!(`ε´ )」
ということでした。
慣れていないためもありますが、ノートPCに比べて左右の移動が多いです。
これが思いの外負担でした。
25年近く前は、逆に
「こういうがっちりしたキーボードじゃないとね!」
などと思っていたので、
「年をとると?いろいろ評価が変わるなあ」
と思いました。
文章の編集については、上記のような状況です。
文章なんてテキトーでも取り急ぎ聴くことができればいいかなと思っていました。
それなのに完璧な文章を用意しようと思い直したのは、少しずつの無駄が読み上げ再生時間に関わってくると思ったからでした。
今回原本と付け合わせてみて、欠落が多かったことに気づいてよかったです。
文字変換ソフトを購入するかどうかは、早めに決めたいと思います。
いずれにしても誤変換はあり編集は必要ながら、いま最新で売れ筋のソフトがどこまで使いやすいのか、気になるところです。
何より、自分の手間を省けるならアリです。
3日坊主の私が、今後読み上げシステム自体を末長く活用てきるかもわかりません。
でも今、やりたいことをやりたいんですー。
この件の次のご報告は、読み上げソフトでの検証と微調整についてです。
本日もお読みいただいてありがとうございましたー
(*≧∇≦)ノ。