2011年7月17日

MetilTranについて

残念ながら、今現在では「スキャンした原稿を自動的にリーダーで読みやすく整形加工してくれるソフト」はない。
PDFやjpgでスキャンした結果は、PCで閲覧するなら何とかなるが、画面の小さいリーダーで読む場合には、余白の削除や再配置が必須で、これを全自動で満足のいくような結果にすることは無理そうだ。
余白の削除をするだけだったらPDFDiet、再配置するにはMetilTranを使い、その後にChainLPでリーダーが読める形式に変換というのが現在の自分のワークフロー。
しかし、PDFDietにしろ、MeitilTranにしろ、ちょっと機能的に問題があるところがあって、出力結果が今ひとつという場合が往々にしてある。フリーツールに文句をつけるつもりは毛頭ないが、これらを使う場合にはある程度妥協せざるを得ない。
MetilTranは、文章のスキャン画像を解析して、行・文字ごとに分解し、リーダーにあった文字数で再配置してくれるツールである。結構高機能で、ノンブル(ページ番号)やイラスト、2段組、ルビなども自動判別してくれるのだが、スキャン画像の質などによっては判別が結構狂う。
古い日焼けした本は、上部が茶色く変色していることが多いが、このようなスキャン画像ではノンブルの抽出ができずに本文と一体化して抽出されてしまう。
段組も誤検出が結構ある。であるから、「お任せ」はできなくて、必ず結果を眺めながらページ毎に確認を行う必要がある。
問題なのは、「字割れ」を起こす場合で、これはルビに起因することがほとんどなのだが、これの個別修正ができない。コマンドとしては修正ボタンがあるのだが、まだ正式に実装されていないようで、ボタンが有効なときとそうでないときがあり、有効なときでも結果が満足できるものにならない場合が多い。
これは環境設定のパラメータをいじれば、ある程度解消されるようなので、今度試してみるつもり。

また、「行割れ」も起こるが、これは改行位置を誤検出しているためだろう。改行は手動で入れられるので、注意すれば防げる。
ということで、読みやすい結果を作成するには結構な手間がかかるものだ。

本日の電子化
北原亜以子 やさしい男
同     夢のなか
同     ほたる(以上、慶次郎縁側日記シリーズ)
佐藤雅美  影帳
同     命みょうが(以上、半次捕物控シリーズ)

0 件のコメント:

コメントを投稿