「e.Typist v.12.0体験版」を使ってみて驚きました。

takuzemi2010-08-22

 アラゴンのLes collages(レ・コラージュ)という本があります。この本の全文データベースを作成してみようかという気になりました。来年の夏休みにでも精読してみたいと思っているからです。ところで、私の使っているフランス語の文字認識ソフトはTextBridge Proというかなり昔に買った製品です。フランス語専門の文字認識ソフトであるにもかかわらず、認識の精度は余り良くはありません。誤読の方が多いかも知れないと言うべきでしょうか。
 Les collagesの冒頭の数ページをスキャンして、テクストと見比べながら手直しを始めたのですが、たちまちうんざりしてしまいました。何しろ誤読が多過ぎるのです。これでは駄目だと気付いて、ネット上で情報を得ることにしました。「フランス語_文字認識ソフト」というキーワードでGoogleで検索したら、色々と役に立つ情報が手に入りました。
 「e.Typist v.12.0体験版」というソフトが無料で14日間試用できるそうです。さっそくダウンロードして、インストールしてみました。試しにフランス語のテクストを読ませてみました。結果とは言えば「あっ!」と驚いてしまいました。ほとんど完璧と言っても良い精度の高さです。感動的な技術の向上が感じられました。
 残念なことに体験版には認識結果を保存する機能はありません。(コピー&ペーストもできません。)これの製品版を入手すれば、Les collagesを一冊丸ごとデータベース化するのに半年もあれば良さそうです。もっとも、もうすぐ夏休みも終りです。仕事の合間を縫って作業を続けるだけのモチベーションを持ち続けられるかどうかが問題ですね。