こんにちは。
げんたといいます。
いわゆるOCRソフトと呼ばれるものですね。
フリーソフトを挙げるとキリがないので、有料版に限って述べさせて頂きます。
現在流通している日本語の高性能OCRソフトで、もっとも評価され使われているソフトは次の3つです。
1.読取革命(パナソニック)
http://panasonic.co.jp/snc/pstc/products/yomikaku/
2.読んde!!ココ(エー・アイ・ソフト(Epson))
http://www.epson.jp/products/ai/koko/index.htm
3.e.Typist(メディアドライブ)
http://mediadrive.jp/products/et/index.html
それぞれの最新版や機能はそれぞれのメーカーサイトで確認して下さい。
上記3つのソフトの性能面で私が感じていることを記載します。
基本的に、上記3つのソフトならば95%以上の認識率はあるのではないかと思います。
ただ、OCRソフトを使う場合、残りの5%が問題になるのであって、思いもよらないところが文字化けしたり抜けてたりして気付かないまま正式書類を作成…なんてことが一番怖いところです。
そういう意味では、私の感覚的には、3のe.Typistが一番認識率は高いかも知れません。
今の最新バージョンではどうだか分かりませんが、私も以前OCRソフトの導入を検討した事があり、
検討の結果、私が順位をつけるとするならば、1位 e.Typist,2位 読取革命,3位 読んde!!ココ
となりました。
と言っても、本当に差は殆どないですよ。
但し、一番使いやすいのは、2位の読取革命だと思います。
以前の検討結果をまとめましたので参考までに記載します。
但し、その時は現在の最新バージョンではないので現在のバージョンではどうなっているかは保証しません。
体験版などを使い、変換したい文章をテストしながらご自分の目でご確認下さい。
1.読取革命
・日本語の認識対象文字数…JISの第二水準の一部を含めた約4000字。
⇒第二水準の約半数の文字が非対応のため、姓名などの旧字体のデータの取り込みに難あり。
・専門用語辞書 …18万ワード
・使うスキャナがCANONのフラッドベッドスキャナの場合、付属ソフトに読取革命Liteがある。
これがあれば、バージョンアップ版が購入可能
2.読んde!!ココ(エー・アイ・ソフト(Epson))
・日本語の認識対象文字数…JISの第二水準の一部を含めた3600字~4000字
⇒これも姓名などの旧字体のデータ取り込みに難ありかな?
・使うスキャナがEPSONのフラッドベッドスキャナの場合、付属ソフトに「読んde!! ココ
パーソナル」がある。これがあれば、バージョンアップ版が購入可能
3.e.Typist(メディアドライブ)
・日本語の認識対象文字数…JISの第二水準のすべてを含んだ6700字
・専門用語辞書 …150万ワード?
・英語以外の言語にも対応しているエディションもある。
・使うスキャナがCanonのドキュメントスキャナの場合、付属ソフトにe.Typist エントリーがある。
これがあれば、バージョンアップ版が購入可能。
・公表はしていないが、リコーの複合機で、スキャンしたデータをPCに保存する場合、オプションで
PCに保存する時点でエクセルやワードに変換して保存する機能があります。
この時のOCRソフトは、リコー用にカスタマイズされたe.Typistが使われています。
横書きの原稿(日本語・英語混在)を読み取る場合には、上記3つのソフトに殆ど差はない。
ただし、縦書き原稿(日本語・英語混在)を読み取る場合には、どのソフトも英語の部分の認識率が
非常に悪かった。