相談の広場

このエントリーをはてなブックマークに追加

総務の給湯室

総務担当者同士の給湯室的空間!「みんなの会社ではどうしてる?」など・・・ご自由に!

PDFからエクセルやワードへ変換するソフトについて

著者 およよよ? さん

最終更新日:2012年02月09日 16:21

画像として読み込んだスキャナよりPDFファイルをエクセルやワード、テキスト等に変換するソフトでオススメのものがあれば教えてください。

理想は、文字化けがない。ですが、、、たぶん、それは難しいと思うので、文字化けが少ないものです。

スポンサーリンク

Re: PDFからエクセルやワードへ変換するソフトについて

著者 mafuna2011 さん

最終更新日:2012年02月09日 23:31

EPSONの「読んde!!ココ」というソフトは如何でしょう。

http://www.epson.jp/products/ai/koko/

体験版
http://www.epson.jp/download/dms/dl_yondekoko.htm

Re: PDFからエクセルやワードへ変換するソフトについて

著者 げんた さん

最終更新日:2012年02月10日 10:24

こんにちは。
げんたといいます。

いわゆるOCRソフトと呼ばれるものですね。

フリーソフトを挙げるとキリがないので、有料版に限って述べさせて頂きます。

現在流通している日本語の高性能OCRソフトで、もっとも評価され使われているソフトは次の3つです。

1.読取革命(パナソニック)
http://panasonic.co.jp/snc/pstc/products/yomikaku/
2.読んde!!ココ(エー・アイ・ソフト(Epson))
http://www.epson.jp/products/ai/koko/index.htm
3.e.Typist(メディアドライブ)
http://mediadrive.jp/products/et/index.html

それぞれの最新版や機能はそれぞれのメーカーサイトで確認して下さい。


上記3つのソフトの性能面で私が感じていることを記載します。

基本的に、上記3つのソフトならば95%以上の認識率はあるのではないかと思います。
ただ、OCRソフトを使う場合、残りの5%が問題になるのであって、思いもよらないところが文字化けしたり抜けてたりして気付かないまま正式書類を作成…なんてことが一番怖いところです。

そういう意味では、私の感覚的には、3のe.Typistが一番認識率は高いかも知れません。

今の最新バージョンではどうだか分かりませんが、私も以前OCRソフトの導入を検討した事があり、
検討の結果、私が順位をつけるとするならば、1位 e.Typist,2位 読取革命,3位 読んde!!ココ
となりました。
と言っても、本当に差は殆どないですよ。

但し、一番使いやすいのは、2位の読取革命だと思います。


以前の検討結果をまとめましたので参考までに記載します。
但し、その時は現在の最新バージョンではないので現在のバージョンではどうなっているかは保証しません。
体験版などを使い、変換したい文章をテストしながらご自分の目でご確認下さい。



1.読取革命

 ・日本語の認識対象文字数…JISの第二水準の一部を含めた約4000字。
  ⇒第二水準の約半数の文字が非対応のため、姓名などの旧字体のデータの取り込みに難あり。

 ・専門用語辞書     …18万ワード
  
 ・使うスキャナがCANONのフラッドベッドスキャナの場合、付属ソフトに読取革命Liteがある。
  これがあれば、バージョンアップ版が購入可能


2.読んde!!ココ(エー・アイ・ソフト(Epson))

 ・日本語の認識対象文字数…JISの第二水準の一部を含めた3600字~4000字
  ⇒これも姓名などの旧字体のデータ取り込みに難ありかな?
  
 ・使うスキャナがEPSONのフラッドベッドスキャナの場合、付属ソフトに「読んde!! ココ
  パーソナル」がある。これがあれば、バージョンアップ版が購入可能

3.e.Typist(メディアドライブ)

 ・日本語の認識対象文字数…JISの第二水準のすべてを含んだ6700字
 
 ・専門用語辞書     …150万ワード?
 
 ・英語以外の言語にも対応しているエディションもある。
 
 ・使うスキャナがCanonのドキュメントスキャナの場合、付属ソフトにe.Typist エントリーがある。
  これがあれば、バージョンアップ版が購入可能。
  
 ・公表はしていないが、リコーの複合機で、スキャンしたデータをPCに保存する場合、オプションで
  PCに保存する時点でエクセルやワードに変換して保存する機能があります。
  この時のOCRソフトは、リコー用にカスタマイズされたe.Typistが使われています。
  


横書きの原稿(日本語・英語混在)を読み取る場合には、上記3つのソフトに殆ど差はない。
ただし、縦書き原稿(日本語・英語混在)を読み取る場合には、どのソフトも英語の部分の認識率が
非常に悪かった。

Re: PDFからエクセルやワードへ変換するソフトについて

著者 およよよ? さん

最終更新日:2012年02月12日 07:40

回答ありがとうございます。参考にさせていただきます。

相談を新規投稿する

1~3
(3件中)

    スポンサーリンク

    経営ノウハウの泉より最新記事

    スポンサーリンク

    労働実務事例集

    労働新聞社 監修提供

    法解釈から実務処理までのQ&Aを分類収録

    注目のコラム

    注目の相談スレッド

    PAGE TOP