Excel VBA質問箱 IV

当質問箱は、有志のボランティア精神のおかげで成り立っています。
問題が解決したら、必ずお礼をしましょうね。
本サイトの基本方針をまとめました。こちら をご一読ください。

投稿種別の選択が必要です。ご注意ください。
迷惑投稿防止のため、URLの入力を制限しています。ご了承ください。


1172 / 13645 ツリー ←次へ | 前へ→

【75865】スキャンPDFの表(画像)をエクセル表として取り込みたい konkon 14/7/19(土) 15:53 質問[未読]
【75866】Re:スキャンPDFの表(画像)をエクセル表と... γ 14/7/19(土) 16:31 発言[未読]
【75868】Re:スキャンPDFの表(画像)をエクセル表と... konkon 14/7/19(土) 22:12 発言[未読]
【75869】Re:スキャンPDFの表(画像)をエクセル表と... γ 14/7/19(土) 23:33 発言[未読]
【75870】Re:スキャンPDFの表(画像)をエクセル表と... konkon 14/7/20(日) 7:33 発言[未読]
【75875】Re:スキャンPDFの表(画像)をエクセル表と... γ 14/7/20(日) 13:20 発言[未読]
【75879】ありがとうございました。 konkon 14/7/27(日) 7:58 お礼[未読]

【75865】スキャンPDFの表(画像)をエクセル表と...
質問  konkon  - 14/7/19(土) 15:53 -

引用なし
パスワード
   こんにちは。

スキャンで_PDF化された表が紙保存で数百枚あり、それを検索できるようエクセル化したいのですが、画像化されているためテキスト化する方法を探しています。

ソフトはAcrobat Readerしかないので、VBAでどうにかならないでしょうか?

過去、「PDFをExcelに戻す方法」でのkeinさんの回答が利用できないか?とやってみたのですが、「SendKeysでキーを送って〜」の部分がよく分かりませんでした。(T_T)

分からないままやってみたら、「このファイルが見つかりません」
「438 オブジェクトはこのプロパティまたはメソッドをサポートしていません」エラーが表示されました。

アドバイスなどよろしくお願いします。

現在の環境は win7 、Excel 2010、Adobe Reader XI ですが、
win7 Excel 2007、Acrobat Reader で同様の処理をすることになる予定です。

【75866】Re:スキャンPDFの表(画像)をエクセル表...
発言  γ  - 14/7/19(土) 16:31 -

引用なし
パスワード
   あなたが言及されているのは、↓ですね。
【10123】PDFをExcelに戻す方法 
ht tp://www.vbalab.net/vbaqa/c-board.cgi?cmd=ntr;tree=10123;id=excel
(参照するならurlを明記してください。)

そのスレッドの話は、
もともとがExcelブックだったものをPDF化したものです。
今回のは紙を画像としてスキャンした物ですから、精度がもともと落ちています。
たぶん、Readerだけではどうにもなりませんし、
VBAだけで画像の文字判定するのも不可能に近いと思います。

仕事で必要な物ですから、Acrobatを入手するなり、投資をすべきです。

【75868】Re:スキャンPDFの表(画像)をエクセル表...
発言  konkon  - 14/7/19(土) 22:12 -

引用なし
パスワード
   γ さん

回答ありがとうございました。

初めて投稿したのですが、URLを載せようとしたところ、
エラーが出てしまい、どうしても乗せられなかったので記載しませんでした。すみません。

元々はエクセル→印刷→スキャンでPDF化だったので応用可能かと思ってためしてみました。

自分のPCでは、エクセル→PDF化したものkeinさんのコードでためしてみたのですが、「SendKeysでキーを送って〜」の部分でつまづいています。

この部分でアドバイスがいただけたら助かります。

よろしくお願いいたします。


▼γ さん:
>あなたが言及されているのは、↓ですね。
>【10123】PDFをExcelに戻す方法 
>ht tp://www.vbalab.net/vbaqa/c-board.cgi?cmd=ntr;tree=10123;id=excel
>(参照するならurlを明記してください。)
>
>そのスレッドの話は、
>もともとがExcelブックだったものをPDF化したものです。
>今回のは紙を画像としてスキャンした物ですから、精度がもともと落ちています。
>たぶん、Readerだけではどうにもなりませんし、
>VBAだけで画像の文字判定するのも不可能に近いと思います。
>
>仕事で必要な物ですから、Acrobatを入手するなり、投資をすべきです。

【75869】Re:スキャンPDFの表(画像)をエクセル表...
発言  γ  - 14/7/19(土) 23:33 -

引用なし
パスワード
   > 自分のPCでは、エクセル→PDF化したものkeinさんのコードでためしてみたのですが、
> 「SendKeysでキーを送って〜」の部分でつまづいています。
> この部分でアドバイスがいただけたら助かります。
どの行でエラーになって、何というメッセージかを書いてもらわないといけませんが、
その前に、そのコードは何をしているのか理解されていますか?

Ctrl+ A ですべてを選択し、
それをコピーして、
それをワークシートに(文字列の変換は若干ありますが)貼り付けているものですよね。

まず、マクロの前に、手作業でそれがうまくいくかどうか確認していますか?
それが先決です。
それができないなら、そのマクロには期待ができません。
画像からテキストが認識できるかどうかがポイントです。

【75870】Re:スキャンPDFの表(画像)をエクセル表...
発言  konkon  - 14/7/20(日) 7:33 -

引用なし
パスワード
   こんにちは。

早速の回答ありがとうございます。

>その前に、そのコードは何をしているのか理解されていますか?
⇒理解していませんでした。

ht tp://www.vbalab.net/vbaqa/c-board.cgi?cmd=ntr;tree=10123;id=excel

この質問者さんはPDFデータをExcelシートに書式付きテキストでコピペしたい(本来はPDFデータをエクセルデータとしたい)との希望をもっていて、keinさんはコピペの部分を自動化するコードを提供されていたんですね。

自分は、PDFデータをテキスト化してコピペするコードかと思っていました。(T_T)

sendkeysなど理解していない部分に気をとられてしまって、都合よく解釈していました。

【75875】Re:スキャンPDFの表(画像)をエクセル表...
発言  γ  - 14/7/20(日) 13:20 -

引用なし
パスワード
   参考までに。

画像からテキストを取り出すソフトはOCRソフトなどと呼ばれるようです。
有償ソフトがいくつも販売されています。
Acrobatもそうした機能を備えています。
もちろんこれらも完全ではありません。
極端な話だと、手書き文字の解析はやはり限界はありますし、
印刷物をスキャンしたものでも、文字化けすることもありえます。

そうした性格のものですから、こうした掲示板でやりとりできるコードで
素手で簡単に実現できるようなものではありません。

【75879】ありがとうございました。
お礼  konkon  - 14/7/27(日) 7:58 -

引用なし
パスワード
   ▼γ さん:

こんにちは。

お礼が遅くなりました。

丁寧な解説をありがとうございました。

OCRの導入を検討してみます。

またよろしくお願いいたします。

1172 / 13645 ツリー ←次へ | 前へ→
ページ:  ┃  記事番号:
2610219
(SS)C-BOARD v3.8 is Free