コンテンツへスキップ

PDFから文字列を切り出すには

茶請け氏の9/5付けアゴラ記事「『どうやって自分達の責任を党全体の責任にするか』だけを考えた参議院選挙の総括」へのコメントです。


どうでもいいような話ですけど、何かのご参考までに、小技をご紹介します。

ちなみに元の報告書は文書内容のコピペなどができないようにされています。

これ、クロームなどで表示したPDFファイルをPDFに出力して、アドビのアクロバットで開くと、コピペができるようになります。

さらにコピペを難しくするためには、文書を画像ファイルにしてしまえばよいのですが、それを文字に変換するソフトも目にしたことがあります。

全部が全部できるかどうかはわかりませんが、テキストとして読めない文書に対して文字列サーチ(CTRL-F)をかけると、自動的に画像ファイルを文字化してくれるPDFリーダもあったように記憶しています。ひょっとして、アドビのアクロバットでもそれができたかもしれません。ご参考まで。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です