PDFからテキストをコピーするにはどうしますか?コピーできないことがあるのはなぜ?コピーできないときはどうしたらいいですか?

更新日:

PDFからテキストをコピーするにはどうしますか?コピーできないことがあるのはなぜ?コピーできないときはどうしたらいいですか?

このページの目的

パソコンやスマホの画面に表示しているPDFから文章や数字など(テキストといいます)をコピーして使いたいときがあります。このためにはPDFビューアのテキストをコピーする機能を使うのが簡単です。ただし、コピーされないように保護されたPDFや画像から作成したPDFではテキストのコピーができないので、別の方策が必要です。

ここではPDFからテキストをコピーする方法、コピーできない場合の原因と対策について整理しました。

画面上でテキスト範囲を指定してコピー

PDFを表示するにはPDFビューアのほか、最新のブラウザはWebで配布されているPDFを直接開くことができます。そして、ブラウザで表示している画面からテキストの範囲を指定してコピーできます。例えば、Chromeブラウザは次のようにします。

  • (1) 表示しているPDFのページ上で、コピーしたい範囲をマウスで選択します。
  • (2) マウスの右ボタンをクリックしてメニューを表示して「コピー」コマンドを選ぶか、コピーしたい範囲を指定した状態でCtrlキー+Cを押すと、選択した範囲のテキストをコピーできます。
  • (3) 次に、テキスト編集ソフトの編集画面を表示してペーストすれば終わりです。

なお、上の例ではペーストしたとき、コピー元PDFの各行の行末位置に改行が入っています。行末に改行が入るかどうかは、ブラウザやPDFビューアによって異なっています。(2020年7月時点)

  • 行毎に改行が入る
    • Google Chrome(83.0.4103.116)
    • Microsoft Edge(83.0.478.58)(Chromiumオープンソースに基づく)
    • Adobe Acrobat Reader(Adobe Reader)(2020.009.20067)
  • 行毎に改行が入らない(行を繋げる)
    • FireFox(78.0.1)

すべてを選択してコピー

Adobe ReaderのようなWindowsアプリケーションでは、メニューに「すべてを選択」コマンドが用意されています。「すべてを選択」コマンドを使うと範囲を指定しないで一括でテキストをコピーできます。

なお、Adobe Readerの「すべてを選択」コマンドでは、PDFの表示しているページ上のすべてのテキスト選択される場合と、Adobe Readerで開いているPDFの全ページに渡るテキストが選択される場合があります。

テキストをコピーできないPDF ― 最も多い理由はPDFの保護

これまでの説明のように、PDFで画面上に表示されているテキストをコピーするのは簡単です。ところが、ときどき、うまく行かないコピーできないケースがあります。

たとえば、次の図のようにAdobe Readerでテキストの範囲を選択して、「編集」メニューを開くと、「コピー」コマンドが有効にならないことがあります。

このようなときは、まず、PDFのプロパティをチェックしましょう。Adobe Readerでは「ファイル」メニューの「プロパティ」コマンドで文書のプロパティダイアログを表示し、「セキュリティ」タブを確認します。

セキュリティタブの「文書に関する制限の概要」のセクションには、PDFファイルの作者によって設定された、PDF利用制限設定(保護)の状態が示されています。「内容のコピー」が「許可しない」に設定されているとテキストや画像などをコピーすることができません。

このようなPDF上のテキストを利用するには、PDF作者からパスワードを入手して保護を解除しなければなりません。それができないときには、PDFを印刷したり、画像に変換したりしたうえで、OCRソフトを使って文字を認識して、テキスト化することになります。

(参考)紙の情報をコンピューターに取り込むOCR

テキストをコピーできないPDF ― その他の理由

PDFのテキストを選択してコピーできないという現象には他に様々な理由が考えられます。

例えば、印刷された文書をスキャナーで読み込んだ画像をPDFにしたもの、あるいはPDFの中の文字がテキストとして扱われていない場合などです。こうしたPDFもOCRソフトを使って文字をテキスト化することになります。

また、まったくコピーできない現象だけではなく、正しくコピーできないという現象もあります。こうした現象についてのより詳しい解説は、「簡単そうで簡単ではないPDFのテキスト抽出」にありますので、ご参照ください。

関連記事

簡単そうで簡単ではないPDFのテキスト抽出

記事を読む

関連情報