PDF Tool APIサンプルコード：画像抽出

指定されたページ内の画像を抽出します

概要

サンプルコードの概要

ページ番号と画像のインデックス番号を入力して、指定された画像を画像ファイルとして書き出します。

PtlEditElement: コンテントに描画されるエレメントを表現したクラス。すべてのエレメントクラスのベースクラス
PtlEditElements.get(int index): indexと一致する番号のEditElementを取得
PtlEditImage: コンテントに描画される画像を表現したクラス
PtlEditImage.writeFile(PtlParamOutput output, PtlEditImage.OUTPUT_FORMAT format): PtlParamOutputで指定したパスに画像を書き出す

サンプルコード

C++

/*
	Antenna House PDF Tool API V7.0
	C++ Interface sample program

	概要：画像抽出

	Copyright 2018 Antenna House, Inc.
*/

#include < PdfTk.h >
#include < stdio.h >

using namespace PdfTk;

void extractImage(PtlPage& page, const char* imagefilename, char kind);

int main(int argc, char* argv[])
{
	if (argc < 4) {
		printf("usage: ExtractImage.exe in-pdf-file out-image-file 出力フォーマット\n\n");
		printf("出力フォーマット\n0 : 自動  1 : BMP  2 : JPEG  3 : PNG\n");
		return 1;
	}

	const char* kind = argv[3];
	switch (kind[0]) {
	case '0':
	case '1':
	case '2':
	case '3':
		break;
	default:
		return 1;
	}

	try
	{
		PtlParamInput input(argv[1]);

		PtlPDFDocument doc;

		// PDFファイルをロードします。
		doc.load(input);

		// ページコンテナの取得
		PtlPages& pages = doc.getPages();

		if (pages.isEmpty()){
			printf("ページコンテナが空\n");
			return 1;
		}

		// 先頭ページの取得
		PtlPage page = pages.get(0);

		// 画像抽出
		extractImage(page, argv[2], kind[0]);

		printf("完了!\n");
	}
	catch (const PtlException &e)
	{
		fprintf(stderr, "Error code : %d\n %s\n", e.getErrorCode(), e.getErrorMessage().c_str());
		return 1;
	}
	return 0;
}

void extractImage(PtlPage& page, const char* imagefilename, char kind)
{
	int numImage = 0;
	// ページコンテントの取得
	PtlContent& content = page.getContent();
	// 画像エレメントの取得
	PtlEditElements& elems = content.getEditElements(PtlContent::GET_IMAGE);
	int numElems = elems.getCount();
	if (numElems == 0) return;

	PtlEditImage::OUTPUT_FORMAT format = PtlEditImage::FORMAT_AUTO;
	switch (kind) {
	case '1':
		format = PtlEditImage::FORMAT_BMP; 
		break;
	case '2':
		format = PtlEditImage::FORMAT_JPEG;
		break;
	case '3':
		format = PtlEditImage::FORMAT_PNG;
		break;
	}
	for (int i=0; i < numElems; ++i) {
		// 画像エレメントの取得
		PtlEditElement& elem = elems.get(i);
		PtlEditElement::ELEMENT_TYPE type = elem.getType();
		switch (type) {
		case PtlEditElement::TYPE_IMAGE:
			{
				++numImage;
				PtlEditImage& elemImage = (PtlEditImage&)elem;
				char pathImage[256] = {'\0'};
				switch (format) {
				case PtlEditImage::FORMAT_AUTO:
					sprintf_s(pathImage, "%s%d", imagefilename, numImage);
					break;
				case PtlEditImage::FORMAT_BMP:
					sprintf_s(pathImage, "%s%d.bmp", imagefilename, numImage);
					break;
				case PtlEditImage::FORMAT_JPEG:
					sprintf_s(pathImage, "%s%d.jpg", imagefilename, numImage);
					break;
				case PtlEditImage::FORMAT_PNG:
					sprintf_s(pathImage, "%s%d.png", imagefilename, numImage);
					break;
				}
				PtlParamOutput output(pathImage);
				elemImage.writeFile(output, format);
			}
			break;
		default:
			break;
		}
	}
}

Java

/*
    Antenna House PDF Tool API V7.0
    Java Interface sample program

    概要：画像抽出

    Copyright 2018-2021 Antenna House, Inc.
*/

package Sample;

import java.io.*;
import jp.co.antenna.ptl.*;

public class ExtractImage {

    /**
     * @param args the command line arguments
     */
    public static void main(String[] args) {
        if (args.length < 3)
        {
            System.out.println("usage: java ExtractImage in-pdf-file out-image-file 出力フォーマット\n");
            System.out.println("出力フォーマット\n0 : 自動  1 : BMP  2 : JPEG  3 : PNG\n");
            return;
        }

        String kind = args[2];
        switch (kind) {
        case "0":
        case "1":
        case "2":
        case "3":
            break;
        default:
            System.out.println("usage: java ExtractImage in-pdf-file out-image-file 出力フォーマット\n");
            System.out.println("出力フォーマット\n0 : 自動  1 : BMP  2 : JPEG  3 : PNG\n");
            return;
        }

        try (PtlParamInput inputFile = new PtlParamInput(args[0]);
             PtlPDFDocument doc = new PtlPDFDocument())
        {
            // PDFファイルをロードします。
            doc.load(inputFile);

            try (PtlPages pages = doc.getPages()) // ページコンテナの取得
            {
                // ページコンテナが空かどうか
                if (pages.isEmpty())
                {
                    System.out.println("ページコンテナが空");
                    return;
                }

                // １ページ目の取得
                try (PtlPage page = pages.get(0))
                {
                    // 画像抽出
                    extractImage(page, args[1], kind);
                }
            }
        }
        catch (PtlException pex) {
             System.out.println("PtlException : ErrorCode = " + pex.getErrorCode() + "\n  " + pex.getErrorMessage());
        }
        catch (Exception ex) {
            System.out.println(ex.getMessage());
            ex.printStackTrace();
        }
        catch (Error ex) {
            System.out.println(ex.getMessage());
            ex.printStackTrace();
        }
        finally {
            System.out.println("-- 完了 --");
        }
    }

    public static void extractImage(PtlPage page, String imagefilename, String kind) throws PtlException, Exception, Error
    {
        int numImage = 0;
        try (PtlContent content = page.getContent(); // ページコンテントの取得
             PtlEditElements elems = content.getEditElements(PtlContent.GET_IMAGE)) // 画像エレメントの取得
        {
            int numElems = elems.getCount();
            if (numElems == 0) return;

            PtlEditImage.OUTPUT_FORMAT format = PtlEditImage.OUTPUT_FORMAT.FORMAT_AUTO;
            switch (kind) {
            case "1":
                format = PtlEditImage.OUTPUT_FORMAT.FORMAT_BMP;
                break;
            case "2":
                format = PtlEditImage.OUTPUT_FORMAT.FORMAT_JPEG;
                break;
            case "3":
                format = PtlEditImage.OUTPUT_FORMAT.FORMAT_PNG;
                break;
            }

            for (int i = 0; i < numElems; ++i)
            {
                // 画像エレメントの取得
                try (PtlEditElement elem = elems.get(i))
                {
                    PtlEditElement.ELEMENT_TYPE type = elem.getType();
                    switch (type)
                    {
                        case TYPE_IMAGE:
                            {
                                ++numImage;
                                PtlEditImage elemImage = (PtlEditImage)elem;
                                String pathImage = "";
                                switch (format)
                                {
                                    case FORMAT_AUTO:
                                        pathImage = String.format("%s%d", imagefilename, numImage);
                                        break;
                                    case FORMAT_BMP:
                                        pathImage = String.format("%s%d.bmp", imagefilename, numImage);
                                        break;
                                    case FORMAT_JPEG:
                                        pathImage = String.format("%s%d.jpg", imagefilename, numImage);
                                        break;
                                    case FORMAT_PNG:
                                        pathImage = String.format("%s%d.png", imagefilename, numImage);
                                        break;
                                }
                                try (PtlParamOutput outputImage = new PtlParamOutput(pathImage))
                                {
                                    // 画像出力
                                    elemImage.writeFile(outputImage, format);
                                }
                            }
                            break;
                        default:
                            break;
                    }
                }
            }
        }
    }
}

/*
	Antenna House PDF Tool API V7.0
	.NET Interface sample program

	概要：画像抽出

	Copyright 2018-2021 Antenna House, Inc.
*/

using System;
using PdfTkNet;

namespace ExtractImage
{
    class Program
    {
        static void Main(string[] args)
        {
            if (args.Length < 3)
            {
                Console.WriteLine("usage: ExtractImage.exe in-pdf-file out-image-file 出力フォーマット\n");
                Console.WriteLine("出力フォーマット\n0 : 自動  1 : BMP  2 : JPEG  3 : PNG\n");
                return;
            }
            String kind = args[2];
            switch (kind)
            {
                case "0":
                case "1":
                case "2":
                case "3":
                    break;
                default:
                    Console.WriteLine("usage: ExtractImage.exe in-pdf-file out-image-file 出力フォーマット\n");
                    Console.WriteLine("出力フォーマット\n0 : 自動  1 : BMP  2 : JPEG  3 : PNG\n");
                    return;
            }

            try
            {
                using (PtlParamInput inputFile = new PtlParamInput(args[0]))    //元PDF
                using (PtlPDFDocument doc = new PtlPDFDocument())
                {
                    // PDFファイルをロードします。
                    doc.load(inputFile);

                    using (PtlPages pages = doc.getPages())
                    {
                        //ページコンテナが空かどうか
                        if (pages.isEmpty())
                        {
                            Console.WriteLine("ページコンテナが空");
                            return;
                        }

                        using (PtlPage page = pages.get(0)) // 先頭ページ
                        {
                            // 画像抽出
                            ExtractImage(page, args[1], kind);
                        }
                    }
                }
            }
            catch (PtlException pex)
            {
                Console.WriteLine(pex.getErrorCode() + " : " + pex.getErrorMessageJP());
                pex.Dispose();
            }
            catch (Exception ex)
            {
                Console.WriteLine(ex.Message);
            }
            finally
            {
                Console.WriteLine("-- 完了 --");
            }
        }

        static void ExtractImage(PtlPage page, String imagefilename, String kind)
        {
            int numImage = 0;
            using (PtlContent content = page.getContent()) // ページコンテントの取得
            using (PtlEditElements elems = content.getEditElements(PtlContent.GET_ELEMENT.GET_IMAGE)) // 画像エレメントの取得
            {
                int numElems = elems.getCount();
                if (numElems == 0) return;
                PtlEditImage.OUTPUT_FORMAT format = PtlEditImage.OUTPUT_FORMAT.FORMAT_AUTO;
                switch (kind)
                {
	            case "1":
		            format = PtlEditImage.OUTPUT_FORMAT.FORMAT_BMP;
		            break;
	            case "2":
		            format = PtlEditImage.OUTPUT_FORMAT.FORMAT_JPEG;
		            break;
	            case "3":
		            format = PtlEditImage.OUTPUT_FORMAT.FORMAT_JPEG;
		            break;
	            }
                for (int i = 0; i < numElems; ++i)
                {
                	// 画像エレメントの取得
                    using (PtlEditElement elem = elems.get(i))
                    {
                        PtlEditElement.ELEMENT_TYPE type = elem.getType();
                        switch (type)
                        {
                            case PtlEditElement.ELEMENT_TYPE.TYPE_IMAGE:
                                {
                                    ++numImage;
				                    PtlEditImage elemImage = (PtlEditImage)elem;
                                    string pathImage = "";
                                    switch (format)
                                    {
                                        case PtlEditImage.OUTPUT_FORMAT.FORMAT_AUTO:
                                            pathImage = String.Format("{0}{1}", imagefilename, numImage);
                                            break;
                                        case PtlEditImage.OUTPUT_FORMAT.FORMAT_BMP:
                                            pathImage = String.Format("{0}{1}.bmp", imagefilename, numImage);
                                            break;
                                        case PtlEditImage.OUTPUT_FORMAT.FORMAT_JPEG:
                                            pathImage = String.Format("{0}{1}.jpg", imagefilename, numImage);
                                            break;
                                        case PtlEditImage.OUTPUT_FORMAT.FORMAT_PNG:
                                            pathImage = String.Format("{0}{1}.png", imagefilename, numImage);
                                            break;
                                    }
                                    using (PtlParamOutput outputImage = new PtlParamOutput(pathImage))
                                    {
                                    	// 画像出力
                                        elemImage.writeFile(outputImage, format);
                                    }
                                }
                                break;
                            default:
                                break;
                        }
                    }
                }
            }
        }
    }
}

コマンド

AHPDFToolCmd70.exe -extractImage c:\sav -pageNo 0 -format 2 –d c:\in\in.pdf

サンプルコードのダウンロードはこちら

実行例

コマンドラインでの実行例

C++

ExtractImage.exe C:\in\in.pdf C:\sav\outExtractImage 2
完了!

Java

java -jar ExtractImage.jar C:\in\in.pdf C:\sav\outExtractImage 2
-- 完了 --

ExtractImage.exe C:\in\in.pdf C:\sav\outExtractImage 2
-- 完了 --

コマンド

AHPDFToolCmd70.exe -extractImage c:\sav -pageNo 0 -format 2 -d c:\in\in.pdf
 use time 0.013000s

出力結果イメージ

API（C++,C#,java）では出力ファイル名は指定できます。
このサンプルでは「指定名+連番」を出力ファイル名として指定としています。
コマンドでは「入力ファイル名+ページ番号+連番」となります。

PDF Tool APIサンプルコード：画像抽出

概要

サンプルコードの概要

サンプルコード

実行例

コマンドラインでの実行例

出力結果イメージ

サンプルコードのダウンロード

サンプルコード

サンプルで使用した入出力PDF