/*
	Antenna House PDF Tool API V7.0
	C++ Interface sample program

	概要：テキスト抽出

	Copyright 2018 Antenna House, Inc.
*/

#include < PdfTk.h >
#include < stdio.h >

using namespace PdfTk;

void extractText(PtlPage& page);

int main(int argc, char* argv[])
{
	if (argc < 2) {
		printf("usage: ExtractText.exe in-pdf-file\n");
		return 1;
	}
	try
	{
		PtlParamInput input(argv[1]);

		PtlPDFDocument doc;

		// PDFファイルをロードします。
		doc.load(input);

		// ページコンテナの取得
		PtlPages& pages = doc.getPages();

		if (pages.isEmpty()){
			printf("ページコンテナが空\n");
			return 1;
		}

		// 先頭ページの取得
		PtlPage page = pages.get(0);

		// テキスト抽出
		extractText(page);

		printf("\n完了!\n");
	}
	catch (const PtlException &e)
	{
		fprintf(stderr, "Error code : %d\n %s\n", e.getErrorCode(), e.getErrorMessage().c_str());
		return 1;
	}
	return 0;
}

void extractText(PtlPage& page)
{
	// ページサイズ
	PtlSize pageSize = page.getSize();

	// ページコンテントの取得
	PtlContent& content = page.getContent();

	// テキスト抽出パラメータ
	PtlParamExtractText paramExtractText;

	// テキスト抽出する範囲
	PtlRect rect(0.0f, 0.0f, pageSize.getWidth()/2, pageSize.getHeight()/2);
	//paramExtractText.appendRect(rect);	// この行のコメントを外すと矩形領域内のテキストを抽出

	// テキスト抽出
	PtlParamString text = content.extractText(paramExtractText);

	printf(text.c_str());
}
