v26.1
新機能: PDF抽出ツールのプロパティ抽出
- PDFプロパティを抽出: タイトル、作者、サブジェクト、キーワード、ページ数。
- Class PdfExtractor: PDFプロパティを抽出するExtractメソッドを追加。
- Class ExtractPropertiesOptions: PdfExtractorプラグイン用のPDFプロパティ抽出オプションを表す。
- Class PdfProperties: PDFドキュメントのプロパティとメタ情報を表す。
- Interface IHaveInput: 単一入力データを持つオプションで使用。
- Class OptionsWithInput: 単一入力データを持つオプションで使用。
- 完全に無料で機能します。
使用例:
The example demonstrates how to Extract Properties (Title, Author, Subject, Keywords, Number of Pages) from PDF file.
// Create ExtractPropertiesOptions object to set input file
var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;使用例:
The example demonstrates how to Extract Properties (Title, Author, Subject, Keywords, Number of Pages) from PDF stream.
// Create ExtractPropertiesOptions object to set input stream
var stream = File.OpenRead("path_to_your_pdf_file.pdf");
var options = new ExtractPropertiesOptions(stream);
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;使用例:
The example demonstrates how to Extract Properties from PDF file in the shortest possible style.
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));強化点
- HTMLからPDFへの変換強化: 画像の代替テキストをサポート
- PDFからPDFA1bへの準拠
修正済みバグ
- PDFファイルの最適化を試みた際にエラーが発生
- フォームフィールドの垂直位置合わせ問題
- フォームフィールドで日本語テキストが表示されない問題を修正
- HTMLからPDFへの変換時のテーブル書式問題
- PDFからPDF/A変換前にPDFサイズを最適化すると出力が破損する問題
- PDFからDOCへの変換でテーブルが正しく表示されない
- PDFからExcelへの変換で出力ファイルの書式に問題
- PDFからHTMLへの変換中にArgumentExceptionが発生
- PDFからHTMLへの変換で一部のリンクが欠落
- PDFからHTMLへ変換時にテキストが欠落