v26.1

新功能:PDF 提取器的属性提取

  • 提取 PDF 属性:标题、作者、主题、关键词、页数。
  • Class PdfExtractor:新增方法 Extract 用于提取 PDF 属性。
  • Class ExtractPropertiesOptions:表示 PdfExtractor 插件的 PDF 属性提取选项。
  • Class PdfProperties:表示 PDF 文档的属性和元信息。
  • Interface IHaveInput:用于单一输入数据的选项。
  • Class OptionsWithInput:用于单一输入数据的选项。
  • 完全免费功能

示例用法:

该示例演示如何从 PDF 文件中提取属性(标题、作者、主题、关键词、页数)。

// 创建 ExtractPropertiesOptions 对象以设置输入文件
var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
// 执行过程并获取属性
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;

示例用法:

该示例演示如何从 PDF 流中提取属性(标题、作者、主题、关键词、页数)。

// 创建 ExtractPropertiesOptions 对象以设置输入流
var stream = File.OpenRead("path_to_your_pdf_file.pdf");
var options = new ExtractPropertiesOptions(stream);
// 执行过程并获取属性
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;

示例用法:

该示例演示如何以最简方式从 PDF 文件中提取属性。

// 执行过程并获取属性
var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));

增强功能

  • HTML 转 PDF 增强支持图片的替代文本
  • PDF 转 PDFA1b 合规性

修复的错误

  • 尝试优化 PDF 文件时出现错误
  • 表单字段垂直对齐问题
  • 修复了 FormField 中日文文本显示的问题
  • HTML 转 PDF – 表格格式化问题
  • 在 PDF 转 PDF/A 之前优化 PDF 大小导致输出损坏
  • PDF 转 DOC – 表格渲染不正确
  • PDF 转 Excel – 输出文件格式问题
  • PDF 转 HTML – 转换期间出现 ArgumentException
  • PDF 转 HTML 转换遗漏部分链接
  • PDF 转 HTML 时文本缺失
2026年5月8日
 中文