v26.1

Tính năng mới: Trích xuất Thuộc tính cho PDF Extractor

  • Trích xuất Thuộc tính PDF: Title, Author, Subject, Keywords, Number of Pages.
  • Class PdfExtractor: thêm phương thức Extract để trích xuất Thuộc tính PDF.
  • Class ExtractPropertiesOptions: Đại diện cho các Tùy chọn Trích xuất Thuộc tính PDF cho plugin PdfExtractor.
  • Class PdfProperties: Đại diện cho Thuộc tính và siêu dữ liệu của tài liệu PDF.
  • Interface IHaveInput: Được sử dụng cho các Tùy chọn có dữ liệu đầu vào duy nhất.
  • Class OptionsWithInput: Được sử dụng cho các Tùy chọn có dữ liệu đầu vào duy nhất.
  • Full Free functional.

Ví dụ sử dụng:

Ví dụ minh họa cách Trích xuất Thuộc tính (Title, Author, Subject, Keywords, Number of Pages) từ tệp PDF.

// Create ExtractPropertiesOptions object to set input file
var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;

Ví dụ sử dụng:

Ví dụ minh họa cách Trích xuất Thuộc tính (Title, Author, Subject, Keywords, Number of Pages) từ luồng PDF.

// Create ExtractPropertiesOptions object to set input stream
var stream = File.OpenRead("path_to_your_pdf_file.pdf");
var options = new ExtractPropertiesOptions(stream);
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;

Ví dụ sử dụng:

Ví dụ minh họa cách Trích xuất Thuộc tính từ tệp PDF theo phong cách ngắn gọn nhất có thể.

// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));

Cải tiến

  • Cải thiện HTML sang PDF hỗ trợ văn bản thay thế cho hình ảnh
  • PDF sang PDFA1b tuân thủ chuẩn

Các lỗi đã được khắc phục

  • Lỗi xảy ra khi cố gắng tối ưu hóa tệp PDF
  • Vấn đề căn chỉnh dọc của Trường biểu mẫu
  • Sửa lỗi hiển thị văn bản tiếng Nhật trong FormField
  • HTML sang PDF – Vấn đề định dạng bảng
  • Tối ưu kích thước PDF trước khi chuyển PDF sang PDF/A gây ra đầu ra bị hỏng
  • PDF sang DOC – Bảng hiển thị không đúng
  • PDF sang Excel – Các vấn đề về định dạng file đầu ra
  • PDF sang HTML – ArgumentException xảy ra trong quá trình chuyển đổi
  • Chuyển đổi PDF sang HTML bị thiếu một số liên kết
  • Văn bản bị mất khi chuyển PDF sang HTML
 Tiếng Việt