v26.1
Tính năng mới: Trích xuất Thuộc tính cho PDF Extractor
- Trích xuất Thuộc tính PDF: Title, Author, Subject, Keywords, Number of Pages.
- Class PdfExtractor: thêm phương thức Extract để trích xuất Thuộc tính PDF.
- Class ExtractPropertiesOptions: Đại diện cho các Tùy chọn Trích xuất Thuộc tính PDF cho plugin PdfExtractor.
- Class PdfProperties: Đại diện cho Thuộc tính và siêu dữ liệu của tài liệu PDF.
- Interface IHaveInput: Được sử dụng cho các Tùy chọn có dữ liệu đầu vào duy nhất.
- Class OptionsWithInput: Được sử dụng cho các Tùy chọn có dữ liệu đầu vào duy nhất.
- Full Free functional.
Ví dụ sử dụng:
Ví dụ minh họa cách Trích xuất Thuộc tính (Title, Author, Subject, Keywords, Number of Pages) từ tệp PDF.
// Create ExtractPropertiesOptions object to set input file
var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;Ví dụ sử dụng:
Ví dụ minh họa cách Trích xuất Thuộc tính (Title, Author, Subject, Keywords, Number of Pages) từ luồng PDF.
// Create ExtractPropertiesOptions object to set input stream
var stream = File.OpenRead("path_to_your_pdf_file.pdf");
var options = new ExtractPropertiesOptions(stream);
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;Ví dụ sử dụng:
Ví dụ minh họa cách Trích xuất Thuộc tính từ tệp PDF theo phong cách ngắn gọn nhất có thể.
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));Cải tiến
- Cải thiện HTML sang PDF hỗ trợ văn bản thay thế cho hình ảnh
- PDF sang PDFA1b tuân thủ chuẩn
Các lỗi đã được khắc phục
- Lỗi xảy ra khi cố gắng tối ưu hóa tệp PDF
- Vấn đề căn chỉnh dọc của Trường biểu mẫu
- Sửa lỗi hiển thị văn bản tiếng Nhật trong FormField
- HTML sang PDF – Vấn đề định dạng bảng
- Tối ưu kích thước PDF trước khi chuyển PDF sang PDF/A gây ra đầu ra bị hỏng
- PDF sang DOC – Bảng hiển thị không đúng
- PDF sang Excel – Các vấn đề về định dạng file đầu ra
- PDF sang HTML – ArgumentException xảy ra trong quá trình chuyển đổi
- Chuyển đổi PDF sang HTML bị thiếu một số liên kết
- Văn bản bị mất khi chuyển PDF sang HTML