PDFlux是一款非常强大的PDF表格智能提取神器,可以帮助大家快速准确的识别PDF文档中的表格数据,同时还可以直接提取处理,支持转换操作,如果有需要的就快来下载免费使用吧!
PDFlux(PDF表格智能提取神器),目前有支持macOS、Windows系统、小程序以及浏览器插件,可以一键识别、一键提取PDF、扫描件、图片中的表格、文本段落、图片等要素!
1、在本极速下载下载解压文件,解压后找到“PDFlux_latest.exe”双击安装
2、稍等片刻就会出现下图的界面,按照提示完成安装即可
表格识别
精准识别无线框表格
精准识别复杂排版页面的表格
精准识别表格内部单元格合并
跨页表格自动合并
支持扫描件的表格识别:去除印章、角度矫正
格式转换
将PDF转化为Word、Excel、HTML等格式
将PDF转化为EPUB、MOBI等电子书格式,可以在手机或Kindle等电纸书上阅读
精准保留文本段落、表格等内容块信息
精准识别文档的章节目录结构
支持复杂排版的PDF文档的转换
SaaS服务
提供一套完整易用的REST API,供计算机调用,让您把PDF复杂格式抛诸脑后
将PDF文档解析为文本段落、表格、图片等内容块的序列,保留原文档的阅读顺序
支持中英文多栏复杂排版的PDF文档解析,跨栏和跨页内容块智能自动合并
智能识别表格的内部结构:单元格合并,单元格文字的对齐方式、缩进、颜色、加粗、斜体等样式信息,跨页和跨栏表格智能合并单元格文字
智能识别文档的目录结构,支持多达10个层级,长文档信息抽取必不可少
支撑后续各类文档智能的应用:PDF文档全文检索、文档级别信息抽取等
版本:v3.11.21
1.增加文档内容收藏功能,支持通过收藏的内容找到原文
2.优化登录后的界面样式,支持无需打开文件即可使用文档格式转换和文档版本对比功能
3.优化添加表格线相关逻辑及样式,支持在已经合并的单元格内添加新的表格线
4.修复在网络不畅等情况下使用识别表格功能后出现的客户端卡顿等异常
5.修复在绘制表格时偶发的崩溃问题