方正OCR世纪版是为用户打造的免费版本,这个软件的功能获得了一定的增强,能为用户自动识别文字,提供文档管理。扫图、扫PPT都能自动转化为编辑文字,这款软件真的超好用!
利用扫描仪和这个软件,你就能轻松将印刷文字变成可供你编辑处理的txt或者html文字了。
本软件系统是应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。
目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。
相比大家都知道OCR技术吧!
所谓OCR也就是图像文字识别技术,利用计算机将扫描仪或者数码相机导入的图片中的文字给抽取出来....
ocr的原理说起来很复杂,简单的说就是利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并存储在文本文件中~
所以说,OCR文字识别技术实际上是一种高效的输入方式
识别字体种类
能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
纯英文字符集
简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
识别字符
简体字符集:国标GB2312-80的全部一、二级汉字6800多个。
表格识别
可以自动判断、拆分、识别和还原各种通用型印刷体表格。
识别字号
初号小六号字体。