深维全能信息采集软件是一套自助式网络信息采集和监控软件。采用交互式策略和机器学习算法,极大简化了配置操作,通过简单的配置,还可以将所采集网页中的非结构化文本数据保存为结构化的数据。另外,该系统还支持用户名密码自动登录、自动参数提交、自动翻页、自动生成模板等多种功能,可以完整、准确地采集各种静态页面、动态页面、文件和数据库。对于采集到的数据,可以通过该系统提供的接口,方便地实现与其他系统的集成应用。
深维全能信息采集软件特点:
- 强大的信息采集功能。可采集几乎任何类型的网站信息,包括静态htm,html类型和动态ASP,ASPX,JSP等。可N级页面采集。可自动下载二进制文件,比如图片,软件,MP3等;
- 网站登录。需要登录才能看到的信息,先在任务的‘登录设置’处进行登录,就可采集登录后才能看到的信息;
- 速度快,运行稳定。真正的多线程,多任务,运行时占用系统资源很少,可稳定地长时间运行。(明显区别于其他软件);
- 数据保存格式丰富。可把采集的数据,保存为Txt,Excel和多种数据库格式(Access sqlserver Oracle Mysql等);
- 强大的新闻采集,自动化处理功能。可自动保留新闻的格式,包括图片等。可通过设置,自动下载图片 ,自动把正文里图片的网络路径改为本地文件路径(也可保留原样);可把采集的新闻自动处理成自己设计的模板格式;可采集具有分页形式的新闻。 通过这些功能,简单设置后即可在本地建立一个强大的新闻系统,无需人工干预;
- 强大的信息自动再加工功能。对采集的信息,可进行二次批量再加工,使之更加符合您的实际要求。也可设置自动加工公式,在采集的过程中,按照公式自动加工处理,包括数据合并和数据替换等。