善肯网页TXT采集器官方版是一款非常不错的网络小说采集软件,该软件可以将你输入的网页中的小说提取出来从而进行章节分类,再提供观看,界面简单,功能实用,有需要的朋友可以在本站下载使用。
3111、规则设置:
①在规则设置窗口,在网站中随便找一篇文,不写任何规则,先点击实时预览,看看能不能获取网页源代码,能获取则再写规则,不能获取就没必要继续了。
②规则设置使用的是正则表达式匹配内容,有一定基础最好,没基础也可以参考给的范例,简单学习下,不需要深入学习正则。
③规则设置的时候,目录页和内容页需要分开预览,也就需要两个链接,一个目录页链接、一个内容页链接。
④关于替换,有通用替换和定制替换,这里目前不需要正则,普通替换就好,需要注意的是必须要输入值,空格也行。删除:选中整行,再按住delete键就行。内置n再作为替换数据的时候代表换行。
⑤编码,目前只设置有GBK和UFT-8,差不多大多数网站就是这两种编码其中之一。
2、解析与下载
①解析请按解析地址2按钮,1按钮目前任性不想删,后面要开发其他功能,
②支持单章节下载和全文下载。
③支持添加章节数【有的小说没有章节数的时候就可以勾上】
④善肯网页TXT采集器官方版支持在线看,但是需要联网,此功能只是辅助,并非专业的看小说软件。
⑤下载进度和总需时间显示,内置多线程。
310关于规则设置
1、输入网址后,可以实时预览(不论有有没规则,有规则就是匹配规则后的内容,没有就是源代码,目前测试,并非所有网页都能获取其内容,具体大家可以自己去实验,能获取源代码的就是可以匹配出内容的)
2、目录页和内容页分别匹配不同的规则:
目录页:
文本名称规则
作者名称规则
章节规则(此处需有两个()一处匹配章节路径,一个匹配章节名称)
内容页:
内容规则
3、关于替换:
通用替换(非正则):所有规则都会自动加上通用替换(有共性的替换规则)
定制替换(非正则):单个网站的特有替换规则
正则替换:暂未开发,请求打赏支持开发~~。
想换行可用内容与 进行替换, 是替换数据不是原数据。
可以根据自己的需求增删,。(原数据和替换数据必填,一个空格都行,否则会抛异常)
删除:选中一行,按DELETE键删除
4、关于规则保存:
保存都是以文件名来的,不同的名称则为不同的规则,最终保存为xml形式。
5、关于地址解析
解析地址1:测试未删,以后会加功能,暂留着
解析地址2:推荐使用
6、理论上,只要是目录页指向内容页的形式都可以抓取【能获取源代码的情况下】。具体请大家自己去实验。
关于文件
1、commonrule.xml 文件存放的是通用替换规则,
2、rule文件夹下存放的是以网站为单位的规则。
如果需要直接拷贝单条规则放到rule文件夹下就可以使用规则了,前提是xml文件格式是对的,
3、其他
暂时还没想到你们可能还会出现什么问题。如果遇到问题欢迎反馈。
最后附上常用匹配全部内容的表达式:(.*?) ([wW]*?) ([sS]*?)
其实只要.exe就行,规则全是自己添加,commonrule.xml里面是通用替换规则。网站规则在rule文件夹下。我这边在里面放了两个网站的规则,主要是测试的时候是用的。其他网站规则,大家可以自己添加,或者支持开发者也行。
版本:1.1
修复第一章不能点击的bug。
新增功能使之提取网页链接的方式更加灵活。