 |
|
 |
|
风车通用Web采集程序在线版 v1.5.4 |
|
|
|
|
|
| 源码语言:简体中文 |
| 授权方式:免费版 |
| 源码类别:.NET源码 / 全站系统 |
| 运行环境:.NET环境/ |
| 源码更新:2008-3-12 16:22:50 |
| 页面刷新:2008-8-28 9:50:49 |
| 相关连接:作者或厂商主页 程序演示 |
| 下载次数:148 次 |
| 源码介绍: |
v1.5.4
改善:修改了采集网址队列数超过5000,自动重启时无法停止的问题 2008-2-29
改善:采集项高级过滤设置中,可进行替换。格式为在原过滤规则后加入"[to]" 2008-2-29
增加:增加了采集时间间隔的设置,避免给采集站服务器带来较大压力
增加:增加了采集网址需要登陆验证的情况,需设置登陆及验证地址 2008-3-1
增加:列表JS提交方式(Post)分页。使用方法:在提交地址上追加参数"?fc_action=post&参数1={$pageid}",如果提交页已包含"?",则为:"&fc_action=post&参数1={$pageid}" 2008-3-1
功能特点:
******************************************
1、采用asp.net开发,运行于IIS下。
2、可根据入库设置,自动挂接到现有的网站系统,与现有系统实现无缝集成,补充或替换现有系统的采集程序。
3、采集调度,即计划任务,可为每个采集规则设定时间定时重复采集,多个采集任务可同时运行,到了设定时间采集程序在Web服务器后台自动执行,真正实现了无须人工干预的自动更新。
4、可自动归类,对采集的信息实现自动分类,当目标分类不存在时可自动创建该分类,也可通过分类映射将目标分类与当前网站内容分类进行合并。无需为每个类别建立一个采集任务。
5、采集规则设定简单易懂,程序具有2种运行方式,前台运行或后台定时运行。
6、可实现多级网页深度的采集,比如内容分页、部分信息在另外的页面、小说连载等类型的有主从表关联的信息采集。
7、独创的断点续采,目标网站有更新,采集程序才进行采集,仅采集更新的部分,效率高。 此功能对采集连载性质的网站特别有用,比如连载小说、连续剧等。
8、自动下载相关的外部文件到本地服务器或替换为远程路径,比如图片、FLASH、下载文件等,无需再手工上传到服务器。
9、支持采集模型的定义,可根据需要定义任意要采集的数据项,每个模型还可包含子模型。
10、自动识别绝大多数采集站的网页编码。比如常见的:GB2312,GBK,UTF-8,windows-1252,iso646-us等。
11、支持从列表页采集缩略图及其他附加信息。
12、多线程异步采集,采集效率高,占用服务器资源较低。 |
|
立即下载: |
|
风车通用Web采集程序在线版 v1.5.4
|
|
|
| 相关源码: |
|
|
|
·搜索更多与"风车通用Web采集程序在线版 "相关的软件
|
| 注意事项: |
·注意:本站源码一律只用鼠标左键打开,否则将不能正常下载!
·如果出现该页无法显示,请多试几次;如果总是不能下载,请点击报告错误,谢谢!
·请一定升级到最新版[WinRAR]才能正常解压本站提供的源码;如有其它问题,欢迎发信联系管理员.
·由于网站服务器承受能力有限,请其他网站不要直接链接我们提供的源码,谢谢!! |
|
|
 |