蓝天采集器 V2.3安装教程:云端自动化数据采集发布系统——墨涩网

蓝天采集器云端自动化数据采集发布系统,蓝天采集器(SkyCaiji),致力于网站数据自动化采集发布,系统采用PHP+Mysql开发,可部署在云端服务器,使数据采集便捷化、智能化、云端化,让您随时随地移动办公!支持多级、多页、分页采集,自定义采集规则(支持正则、XPATH、JSON等)精准匹配任意信息流,几乎能采集所有类型的网页,绝大多数文章类型页面内容可实现智能识别,无缝对接各类CMS建站程序,实现免登陆导入数据,支持自定义数据发布插件,也可以直接导入数据库、存储为Excel文件、生成API接口等,软件实现定时定量全自动采集发布,无需人工干预!内置云平台,用户可分享及下载采集规则,发布供求信息以及社区求助、交流等


官网

http://www.skycaiji.com/

要求

PHP5.4 至 PHP7

安装环境要求

操作系统:Linux/Windows

软件环境:IIS/Apache/Nginx + MySQL 5.0 及以上

安装教程

1.将下载的软件上传至您的服务器,如果根目录有站点建议放在子目录里,解压后打开浏览器输入您的服务器域名或ip地址(存放在子目录则加上子目录的名称),进入安装界面

2.点击“接受”,进入环境检测页面

3.必须确保所有参数都正确,否则使用中会出现错误,点击“下一步”进入数据安装界面

4.填写好数据库及创始人配置,点击“下一步”

5.登录界面

6.后台界面

使用手册:

http://www.skycaiji.com/Manual/doc/about

蓝天采集器V2.3版本更新文档

1、修复自动采集死循环卡死问题,cli命令模式php路径问题(linux中自动识别php路径需要关闭目录跨站保护)
2、加强自动采集触发的安全性,优化自动采集性能减少系统消耗
3、加入函数插件,可用于数据处理的使用函数和条件判断中,(注意:条件判断中的使用函数功能有改动需要重新编写)
4、加入调用接口功能,可用于数据处理和发布设置中
5、新增代理类型socks4和socks5,加入代理ip动态获取功能,可对接多个api接口自动分析获取有效ip
6、新增腾讯翻译,优化翻译功能
7、加强页面分析功能,只需点击即可精准获取元素的xpath和同类型元素的xpath,制作规则更加简单
8、规则增加简单模式,有新手引导和页面分析功能,让新手更易入门
9、已采集数据新增统计图表,可查看年、月、日、任务、发布方式等相应的数据量
10、采集增加遵守robots协议功能(可关闭),采集设置和图片本地化设置分离
11、升级“第三方平台”应用

源码下载

官网下载:http://www.skycaiji.com/Manual/doc/install

网盘下载:https://www.lanzous.com/i7vio0f

 

THE END