不用写代码的爬虫框架SpiderFlow教程

spider-flow 是一个爬虫平台,以图形化方式定义爬虫流程,无需代码即可实现一个爬虫。

1059人学习

高级6课时2020/08/07更新

二维码下载学堂APP缓存视频离线看

猿课教育
    • 畅销套餐
    • 精选套餐
    • 人气套餐
    • 尊享套餐
    • 高薪套餐
  • 课程介绍
  • 课程大纲

适合人群:

适合有Java基础的学员

你将会学到:

spider-flow 是一个爬虫平台,以图形化方式定义爬虫流程,无需代码即可实现一个爬虫。

  • spider-flow 是一个爬虫平台,以图形化方式定义爬虫流程,无需代码即可实现一个爬虫。

课程简介:


Spider-flow是一个无需写代码的爬虫平台,1.无需编写代码(在线定制爬虫规则),2.插件丰富(redis、mongodb、oss、ocr、IP代理池、selenium等插件),3.高度灵活(扩展方便,规则定制灵活)。 


Spider-flow 是一个爬虫平台,以图形化方式定义爬虫流程,无需代码即可实现一个爬虫。

特性

  • 支持css选择器、正则提取

  • 支持JSON/XML格式

  • 支持Xpath/JsonPath提取

  • 支持多数据源、SQL select/insert/update/delete

  • 支持爬取JS动态渲染的页面

  • 支持代理

  • 支持二进制格式

  • 支持保存/读取文件(csv、xls、jpg等)

  • 常用字符串、日期、文件、加解密、随机等函数

  • 支持流程嵌套

  • 支持插件扩展(自定义执行器,自定义函数、自定义Controller、类型扩展等)

  • 支持HTTP接口

插件

  • redis插件

  • mongodb插件

  • IP代理池插件

  • OSS插件

  • OCR插件

  • Selenium插件

爬虫截图.png

爬虫效果.png





展开更多
在线
客服
APP
下载

下载Android客户端

下载iphone 客户端

官方
微信

关注官方微信

返回
顶部