Socket
Socket
Sign inDemoInstall

crawlercore

Package Overview
Dependencies
166
Maintainers
1
Versions
34
Alerts
File Explorer

Advanced tools

Install Socket

Detect and block malicious and high-risk dependencies

Install

    crawlercore

crawler with nodejs


Version published
Weekly downloads
33
increased by3200%
Maintainers
1
Created
Weekly downloads
 

Readme

Source

crawlercore


crawlercore是一套强大的爬虫库,有以下特点:

  1. 组件式,可配置出各种类型的爬虫。
  2. 使用async/await语法,上层编码更人性化。
  3. 自动的编码处理(uft8、gbk)。
  4. 支持headless chrome
  5. 可配置的持久化模块。
  6. 强大的爬虫管理器,会自动重试,支持分布式管理。
  7. 强大的数据分析模块,除了常用的html选择器外,还有js虚拟机,方便直接爬取js数据。

安装说明

npm i crawlercore --save

即可安装,具体使用方法,见 https://github.com/zhs007/crawler-js 项目。


更新日志

  • 1.0 - 正式发布,基本功能正常。
  • 1.1 - 增加redis缓存集中管理缓存,初步支持分布式,支持各种重启多开。
  • 1.2 - 对headless chrome有进一步支持,提供了一些实际例子,譬如js断点取瞬时内存数据等。
  • 1.3 - 和jarvis-task项目结合,支持更复杂的上层任务调度。
  • 1.5 - 调整架构,去掉cache管理,任务调度统一交给jarvis-task

Keywords

FAQs

Last updated on 07 Feb 2018

Did you know?

Socket for GitHub automatically highlights issues in each pull request and monitors the health of all your open source dependencies. Discover the contents of your packages and block harmful activity before you install or update your dependencies.

Install

Related posts

SocketSocket SOC 2 Logo

Product

  • Package Alerts
  • Integrations
  • Docs
  • Pricing
  • FAQ
  • Roadmap

Stay in touch

Get open source security insights delivered straight into your inbox.


  • Terms
  • Privacy
  • Security

Made with ⚡️ by Socket Inc