核心概念¶
深入理解 Crawlo 框架的设计理念和核心机制。
📖 核心概念¶
🏗️ 架构设计¶
- 模块化设计
- 核心组件交互
- 数据流转
🧩 核心组件¶
- Engine(引擎)
- Scheduler(调度器)
- Downloader(下载器)
- Spider(爬虫)
- Pipeline(数据管道)
- Middleware(中间件)
🔄 请求生命周期 🆕¶
- 请求创建
- 中间件处理
- 下载执行
- 响应解析
- 数据输出
🕷️ 爬虫生命周期 🆕¶
- 爬虫初始化
- 打开爬虫
- 爬取执行
- 关闭爬虫
🔗 中间件链 🆕¶
- 中间件类型
- 执行顺序
- 优先级设置
❌ 错误处理机制 🆕¶
- 异常分类
- 重试机制
- 降级策略
💾 检查点系统¶
- 检查点原理
- 断点续爬
- 状态恢复
🎯 学习建议¶
这些概念是理解 Crawlo 框架的基础,建议:
🔗 相关资源¶
想深入了解 Crawlo? → 架构设计