安装问题¶
安装 Crawlo 的最低要求是什么?¶
- Python: 3.11+
- 操作系统: Windows/Linux/macOS
- 内存: 最少 512MB
- 磁盘: 最少 100MB
如何安装 Crawlo?¶
基础安装¶
包含核心功能:异步请求、CSS/XPath 选择器、数据管道等。
完整安装(推荐)¶
包含:浏览器渲染、AI 集成等高级功能。
开发安装¶
安装失败怎么办?¶
问题 1: pip 版本过旧¶
错误信息:
解决方案:
问题 2: Python 版本不兼容¶
错误信息:
解决方案: 升级到 Python 3.11+:
问题 3: 权限不足¶
错误信息:
解决方案:
# 方式1: 使用 --user
pip install --user crawlo
# 方式2: 使用虚拟环境(推荐)
python -m venv venv
source venv/bin/activate # Linux/Mac
venv\Scripts\activate # Windows
pip install crawlo
Playwright 安装失败怎么办?¶
问题 1: 下载浏览器内核失败¶
错误信息:
解决方案:
# 使用国内镜像
export PLAYWRIGHT_DOWNLOAD_HOST=https://npmmirror.com/mirrors/playwright/
playwright install
问题 2: Windows 缺少依赖¶
错误信息:
解决方案:
问题 3: Linux 缺少系统库¶
错误信息:
解决方案:
# Ubuntu/Debian
sudo apt-get install -y libnss3 libatk1.0-0 libatk-bridge2.0-0 libcups2 libdrm2
# CentOS/RHEL
sudo yum install -y nss atk at-spi2-libs cups-libs libdrm
如何验证安装是否成功?¶
运行以下命令:
# 检查版本
crawlo --version
# 创建测试项目
crawlo startproject test_project
cd test_project
crawlo genspider test example.com
# 运行测试
crawlo run test
如果能看到爬虫运行日志,说明安装成功!✅
Crawlo 可以和其他爬虫框架共存吗?¶
可以!Crawlo 使用独立的命名空间,不会与 Scrapy 等框架冲突。
如何升级 Crawlo?¶
如何卸载 Crawlo?¶
安装后无法导入模块?¶
错误信息:
可能原因: 1. 安装到了错误的 Python 环境 2. 虚拟环境未激活
解决方案:
# 检查 Python 路径
which python # Linux/Mac
where python # Windows
# 检查 crawlo 安装位置
pip show crawlo
# 重新安装
pip install --force-reinstall crawlo
需要安装可选依赖吗?¶
可选依赖根据需求安装:
| 依赖 | 功能 | 安装命令 |
|---|---|---|
| render | 浏览器渲染 | pip install crawlo[render] |
| mcp | AI 集成 | pip install crawlo[mcp] |
| all | 全部依赖 | pip install crawlo[all] |
💡 说明:Redis、MySQL、MongoDB 等数据库支持已包含在基础安装中,无需额外安装。
在 Docker 中使用 Crawlo?¶
创建 Dockerfile:
FROM python:3.11-slim
RUN pip install crawlo
WORKDIR /app
COPY . /app
CMD ["crawlo", "crawl", "my_spider"]
构建和运行:
还有其他安装问题? 查看 一般问题 或提交 GitHub Issue。