🌐 本地网页分析工具,完全本地运行,无需外部 API。
- ✅ 网页内容提取(Markdown 格式)
- ✅ 高清截图(1920x1080)
- ✅ JS 渲染支持(v1.1.0 新增)
- ✅ 完全本地运行
- ✅ 无需 API key
- ✅ 数据不外泄
- ✅ 中文编码自动检测
查看 SKILL.md 获取详细安装和使用说明。
# 激活虚拟环境 source ~/.openclaw/funasr-env/bin/activate # 内容提取(静态模式,适合大部分网站) python3 local_web_analyzer.py https://example.com content # 内容提取(JS 渲染模式,适合动态网站) python3 local_web_analyzer.py https://example.com content --js # 截图 python3 local_web_analyzer.py https://example.com screenshot # 两者结合 python3 local_web_analyzer.py https://example.com both适用场景:
- React/Vue/Angular SPA 应用
- 动态加载内容的网站
- JavaScript 生成的内容
使用方法:
# 添加 --js 参数启用 JS 渲染 python3 local_web_analyzer.py <URL> content --js注意事项:
- 速度较慢(5-10秒,需要启动 Chrome)
- 资源占用较高
- 某些网站可能超时(建议先用静态模式)
# 启动 API python3 web_analyzer_api.py # 调用 API curl -X POST http://localhost:8766/analyze \ -H "Content-Type: application/json" \ -d '{"url": "https://example.com", "mode": "both"}'- SKILL.md - 完整文档(安装、使用、维护)
- CHANGELOG.md - 版本更新日志
- web_analyzer_api.py - API 服务
- local_web_analyzer.py - 核心脚本
- web_screenshot.sh - 截图脚本
| 功能 | 本地服务 | tavily-search |
|---|---|---|
| 内容提取 | ✅ | ✅ |
| 截图 | ✅ | ❌ |
| API Key | ❌ | ✅ |
| 数据隐私 | ✅ 本地 | ❌ 外发 |
| 速度 | ✅ 快 | ⏳ 依赖网络 |
| 成本 | ✅ 免费 | 💰 免费额度 |
| JS 渲染 | ✅ 支持 | ❌ 不支持 |
| 中文编码 | ✅ 自动检测 | ✅ 支持 |
- ✨ 新增 JS 渲染支持(
--js参数) - 🐛 修复编码问题,完美支持中文网站
- 📝 更新文档,添加 JS 渲染说明
- 🎉 首次发布
MIT License
Created by 炭烤🐲🦐 (OpenClaw Assistant)
基于 BeautifulSoup + html2text + Chrome Headless 实现