Deep Search Agent

一个无框架的深度搜索AI代理实现，能够通过多轮搜索和反思生成高质量的研究报告。

特性

无框架设计: 从零实现，不依赖LangChain等重型框架
多LLM支持: 支持DeepSeek、OpenAI等主流大语言模型
智能搜索: 集成Tavily搜索引擎，提供高质量网络搜索
反思机制: 多轮反思优化，确保研究深度和完整性
状态管理: 完整的研究过程状态跟踪和恢复
Web界面: Streamlit友好界面，易于使用
Markdown输出: 美观的Markdown格式研究报告

工作原理

Deep Search Agent采用分阶段的研究方法：

graph TD A[用户查询] --> B[生成报告结构] B --> C[遍历每个段落] C --> D[初始搜索] D --> E[生成初始总结] E --> F[反思循环] F --> G[反思搜索] G --> H[更新总结] H --> I{达到反思次数?} I -->|否| F I -->|是| J{所有段落完成?} J -->|否| C J -->|是| K[格式化最终报告] K --> L[输出报告]

核心流程

结构生成: 根据查询生成报告大纲和段落结构
初始研究: 为每个段落生成搜索查询并获取相关信息
初始总结: 基于搜索结果生成段落初稿
反思优化: 多轮反思，发现遗漏并补充搜索
最终整合: 将所有段落整合为完整的Markdown报告

快速开始

1. 环境准备

确保您的系统安装了Python 3.9或更高版本：

python --version

2. 克隆项目

git clone <your-repo-url> cd Demo\ DeepSearch\ Agent

3. 安装依赖

# 激活虚拟环境（推荐） conda activate pytorch_python11 # 或者使用其他虚拟环境 # 安装依赖 pip install -r requirements.txt

4. 配置API密钥

项目根目录下已有config.py配置文件，请直接编辑此文件设置您的API密钥：

# Deep Search Agent 配置文件 # 请在这里填入您的API密钥 # DeepSeek API Key DEEPSEEK_API_KEY = "your_deepseek_api_key_here" # OpenAI API Key (可选) OPENAI_API_KEY = "your_openai_api_key_here" # Tavily搜索API Key TAVILY_API_KEY = "your_tavily_api_key_here" # 配置参数 DEFAULT_LLM_PROVIDER = "deepseek" DEEPSEEK_MODEL = "deepseek-chat" OPENAI_MODEL = "gpt-4o-mini" MAX_REFLECTIONS = 2 SEARCH_RESULTS_PER_QUERY = 3 SEARCH_CONTENT_MAX_LENGTH = 20000 OUTPUT_DIR = "reports" SAVE_INTERMEDIATE_STATES = True

5. 开始使用

现在您可以开始使用Deep Search Agent了！

使用方法

方式一：运行示例脚本

基本使用示例：

python examples/basic_usage.py

这个示例展示了最简单的使用方式，执行一个预设的研究查询并显示结果。

高级使用示例：

python examples/advanced_usage.py

这个示例展示了更复杂的使用场景，包括：

自定义配置参数
执行多个研究任务
状态管理和恢复
不同模型的使用

方式二：Web界面

启动Streamlit Web界面：

streamlit run examples/streamlit_app.py

Web界面无需配置文件，直接在界面中输入API密钥即可使用。

方式三：编程方式

from src import DeepSearchAgent, load_config # 加载配置 config = load_config() # 创建Agent agent = DeepSearchAgent(config) # 执行研究 query = "2025年人工智能发展趋势" final_report = agent.research(query, save_report=True) print(final_report)

方式四：自定义配置（编程方式）

如果需要在代码中动态设置配置，可以使用以下方式：

from src import DeepSearchAgent, Config # 自定义配置 config = Config( default_llm_provider="deepseek", deepseek_model="deepseek-chat", max_reflections=3, # 增加反思次数 max_search_results=5, # 增加搜索结果数 output_dir="my_reports" # 自定义输出目录 ) # 设置API密钥 config.deepseek_api_key = "your_api_key" config.tavily_api_key = "your_tavily_key" agent = DeepSearchAgent(config)

项目结构

Demo DeepSearch Agent/ ├── src/ # 核心代码 │ ├── llms/ # LLM调用模块 │ │ ├── base.py # LLM基类 │ │ ├── deepseek.py # DeepSeek实现 │ │ └── openai_llm.py # OpenAI实现 │ ├── nodes/ # 处理节点 │ │ ├── base_node.py # 节点基类 │ │ ├── report_structure_node.py # 结构生成 │ │ ├── search_node.py # 搜索节点 │ │ ├── summary_node.py # 总结节点 │ │ └── formatting_node.py # 格式化节点 │ ├── prompts/ # 提示词模块 │ │ └── prompts.py # 所有提示词定义 │ ├── state/ # 状态管理 │ │ └── state.py # 状态数据结构 │ ├── tools/ # 工具调用 │ │ └── search.py # 搜索工具 │ ├── utils/ # 工具函数 │ │ ├── config.py # 配置管理 │ │ └── text_processing.py # 文本处理 │ └── agent.py # 主Agent类 ├── examples/ # 使用示例 │ ├── basic_usage.py # 基本使用示例 │ ├── advanced_usage.py # 高级使用示例 │ └── streamlit_app.py # Web界面 ├── reports/ # 输出报告目录 ├── requirements.txt # 依赖列表 ├── config.py # 配置文件 └── README.md # 项目文档

代码结构

graph TB subgraph "用户层" A[用户查询] B[Web界面] C[命令行接口] end subgraph "主控制层" D[DeepSearchAgent] end subgraph "处理节点层" E[ReportStructureNode<br/>报告结构生成] F[FirstSearchNode<br/>初始搜索] G[FirstSummaryNode<br/>初始总结] H[ReflectionNode<br/>反思搜索] I[ReflectionSummaryNode<br/>反思总结] J[ReportFormattingNode<br/>报告格式化] end subgraph "LLM层" K[DeepSeekLLM] L[OpenAILLM] M[BaseLLM抽象类] end subgraph "工具层" N[Tavily搜索] O[文本处理工具] P[配置管理] end subgraph "状态管理层" Q[State状态对象] R[Paragraph段落对象] S[Research研究对象] T[Search搜索记录] end subgraph "数据持久化" U[JSON状态文件] V[Markdown报告] W[日志文件] end A --> D B --> D C --> D D --> E D --> F D --> G D --> H D --> I D --> J E --> K E --> L F --> K F --> L G --> K G --> L H --> K H --> L I --> K I --> L J --> K J --> L K --> M L --> M F --> N H --> N D --> O D --> P D --> Q Q --> R R --> S S --> T Q --> U D --> V D --> W style A fill:#e1f5fe style D fill:#f3e5f5 style E fill:#fff3e0 style F fill:#fff3e0 style G fill:#fff3e0 style H fill:#fff3e0 style I fill:#fff3e0 style J fill:#fff3e0 style K fill:#e8f5e8 style L fill:#e8f5e8 style N fill:#fce4ec style Q fill:#f1f8e9

API 参考

DeepSearchAgent

主要的Agent类，提供完整的深度搜索功能。

class DeepSearchAgent: def __init__(self, config: Optional[Config] = None) def research(self, query: str, save_report: bool = True) -> str def get_progress_summary(self) -> Dict[str, Any] def load_state(self, filepath: str) def save_state(self, filepath: str)

Config

配置管理类，控制Agent的行为参数。

class Config: # API密钥 deepseek_api_key: Optional[str] openai_api_key: Optional[str] tavily_api_key: Optional[str] # 模型配置 default_llm_provider: str = "deepseek" deepseek_model: str = "deepseek-chat" openai_model: str = "gpt-4o-mini" # 搜索配置 max_search_results: int = 3 search_timeout: int = 240 max_content_length: int = 20000 # Agent配置 max_reflections: int = 2 max_paragraphs: int = 5

示例

示例1：基本研究

from src import create_agent # 快速创建Agent agent = create_agent() # 执行研究 report = agent.research("量子计算的发展现状") print(report)

示例2：自定义研究参数

from src import DeepSearchAgent, Config config = Config( max_reflections=4, # 更深度的反思 max_search_results=8, # 更多搜索结果 max_paragraphs=6 # 更长的报告 ) agent = DeepSearchAgent(config) report = agent.research("人工智能的伦理问题")

示例3：状态管理

# 开始研究 agent = DeepSearchAgent() report = agent.research("区块链技术应用") # 保存状态 agent.save_state("blockchain_research.json") # 稍后恢复状态 new_agent = DeepSearchAgent() new_agent.load_state("blockchain_research.json") # 检查进度 progress = new_agent.get_progress_summary() print(f"研究进度: {progress['progress_percentage']}%")

高级功能

多模型支持

# 使用DeepSeek config = Config(default_llm_provider="deepseek") # 使用OpenAI config = Config(default_llm_provider="openai", openai_model="gpt-4o")

自定义输出

config = Config( output_dir="custom_reports", # 自定义输出目录 save_intermediate_states=True # 保存中间状态 )

常见问题

Q: 支持哪些LLM？

A: 目前支持：

DeepSeek: 推荐使用，性价比高
OpenAI: GPT-4o、GPT-4o-mini等
可以通过继承BaseLLM类轻松添加其他模型

Q: 如何获取API密钥？

A:

DeepSeek: 访问 DeepSeek平台注册获取
Tavily: 访问 Tavily 注册获取（每月1000次免费）
OpenAI: 访问 OpenAI平台获取

获取密钥后，直接编辑项目根目录的config.py文件填入即可。

Q: 研究报告质量如何提升？

A: 可以通过以下方式优化：

增加max_reflections参数（更多反思轮次）
增加max_search_results参数（更多搜索结果）
调整max_content_length参数（更长的搜索内容）
使用更强大的LLM模型

Q: 如何自定义提示词？

A: 修改src/prompts/prompts.py文件中的系统提示词，可以根据需要调整Agent的行为。

Q: 支持其他搜索引擎吗？

A: 当前主要支持Tavily，但可以通过修改src/tools/search.py添加其他搜索引擎支持。

贡献

欢迎贡献代码！请遵循以下步骤：

Fork本项目
创建特性分支 (git checkout -b feature/AmazingFeature)
提交更改 (git commit -m 'Add some AmazingFeature')
推送到分支 (git push origin feature/AmazingFeature)
开启Pull Request

许可证

本项目采用MIT许可证 - 查看 LICENSE 文件了解详情。

致谢

感谢 DeepSeek 提供优秀的LLM服务
感谢 Tavily 提供高质量的搜索API

如果这个项目对您有帮助，请给个Star！

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
examples		examples
img		img
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
config.py		config.py
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

Deep Search Agent

特性

工作原理

核心流程

快速开始

1. 环境准备

2. 克隆项目

3. 安装依赖

4. 配置API密钥

5. 开始使用

使用方法

方式一：运行示例脚本

方式二：Web界面

方式三：编程方式

方式四：自定义配置（编程方式）

项目结构

代码结构

API 参考

DeepSearchAgent

Config

示例

示例1：基本研究

示例2：自定义研究参数

示例3：状态管理

高级功能

多模型支持

自定义输出

常见问题

Q: 支持哪些LLM？

Q: 如何获取API密钥？

Q: 研究报告质量如何提升？

Q: 如何自定义提示词？

Q: 支持其他搜索引擎吗？

贡献

许可证

致谢

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages