跳转到主内容

简介

Official Website Discord Follow

GitHub Repo stars Twitter Follow PyPI version Open In Colab

GPT Researcher 是一个自主代理,旨在对各种任务进行全面的在线研究。

该代理可以生成详细、真实且无偏见的研究报告,并提供自定义选项,以专注于相关资源、大纲和要点。受到近期 Plan-and-SolveRAG 论文的启发,GPT Researcher 解决了速度、确定性和可靠性问题,通过并行化的代理工作,而不是同步操作,提供了更稳定的性能和更高的速度。

为什么选择 GPT Researcher?

  • 对于人工研究任务,要形成客观的结论可能需要很长时间,有时需要数周才能找到合适的资源和信息。
  • 当前的 LLM(大语言模型)是在过去和过时的信息上训练的,存在很高的幻觉风险,这使得它们几乎不适用于研究任务。
  • 当前的 LLM 受限于短令牌输出,这不足以生成详细的长篇研究报告(2000字以上)。
  • 支持网页搜索的解决方案(例如 ChatGPT + 网页插件)只考虑有限的资源和内容,这在某些情况下会导致肤浅的结论或带有偏见的答案。
  • 仅使用部分资源可能会在为研究问题或任务确定正确结论时产生偏见。

架构

其主要思想是运行“规划器”和“执行者”代理,其中规划器生成要研究的问题,而执行者代理根据每个生成的研究问题寻找最相关的信息。最后,规划器筛选并汇总所有相关信息,并创建一份研究报告。

这些代理利用 gpt-4o-mini 和 gpt-4o(128K 上下文)来完成研究任务。我们仅在必要时使用它们来优化成本。平均每个研究任务耗时约 3 分钟,成本约为 0.1 美元。

更具体地说

  • 根据研究查询或任务创建一个特定领域的代理。
  • 生成一组研究问题,这些问题共同对任何给定任务形成客观的意见。
  • 对于每个研究问题,触发一个爬虫代理,从在线资源中抓取与给定任务相关的信息。
  • 对于每个抓取的资源,根据相关信息进行总结,并跟踪其来源。
  • 最后,筛选并汇总所有总结的来源,生成一份最终的研究报告。

演示

教程

功能

  • 📝 生成研究、大纲、资源和要点报告
  • 📜 可生成长篇详细的研究报告(超过2000字)
  • 🌐 每次研究聚合超过20个网络来源,以形成客观和真实​​的结论
  • 🖥️ 包含一个易于使用的网页界面 (HTML/CSS/JS)
  • 🔍 抓取支持JavaScript的网页来源
  • 📂 跟踪并记录已访问和使用的网络来源
  • 📄 将研究报告导出为 PDF、Word 等格式...

让我们从这里开始吧!