跳转到主要内容

标签(标签)

资源精选(342) Go开发(108) Go语言(103) Go(99) angular(83) LLM(79) 大语言模型(63) 人工智能(53) 前端开发(50) LangChain(43) golang(43) 机器学习(39) Go工程师(38) Go程序员(38) Go开发者(36) React(34) Go基础(29) Python(24) Vue(23) Web开发(20) Web技术(19) 精选资源(19) 深度学习(19) Java(18) ChatGTP(17) Cookie(16) android(16) 前端框架(13) JavaScript(13) Next.js(12) 安卓(11) 聊天机器人(10) typescript(10) 资料精选(10) NLP(10) 第三方Cookie(9) Redwoodjs(9) ChatGPT(9) LLMOps(9) Go语言中级开发(9) 自然语言处理(9) PostgreSQL(9) 区块链(9) mlops(9) 安全(9) 全栈开发(8) OpenAI(8) Linux(8) AI(8) GraphQL(8) iOS(8) 软件架构(7) RAG(7) Go语言高级开发(7) AWS(7) C++(7) 数据科学(7) 智能体(6) whisper(6) Prisma(6) 隐私保护(6) JSON(6) DevOps(6) 数据可视化(6) wasm(6) 计算机视觉(6) 算法(6) Rust(6) 微服务(6) 隐私沙盒(5) FedCM(5) 语音识别(5) Angular开发(5) 快速应用开发(5) 提示工程(5) Agent(5) LLaMA(5) 低代码开发(5) Go测试(5) gorm(5) REST API(5) kafka(5) 推荐系统(5) WebAssembly(5) GameDev(5) CMS(5) CSS(5) machine-learning(5) 机器人(5) 游戏开发(5) Blockchain(5) Web安全(5) nextjs(5) Kotlin(5) 低代码平台(5) 机器学习资源(5) Go资源(5) Nodejs(5) PHP(5) Swift(5) RAG架构(4) devin(4) Blitz(4) javascript框架(4) Redwood(4) GDPR(4) 生成式人工智能(4) Angular16(4) Alpaca(4) 编程语言(4) SAML(4) JWT(4) JSON处理(4) Go并发(4) 移动开发(4) 移动应用(4) security(4) 隐私(4) spring-boot(4) 物联网(4) 网络安全(4) API(4) Ruby(4) 信息安全(4) flutter(4) 专家智能体(3) Chrome(3) CHIPS(3) 3PC(3) SSE(3) 人工智能软件工程师(3) LLM Agent(3) Remix(3) Ubuntu(3) GPT4All(3) 软件开发(3) 问答系统(3) 开发工具(3) 最佳实践(3) RxJS(3) SSR(3) Node.js(3) Dolly(3) 移动应用开发(3) 低代码(3) IAM(3) Web框架(3) CORS(3) 基准测试(3) Go语言数据库开发(3) Oauth2(3) 并发(3) 主题(3) Theme(3) earth(3) nginx(3) 软件工程(3) azure(3) keycloak(3) 生产力工具(3) gpt3(3) 工作流(3) C(3) jupyter(3) 认证(3) prometheus(3) GAN(3) Spring(3) 逆向工程(3) 应用安全(3) Docker(3) Django(3) R(3) .NET(3) 大数据(3) Hacking(3) 渗透测试(3) C++资源(3) Mac(3) 微信小程序(3) Python资源(3) JHipster(3) 语言模型(2) 可穿戴设备(2) JDK(2) SQL(2) Apache(2) Hashicorp Vault(2) Spring Cloud Vault(2) Go语言Web开发(2) Go测试工程师(2) WebSocket(2) 容器化(2) AES(2) 加密(2) 输入验证(2) ORM(2) Fiber(2) Postgres(2) Gorilla Mux(2) Go数据库开发(2) 模块(2) 泛型(2) 指针(2) HTTP(2) PostgreSQL开发(2) Vault(2) K8s(2) Spring boot(2) R语言(2) 深度学习资源(2) 半监督学习(2) semi-supervised-learning(2) architecture(2) 普罗米修斯(2) 嵌入模型(2) productivity(2) 编码(2) Qt(2) 前端(2) Rust语言(2) NeRF(2) 神经辐射场(2) 元宇宙(2) CPP(2) 数据分析(2) spark(2) 流处理(2) Ionic(2) 人体姿势估计(2) human-pose-estimation(2) 视频处理(2) deep-learning(2) kotlin语言(2) kotlin开发(2) burp(2) Chatbot(2) npm(2) quantum(2) OCR(2) 游戏(2) game(2) 内容管理系统(2) MySQL(2) python-books(2) pentest(2) opengl(2) IDE(2) 漏洞赏金(2) Web(2) 知识图谱(2) PyTorch(2) 数据库(2) reverse-engineering(2) 数据工程(2) swift开发(2) rest(2) robotics(2) ios-animation(2) 知识蒸馏(2) 安卓开发(2) nestjs(2) solidity(2) 爬虫(2) 面试(2) 容器(2) C++精选(2) 人工智能资源(2) Machine Learning(2) 备忘单(2) 编程书籍(2) angular资源(2) 速查表(2) cheatsheets(2) SecOps(2) mlops资源(2) R资源(2) DDD(2) 架构设计模式(2) 量化(2) Hacking资源(2) 强化学习(2) flask(2) 设计(2) 性能(2) Sysadmin(2) 系统管理员(2) Java资源(2) 机器学习精选(2) android资源(2) android-UI(2) Mac资源(2) iOS资源(2) Vue资源(2) flutter资源(2) JavaScript精选(2) JavaScript资源(2) Rust开发(2) deeplearning(2) RAD(2)

category

AutoGPT是一个实验性开源应用程序,展示了GPT-4语言模型的功能。该程序由GPT-4驱动,将LLM“思想”链接在一起,以自主实现您设定的任何目标。作为GPT-4完全自主运行的首批例子之一,AutoGPT突破了人工智能的极限。

https://vimeo.com/879672682

特征

 

  • 用于搜索和信息收集的互联网接入
  • 使用以下任一项进行长期和短期记忆管理:
    • 1.json_file使用本地json缓存文件
    • 2.Pinecone使用您在ENV设置中配置的Pinecone.io帐户
    • 3.Redis将使用您配置的Redis缓存
    • 4.Milvus将使用您配置的Milvus缓存
    • 5.Weaviate将使用您配置的Weaviate缓存
  • 用于文本生成的GPT-4实例(需要OpenAI密钥)
  • 使用GPT-3.5进行文件存储和摘要(需要OpenAI密钥)
  • 与十一个语音实验室集成(TTS,需要API密钥)。按照以下说明进行配置。
  • 使用以下任一项生成图像的功能:
  • 访问热门网站和平台
  • 插件的可扩展性

它的工作原理


当给定要执行的任务时,AutoGPT会为自己设置目标和约束。它查询LLM(默认为OpenAI)以实现其目标。对于LLM无法获得的知识,它可以浏览互联网来收集完成目标所需的数据。
最后,AutoGPT支持插件,使其能够执行许多复杂的任务,如发送电子邮件、在Twitter或Instagram上发帖等。

 

现在,将AutoGPT设置为使用本地托管的LLM与使用AutoGen进行相同操作相比并不容易。幸运的是,这里有一些开源实现,我们可以参考。

要在本地设置带有插件支持的AutoGPT,您可以:

  • 创建一个新环境。


conda create -n autogpt python=3.10 -y
conda activate autogpt

 

  • 在某些情况下,插件可能仍然无法工作或无法加载,在这种情况下,您必须安装此requirements.txt。
  • pip install -r requirements.txt

调查结果和应用


现在,与AutoGen不同,AutoGPT不具备让多个代理协作以产生更好结果的功能。相反,它所要做的是扩展其功能的插件支持,其中最关键的是内置的网络访问,它可以直接从互联网上获取数据。

使用这些插件,它可以通过创建文件和文件夹直接与环境交互,根据当前活动的插件,甚至可以调用某些API,例如,Twitter插件允许它调用Twitter API等。AutoGPT的插件模板是开源的,因此任何人都可以按照此处给出的说明生成AutoGPT插件。

当有任何任务需要完成时,它会将其重新构建为一组目标或子任务。然后,在完成子任务的过程中,它会以以下格式显示结果:

  • 思想——它想要采取的行动来完成子任务。
  • 推理——它想采取这种行动的原因。
  • 计划——完成行动的计划。
  • 批判主义——对该计划的任何回溯。
  • 演讲——对思维过程的总结。
  • 下一步行动——将调用以执行计划的实际函数。

这个细致的过程允许AutoGPT迭代自己的结果并对其进行细化。但它也需要更快地在实践中取得成果。

因此,对于任何定义宽泛或不需要非常精确输入的问题语句,AutoGPT是您的首选。如上面的演示所示,我使用了AutoGPT及其EMail插件创建了一个自主的上下文感知电子邮件响应代理,该代理可以读取我最新的未读电子邮件,并可以根据该电子邮件中的内容做出响应。如果需要,它甚至可以创建和发送附件。

最后,AutoGPT具有极好的支持和与docker的兼容性。要使用docker设置AutoGPT,请执行以下操作。此外,任何必须在本地运行的代码,如果有选择的话,都会尝试在docker容器中运行。

可以实现AutoGPT的一些领域包括:

  • 问题陈述涉及web抓取和数据收集,并且需要快速处理收集的数据的用例。AutoGPT不仅可以通过谷歌或DuckDuckGo搜索原生访问网络,还可以访问维基百科搜索、SerpApi、百度搜索、必应搜索等插件,从而从搜索结果中获得丰富的信息。收集的数据可用于各种目的,包括创建数据集。
  • AutoGPT为所有大量使用的社交媒体应用程序(如Reddit、Twitter、Instagram等)提供了插件。结合使用这些插件,我们可以建立一个社交媒体分析和管理系统,该系统可以定期从这些平台上刮取并分析它,并在所有这些平台上发布生成和策划的内容。
  • AutoGPT具有语音和视觉集成功能,因此可以有效地提供多模式输出。为了使其采用多模式输入,我们可以为其设计插件。
  • 回答问题、浏览网络以收集和汇总信息、在更大范围内生成代码(如创建整个网站)等,AutoGen是更好的选择,因为它可以更好地访问信息。

弱点


AutoGPT不适用于需要一定精度的任务,例如调用需要非常特殊形式输入的API。例如,我想为我的网站创建一个旅行社,因此每次都需要AutoGPT只调用我的API。但在实现时,调用的API是

类似地,需要执行特定逻辑流的任务(如创建后端)不仅需要代码,还需要环境、数据库、测试、CI/CD工作流、部署文件等。因此,尽管AutoGPT将能够为其中的大多数创建文件,但以逻辑方式执行它们将超出其范围。当我尝试使用AutoGPT创建NextJS博客应用程序时,它正确地推断出它需要运行npx create next app命令,但无法实际执行,尽管它有能力执行。

AutoGPT的输出也存在一致性问题,即在不同的运行过程中,同一个代理和提示给出的输出截然不同,在大多数情况下都是错误的。

结论


AutoGPT利用GPT-4语言模型的功能,代表了自主人工智能应用领域的突破性进展。它令人印象深刻的一套功能,特别是通过插件的可扩展性,在数据收集、与web平台的交互以及多模式功能方面提供了无与伦比的多功能性。然而,需要注意的是,尽管AutoGPT在广泛的问题陈述中大放异彩,但其在某些任务中的准确性和一致性仍有待改进。与任何不断发展的技术一样,当前的限制为进一步改进提供了令人兴奋的机会,确保AutoGPT及其后续版本将在人工智能驱动的解决方案的未来发挥关键作用。