12-8 AI Agent剖析

在本文中,我们将详细阐述 Agentic AI 的结构及其运作方式。

12-8 AI Agent剖析

该图说明了代理 AI 的多代理系统架构,其中多个代理在业务和/或物理环境上下文中协作以实现共同目标。关键组件和技术细节如下。

核心组件

在代理型人工智能的架构中,主要构建模块是代理以及它们与之交互的业务或物理环境。每个代理都以 [半] 自主的方式运行,感知其环境、推理其情况、做出决策并采取适当的行动。这些代理与数字和物理环境交互以实现特定目标。该系统的核心是共享内存它是一个允许所有代理之间无缝通信和协调的存储库。此共享内存充当信息、计划和目标交换的枢纽,确保每个代理都可以为集体知识和策略做出贡献并从中受益。

Agent 剖析

每个代理都拥有详细的内部结构,使其能够在系统内独立但协作地运作。代理的记忆是一个关键组成部分,存储其个人知识、过去的经验和信念状态。这种记忆提供了明智决策所需的历史背景和学习。

特工 1 解剖学

多智能体系统的关键组件可以总结为以下几个动词:

  • 目标: 力求实现的目的或期望结果。
  • 感知:从商业环境背景收集信息,也称为感知或知觉。
  • 推理:处理感知到的信息以获得洞察力,使用内部 LM 来解释目标、感知、协作、执行结果之间的关系。
  • 计划:根据合理的见解制定行动方案。
  • 协调:通过共享内存与其他代理交互以协调操作。协商是一个相关动词,但我们将在代理 AI 模式中详细讨论这一点。协作也用于 MAS。
  • 行动:执行对环境所计划的行动。
  • 记忆:存储代理的个人知识和经验。
  • LLM: “推理”部分的核心,负责处理和理解环境和共享记忆中的基于语言的信息。

让我们更详细地研究一下这个问题。

代理的目标定义为其寻求实现的目标或期望结果。这些目标不是静态的;它们会根据环境反馈和代理的内部状态动态更新

通过感知组件,代理从周围环境中收集数据。这些感知信息既可以来自数字源(如数据馈送),也可以来自物理源(如摄像头或物联网设备)。然后,推理组件处理收集的数据在这里,代理使用其存储的知识分析信息,并经常利用LLM进行复杂的基于语言的推理和推断。

一旦了解了情况,代理就会进入计划阶段,在此阶段,它会制定一系列旨在实现其目标的行动。此计划基于合理的理解和情境背景。

为了在多代理系统中有效运行,协调组件起着至关重要的作用。它使代理能够通过共享内存与其他代理共享信息并协调其计划,确保共同努力实现共同目标。

在执行方面,行动组件负责实施计划的行动。代理使用各种工具与其环境进行交互,这些工具的范围从用于物理任务的机械臂到用于数字任务的软件界面。 LLM 通过在整个过程中促进基于语言的推理和决策来继续支持代理。

但是如果没有数据,代理就无法确定下一步该做什么。

数据存储

你可以拥有多个数据存储库,数据源由以下组合组成

  • 非结构化数据:各种格式(文本、图像等)的原始数据。
  • 向量存储:存储(通常是文本)数据的向量表示(嵌入),以实现有效的相似性搜索。
  • 结构化数据:数据库或知识图谱中组织的数据。
  • 知识图谱:知识的结构化表示,连接实体及其关系。这提供了对业务环境的语义理解。

环境上下文

代理在不同的环境中运行。数字业务环境涵盖与业务领域相关的所有数字数据源。这包括文本和图像等非结构化数据、来自数据库的结构化数据、用于嵌入的向量存储以及用于语义理解的知识图谱。

物理环境上下文中,代理通过物理设备与现实世界元素进行交互。这些交互对于需要直接操纵物理世界的任务至关重要,由嵌入在环境中的传感器和执行器来协助。

互动与合作

代理 AI 的运作涉及多种关键交互和协作。代理不断感知其环境,从数字和物理环境中收集数据。这种持续的信息流对于保持对周围环境的最新了解至关重要。

代理使用这些数据进行推理和规划。它们利用 LLM 来处理感知到的信息、进行推理并制定计划。最终结果是一组精心设计的操作,旨在满足代理的目标。

代理之间的协调是通过共享内存实现的。这个中央存储库使代理能够交换他们的理解、计划和意图,从而促进协作决策和协调行动。当代理行动时,他们会根据需要通过操纵物理设备或与数字系统交互来执行他们的计划。

该系统包含一个反馈回路,其中观察行动的结果并将其反馈到系统中。这种反馈用于更新知识和完善未来计划,确保代理能够从他们的经验中学习并不断提高他们的表现。

关键点

Agentic AI 的架构有几个重要特点。模块化确保系统可以在不破坏整体架构的情况下添加或删除代理,从而实现灵活性和可扩展性。这种设计支持处理具有多个代理和不同数据源的复杂环境,使系统具有高度可扩展性

适应性是另一个重要特征。代理能够从经验中学习并相应地调整其行为。这种持续改进随着时间的推移提高了系统的效率和响应能力。

该系统支持多模式交互,使代理能够无缝地与数字和物理环境互动。这扩大了代理可以执行的任务范围。最后,通过共享内存促进协作,从而提高代理共同努力实现共同目标时解决问题和决策的能力。

Agentic AI 系统的工作原理

  1. 感知:代理通过各自的“感知”组件从商业环境背景中收集信息。
  2. 推理:代理使用其“推理”组件处理感知到的信息,通常依靠 LLM 来理解和解释基于语言的数据。
  3. 计划:基于合理的见解,代理在其“计划”组件中制定行动计划。
  4. 协调:代理在“协调”阶段通过共享内存分享他们的计划和相关信息,确保协作决策。
  5. 行动:代理通过其“行动”组件对环境执行计划的行动。
  6. 学习和适应:代理根据其行为的结果更新其个人记忆和潜在的共享记忆,从而实现随着时间的推移而学习和适应。

技术考虑

  • 可扩展性:系统应该能够处理越来越多的代理和数据源。
  • 沟通效率:有效的沟通机制对于代理之间的协调至关重要。
  • 数据处理:有效处理多种数据类型(非结构化、结构化、向量)至关重要。
  • 知识表示:知识图谱在表示和推理商业环境方面发挥着关键作用。
  • LLM 整合:有效地整合 LLM 对于语言理解和推理至关重要。

结论

讨论了代理式人工智能的构造。其交互涉及通信代理的协作,每个代理都配备了用于感知、推理、规划和行动的内部机制。在多代理系统 (MAS) 中,这些代理通过共享内存进行协作,利用各种数据源和知识表示与数字和物理环境进行有效交互。

关键要点包括:

  • 模块化和可扩展性: Agentic AI 系统旨在具有适应性,并可以扩展以使用多个代理来处理复杂的任务。
  • 适应性:代理具有从经验中学习并随着时间的推移改进其行为的能力。
  • 多模式交互:与数字和物理环境交互的能力扩展了代理 AI 的潜在应用。
  • 协作:共享记忆机制促进代理之间的协作,从而更有效地解决问题和决策。

随着该领域研究的不断进步,我们可以预期代理人工智能将在金融、零售、医疗保健、教育等各个行业和应用领域中发挥越来越重要的作用,带来重大的业务转型。集成语言模型的能力增强了代理的推理能力,使其能够理解和响应复杂的指令和情况。

代理型人工智能的发展标志着我们朝着创建能够自主运行、有效协作并从与世界的互动中学习的智能系统迈出了重要一步。这有望彻底改变从业务自动化到机器人技术等众多领域。

在可扩展性、道德考量以及对强大错误处理的需求方面,仍然存在挑战,但代理 AI 在推动积极的业务转型方面具有巨大的潜在优势。随着持续的研究和开发,我们可以预见,未来代理 AI 系统将变得更加复杂,并融入我们的日常生活,从而提高各个领域的效率、生产力和决策能力。

RA/SD 衍生者AI训练营。发布者:chris,转载请注明出处:https://www.shxcj.com/archives/3129

(0)
上一篇 2024-06-14 10:41 下午
下一篇 2024-06-15 11:22 上午

相关推荐

发表回复

登录后才能评论
本文授权以下站点有原版访问授权 https://www.shxcj.com https://www.2img.ai https://www.2video.cn