3月6日,中国创业公司Monica推出全球首款通用AI Agent产品Manus,在国内科技圈迅速引发轰动。上线首日,邀请码便被疯抢,甚至在闲鱼上炒至5万元高价。尽管如此,许多行业KOL仍提前获得邀请码,并发布了大量体验解读文章。
作为一款通用AI Agent,Manus具备从规划到执行全流程自主完成任务的能力,如撰写报告、制作表格等。它不仅能够生成想法,还能独立思考并采取行动,直接交付完整成果,展现了前所未有的通用性和执行能力。
Manus的成功发布为AI Agent开发提供了宝贵的产品思路和设计灵感。随着AI技术的飞速发展,AI Agent正逐渐从概念走向现实,并展现出巨大的应用潜力,尤其是在Web3领域。
AI Agent是一种根据环境、输入和预定义目标自主决策并执行任务的计算机程序。其核心组成部分包括大语言模型(LLM)作为“大脑”、观察和感知机制、推理思考过程、行动执行以及记忆和检索功能。
AI Agent的设计模式有两条主要发展路线:一条偏重规划能力(如REWOO、Plan Execute、LLM Compiler),另一条偏重反思能力(如Basic Reflection、Reflexion)。其中,ReAct模式是最早且应用最广泛的AI Agent设计模式。
ReAct通过结合语言模型中的推理(Reasoning)和行动(Acting)来解决多样化的语言推理和决策任务。其典型流程包括思考(Thought)、行动(Action)、观察(Observation),简称TAO循环。
思考:深入分析问题,确定解决问题的关键信息和步骤。
行动:根据思考方向,采取相应措施或执行特定任务。
观察:仔细观察行动结果,评估是否接近问题答案。
循环迭代:根据观察结果调整策略,不断优化。
此外,AI Agent可根据智能体数量分为Single Agent和Multi Agent。Single Agent注重LLM与工具的配合,强调多轮用户交互;Multi Agent则通过多个Agent协同合作完成复杂任务。
Model Context Protocol(MCP)是由Anthropic公司于2024年11月25日推出的开源协议,旨在解决LLM与外部数据源之间的连接和交互问题。MCP提供三种扩展能力:Resources(知识扩展)、Tools(执行函数调用外部系统)、Prompts(预编写提示词模板)。
自今年1月以来,AI Agent在Web3领域的热度大幅下降,整体市值缩水超过90%。目前声浪较大的项目主要围绕AI Agent框架展开,包括以Virtuals Protocol为代表的发射平台模式、以ElizaOS为代表的DAO模式以及以Swarms为代表的商业公司模式。
发射平台允许用户创建、部署和变现AI Agent。Virtuals Protocol是最大的发射平台之一,其模块化Agent框架G.A.M.E使开发和上线AI Agent像WordPress建站一样简单。
DAO模式以ElizaOS为代表,最初利用AI模拟知名风投机构a16z的投资决策,后来发展为以Eliza框架为核心的开发者社区。而Swarms则是一个企业级Multi Agent框架,专注于通过智能编排和高效协作解决复杂的业务需求。
尽管发射平台理论上可以实现经济闭环,但当前绝大多数发行的AI Agent缺乏内在价值支撑,难以形成正向飞轮。
MCP的出现为Web3中的AI Agent带来了新的方向:
将MCP Server部署到区块链网络,提升抗审查性;
赋予MCP Server与区块链交互的功能,例如DeFi交易管理,降低技术门槛。
第一个方向对底层区块链的存储系统和异步计算能力要求极高,可选择类似0G这样的模块化AI区块链。第二个方向类似于DeFAI的变种,UnifAI通过统一的MCP Server避免重复造轮子。
此外,LXDAO和ETHPanda创始人@brucexu_eth提出构建基于以太坊的OpenMCP.Network创作者激励网络方案,通过智能合约实现自动化激励分配。
然而,当前零知识证明技术尚无法验证Agent行为真实性,去中心化网络也存在效率问题,这一方案短期内难以成功。
Manus的发布标志着通用AI Agent的重要里程碑,而MCP则为Web3中的AI Agent探索注入了新活力。虽然AI与Web3的融合充满挑战,但这无疑是最具前景的方向之一。我们需保持耐心和信心,持续探索。
本文由ZAN Team(X账号@zan_team)的pignard.eth(X账号@pignard_web3)撰写。
注:本文仅作为技术分享,不构成任何推荐和建议。