大参考

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 576|回复: 0

戍天九思:杀手级应用:中国智能体Manus性能超OpenAI

[复制链接]
发表于 2025-3-8 11:07:10 | 显示全部楼层 |阅读模式
  继DeepSeek-R1硬刚OpenAI-01之后,3月6日就在OpenAI发布月租2万美元博士级智能体的同一天,中国蝴蝶科技(Monica)公司发布了Manus通用智能体,又一次硬刚OpenAI,又一个震惊全球的中国AI产品,甚至有人称其为又一个“国运级科技成果”。

  笔者高兴之余,更关注这五个专业问题:Manus和OpenAI月租2万美元的智能体,到底哪个性能更好?Manus靠调用其它大模型工作,其业务可持续吗?Manus能不能通过快速迭代变成独立的通用智能体?有了Manus通用智能体是否意味着短期内可实现AGI?

  Manus和OpenAI月租2万美元智能体哪个性能更好?

  Manus是首款通用AI智能体,推出这个爆款AI产品的公司名叫蝴蝶科技(Monica),是这两年业内非常出名的AI公司,创始人兼CEO肖弘。它和其他AI公司不同的是,它们的核心业务并不是大模型,而是AI应用。其实,它解决了一个非常实际的需求——让很多国内用户能够通过它的产品,使用DeepSeek和ChatGPT、Claude等开源的国内外大模型。而Monica有自己的品牌和定位,它通过技术整合,大大降低了普通人使用AI的门槛。

  ①Manus基准测试领先。Manus在GAIA基准测试(评估AI助手在现实任务中的综合能力)中,所有三个难度级别(入门、中等、最高)的得分均超越OpenAI同层次大模型,尤其在最高难度级别上通过率高出10%。

  ②Manus任务执行能力强。Manus不仅能提供建议,还能直接交付成果(如生成报告、分析股票数据、筛选简历等),并通过虚拟机界面展示操作过程,提升用户体验的沉浸感。

  ③安全设计比较合理。采用多重签名系统,由多个独立模型协同驱动,兼顾能力与安全性。

  笔者认为,Manus真正厉害的地方在于虽然它不拥有最好的大模型,但是它能够调动和利用最好的开源大模型来为自己服务。形象地说,Manus就象法力无边的千手观音。OpenAI有持续迭代的大模型品牌优势,主要为学术研究、软件开发、金融分析等高端用户提供定制化解决方案。

  总之,Manus更适合大多数用户。凭借更高的性能表现、更广泛的任务适配性及潜在的开源生态,Manus在通用场景中更具竞争力。

  OpenAI服务面向高挡用户。其高价策略瞄准特定行业的高端需求,适合技术预算充足的大型企业。

  Manus靠调用其它大模型工作,其业务模式可持续吗?

  Manus作为一款靠调用其他大模型工作的智能体AI 产品,主要有三大特点:

  一是有灵活性与成本控制的优势。Manus通过集成DeepSeek、GPT、Claude等主流大模型,调用各模型在编码、推理、多模态等领域的专长,避免自研基座模型的巨额投入。这种“多智能体系统”模式(Multiple Agent架构)可动态选择最优模型完成任务,提升任务执行效率。特别是快速迭代能力强,依赖外部模型更新,Manus能快速集成最新技术(如Claude 3.7的SVG绘制能力),保持产品竞争力。

  二是同时存在依赖风险。若大模型厂商调整API政策(如收费模式、调用限制),或技术路线发生重大变化(如闭源或功能整合),可能直接影响Manus的功能稳定性。

  三是技术壁垒有限。部分业内人士认为,Manus的核心创新更多是工程调优(如虚拟机沙盒环境、任务拆解流程),而非底层技术突破,可能被大模型厂商或竞争对手快速模仿。

  总之,Manus的业务模式短期内具备可持续性,因其精准匹配了企业对自动化工具的需求,并通过灵活调用大模型降低了研发成本。团队若能持续迭代技术并拓展生态,与模型厂商达成深度合作,Manus有望在AI Agent赛道中占据一席之地;否则,可能面临被整合或替代的风险。

  Manus能不能快速迭代成独立的通用智能体?

  Manus当前架构具备通过多模型调用加速迭代的硬件基础,但要实现独立通用智能体的质变,需要突破自主进化机制、跨模型知识融合等关键技术瓶颈。当前技术条件下,完全独立的通用智能体仍需3-5年演进周期。DeepSeek建议采取渐进式发展路径:前期聚焦特定领域垂直应用(如医疗诊断/金融分析),在取得领域突破后逐步扩展能力边界。关键突破口在于开发新型模型交互协议和分布式训练框架,这需要算法创新与系统工程能力的深度结合。

  笔者认为,Manus能不能拥有核心竞争力,关键在于能不能在大模型还大量保持开源时快速迭代成为独立的通用智能体。

  有了Manus通用智能体是否意味着短期内可实现AGI?

  虽然AI乐观派认为短期可实现AGI,Elon Musk曾预测AGI可能在2026年左右出现,但行业普遍认为需更长时间。例如,Gartner预测到2028年仅15%的日常工作决策由智能体完成,Meta等机构则认为AGI需数十年基础研究。目前,还存在一些关键障碍。硬件算力(如处理器供应)、能源消耗(训练大模型需数十万GPU和兆瓦级电力)以及伦理安全机制仍是主要瓶颈。

  Manus的发布标志着AI智能体在任务执行层面的重大进步——实现了从“对话交互”向“人机协作”的能力跨越,但其技术框架仍局限于特定场景和预设工具,与AGI所需的自主性、泛化能力和创造性思维仍有本质差距。尽管Manus团队将其定位为“AGI的窗口”,但短期内实现AGI的可能性较低,需依赖底层技术(如大模型推理、持续学习)和硬件基础设施的进一步突破。当前AI行业更可能经历的是智能体应用场景的扩展(如医疗、金融),而非AGI的突然降临。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则




QQ|手机版|小黑屋|大参考 |

GMT+8, 2025-4-3 10:05 , Processed in 0.125034 second(s), 16 queries .

 

Powered by 大参考 X3.4 © 2001-2023 dacankao.com

豫公网安备41010502003328号

  豫ICP备17029791号-1

 
快速回复 返回顶部 返回列表