继续上一章,石超利用克洛德·科沃克完成了所有的日常任务。这家伙看上去擅长数据分析、文档整理、路线规划等,但实际上还是在小细节上犯了错误。再加上开源模式受到攻击,Anthropic无法承受攻击,Cowork的入门价格立即降低了80美元。世超刚刚从这波大销售中分得一杯羹,今天他就带大家看看这些免费开源的“类似协同办公”的代理是如何工作的。此次,世超一共测试了列表中的三个开源项目:OpenWork、Eigent、AionUi。其中,只有OpenWork是在Cowork之后发布的。 Eigent 和 AionUi 的原始版本已于去年 8 月上线。这股浪潮与Cowork的崛起有关。从真正的可用性来看,OpenWork比后两者完善得多,可用性也更接近Cowork。好消息是,如果你只是看看你能不能做这个工作,如果你能用Cowork做,你基本上可以用开源来做。坏消息是,这些免费开源代理都有其自身的缺点。它速度慢、笨重、质量差,很难与 Cowork 和 Manus 等成熟的商业产品相比。好吧,让我们开始吧。为了比较 Cowork,我们还设置了三个难度逐渐增加的任务来检查四种不同的技能。第一个是安排桌面屏幕录制并测试您的文件和文档管理。二是规划珠海、港澳春节旅游线路,并进行研究分析和论证。第三个是整理B站2025年的数据和负面评论者的测试数据的收集和分析。开头是顶,世超给大家展示了OpenWork。。有一件事我只能说,这个还不错。它带有免费的基本模型,并且是最有效的。文件排序10秒轻松搞定第二,速度非常快。然而,它不如Cowork,因为它不允许根据视频内容更改文件名。查看我们的行程规划中的葡萄酒推荐。仅仅两分多钟的时间,文件就直接放到了他的办公桌上。我还能说什么? Cowork 得分达到 7 分或更高。生成的文档有点简单,但它包含了您需要的一切。如果你在价格上搞错了,正常的价格会被当作春节价格,就像工作共享一样,但既然是免费的,市桥会原谅你的。但对于难度更大的数据采集和分析,OpenWork 仍然落得个头破血流。这些数据令人困惑、混乱、缺失和错误,更不用说进行分析了。结果将在 5 分钟内得出,之后您将无法思考您听到的任何其他内容。 以我的一般经验来看,OpenWork最大的优点是速度快,但就像是在和低级别的worker一起玩。这只能从头开始解决问题,质量不能指望很好。如果您只是想为老板写一份好的报告,这就是您所需要的。而且下一个igent将很难扩展,并完整解释什么是免费的,什么是更昂贵的。 Eigent 附带了多种免费可互换的型号,Shichao 立即选择了 Gemini 3 Pro Preview。高端机型都是免费的,还有什么比这更好的呢?事实上,市场上可用的模型速度非常慢。即使 20 分钟后,Eigent 甚至无法在我的桌面上创建文件夹。现在,让我们更改 API 并再次测试。好吧,让我们计划一下我们的旅行策略吧。任务开始后不到两分钟,Eigent 就上网搜索并很快删除了我的 5 美元 API 余额。最终什么也没做。 。 。以此计算,他们的使用费比Cowork每月100美元还要高,有些过高。代理是数字化的。它被称为塔尔实习生。如果一家公司有这样一个实习生,财务部会第一个报警,第二天法务部就会提起诉讼。客观来说,Igent的想法非常好。您尝试将四个不同的代理集成到一个系统中,每个代理都编写代码、搜索信息、创建文档、查看照片和视频以及执行独特的任务。您还可以清楚地看到每个代理在做什么。这看起来很有道理。但实际上,四名特工中的每一位都扮演着独特的角色。不仅代币消耗会迅速增加,而且协调不好会降低效率,你就要为繁忙的表现付出代价,最后的任务也不会成功。我只能说,这个节目结束了。相比之下,下面的AIonUi看起来就很不错了。这不是骗局,这只是一个纯粹愚蠢的NPC。 AIonUi 可以回答问题,但无法准确回答问题,并且不了解有关处理文件或文档的任何信息。 AIonUi 有很多小错误。例如,每个操作配给需要重复的指导。显示任务运行了5分钟,但是世超后端API没有信号。这表明AI只专注于钓鱼,不做任何工作。从生成的内容来看,旅游指南大同小异,但数量仍然不正确。数据分析工作更是可耻。总共只找到了四个视频,并且这四个视频都没有添加到Bilibili的Bilibili帐户中。 。 。总结一下结果,OpenWork勉强超过了三个级别,但质量一般。 Eigent和AIonUi基本上失败了。经过一番操作,开源项目实在是抵挡不住Claude Cowork的降价。这表现丝毫不逊色,也没有丝毫威胁。所以世超推荐大家有兴趣的话可以尝试一下OpenWork。而在开始之后,Hichao 意识到人们对这些开源项目存在很多误解。首先,开酸ce项目与常规软件不同,您可以放心下载、安装和使用。例如,安装OpenWork后,出现CLI未找到错误,可以使用终端命令行解决,但对于非技术用户来说很困难。另外,对于不带模型或者很难使用的软件,基本上都会使用自己制作的模型API。不过,如何进入这个API配置,这对于一般用户来说是一个门槛。这也导致了第二个错误。开源并不意味着免费。 OpenWork 自己的模型很好,但如果您没有底层模型,请查看 Eigent 的示例。这种 API 代币众售模式比订阅模式贵得多。 最终,世超发现了一件很矛盾的事情。也就是说,代理不是模型功能的放大器,而是限制器。世超提供给代理的API是最好的Claude-Opus-4.5。如果你问克劳德直接为您的出行策略和数据分析,肯定会更快更稳定。为什么一组特工有如此大的智慧?这是因为大多数开源代理的设计本质上削弱了模型。他们将原本可以被认为是一次性完成的任务分成无数间隔的小步骤。在每个步骤中,都需要将上下文传递回模型、同步进度并强调目标。这与人工智能每走一步都会失去记忆一样,将原本在模型内完成的连续思考变成低带宽文本传递。例如,当轮到你的人工智能预订酒店时,你至少需要告诉它你之前评论过的必看景点,并且你还需要有预订航班的预算。这些代币和时间被人工智能使用,对你的内部对话毫无帮助。当由于缺乏沟通而产生错觉时,在繁忙的环境中很容易犯错误。相比之下,Claude Cowork 等代理的产品可以让人工智能从头到尾不断地完成同样的事情。借助人工智能,您始终知道自己正在执行一项完整的任务,并且可以自己决定首先要考虑什么以及下一步要做什么。过程看起来更简单,思路也更一致,也不那么容易忘记事情或迷失方向。然而,由于代理本质上是为了提供更完整的结果,因此与较大的模型相比,它们往往会执行更多的步骤,例如验证、结果分类和文档记录。反过来,结果会更完整、更漂亮,但如果你赶时间,直接问模特其实更容易。毕竟,特工不仅仅是能点石成金的贝壳。至少在现阶段,大多数代理,无论开源还是闭源,距离真正融入生产环境和生活还有很长的路要走。当然,您可以将流程打包得更完整ly,但往往以效率和稳定性为代价。对于普通用户来说,aagent 是一个看似聪明但实际上可能并不聪明的助手。所以不要太认真地对待它,只是玩它。作者:陌陌天天 发布者:江江面 发布者:轩轩影业,数据来源:陌陌测Github、小红书
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
请注意:以上内容(包括照片和图片,如有视频)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。