新Agent玩起了“无限流” agent新版本 agent开发反应很慢
创始人
2025-05-24 14:22:37
0



Manus的“上帝之手”称号近日被一个新的AI智能体——Flowith旗下的Neo夺走了。这款智能体背后的团队不仅异常年轻,还在社交媒体上宣称在0营销投入的情况下,实现了130万美元的ARR收入。

在GAIA智能体评测标准的三个等级中,Neo不仅超越了Manus,还创下了新的评分记录。其中Level1和Level3更是突破了“整数级”评分。



目前的智能体市场可谓是“大风起兮云飞扬”,新玩家不断涌入这一赛道。从传统互联网巨头到专注产品研发的初创团队皆有涉足。

各类产品纷纷打着“AI智能体”的旗号,但正如一些网友所说:许多所谓的智能体,不过是在Manus的框架上又叠加了一层LLM而已,万物皆可套壳。

今天,让我们深入分析下这款标榜自己是“下一代AI生成力”的产品,看看它是否是“穿新鞋,走老路”。

01

Flowith Neo:无限步骤、无限上下文、无限工具

在Flowith产品官网中,如果点开输入框右上角的Agent Mode,则自动启用 Agent Neo,在此模式下,Neo可以智能调控各种大模型,完成长序列的复杂任务。



在非智能体模式下,Flowith则提供了诸如常规模式、联网搜索、图片/视频生成等“垂类功能模式”。每一个模式里,都集成了数量非常多的市场主流LLM。



Flowith将它们能够提供的所有存货几乎都摆了出来,并分成T1/T2两个阵营,我稍微数了下,一共近30个模型。

它们集成了市场上几乎所有主流的大模型,涵盖了几乎所有模态,例如Claude 3.7 Sonnet、Grok3、GPT Image1、Gemini 2.5 Pro preview、o3、o4 mini、DALL・E 3、Flux、Recraft和Kling等。



相对于Flowith的上一代智能体Oracle,Neo最大的提升在于它将任务搬到了云端执行,智能体嵌套、上下文、工作步骤都得到了大幅的性能和稳定性提升。



这款新晋智能体产品主要有三个亮点:无限步骤、无限上下文和无限工具。

我们通过一系列测试来逐一展示这些特点。

(1)无限步骤

Neo由于将任务的执行搬到了云端,现在的它几乎可以在任务中一直工作,即便用户关闭了网页,它对于用户本身网络环境的依赖已经不再是必需的了。

一个最明显的样本是:它可以帮你订阅几乎大量平台的关键KOL或者是新闻媒体,并调用推理和相关模型撰写报告,发送到你的邮箱。并且用户可以规定发送的频率,Neo几乎会无限制地在云端跑流程,不断地重复工作步骤。

如果想要Neo完成此类任务,可以直接输入一段非常简单的Prompt:

请你帮我找到10家最主流AI新闻媒体,并将它们最新更新的消息做成简报,每两小时更新一次,发送到我的邮箱。



Neo 会以非常快的速度处理用户的Prompt,它此时的第一步就是在工作流程中与用户交互,确认我的电子邮件地址。



Neo制定了一个非常详细的流程图,明确每个步骤的任务,为自己做出了一个清晰的整体视图。



Neo按步骤执行工作,收集所需知识和信息。信息来源十分广泛,并且会不断地检查信息内容是否与用户需求相一致。



以下就是Neo所找到的10家AI新闻信息源:



Neo会从先前确定的10家AI新闻媒体的官方网站分别获取各自最新的3-5篇AI相关新闻报道的详细内容,并使用browser从每个网站上独立抓取信息。



Neo会多线程同时处理10家媒体的信息抓取任务,并将所有信息整合做出一份简报:



第一份结构化的AI行业最新简报顺利地发到了我的邮箱,内容几乎占用了12页的Word文档。



后续,我的邮箱中陆续收到了几份来自Flowith在云端执行定时任务的稿件。



(2)无限上下文

从实际体验来看,Neo 的上下文非常之长,常常能达到数万甚至数十万字的地步。

这种超长的上下文能力使得Neo能够记住之前的对话内容,保持上下文连贯性,避免了频繁重复之前的叙述或信息,从而提升了交互的效率和质量。

在实际应用中,这意味着我们可以与Neo进行长时间、多轮次的深入对话,而无需担心它会“忘记”之前的讨论内容。

比如,我试着让它做了一个全球文科倒闭潮的可视化报道切片,提示词比较简略:

收集2024年至今中国大陆、新加坡、英国、美国、韩国、日本所有大学裁撤文科的情况,并在一张世界地图上进行可视化呈现。

拿到提示词后,Neo 会先在左侧的 workflow 面板里自行规划出一整套清晰的工作流程,然后按步骤一项项执行任务。

考虑到最终生成的内容可能过多导致混乱,它贴心地设置了一个 Files 面板,将所有生成的文件整理归类,便于随时查阅。



不到十分钟,它就收集好了九个地区的数据,并自动整合成了一篇结构完整的报道。内容不仅详实、分析有理,而且自带思辨性,与用户的意图进行了对齐。



Neo设计的交互界面几乎是一步到位,呈现效果也非常流畅自然。

“无限上下文”的Neo究竟能产生多少个文档?这是一个无法给出确切数字的问题。

在这一项任务中,它就累计了如此多的信息内容:



(3)无限工具

Neo的操作流程兼容多种外部工具,并整合了Flowith自推出以来就广受好评的知识花园功能。知识花园其实就是我们一般所说的“知识库”,但Flowith会在你上传知识内容后,以“Seed”作为最小单元识别其中的知识。

为了增强Neo的检索能力,我会外挂知识花园中与AI相关的知识库,以增强Neo的检索能力,其中包含与人工智能相关的丰富信息。

然后输入Prompt:

帮我找到 20 个非常专业的 AI 科技 X(原 Twitter)博主,做成网页。

然后,我又让AI模型自动丰富这些提示词,规定好了颜色显示等等条件。

Neo开始调用外挂工具,进行大量的相关信息搜索:



在Neo实际的工作步骤中,Flowith将所有工作流搬到了“无限画布”中,很直观地显示出了一个“纺锤形”的思考样态。

在进行HTML网页任务的前期,Neo会先进行知识积攒,这也是为何思维流程中体现出“两边细,中间宽”的形态。



经过三个版本的迭代,Neo成功制作了一个HTML网页项目。

在这个网页中,它将奥特曼、杨立坤、吴恩达等一众X上的AI科学家和博主汇集在一起,为每个人贴上了标签,并实现了交互功能。每个名字下方还附有该博主在X上的链接,用户可以一键直接访问。

可以看得出来,Neo非常适合这类“需要调用多种工具并且高度复杂的任务”,它对于大模型的调控和整体流程的把控都非常的严谨。

比如,Neo与其他AI智能体最大的一个区别就是:它会在工作流程中大量地嵌入审查机制,比如在每一个结果产出之前和之后都会进行自我反思。即便在所有项目结束后,也会给出好几份审查报告、项目总结报告等等。



在每一个节点之中,Flowith都允许使用者进行单一节点的微调工具。



在文档文件中,Flowith则允许用户使用文本编辑器,实时手动更改文件内容甚至是代码。无论是在编写程序代码还是修改文档内容方面,Flowith都提供了一个直观且友好的操作界面。

这样将用户也视作参与者的操作,虽然有放权嫌疑,但也能够让后续的效果更好。



Neo能将整个创作流程以可视化流程图的方式展示出来,我可以对其中任意节点“点选修改”“局部重启”,真正实现模块化调用“无限工具”创作的自由调度。

这可能是 Neo 区别于传统 Agent 的关键能力:不是“从头再来”,而是“就地优化”。

02

Flowith,一家在OpenAI o1发布之前就早已深耕Agent赛道的选手

Flowith最初在全网崭露头角的名称还只是“画布式AI创作平台”,但却一直在探索智能体方向,第一代产品Oracle于2024年8月就已发布,甚至早于OpenAI的推理模型o1的发布。这款产品在各个社区都有一定的热度。当时的Flowith凭借Oracle甚至被誉为“让Chatbot式AI成为历史的下一代工具”

这家初创企业背后的团队也异常年轻,Flowith由倪正民(Derek Nee)团队于2024年正式推出。这位96后CEO在20岁前就曾创立X Academy、项目超过千万人民币ARR的Realm项目,都曾风动一时。据“观察者网”心智观察,Flowith的全体团队都是95后,市场负责人郭梓溢本人则是00后。这家团队在架构体系中几乎将任务导向做到了新高度:每周团队可能会有100个任务,而每个人只需摘取自己最适合的任务。他们在团队构建中抛弃了传统的任务分配机制,转而采用鼓励极致创新的开放式思路。

在这样的团队中孕育出来的Oracle显然也带有创新基因,这款产品最大的特色在于交互范式的创新。它没有沿用传统聊天框+黑箱执行的模式,而是开创性地引入了画布多线程交互理念。Flowith 没有自己训练大模型,而是专注于上层架构和交互创新:通过可视化工作流编排,把LLM的推理能力、搜索工具、插件能力组合起来。

这一理念的背后,其实代表了两种AI使用观念的差异:Manus 等追求的是AI完全自主行动,用户给出指令后AI自主完成一切;而 Flowith 则强调“用户”角色,等同于坦诚了一个事实:现在还不存在通用AI智能体,但是有了用户的参与,Flowith能够表现地更好。

比如,在上面的操作演示中,我们可以清楚地看到Flowith为用户提供了微调和干预流程的能力,确保 AI 输出更精准地满足特定需求。例如,用户可以在 Flowith 画布的特定节点添加自定义数据源,使最终报告的关键信息往往能超越 Manus。

03

与大厂截然不同的思路

百度Q1财报的公众号文章中就把AI智能体放在了很重要的位置,不断地强化自家平台已经接入“几千+MCP组件”,在未来更是会将通用AI智能体的任务类型扩展数十万的水平。然而,Flowith 却走了条不同的路:研发了个“模拟人类大脑思维流程”的AI智能体工作流。

这或许仅是一种噱头,实际上更多地取决于使用者的个人偏好,这也反映了当前智能体市场所呈现的世界参差感:热爱者视之为真爱,可能是通向AGI的必由之路,而不喜欢者则觉得这玩意就是个噱头。

不过,不得不说的是Flowith仍然使用行业主流的LLM,在智能能力上没有显著突破。它的优势在于速度更快、操作更流畅以及更强的反思能力。尽管如此,Flowith还是成功地将智能体产品投入市场,因此建立了独特的竞争优势。

Flowith 所塑造的竞争壁垒主要在于用户社区和创新速度。前一代Oracle自发布以来,到今年Neo推出之前,一直在小众社区中保持了一定的热度,但也受到不少批评,比如多线程工作容易卡死、非云端导致用户过于依赖网络环境。

不过,Neo的上线很大程度上解决了这些问题。

Flowith的另一个潜在壁垒是团队一直想要构造的“社区”。各网络平台上其实一直都有这么一句笑言:少玩产品,多搞社区。像是Flowith很早就搞了个“知识花园”功能模块,每个人跑完自己的工作流程还可以继续分享Recipe到社区里。这就会形成独特的知识共享网络,这会吸引新用户的加入。

总的来说,Manus、Lovart、字节的扣子空间、百度的心响,以及一些将AI智能体应用于自家搜索产品的公司,构成了整个智能体赛道。

但目前来看,与行业热度一起到来的还有些许乱象。

从Manus 在 GAIA 上的综合成功率显著超过了 OpenAI 的 DeepResearch 等系统,刷新了该基准的SOTA性能记录开始,几乎所有大厂全部下场搞智能体。然而,没过多久,这些产品的宣传重点从智能体的能力转向了产品本身的能力,接着又开始宣传MCP工具的接入。

整个行业好像已经从AI能力优先,转化为生态优先。先将产品做出来,抢夺完用户,再煮酒论英雄。像Flowith这样的智能体在整体工作流程中几乎将自己的“肠子”都挖出来,向各位看官证明一下自己吃了几碗粉,仿佛成了一股清流。

前OpenAI 副总裁 Lilian Weng 曾在博文中将智能体的标配总结为:Agent = LLM + Memory + Planning + Tool Use。

而在预训练大模型幻觉率仍居高不下的当今,我们将会看到这样一个局面:再靠纯LLM能力突围已经不再现实,从基础模型上挖掘不到更多的宝藏。各家厂商都在产品侧,以产品经理的思维寻找突破口。

相关内容

热门资讯

鲁政委:PMI预测模型的优化更... 鲁政委张励涵 郭于玮(鲁政委系兴业银行首席经济学家、中国首席经济学家论坛理事)PMI制造业采购经理指...
小米,造出了“法拉利”,马斯克... 银行,背后有高人指点来源 | TechWire小米首款SUV YU7终于正式发布!定位为中大型SU...
周浩:港股策略:红利成 “观望... 周浩 黄凯鸿(周浩 系国泰君安国际首席经济学家、中国首席经济学家论坛成员)中美5月12日发布联合声明...
靠魔性广告走红,背对赌条约,溜... 文 | 张佳儒港股市场正迎来新一轮IPO热潮。Wind数据显示,截至5月21日,近一年港股IPO募资...
柴油皮卡怎么选?长城、江铃、郑... 柴油皮卡才是主流在我国,皮卡由于被划归到了商用车范畴,所以使用场景大受限制,整体市场规模并不大。但是...
曾一天卖出8818杯的村咖,现... 作者 |餐饮老板内参内参君第一批跟风开村咖的人,后悔了?前段时间,村咖又上了热搜。但这次,热搜上的词...
机器人爆火背后的隐形赢家:安徽... 今年,科技界最火的话题恐怕就要数“人形机器人”了。1月,在央视春晚舞台上扭秧歌。4月,在北京亦庄跑半...
玄戒O1×2000亿:雷军给中... 近期科技圈最火热的话题,非小米玄戒O1莫属,没有之一!从权威官媒到各路大V,对小米取得的硬核成果皆不...
大麦娱乐接棒、万达入局潮玩,电... 犀牛娱乐原创文|小福 编辑|朴芳5月21日,阿里大文娱集团召开焕新发布会,宣布更名为虎鲸文娱集团,旗...
朱华荣同框姚安娜,阿维塔缘何加... 文丨詹詹 编辑丨杜海来源丨正经社(ID:zhengjingshe)(本文约为900字)不久前的5月2...
厉害了!西博会乐山现场签下14... 5月23日下午,第二十届中国西部国际博览会配套活动——乐山市投资推介会暨项目签约仪式在成都举行,现场...
董小姐与孟羽童“大和解”,没有... 01 从“伯乐与千里马”,到“师徒反目”董明珠与孟羽童,来了一场“大和解”。2025年5月20日,孟...
A股下周怎么走? A股下周怎么... 5月23日,A股延续弱势震荡态势,午后跌幅扩大,尤其在下午两点后加速下跌。指数、板块、个股多数飘绿,...
连收三张罚单!这家券商被警示 ... 5月23日,浙江证监局连开三张罚单,剑指投资者招揽存违规行为,华西证券一营业部及相关负责人被监管警示...
新Agent玩起了“无限流” ... Manus的“上帝之手”称号近日被一个新的AI智能体——Flowith旗下的Neo夺走了。这款智能体...
李嘉诚旗下一近50亿元在建楼盘... 红星资本局5月24日消息,香港廉政公署官网5月21日通报称,廉政公署近日展开代号“战鼓”的执法行动,...
守住最低3%!房贷利率还有下行... LPR(贷款市场报价利率)下调,房贷利率降了吗?近日,《国际金融报》记者注意到,本轮5年期以上LPR...
百菲乳业二度冲刺沪市主板,上市... 近日,新三板挂牌乳企广西百菲乳业股份有限公司(简称“百菲乳业”)宣布计划申请上海证券交易所主板(简称...
中国量化私募百强榜出炉!3家百... 近几年来,A股的轮动速度明显加快,交易难度增大。量化私募通过分散投资和动态调整持仓的优势,快速捕捉市...
深铁四次“输血”近120亿,万... 5月21日,万科公布了42亿元借款的新进展。根据公告,万科已与深铁集团签署借款合同,并收到深铁集团提...