这几天,各大AI社群被一场“投资直播”刷屏。网友们实时追踪六大AI模型的交易表现,讨论的热情程度甚至超过研究自己炒股,这是一场用真金白银进行的AI投资对决。
10月17日晚在 Alpha Arena 的实验平台上,来自中美的顶级AI模型被同时放进加密市场,每个模型获得 1万美元实盘资金,自由买卖BTC、ETH、SOL、DOGE、BNB、XRP等主流币。没有人类干预,没有额外提示,谁能让账户价值最高,谁就是真正的“会炒币的AI”。
这场比赛最有趣的地方在于,它把AI从枯燥的榜单,扔进了最真实、最不可预测的金融市场。
过去,市场用MMLU、ImageNet这些静态的排行榜来衡量AI的能力。但市场不一样,它是一个由无数信息、情绪构成的生命体,在这里,没有标准答案,只有不断变化的概率。模型不仅仅要去分析数据,还要去分析市场的情绪,跟一个真正的交易员一样。

目前过去了6天,已经历了一些波动。前三天,排名第一的DeepSeek Chat v3.1收益率还一度接近40%,盈利超过4000美元,但10月21日随着大盘下跌,也回吐了部分收益,DeepSeek Chat v3.1收益率稳定在10%左右,不过仍然是前两名。
收益最低的却是用户量最多最知名的GPT-5,亏损高达68.9%(截10月23日12点),目前还在一路下行,不怀疑GPT-5可能是最先出局的模型。
马斯克的Grok-4属于高频激进派,几乎满仓操作,涨了加仓,跌了也不割肉,所以一开始能实现超40%的盈利,但随着市场变化,也迅速跳水。
Claude则是理性保守派,仓位轻、杠杆低、止损严格,可惜过于谨慎错失行情,总收益负17.46%。

比较有意思的是,Qwen3 Max凭借着比Grok-4更激进策略,成功实现反超DeepSeek Chat v.31——20倍杠杆、几乎全仓操作,现金余额一度仅剩96.8美元!实现总收益13.41%,领先DeepSeekv3.1已经一天多了。(截止10月24日Qwen3 Max大幅领先DeepSeek Chat v.31二十个点以上)
此次炒币大战最让人困惑的是DeepSeek难道真的有量化基因,在炒股炒币方面遥遥领先?还有最知名的GPT-5和Gemini 2.5 Pro,为何表现一直非常拉
先说说DeepSeek量化基因的问题,客观来说DeepSeek是由幻方量化团队训练而来的,在金融和数学方面有一定积累是正常的,但真的到了遥遥领先的地步也不至于。就在这次大赛开始前的小规模测试,GPT和Grok是实现了盈利,反倒是DeepSeek有一定程度亏损。

那么你相信哪个最强呢?笔者觉得至少目前还是难以判断。
Alpha Arena平台提供了前所未有的市场公开窗口,但作为基准测试,它仍然缺乏大样本、长时间、跨市场的数据积累,缺乏透明、可复现的输入与运行设置。而这意味着其仍然有很大随机性和不可靠性。
为什么这次GPT-5和Gemini2.5 Pro表现这么拉胯?因为它们是“通用模型”。它们被训练的目的是聊天、写代码、写文章、做总结。它们学习的是整个互联网的知识,但也包括网上无数相互矛盾的分析、情绪化的演讲。GPT和Gemini那种“散户式”高频交易,很可能就是学了太多互联网上的“噪音”导致的。

我们要观察并不是各大模型的收益结果,而是在真实市场中的博弈,要看他们买了什么,卖了什么,持仓多久,怎么止盈止损,这才是这场“真人秀”真正的意义。
01、选对模型很重要
想象一下:你不再需要苦读财报,不用耗费巨资订阅 Bloomberg 终端。只需在聊天机器人里输入一句:“我该买哪只股票?”——一场由人工智能驱动的金融革命,正以我们难以置信的速度席卷全球投资界。根据路透社消息,至少有十分之一的散户投资者已经开始依赖 ChatGPT 或 Gemini 这样的聊天机器人来筛选投资标的。
券商eToro 指出,我们必须承认,当前美股正处于历史高位,全球市场也相对乐观。但 ChatGPT 选股的成功并非“零门槛”——它要求使用者具备一定的金融知识,否则“试错”的成本会非常高昂。
公众希望的是大模型能够成为高成功率预测市场的“水晶球”,但真的有这种“预测未来水晶球”吗?应该选哪种模型?目前并没有市场公允推荐。

金融大模型的发展可以追溯到2023年,那一年也是大模型的“开元之年”。当时最具标志性的金融大模型是彭博社发布的BloombergGPT。500亿参数的数据集包含了 Bloomberg 自家的新闻文章、市场数据和研究报告,也曾红极一时但很快寂寥无声。
因为,BloombergGPT成本高昂、系统封闭,普通个人开发者和小型机构完全无法触及。其模型内部的运作机制是一个黑箱,使用者只能接受其输出结果,而无法对其进行定制或深入研究。在金融预测性方面的提升感也不是很大,所以就其收益而言,可能还不如专业的投资顾问。
2025年8月,清华大学研究团队在Gtihub上发布了一个叫做Kronos的开源项目,其目标是利用时间序列大模型来预测金融市场的K线走势。从项目介绍来看,这是一个典型的、试图利用大模型在金融市场中直接寻找盈利机会的尝试。
理论上是非常专业全面的金融大模型表现应该还可以,但据多数使用者反馈,对其输出的结果表示不满,要么是观点判断太过平均市场化,要么是臆造观察其预测结果难以让人信服。
为什么会这样?是AI不够强还是交易频次赶不上量化,都不是!而是大模型往往从市面挖掘有效因子,对于矛盾之处缺乏深入推理,其策略是趋同的。
金融市场向来有“买在分歧,卖在一致”的说法,如果只是单纯的利用网络公开信息做策略,那很难跑得过资金体量更大,信息收集调研更强的量化机构。
当然,目前声量更大的还是各大券商推出的AI选股,并已经开始收费,从月费几百到3888元不等。中国银河证券推出了智能投顾服务——财富星AI投顾,其包含AI选股、AI数据和AI ETF三大功能。

东方财富的“妙想”大模型分为体验版、进阶版、专业版。体验版可以每天体验3次深度研究;进阶版每个季度518元,每天可以体验50次深度研究;专业版每季度818元,每天可以体验100次深度研究。
从结果来看用AI炒股的人却收获寥寥。一方面要调教AI学习交易规则,另一方面又要核验AI策略防止算法幻觉带来的风险,结果上反而不如传统购买ETF的基民。
但利用AI模型来协助炒股依然是大趋势,我们已经迈入全面AI时代,不用AI的人跟使用的人在效率上的差距是天壤之别。AI对于上市公司财报总结和行情基本分析,是快速的,概括性很强的,把这类文本和图表的繁琐任务丢给AI再好不过了。
至于选择哪家模型,目前来看并没有太本质的区别,在选择的过程中不应以名气来判断,而是根据自身目标来看哪家完成度准确性高。反复使用和调换模型在当下应该是基本动作。
02、明确你的炒股目标
有网友在AI的“指导”下,反而经历一场财富大缩水,“账户金额每天都在稳定地减少”。原本期望的三个月翻倍,变成了一个月跌幅超过50%。
这位网友不仅过于相信AI,而且还不懂AI,在出现明确持续下跌信号还不选择止损,反而慌乱操作的情况下,更多就是他的问题了。
所以有着明确的炒股目标和纪律非常重要,就像在AI炒币比赛中独树一帜的DeepSeek,完全按照预设交易计划,行情波动也不做盘中调整,哪怕浮盈接近2000美元,它也坚持“计划未变,仓位不动”。DeepSeek非常看重风控结构和盈亏比,而散户中很少有人有这个概念。
根据笔者的实操经验来看,有时候为了达成一个定义的共识,可能要反复跟AI解释和强调。就比如对于价值投资的理解,AI一开始只强调高ROE和现金流,对于有着护城河的企业理解甚至会出现“南辕北辙”的情况,不知道是不是太多企业用拥有“护城河”形容自己。
当输入笔者对于护城河的理解之后,完成了新的条件约束,又忘了上文要求回答美股市场规则。
简单来说,当前AI输出的质量高度取决于数据质量和提示词设计,例如提供的数据是什么角度、构建的问题是哪个方向,它倾向于哪方面的概率就越大。
目前多数AI更擅长的是技术面分析,比如趋势、支撑与阻力、成交量、关键价位等因素,至于基本面分析更多时候是重复新闻和研报,还是需要用户自己来分析其行业地位和前景,以及未来的盈利能力。
03、比AI更懂投资
是的,你没有看错,想用好AI就需要比AI更懂投资,这就好比能用刀切菜的人很多,但能用刀来雕花的人就比较少了。
不管是用DeepSeek还是GPT来炒股,“只负责抄作业坐等挣钱”的情况都是不存在的,相反亏掉本金的可能性很大。
除了明确自己的目标和投资纪律之外,还要注意AI数据的可靠性,如果只会搜索数据很可能得到的都是错误数据,要有被投资行业的常识,比如猪周期客观存在但因为疫病风险和逆势投入,也会导致猪周期时间远超以往。还有机器人行业,是值得投资的企业和产业链不假,但是宣传展示肌肉还是有马上可以量产,结果是完全不同的。
此外,AI难以判断“黑天鹅”风险,对于“灰犀牛”事件的认知也比较滞后,不同的事件风险也需要随时调整投资策略。
知名投资人段永平并不看好用AI来投资。他将AI定义为“高级的看图看线” 。无论算法多复杂,数据量多大,AI只是在优化“猜人心”(其他交易者在想什么)的游戏,而不是在实践“估价值”(公司值多少钱)的投资。
AI的局限性在于“精确的错误”,AI极度擅长在既定规则下进行精确计算,但投资面对的是一个充满不确定性的未来。
AI可以回溯过去所有的数据,找到完美的相关关系,但无法真正“理解”为什么可口可乐的品牌价值如此持久,也无法“感受”苹果公司企业文化的力量。当出现模型从未见过的“未知的未知”时(如全新的商业模式、颠覆性的技术),AI可能会犯下灾难性的错误。
或许有人对于“价值投资”这一套理论并不感兴趣,但不迷信AI,保持个人清醒的判断主见还是非常有必要的。
值得注意的是,目前正规一点的AI模型,都会标注:该服务所提供的指标均基于历史数据,过往表现不代表未来趋势,不构成投资建议,接受该服务的投资者,请注意投资风险。
这并不是甩锅,而是揭示了当前AI的困境,以为是“万能水晶球”,实际上只是一个精于计算,功能有限,不保证对错的工具。