前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

  人工智能(AI)还没有准备好取代你的基金经理 ,一系列公开测试说明了其中缘由 。

前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人-第1张图片

  在全球领先AI模型参与的一系列新的交易竞赛中 ,迄今为止AI的表现并不算好 。大多数系统蒙受了亏损。它们交易过于频繁,在收到完全相同指令时会作出截然不同的决策。而且目前仍无人知道,这些缺陷会否随着模型迭代升级而消失 ,还是揭示了大语言模型与市场实际运作方式之间存在的根本性鸿沟 。

  以科技初创公司Nof1运营的Alpha Arena为例。该平台让八个主要前沿AI系统同台较量,开展四场比赛,其中包括Anthropic的Claude 、谷歌的Gemini 、OpenAI的ChatGPT以及埃隆·马斯克的Grok。每个系统在每场比赛开始前都获得1万美元资金 ,随后在两周内自主交易美国科技股 。挑战包括依据多种信号交易、采取防御性策略、对竞争对手表现作出反应,以及使用高杠杆操作。

  整体投资组合最终亏掉了约三分之一资金。在全部32组结果中,模型仅有6次实现盈利 。Grok 4.20在一项可获知竞争对手表现的挑战中取得最佳成绩。它只进行了158笔交易;在相同提示下 ,阿里巴巴的千问则交易了1418次。

  Alpha Arena只是越来越多相关实验中的一个 。这些实验都在测试,大语言模型能否胜任金融业最困难的工作:战胜市场。尽管这些竞赛远谈不上具有学术严谨性,但它们迄今最公开地展示了 ,当这些系统尝试承担华尔街一些利润最丰厚 、风险最高的工作时,会发生什么。

  这些初步结果之所以重要,是因为交易正是金融业对于完全交给AI仍保持谨慎的少数工作之一 。过去几年 ,从摩根大通到Balyasny Asset Management等行业巨头 ,几乎已将这项技术用于其他各个环节 。如今,大语言模型已在量化机构中用于解析新闻,在对冲基金中起草备忘录 ,在大型银行中识别欺诈等。但在真金白银的交易上,“人类参与”仍是行业信条,似乎也是情有可原。

  Nof1创始人Jay Azhang表示:“大语言模型本身其实无法真正赚钱 。你基本上需要一整套非常复杂的约束框架、支撑系统和数据平台 ,才有可能给它们一个发挥的机会。 ”

  他说,大语言模型擅长做研究,也擅长为某些任务寻找并调用合适工具。但它们目前仍不知道 ,影响股价波动的诸多变量 —— 包括分析师评级、内部交易和市场情绪变化等 —— 各自究竟有多重要 。它们往往把握不好交易时机,错误设定仓位规模,而且买卖过于频繁。

  AI博客Flat Circle追踪了11个与市场相关的竞技平台 ,所有平台都至少有一个模型实现盈利。但在这11个平台中,只有两个平台的模型中位数实现盈利,这表明大多数模型都难以战胜市场 。

  这一结果与人类的表现如出一辙 ,因为众所周知 ,多数主动管理型基金同样跑输大盘。而且就像人类一样,这些模型也容易出现明显偏颇。多场竞赛显示,AI系统在收到相同指令时会作出非常不同的决定 ,这对部署它们的机构具有重大影响 。Azhang举例说,在Alpha Arena最近一轮比赛中,Claude大多倾向做多 ,Gemini并不排斥做空,而千问则更愿意借助高杠杆承担风险。

  运营Intelligent Alpha的Doug Clinton表示:“它们有自己的‘个性’,你必须像管理人类分析师那样去管理它们。 ”他说 ,如果让模型意识到自己表现出某种偏见,结果可以得到改善 。Intelligent Alpha有一个由大语言模型驱动的基金,就AI预测企业盈利的表现发布其自身的基准 。

  Intelligent Alpha的基准为10个AI模型提供财务申报文件 、分析师预测、业绩电话会纪要、宏观经济数据以及最多10次网络搜索权限。由于聚焦范围更窄 ,大语言模型在这项测试中的表现更为积极。2025年第四季度,OpenAI的ChatGPT对盈利预期变动方向的判断准确率达到68%,创下迄今最佳成绩 。Clinton表示 ,这些模型通常会随着每次新版本发布而持续改进。

标签:

相关推荐

  • 疫情十清(疫情十严)

    疫情十清(疫情十严)

    本文目录一览:〖壹〗、疫情过后街道冷清的说说〖贰〗、郑州全市解封,当地的病例全部清零了吗?〖叁〗、2020抗疫前十人物〖肆〗、防护疫情的10条措施有哪些?〖伍〗、健康养生系列--疫情自我管理口诀疫情过后街道冷清的说说〖壹〗、上海的街道褪去了熙熙攘攘,突如其来的疫情让许多人猝不及防,在心理上接受了当前状况之后,空荡的城市就成了现...

    2026/05/07
  • 疫情手工/疫情手工做品

    疫情手工/疫情手工做品

    本文目录一览:〖壹〗、疫情期间,陪孩子做这个手工,好玩又有趣〖贰〗、用口罩做的手工作品〖叁〗、用彩纸可以做什么东西不用双面胶,不用胶盖的〖肆〗、疫情期间不能出门,在家中找点事做,滴胶与压花的神级组合〖伍〗、关于疫情的手工作品简单又漂亮疫情期间,陪孩子做这个手工,好玩又有趣制作龙头:取出绿色的卡纸,用卡纸将纸筒包裹起来,用固体胶...

    2026/05/07
  • 天津疫情提职/天津疫情工资补贴政策

    天津疫情提职/天津疫情工资补贴政策

    本文目录一览:〖壹〗、天津市卫生计生综合监督所所长刘洪亮一行莅临微天津调研交流〖贰〗、天津市疫情最新消息〖叁〗、天津疫情防控指挥部4号通告天津市卫生计生综合监督所所长刘洪亮一行莅临微天津调研交流〖壹〗、月2日下午,天津市卫生计生综合监督所所长刘洪亮一行5人莅临微天津新媒体运营中心调研交流,双方就新媒体传播与卫生健康监督法规宣传等议题展开座...

    2026/05/07
  • 博白周边疫情/博白疫情最新消息分布

    博白周边疫情/博白疫情最新消息分布

    本文目录一览:〖壹〗、广西博白疫情封了吗〖贰〗、9月16日广西玉林新冠疫情13例分别什么地方〖叁〗、广东猪价迎来全面上涨!广西生猪禁运导致猪源缺口进一步扩大〖肆〗、博白疫情封城了没有广西博白疫情封了吗没有疫情,没有封城。通过查询广西壮族自治区玉林市疫情防控局显示:截止到2022年11月1日,广西壮族自治区玉林市全域属于常态化管理,所...

    2026/05/07
  • 江门的疫情(江门疫情问责)

    江门的疫情(江门疫情问责)

    本文目录一览:〖壹〗、江门市有疫情吗?〖贰〗、江门进屋灭蚊原因〖叁〗、广东无新增病例,又一市清零〖肆〗、江门9月5日23点前有几位感染者呢〖伍〗、江门基孔肯雅热疫情常态化防控是什么意思江门市有疫情吗?〖壹〗、江门市有疫情。截止到11月1日,江门市蓬江区新报告发现4例本土确诊病例,因疫情防控需要,请在相关时段到过以下重点场所的人...

    2026/05/07
  • 一季度GDP30强城市名单出炉!谁在领跑?后劲何在?

    一季度GDP30强城市名单出炉!谁在领跑?后劲何在?

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  来源:大河财立方  大河财立方记者程帅星  连日来,随着2026年各地一季度经济数据陆续公布,全国30强城市竞速格局初定。  GDP30强城市中,广州超重庆,重回全国第四,除此之外,16强城市保持稳定,郑州仍居第16位。合肥、济南双双进两位,特别是合肥,增速(实际增速,...

    2026/05/07
  • 视频|万斯演讲卡壳,诶!我读到哪儿了,快帮帮我!观众嘘声一片

    视频|万斯演讲卡壳,诶!我读到哪儿了,快帮帮我!观众嘘声一片

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!来源:参考消息...

    2026/05/07
  • 前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

    前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

      人工智能(AI)还没有准备好取代你的基金经理,一系列公开测试说明了其中缘由。  在全球领先AI模型参与的一系列新的交易竞赛中,迄今为止AI的表现并不算好。大多数系统蒙受了亏损。它们交易过于频繁,在收到完全相同指令时会作出截然不同的决策。而且目前仍无人知道,这些缺陷会否随着模...

    2026/05/07
  • 疫情还会反弹/疫情到底会不会反弹

    疫情还会反弹/疫情到底会不会反弹

    本文目录一览:〖壹〗、2025春节新冠疫情还会封控吗〖贰〗、聊聊疫情“反复发作”的现象〖叁〗、2025疫情还会封控吗〖肆〗、国内的疫情会由于境外输入导致二次爆发吗?〖伍〗、春节期间武汉疫情还会不会卷土重来?〖陆〗、只要疫情控制得当,经济就会深跌反弹2025春节新冠疫情还会封控吗〖壹〗、综上所述,2025年春节新冠疫情是否...

    2026/05/07
  • 疫情持续战(疫情防控持续战时状态)

    疫情持续战(疫情防控持续战时状态)

    本文目录一览:〖壹〗、假期非必要不出京,疫情形势严峻之下北京这样的倡导很有必要!〖贰〗、以战时状态面对肺炎疫情〖叁〗、抗“新冠”,为你、我、他的理解与包容点赞(附图)假期非必要不出京,疫情形势严峻之下北京这样的倡导很有必要!〖壹〗、北京在疫情形势严峻下倡导“假期非必要不出京”十分必要,这既是基于世界国内复杂疫情形势的科学决策,也是落实“外...

    2026/05/07
返回顶部