落地有声|“大模型应用尚在早期,兼具技术积累和商业眼光才能走向头部” 落地有声|“大模型应用尚在早期,兼具技术积累和商业眼光才能走向头部”
创始人
2024-09-11 14:41:50
0

·大模型的商业应用还处于浪潮最早期,很难说哪家企业会率先占据某个赛道的主导权,一方面要看企业技术积累、快速迭代和应变能力,另一方面也要看企业的商业整合能力和商业布局眼光。

·目前大模型测评集并不能满足金融业务的真实需要。金融测评集主要以客观选择题结合主观问答的方式评估大模型的准确率、稳定性,但这并不能有效指导模型进一步优化。金融界数据缺乏共享,金融交易规则和金融工具内部逻辑复杂,高质量数据的可获得性是影响大模型效果的瓶颈之一。


中国大模型产业从卷性能、卷排名、卷价格,到如今越来越关注落地应用。尽管在技术和产品上存在同质化,但产业界已经开始向差异化探索迈进。

上海财经大学信息管理与工程学院院长黄海量日前在接受澎湃科技采访时表示,“大模型的商业应用还处于浪潮早期,很难说哪家企业会率先占据某个赛道的主导权。”迈向头部,考验的既是企业本身的技术积累、快速迭代和应变能力,又是企业的整合能力和商业布局眼光。

以金融行业为例,大模型落地金融,可解释性、安全性、公正性、严谨性仍是痛点,他表示,“大模型+金融”既要考虑实际业务需求和内在逻辑,更要关注应对金融风险、促进金融公平,这是我国金融发展更重要的关切,而不仅仅着眼于如何提升金融领域的工作效率和投资效率。

同质化是必经阶段,但无法产生竞争力

谈及当前学术界对大模型的研究热点,黄海量表示,大模型的基础理论和算法架构是当前学术研究的前沿课题。大模型为何能够通过神经网络,结合上下文生成合理的语言,甚至存在类人的思维,这些底层的科学原理仍未完全摸清,学术界需要进一步探索创新。同时,持续的算法创新和数据工程技术探索将是推动大模型持续进步的关键。经典Transformer模型在处理长文本时会出现理解能力有限、效率较低、算力消耗过大等问题,学术界探索基于改进位置编码和注意力机制的新型模型结构,大幅提升模型对长文本的理解能力。特定领域高质量训练数据标注成本高,先进的数据合成、数据筛选技术将通过大规模、高质量、多样化的训练数据进一步提升大模型在金融等特定领域任务中的能力。

当前大模型的另一个研究热点是如何让大模型与RAG(检索增强生成)等其他工具相互配合、有效协同,发挥更大威力。大模型在生成回答时,通过RAG检索外部知识库,动态获取最新的相关信息,以弥补大模型内部知识的不足。然而,如何提升检索质量、高效地将检索到的信息与大模型的生成能力结合,仍然是一个复杂的技术问题。特别是在需要快速检索和生成高质量内容时,如何平衡计算开销与响应速度,是大模型与IT系统协同的关键挑战。

从产业界来看,中国大模型产业历经打榜、降价,逐步步入应用,走向搜索、音乐、金融、社交等各行各业。尽管当前大模型技术和产品存在同质化,但黄海量认为,从科技发展历程来看,同质化是必经阶段,无论是大模型的原创性技术,还是垂直落地的应用技术,当前都还处于科技浪潮的早期,在这个阶段,业界对大模型的认知是有限的、趋同的,这约束了大模型应用开发的发散性。

“同质化无法产生竞争力。”黄海量也看到,产业界正在探索差异化道路,比如在模型架构上尝试非Transformer架构,在数据采集和训练方式上采用独特的方案等,“避免在同质化的路上越卷越深。” 他提到,在“大模型+证券投资研究”研究领域,A机构采用大量研究报告等公开数据和少量自有数据,B机构基于几十年来沉淀的私有数据和部分公有数据,数据来源和训练方式不同,最终模型的特点和应用场景也不同。

当前,大模型杀手级应用尚未出现,国内外大模型企业都在探索过程中。“大模型的商业应用还处于浪潮最早期,很难说哪家企业会率先占据某个赛道的主导权,一方面要看这些企业本身的技术积累、后续的快速迭代和应变能力,另一方面也要看这些企业的商业整合能力和商业布局眼光。”黄海量表示,所谓商业整合能力,即技术出身的企业能否真正与特定行业形成产业链的整合,而不仅仅是作为乙方为甲方提供解决方案。“以金融为例,你必须不仅仅是一个科技企业,而是一个既懂金融又懂科技的企业,能够理解金融背后的业务逻辑、合规风险等,同时又有很强的科技研发能力。”

大模型+金融,痛点待解决

大模型在金融领域的落地,风险是核心问题,黄海量表示,“大模型落地金融既要考虑实际业务需求和内在逻辑,更要关注应对金融风险、促进金融公平,这是我国金融发展更重要的关切,而不仅仅着眼于如何用大模型提升金融领域的业务能力和效率。”

当前,可解释性、安全性、公正性、严谨性仍是金融大模型的痛点,黄海量表示,目前产业界并没有形成公认的解决方案。“各家都在按照各自的理解尝试解决。大模型本身是一个黑箱模型,构建可信大模型的途径之一是采用子任务分解和检索增强的方式。一个整体任务分解成若干个相对独立的子任务给不同的大模型智能体,在完成各个子任务的同时,从知识库中检索到相关的支撑依据并以参考文献的形式表述出来。这样通过观察子任务的输入输出结果,观察大模型在各个环节做了什么工作,来降低大模型的黑箱化程度。另一种方式是通过思维链等方法,让大模型既给出答案,同时也给出一步一步的推理过程。”

与此同时,模型性能和稳定性还有待提高。黄海量表示,同一个模型针对某一类问题过拟合的现象仍然严重,大模型通过二次训练、精调、提示工程等,在回答某类问题时表现良好,但往往在回答其他问题时存在较大短板。

除了模型本身的问题,将金融专业知识转化成数据以训练模型时,数据的丰富程度也困扰着行业,影响模型落地。黄海量表示,金融领域并不缺乏专业知识,但金融界数据由于缺乏共享,以及金融交易规则和金融工具的内部逻辑复杂性,高质量数据的可获得性成为影响大模型效果的瓶颈之一。

评测是大模型不断进化的指挥棒和指南针。为了评价大模型的能力,学术界和产业界都在开发大模型的测评集。学术界推出的测评体系主要考察模型知识和某种特定能力,产业界则更贴近实际业务需求。但黄海量表示,以金融领域为例,目前大模型测评集并不能够满足金融业务的真实需要。当前的金融测评集主要以客观选择题结合主观问答的方式评估大模型的准确率、稳定性,但这些测评集并不能有效指导模型的进一步优化。

“金融领域的很多问题不是通过选择是或否来解决的,所以不能通过选择题来测试模型性能,而是必须要看模型本身的在场景中的业务能力,比如投资研究的逻辑性、产品设计的创新性等,需要模型像人类专家一样‘从0到1’解决一个开放问题,但测评集往往无法测评这些方面的能力。”黄海量表示,缺乏和金融行业需求贴合的测评集,与缺乏高质量数据一样,都是阻碍模型性能进一步提升的因素。目前学术界和产业界正在联合开发更贴近应用场景真实需求的测评集。

相关内容

热门资讯

泼天的流量之下,亚瑟士“危机”... 亚瑟士的成功与挑战。当Crocs洞洞鞋、Birkenstock勃肯鞋、New Balance“灰色老...
当世界充满迷雾,如何握紧资产的... 原创 刘博团队你是否也感受到了?世界正充满迷雾,变得越来越“模糊”。特朗普频频“变脸”,贸易环境阴晴...
本周外盘看点丨美联储最新会议纪... 上周国际市场风云变幻,外界密切关注美国财政状况,美欧贸易形势再掀波澜。市场方面,美股全线下挫,道指周...
国产瘦身科技打破天价,日均成本... 从罕见病药物到健康产品,欧美企业长期把控着生物科技领域新成果的定价权。动辄数千元的高昂价格,将普通民...
董明珠孟羽童同框直播,带货销售... 5月23日,董明珠与孟羽童同框直播,这是孟羽童离开格力电器后两人首次同框破冰。在直播间内,董明珠在谈...
600793,4连板!0027... 本周(5月19日—5月23日)A股市场小幅回调,上证指数全周下跌0.57%,收于3348.37点;深...
从“宁王”到吉利,内地巨头纷纷... 本报(chinatimes.net.cn)记者陶炜 南京报道到港股上市,似乎突然变成了国内龙头企业眼...
特朗普为何突然对欧盟发难?“嫌... 【文/观察者网 熊超然】当地时间5月23日,美国总统特朗普突然在社交媒体上“放狠话”,并建议自6月1...
再这么下去,苹果要吃不起了 苹... 出品|虎嗅ESG组作者|陈玉立头图|视觉中国本文是#ESG进步观察#系列第134篇文章本次观察关键词...
万亿AI终端产业,深圳靠什么赢... 作者 | 王战新深圳这片沃土,永远不缺话题热度。5月第四周,深圳同时举办了三场国际盛会,分别是第二...
东莞便利店之王,狂飚540亿 ... 记者丨李惠琳 编辑丨陈晓平便利店之王,扩张凶猛。5月22日,美宜佳董事长张国衡现身福州,参加2025...
歌尔股份,被1000亿困住! ... 在竞争激烈的行业生存,绝非易事。尤其是在消费电子这个不断“新王换旧王”的战场,就连苹果也得紧跟时代更...
中科锦智亮相警博会,以AI赋能... 本文来源:时代周报 作者:唐洛2025年5月14日—5月17日,第十二届中国国际警用装备博览会(以下...
散布股市不实信息,一批账号网站... 5月24日,国家网信办披露,近期,国家网信办会同金融管理部门依法处置一批账号、网站。具体来看,这些账...
52TOYS递表港交所,近3年... 红星资本局5月24日消息,近日,52TOYS(北京乐自天成文化发展股份有限公司)向港交所递交招股说明...
零跑离“飞跃”只差一步 零跑超... 来源 | 伯虎财经(bohuFN)作者 | 楷楷当新势力掌门人还在以“金句”抢占头条时,零跑汽车创始...
看股市、债市、黄金后市:专家揭... 今年以来,黄金、港股等资产表现优异。Wind数据显示,截至5月23日收盘,年内恒生指数、恒生科技指数...
IPO保荐存多项违规!深交所对...   中新经纬5月24日电 23日,深交所网站发布《关于对中航证券有限公司的监管函》(下称《监管函》)...
鲁政委:PMI预测模型的优化更... 鲁政委张励涵 郭于玮(鲁政委系兴业银行首席经济学家、中国首席经济学家论坛理事)PMI制造业采购经理指...
小米,造出了“法拉利”,马斯克... 银行,背后有高人指点来源 | TechWire小米首款SUV YU7终于正式发布!定位为中大型SU...