在当今竞争激烈的人工智能领域,DeepSeek的亮眼表现引发了行业内的热议。近日,著名风险投资公司Andreessen Horowitz的普通合伙人、Mistral董事会成员Anjney Midha,接受了TechCrunch的采访,他对此次DeepSeek的创新成果表示高度赞赏。六个月前,Midha首次接触到DeepSeek的产品,并被其出色的性能所震撼。他指出,DeepSeek最近推出的CoderV2在特定的编码任务中,已经能够与OpenAI的领先产品GPT-4 Turbo相抗衡。这个巨大的进步为DeepSeek奠定了基础,使其能够每隔几个月就发布改进后的模型,至最新的R1型号问世。
R1作为一款开源推理模型,以超低成本提供行业内标准的高性能,致使科技行业面临颠覆性的变化。尽管Nvidia的股票在市场上遭遇抛售,但Midha依旧看好R1的推出将推动企业更加高效地利用现有的计算资源。他强调,Mistral筹集的10亿美元资金并不意味着AI基础模型的开发会停止,反而是企业在提升效率和技术改进方面极为重要的投入。“虽然在资金筹集中,Mistral无法与OpenAI和Anthropic等巨头相提并论,”Midha解释道,“但开源模式为我们赢得了竞争优势。”
开源的特性使得Mistral能够借助使用其项目的用户贡献免费技术支持,反观那些采用闭源模式的竞争对手,则不得不承担研发和计算能力的全部成本,因此Midha辩称,Mistral在计算资源方面的优势显而易见。同时,对于Facebook推出的Llama等开源AI模型的竞争态势,Midha也持有开放态度。Facebook首席执行官马克·扎克伯格已表示,其将计划在AI领域投入数千亿资金,其中包括2025年的600亿资本支出,主要用于数据中心的基础建设。
Midha并不仅仅参与Mistral的发展,他也是AI生成图像的公司BlackForest Labs及3D模型制造商Luma的董事会成员,这使他更加明确AI对GPU的需求将是持续增长的。他还担任a16z的Oxygen项目负责人,该项目旨在针对GPU短缺问题展开应对。由于像Nvidia的H100这样的GPU已成为稀缺资源,a16z开始直接采购GPU,为旗下投资公司使用。
Midha幽默地表示,Oxygen项目目前已经出现超额预订,无法满足所有GPU需求。他补充道,初创公司不仅需要GPU来训练AI模型,同时也需更多GPU来为客户提供他们正在开发的AI产品。他如是说:“关于推理和消费的需求几乎是没有止境的。”尽管DeepSeek的工程突破显著提升了AI模型的运行效率,但Midha认为这并不会对OpenAI与软银、甲骨文联手宣布的5000亿美元AI数据中心建设合作计划造成影响。
在当前国际背景下,Midha指出,多个国家开始意识到,人工智能应被视为下一代基础设施的重要组成部分,其地位可与电力和互联网相提并论。他呼吁各国在构建AI基础设施时,应考虑“基础设施独立性”的问题,以及应该依赖于怎样的法律和道德框架。他显然对西方模式持更为倾向的态度,鼓励国家遵循与其价值观相一致的方向,正如他在巴黎的Mistral所践行的方式。尽管如此,并非所有公司对中国的开源模式表示担忧。有些企业选择在自身的数据中心搭建本地运行的开源模型,DeepSeek已作为安全云服务由美国公司提供,比如Microsoft Azure Foundry,所以开发者并非完全依赖于DeepSeek的云服务。
值得一提的是,英特尔前首席执行官帕特·基辛格也表示,他的初创公司Gloo正在基于DeepSeek R1定制化开发AI聊天服务,且并未选择Llama或OpenAI作为竞争对手。在采访最后,Midha幽默又诚挚地表示,如果有公司因为DeepSeek而希望放弃自己的数据中心计划,他愿意接收任何多余的GPU。“如果你有多余的GPU,请将它们发送给我。”这样的幽默表达,不仅展现了他对人工智能未来的信心,也透出对行业动向的敏锐洞察。在AI快速发展的时代,DeepSeek的种种突破无疑将继续引发众多人的关注与探讨。