华为盘古否认抄袭阿里后,其大模型员工自曝存在套壳、续训、洗水印
创始人
2025-07-07 13:23:03
0

新闻荐读

2025年6月30日,华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE,包括70亿参数稠密模型和720亿参数的混合专家模型,宣称这是构建昇腾生态的关键举措。

然而仅隔四天,一项发布于GitHub的研究引发业界关注:用户@HonestAGI 通过“LLM指纹”技术分析指出, 盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0为完全一致,远超业内0.7以下的正常差异范围。

华为诺亚方舟实验室声明截图

华为诺亚方舟实验室7月5日发布最新声明,表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。

盘古团队表示,“盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。 我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。”

然而,就在7月6日凌晨, 一位自称是盘古大模型团队的员工自曝,确实存在套壳、续训、洗水印的现象。

爆料文章截图

该员工表示,由于团队初期算力非常有限,虽做出了很多努力和挣扎,但没有预期效果,内部的质疑声和领导的压力也越来越大。后来小模型实验室多次套壳竞品,领导层被指默许造假行为换取短期成果。

自曝文中称:“经过内部的分析,他们实际上是使用Qwen 1.5 110B续训而来,通过加层,扩增ffn维度,添加盘古pi论文的一些机制得来,凑够了大概135B的参数。”并表示,“听同事说他们为了洗掉千问的水印,采取了不少办法,甚至包括故意训了脏数据。”“他们选择了套壳DeepSeekv3续训。他们通过冻住DeepSeek加载的参数,进行训练。”

最后他表示出于对技术伦理的坚持,决定离职并曝光内幕。

截至目前,华为并未对此自曝内容发表声明。

新黄河客户端、新浪科技、诺亚方舟实验室等

编辑:鲍文慧 审定:金官 核发:胡盛龙

相关内容

热门资讯

vivo商业升维实践:以“用户... 作 者:周掌柜 知名科技战略专家、多家全球化公司战略顾问来 源:正和岛(ID:zhenghedao)...
微众银行与银联商务达成战略合作... 近日,微众银行与银联商务支付股份有限公司(以下简称“银联商务”)在深圳正式签署生态战略合作协议。双方...
7月7日沪深两市强势个股与概念... 一、强势个股截至7月7日收盘,上证综指上涨0.02%,收于3473.13点,深证成指下跌0.7%,收...
罗马仕京东、淘宝等官方旗舰店已... 7月7日,记者查阅各大电商平台获悉,罗马仕京东、淘宝等官方旗舰店目前已关闭,其中京东平台仅剩下京东自...
识局安排新能源电池扩建项目反向... 文/识局招商团队(识局微信公共账号zhijuzk)7月7日,周一。识局安排新能源电池扩建项目反向考察...
三年前估值200亿却持续亏损,... 文 | 董武英2020年9月底,宁德时代和小米长江产业基金纷纷投资了同一家半导体企业,这家成立仅一年...
康惠制药:股东赛乐仙拟减持不超... 7月7日,陕西康惠制药股份有限公司(康惠制药,603139.SH)公告,截止本公告披露日,公司股东上...
市值蒸发84%,李宁能靠NBA... 国产运动巨头的差距,还在继续拉大。从2021年的2800亿港元到现在的430亿港元,短短几年李宁的市...
创新药引领医药板块大涨,下半年... 21世纪经济报道记者 唐唯珂 广州报道对于医药投资人,尤其是港股医药投资人来说,今年上半年是比较扬眉...
破解能源转型痛点,虚拟电厂开启... 7月7日,虚拟电厂概念震荡拉升,板块指数大涨3.35%。截至收盘,苏文电能涨20%,南网科技涨14....