选择你喜欢的标签
我们会为你匹配适合你的网址导航

跳过将删除所有初始化信息

华为盘古否认抄袭员工发文自曝证据

动态 2025-07-07 17:19

声明：该文章来自（东南早报）版权由原作者所有，K2OS渲染引擎提供网页加速服务。

2025年6月30日，华为高调宣布开源其盘古大模型核心组件（Pangu Pro MoE），包括70亿参数稠密模型和720亿参数的混合专家模型，宣称这是构建昇腾生态的关键举措。

然而仅隔四天，一项发布于GitHub的研究引发业界关注：用户@HonestAGI 通过“LLM指纹”技术分析指出，盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927（1.0为完全一致），远超业内0.7以下的正常差异范围。

华为诺亚方舟实验室声明截图

华为诺亚方舟实验室7月5日发布最新声明，表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型，并非基于其他厂商模型增量训练而来。

盘古团队表示，“盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践，涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求，在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法，也符合业界倡导的开源协作精神。”

然而，就在7月6日凌晨，一位自称是盘古大模型团队的员工自曝，确实存在套壳、续训、洗水印的现象。

爆料文章截图

该员工表示，由于团队初期算力非常有限，虽做出了很多努力和挣扎，但没有预期效果，内部的质疑声和领导的压力也越来越大。后来小模型实验室多次套壳竞品，领导层被指默许造假行为换取短期成果。

自曝文中称：“经过内部的分析，他们实际上是使用Qwen 1.5 110B续训而来，通过加层，扩增ffn维度，添加盘古pi论文的一些机制得来，凑够了大概135B的参数。”并表示，“听同事说他们为了洗掉千问的水印，采取了不少办法，甚至包括故意训了脏数据。”“他们选择了套壳DeepSeekv3续训。他们通过冻住DeepSeek加载的参数，进行训练。”

最后他表示出于对技术伦理的坚持，决定离职并曝光内幕。

截至目前，华为并未对此自曝内容发表声明。

关注我们

[超站]友情链接：

四季很好，只要有你，文娱排行榜：https://www.yaopaiming.com/
关注数据与安全，洞悉企业级服务市场：https://www.ijiandao.com/

*文章为作者独立观点，不代表 0XUCN 立场

本文由 nanalittlepupy 发表，转载此文章须经作者同意，并请附上出处(0XUCN)及本页链接。

原文链接 https://www.0xu.cn/article/intelnet/dynamic/61435.html

华为盘古阿里阿里巴巴抄袭

图库

百度热搜榜

排名热点搜索指数

bgame.cn

分享文章

微信
微信扫码分享

新浪微博
离开
复制链接
返回顶部