发布日期:2025-08-19 06:15 点击量: 信息来源:利博
做者提出了一种黑盒大模子指纹识别手艺,即便无法拜候模子权沉。
近日,一项发布于 GitHub 取 arXiv 的研究激发业界热议:华为推出的盘古大模子(Pangu Pro MoE)被发觉取阿里巴巴达摩院发布的通义千问 Qwen-2。5 14B 模子正在参数布局上“惊人分歧”。
“盘古 Pangu Pro MoE 取 Qwen-2。5 14B 模子正在留意力模块中呈现 极高类似性 ,”?。
该成果意味着,Pangu 很可能正在 Qwen 的根本长进行锻炼或点窜,而非“从零自从研发”。
鉴于 QKV 误差是 Qwen 1代至2。5代的一个显著设想特征,而大大都开源模子(包罗 Qwen3)放弃了这种方式。
该研究利用最新的“LLM 指纹”手艺,指出两者之间正在留意力权沉输出空间的类似性高达0。927?。