爆了！日本"自主研发"的7000亿大模型，被扒出是DeepSeek V3换了个皮？

解语樱木 发表于 2026-3-18 14:16:13

爆了！日本"自主研发"的7000亿大模型，被扒出是DeepSeek V3换了个皮？

好家伙，这回真的是看乐子了。3月17日，日本楽天（Rakuten）集团高调发布了一个叫 Rakuten AI 3.0 的模型。宣传文案写得那叫一个漂亮——“日本国内最大规模的高性能AI模型”，参数量约7000亿，专门为日语优化，还拿了日本经济产业省和NEDO的GENIAC项目补助。结果呢？发布不到12小时，网友直接把它的底裤扒了个精光。01 一个config.json引发的血案这事儿的发现过程，简单到没有任何技术含量。Rakuten AI 3.0发布后，模型权重照例会传到Hugging Face（全球最大的模型托管平台）的楽天官方仓库。任何一个懂点AI的人，点进去，打开那个叫 config.json 的配置文件，都能直接傻眼。architectures（模型架构）那一栏，赫然写着一行英文：DeepseekV3ForCausalLM。model_type那一栏，更干脆：deepseek_v3。懂行的朋友看到这儿已经笑了——这不是“参考”DeepSeek，不是“借鉴”DeepSeek，这是直接把DeepSeek V3的“身份证”亮出来了。往下翻，参数配置更是对得严丝合缝：hidden_size是7168，intermediate_size是18432，num_hidden_layers是61，n_routed_experts是256，vocab_size是129280。这些数字，和DeepSeek V3的原版配置一模一样。难怪楽天敢号称“参数量约7000亿”——因为DeepSeek V3本来就是6810亿参数。改名归改名，参数又不能凭空变多。更搞笑的是，Hugging Face的模型页面上，标签栏甚至直接挂着“deepseek_v3”的标签。这不是网友手动后加的，是模型上传时系统根据config自动生成的。演都不演了属于是。02 楽天：我说的是“基于开源社区优秀成果”，有错吗？楽天自己的说法是什么？他们在官方新闻稿里写的是：“基于开源社区最优秀的模型开发”。这句话写在新闻稿里，写在模型卡片里，也写在PR Times的新闻通稿里。从技术角度讲，这句话确实没有说谎。DeepSeek V3本来就是开源的，许可证（MIT协议）允许商业使用、允许修改、允许二次发布。楽天在此基础上用日语双语数据做了微调和优化——这在业界确实是常见操作，叫微调（fine-tuning）。但问题来了：楽天在所有对外宣传中，从头到尾没提过“DeepSeek”这三个字。新闻稿里没有，模型描述里没有，接受媒体采访时也没有。这就好比你去米其林餐厅点了一份和牛，结果后厨端出来的是街边牛肉干，只不过撒了点黑胡椒。老板还说：“我这是基于市面上最优质的肉类资源开发的菜品。”——话是没错，但你为什么不直接告诉客人这肉是哪来的？所以当网友把config.json的截图贴到X（原Twitter）上时，评论区的画风就很微妙了。有个叫Ryu的日本用户写了一句：“日本终于到了用中国AI冒充日本产AI的时代了吗？”底下的日语评论基本都在骂街，中文评论都在看乐子。场面一度十分热闹。03 把中国AI比作“黑船”，然后自己偷偷用？这事儿最讽刺的地方在这儿。2025年DeepSeek刚火起来的时候，日本媒体给它起了个外号，叫 “AI界的黑船事件” 。“黑船”是什么？是1853年美国海军准将佩里率舰队强行叩开日本国门的历史事件。在日语里，这个词专门用来形容外来力量对日本造成的巨大冲击。把一个中国的AI产品比作“黑船”，这个措辞本身就说明了很多问题。日本政府的反应也确实很快。2025年2月初，日本数字大臣平将明公开表态：在安全疑虑消除之前，日本公务员应避免使用DeepSeek，使用时要格外谨慎。随后日本政府向各省厅发出警告，要求不要在政府设备上使用DeepSeek。企业层面的动作更直接：丰田明确禁止员工使用，理由是“信息安全考虑”；三菱重工同样实施禁令；软银则限制了公司内部对DeepSeek的访问。结果呢？一边喊着“黑船来了快防御”，一边拿着政府补贴的算力，在中国开源的DeepSeek V3上做微调，然后贴上自己的牌子当“日本国产AI”发布。这个画面，真的很难忍住不笑。04 到底谁尴尬？严格来说，楽天没有违反任何规则。DeepSeek V3的开源许可允许商业使用，在开源模型基础上做微调也确实是行业通行做法。楽天甚至可以说：“我们用的是自己的日语数据，做了大量优化，这就是我们的模型。”但问题是——这事儿真的体面吗？想象一下这个场景：日本政府警告公务员别用DeepSeek，怕数据泄露到中国。日本企业纷纷跟进封杀。结果楽天这个拿了政府补贴的“国产AI标杆”，发布当天就被扒出底层就是DeepSeek V3。那些用Rakuten AI 3.0的用户，输入的数据最终会流向哪里？模型的推理请求会打到谁的服务器？如果DeepSeek本身“不安全”，那基于DeepSeek微调的模型怎么就突然“安全”了？如果中国AI是“黑船”，那开着这艘黑船、插上日本旗、号称“国产最大”的行为，算不算自己把船开进了港口？05 这事儿还没完现在的情况是：DeepSeek V3的幻觉率确实不低，楽天拿它微调后能不能优化好，还是个未知数。日本政府刚发了警告，结果自己资助的项目用的是“被警告对象”的技术——这事儿后续怎么圆，也是个问题。最逗的是，DeepSeek现在已经更新到V3.2了。楽天发布的V3版本，严格来说已经是“上一代”的技术了。写到这儿，我突然想到一个问题：如果哪天你发现自己花大价钱买的“国产自研”，底子里是别人开源的“进口货”，你是会觉得赚了，还是觉得自己被耍了？

页: [1]

AMT|智造云|世界先进制造技术论坛，领先的高科技先进制造产业服务平台's Archiver

爆了！日本"自主研发"的7000亿大模型，被扒出是DeepSeek V3换了个皮？