解语樱木 发表于 2026-3-18 14:16:13

爆了!日本"自主研发"的7000亿大模型,被扒出是DeepSeek V3换了个皮?

好家伙,这回真的是看乐子了。3月17日,日本楽天(Rakuten)集团高调发布了一个叫 Rakuten AI 3.0 的模型。宣传文案写得那叫一个漂亮——“日本国内最大规模的高性能AI模型”,参数量约7000亿,专门为日语优化,还拿了日本经济产业省和NEDO的GENIAC项目补助。结果呢?发布不到12小时,网友直接把它的底裤扒了个精光。01 一个config.json引发的血案这事儿的发现过程,简单到没有任何技术含量。Rakuten AI 3.0发布后,模型权重照例会传到Hugging Face(全球最大的模型托管平台)的楽天官方仓库。任何一个懂点AI的人,点进去,打开那个叫 config.json 的配置文件,都能直接傻眼。architectures(模型架构)那一栏,赫然写着一行英文:DeepseekV3ForCausalLM。model_type那一栏,更干脆:deepseek_v3。懂行的朋友看到这儿已经笑了——这不是“参考”DeepSeek,不是“借鉴”DeepSeek,这是直接把DeepSeek V3的“身份证”亮出来了。往下翻,参数配置更是对得严丝合缝:hidden_size是7168,intermediate_size是18432,num_hidden_layers是61,n_routed_experts是256,vocab_size是129280。这些数字,和DeepSeek V3的原版配置一模一样。难怪楽天敢号称“参数量约7000亿”——因为DeepSeek V3本来就是6810亿参数。改名归改名,参数又不能凭空变多。更搞笑的是,Hugging Face的模型页面上,标签栏甚至直接挂着“deepseek_v3”的标签。这不是网友手动后加的,是模型上传时系统根据config自动生成的。演都不演了属于是。02 楽天:我说的是“基于开源社区优秀成果”,有错吗?楽天自己的说法是什么?他们在官方新闻稿里写的是:“基于开源社区最优秀的模型开发”。这句话写在新闻稿里,写在模型卡片里,也写在PR Times的新闻通稿里。从技术角度讲,这句话确实没有说谎。DeepSeek V3本来就是开源的,许可证(MIT协议)允许商业使用、允许修改、允许二次发布。楽天在此基础上用日语双语数据做了微调和优化——这在业界确实是常见操作,叫微调(fine-tuning)。但问题来了:楽天在所有对外宣传中,从头到尾没提过“DeepSeek”这三个字。新闻稿里没有,模型描述里没有,接受媒体采访时也没有。这就好比你去米其林餐厅点了一份和牛,结果后厨端出来的是街边牛肉干,只不过撒了点黑胡椒。老板还说:“我这是基于市面上最优质的肉类资源开发的菜品。”——话是没错,但你为什么不直接告诉客人这肉是哪来的?所以当网友把config.json的截图贴到X(原Twitter)上时,评论区的画风就很微妙了。有个叫Ryu的日本用户写了一句:“日本终于到了用中国AI冒充日本产AI的时代了吗?”底下的日语评论基本都在骂街,中文评论都在看乐子。场面一度十分热闹。03 把中国AI比作“黑船”,然后自己偷偷用?这事儿最讽刺的地方在这儿。2025年DeepSeek刚火起来的时候,日本媒体给它起了个外号,叫 “AI界的黑船事件” 。“黑船”是什么?是1853年美国海军准将佩里率舰队强行叩开日本国门的历史事件。在日语里,这个词专门用来形容外来力量对日本造成的巨大冲击。把一个中国的AI产品比作“黑船”,这个措辞本身就说明了很多问题。日本政府的反应也确实很快。2025年2月初,日本数字大臣平将明公开表态:在安全疑虑消除之前,日本公务员应避免使用DeepSeek,使用时要格外谨慎。随后日本政府向各省厅发出警告,要求不要在政府设备上使用DeepSeek。企业层面的动作更直接:丰田明确禁止员工使用,理由是“信息安全考虑”;三菱重工同样实施禁令;软银则限制了公司内部对DeepSeek的访问。结果呢?一边喊着“黑船来了快防御”,一边拿着政府补贴的算力,在中国开源的DeepSeek V3上做微调,然后贴上自己的牌子当“日本国产AI”发布。这个画面,真的很难忍住不笑。04 到底谁尴尬?严格来说,楽天没有违反任何规则。DeepSeek V3的开源许可允许商业使用,在开源模型基础上做微调也确实是行业通行做法。楽天甚至可以说:“我们用的是自己的日语数据,做了大量优化,这就是我们的模型。”但问题是——这事儿真的体面吗?想象一下这个场景:日本政府警告公务员别用DeepSeek,怕数据泄露到中国。日本企业纷纷跟进封杀。结果楽天这个拿了政府补贴的“国产AI标杆”,发布当天就被扒出底层就是DeepSeek V3。那些用Rakuten AI 3.0的用户,输入的数据最终会流向哪里?模型的推理请求会打到谁的服务器?如果DeepSeek本身“不安全”,那基于DeepSeek微调的模型怎么就突然“安全”了?如果中国AI是“黑船”,那开着这艘黑船、插上日本旗、号称“国产最大”的行为,算不算自己把船开进了港口?05 这事儿还没完现在的情况是:DeepSeek V3的幻觉率确实不低,楽天拿它微调后能不能优化好,还是个未知数。日本政府刚发了警告,结果自己资助的项目用的是“被警告对象”的技术——这事儿后续怎么圆,也是个问题。最逗的是,DeepSeek现在已经更新到V3.2了。楽天发布的V3版本,严格来说已经是“上一代”的技术了。写到这儿,我突然想到一个问题:如果哪天你发现自己花大价钱买的“国产自研”,底子里是别人开源的“进口货”,你是会觉得赚了,还是觉得自己被耍了?


页: [1]
查看完整版本: 爆了!日本"自主研发"的7000亿大模型,被扒出是DeepSeek V3换了个皮?