笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了个名?

AGI
演都不演了,打开配置文件一看,是DeepSeek

文 | 字母AI

好家伙……我真的是直接好家伙!

3月17日,楽天(乐天)集团正式发布了Rakuten AI 3.0模型,号称是“日本国内最大规模的高性能AI模型”。官方宣传的参数量为约7000亿,并且日语特化,Apache 2.0开源许可,还拿了日本经产省和NEDO的GENIAC项目补助。

然而就是这样一个日本国民级的AI模型,不到12小时,爆出惊天大雷。

当天下午,有人打开了Rakuten AI 3.0在Hugging Face上的config.json。

第一行配置,architectures(架构)字段,赫然写着一个在中国家喻户晓的模型:DeepseekV3ForCausalLM.

而model_type字段为deepseek_v3。

也就是说,这个日本“国内最大规模的高性能AI模型”,正是DeepSeek V3。

01

事情的发现过程没有任何技术门槛。

Rakuten AI 3.0发布后,模型权重按惯例上传到了Hugging Face的楽天官方仓库。

任何人点进去,切到“Files and versions”标签页,打开config.json就能看到。

这个config.json是每个大模型都有的配置文件,记录着模型的架构信息。

architectures字段写的“DeepseekV3ForCausalLM”,意思是这个模型使用的是DeepSeek V3的因果语言模型架构。

不是“参考”,不是“借鉴”,是直接声明了模型类别。

往下看,hidden_size是7168,intermediate_size是18432,num_hidden_layers是61,n_routed_experts是256,vocab_size是129280。

这些数字和DeepSeek V3的原版配置一模一样。

说实话,真的是演都不演了。而且现在DeepSeek已经更新到V3.2了,V3幻觉太高,其实不怎么好用的。

难怪楽天的Rakuten AI 3.0号称“参数量约7000亿”,因为DeepSeek V3的参数量就是6810亿。

Hugging Face的模型页面上,标签栏里甚至直接挂着“deepseek_v3”的标签。这不是网友后加的,是模型上传时系统根据config自动生成的。

楽天自己的说法是基于开源社区最优秀的模型开发。

这句话写在官方新闻稿里,还写在Hugging Face的模型卡片里,也写在楽天集团的PR Times新闻通稿里。从技术角度讲,这句话没有说谎。

改了个名字确实也算是开发。

DeepSeek V3是开源模型,许可证也允许这么做。楽天在此基础上用自己的日语双语数据做了微调和优化,这个流程在业界很常见。

但问题在于,楽天在所有对外宣传中,从未提及“DeepSeek”这三个字。

新闻稿里没有,模型卡片的描述里没有,接受媒体采访时也没有。

所以当有人把config.json的截图贴到 X(原Twitter)上时,评论区的反应可想而知。

02

最先传播开来的是一张截图:Hugging Face上Rakuten AI 3.0的config.json 页面,architectures字段里的“DeepseekV3ForCausalLM”被蓝框高亮圈出。

截图下面,有人只写了两个词加一个问号:“deepseek V3?”

这条帖子被迅速转发到Impress Watch的报道推文下面。

Impress Watch是最早报道 Rakuten AI 3.0 的日本科技媒体之一,它的推文本来是一条普通的新闻转发,评论区却变成了另一番景象。

一个叫Ryu的用户写道:“日本终于到了用中国AI冒充日本产AI的时代了吗?”

底下的日语评论普遍都是骂街的,中文评论都是看乐子的,在这里我也就不放出来了,大家自行想象一下那个场景就好了。

诚然,严格来说,楽天没有违反任何规则。DeepSeek V3的开源许可允许商业使用和二次开发,在开源模型基础上做微调也是行业通行做法。

可是这事并没有那么体面。

2025年DeepSeek爆火的时候,日本媒体给它起了个名字,叫“AI界的黑船事件”。

黑船是 1853 年美国海军准将佩里率舰队强行叩开日本国门的历史事件,在日语里专门用来形容外来力量对日本造成的巨大冲击。

把一个中国的AI产品比作黑船,这个措辞本身就说明了很多。

日本政府的反应很快。2025年2月初,日本数字大臣平将明公开表态,称在安全疑虑消除之前,日本公务员应避免使用DeepSeek,或者在使用时格外谨慎。

他特别提到了个人信息保护的问题。随后,日本政府向各省厅发出警告,要求不要在政府设备上使用DeepSeek。

企业层面的动作更直接。

丰田汽车明确禁止员工使用DeepSeek,官方理由是“出于信息安全的考虑”。三菱重工同样实施禁令,即便员工提交内部申请也不会被批准。

软银则限制了公司内部对 DeepSeek 的访问,并禁止员工在工作设备上下载和使用。

可是现在……你怎么让我忍得住不笑啊!

本文系作者 字母AI 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 作者水平很低

    回复 3月18日 · via harmony
  • 从黑船事件到换皮使用日本 AI 产业的尴尬全写在这了

    回复 3月18日 · via pc
  • 模型标签自动标了 deepseek_v3 乐天这波演都不演了

    回复 3月18日 · via iphone
  • 日本吹了半天的自研高性能 AI 原来只是中国模型的中文版

    回复 3月18日 · via pc
  • 所有关键参数和 DeepSeek V3 一模一样乐天连改都懒得改了

    回复 3月18日 · via android
  • 开源许可允许二次开发但光明正大换皮属实吃相太难看

    回复 3月18日 · via android
  • 丰田三菱软银全禁了 DeepSeek 乐天却把它当自家王牌发布

    回复 3月18日 · via iphone
  • 更尬的是 DeepSeek 都更到 V3.2 了乐天还拿有幻觉的 V3 凑数

    回复 3月18日 · via android
  • 拿日本经产省补助搞换皮 AI 乐天这波操作属实有点难看

    回复 3月18日 · via h5
  • 乐天只说基于开源模型开发全程不提 DeepSeek 藏得够深的

    回复 3月18日 · via iphone
更多评论

快报

更多

2026-03-18 23:05

圆通速递:阿里旗下杭州灏月拟减持不超2%公司股份

2026-03-18 23:04

部分期货品种夜盘收盘,能源化工品全线上涨

2026-03-18 22:58

美财政部授权开展部分与委内瑞拉国家石油公司有关交易

2026-03-18 22:55

加密货币价格持续下行,以太坊跌破2200美元

2026-03-18 22:55

虎牙宣布新一轮5000万美元股票回购计划

2026-03-18 22:53

日本汽油零售价创新高

2026-03-18 22:46

国际原子能机构:目前不是考虑恢复美伊核谈判的时机

2026-03-18 22:44

七部门联合印发意见,加快推动小水电绿色转型高质量发展

2026-03-18 22:44

英国富时100指数、欧洲斯托克600指数跌幅扩大至1%

2026-03-18 22:40

链博会产业对接活动(浙江站)成功举办

2026-03-18 22:39

迈为股份新项目签约落地,总投资50亿元

2026-03-18 22:38

3000亿港元中东资本涌入香港?调查:有中东资本流入,但具体流入规模与真实流向难以精准统计和核查

2026-03-18 22:37

腾讯总裁刘炽平:2026年腾讯预计还会增加资本开支

2026-03-18 22:36

美股光通信板块多只个股大涨,Lumentum大涨逾12%

2026-03-18 22:35

交易员们已充分预期欧洲央行将在2026年两次上调利率各0.25个百分点

2026-03-18 22:35

美国能源信息署:上周原油库存增加616万桶

2026-03-18 22:34

特朗普授权解除船禁60天,以降低美境内能源运输成本

2026-03-18 22:23

腾讯高管:行业别无选择,只能将成本上涨转嫁

2026-03-18 22:22

国际油价持续走高,美油涨3%、布油涨超5%

2026-03-18 22:19

国家电网前两月投产110千伏及以上交流线路长度同比增长超80%

21

扫描下载App

Baidu
map