小米 mino v2 flash 套壳谷歌模型

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

请不要在回答技术问题时复制粘贴 AI 生成的内容

https://i.imgur.com/F4y0Bsk.png

所以应该是套壳吧，提示词都没写好

第 1 条附言 10 小时 12 分钟前

经过 v 友提醒，重新查了相关资料，确实是数据清洗的时候出问题的概率比较大，不能直接说是套壳:
"目前的开源或自研模型，为了提升逻辑和对话能力，通常会使用“蒸馏法”即使用更强的模型（ Gemini 、OpenAI ）生成的优质对话数据来训练自己的小模型。小米在训练 MiMo v2 时，可能大量使用了 Google 模型生成的合成数据。这些数据里包含了大量“我是 Google 训练的模型”这样的自我介绍语料。"

第 2 条附言 9 小时 48 分钟前

确实是 op 的问题，标题党了，新进来的建议直接退出，实在看不顺眼的点个 block 吧，实在抱歉。

小米

flash

75 条回复 2025-12-25 19:55:34 +08:00

orrinex

10 小时 40 分钟前

大模型本来就是这样的吧......

Kale

10 小时 40 分钟前

蒸馏。。

Hilong

10 小时 39 分钟前

大模型都出来多久了还能问出这种问题.他们俩是一个东西吗,那个推理速度也不是一个层级的啊

coconutwater

10 小时 39 分钟前

@orrinex #1 试了其他几家的，都没有出现这种问题。并且目前依然可以复现"你爸爸是谁"

si1enceneo

10 小时 36 分钟前

快 2026 年了还在问这种问题，挺无语的

coconutwater

10 小时 36 分钟前

smallparking

10 小时 36 分钟前 via Android

闭源也能套壳吗？我们小米太牛逼了

miniliuke

10 小时 35 分钟前

谷歌又没开源，怎么套

tsja

10 小时 34 分钟前

和 DeepSeek 一样是基于主流大模型训练和蒸馏的，DeepSeek 刚出来的时候也一堆人问你是不是 openai ，也能得到肯定的回答。不管技术路径如何，小米赶紧基于此把弱智的小爱提升一下 AI 能力吧

Yjhenan

10 小时 33 分钟前

数据不都是蒸馏出来吗还是怎么着，反正各大模型都有这毛病

cryptovae

10 小时 32 分钟前

小米罗福莉前 DeepSeek 研究员，加上上面说的，还不懂吗

yhxx

10 小时 32 分钟前

@miniliuke 哈哈哈哈 iframe

keethebest

10 小时 32 分钟前

很正常啊训练数据问题以前 gimini 还说自己是百度的模型呢

brazz

10 小时 31 分钟前

好像没复现出来 https://aistudio.xiaomimimo.com/

iorilu

10 小时 31 分钟前

小米要能有 flash 水平, 早吹起来了

coconutwater

10 小时 30 分钟前

@brazz #14 我是直接接入的 api 调用

dhb233

10 小时 27 分钟前

哪怕看你的图，也说明不了是谷歌的模型啊，transformer 本来就是所有 AI 的基础啊。

coconutwater

10 小时 25 分钟前

经过 v 友提醒，重新查了相关资料，确实是数据清洗的时候出问题的概率比较大，不能直接说是套壳:
"目前的开源或自研模型，为了提升逻辑和对话能力，通常会使用“蒸馏法”即使用更强的模型（如 Google 的 Gemini 、OpenAI 的 GPT-4 ）生成的优质对话数据来训练自己的小模型。小米在训练 MiMo v2 时，可能大量使用了 Google 模型生成的合成数据。这些数据里包含了大量“我是 Google 训练的模型”这样的自我介绍语料。"

Gondolier

10 小时 22 分钟前

@tsja 这倒是真的。同样的苹果的 Apple Intelligence 也很弱智

tanranran

10 小时 16 分钟前

开源的东西，以小米的风评，要是真套壳，早就全网讨伐了

Lisa9527

10 小时 10 分钟前

还没训练彻底，半成品吧

MartinYANG06

10 小时 9 分钟前

开始的时候谷歌的模型也说自己是千问、llama 、chatgpt ，说明小米模型的训练数据里用过其他模型的蒸馏数据，然后模型自我认知没有矫正，一开始 Gemini 也是这样的，兄弟发帖之前最好先百度或者谷歌一下好吧。

imokkkk

10 小时 9 分钟前

怎么还有人问这种问题，人家上市公司，小米又自带流量 buff ，你觉得可能吗

fkdtz

10 小时 6 分钟前

@yhxx 真就字面意思

majiajia

10 小时 3 分钟前

@coconutwater #6 这不是你一直在提雷军吗

cyp0633

10 小时 2 分钟前

有这么好的事？小米套出来 Gemini 的 API 给大家免费用？那赶紧冲啊

xFrye

10 小时 0 分钟前

实在搞不懂为啥有些人看到个新模型，第一时间是问他 ai 的爸爸是谁之类的无聊问题

boringwheat

9 小时 59 分钟前

建议拉黑这类标题党，如果你不确定，你可以问为什么 mino v2 flash 会自称来自 Gemini ？”而不是一开始起一个耸人听闻的标题，再假模假样的解释，因为这种行为在我眼里只有引战的效果

issakchill

9 小时 51 分钟前

不止见过一次这样的言论了。。都快 2026 了还用“你是谁”来让模型回答自己是啥模型。。

MIUIOS

9 小时 35 分钟前

v2ex 已经不是技术论坛了，纯水论坛，搬屎大论坛，啥人都可以搬屎上来

MIUIOS

9 小时 33 分钟前

现在的模型基本都做蒸馏，甚至有可能还共用一套数据集，我每次看到小白去问 ai 你是谁你是什么模型这种问题就觉得好笑。

LLM 模型根本没有自己的思维，他只是一个生成式的 AI ，讲大白话就是组词器，前词组后词，词哪里来，不也是训练的数据集。

zhengluqing13

9 小时 31 分钟前 via Android

评论区一堆神人懂王

MIUIOS

9 小时 22 分钟前

@zhengluqing13 讲讲你的见解

coconutwater

9 小时 19 分钟前

@MIUIOS #30 是的，https://v2ex.com/t/727511

IlIl

9 小时 6 分钟前

雷子大善人免费给我们用 Gemini 的 api 雷门

xeneizes

9 小时 4 分钟前

真套壳的只有盘古套壳 qwen 吧，毕竟这个是内部人员爆料的

lijintapx

9 小时 1 分钟前

你的求知精神值得肯定，但是探索过程有些低能(客观描述

argentea

8 小时 58 分钟前

蒸馏其它大模型的数据没啥好喷的，也算是一种节约资源，大家都从头开始训练大模型的话先不说显卡和储存要涨价多少，光电就不知道要多耗费多少

lijintapx

8 小时 58 分钟前

@miniliuke 雷子一个心灵控制抓出 Google 老总的脑子强制他们交出代码完成套壳。

ninja543

8 小时 52 分钟前

套不套不知道，但是论坛里面米粉蛮多的

izToDo

8 小时 51 分钟前

@ninja543 你和之前帖子里说果粉多的打一架吧，话都被你们说完了

DeYiAo

8 小时 50 分钟前

v 站上 v 友还算是有头脑可以反思的，看到好几个黑小米的帖子了，最后 lz 都能承认表示论据确实有问题。很多年龄大的社区里，天天转发各种无脑黑的信息，解释了还不听，反而是：就算我转的是谣言，小米就没问题吗？

nrtEBH

8 小时 46 分钟前

结婚 3 个月就生娃能正常吗
talk is cheap , show me your arXiv link

brookegas

8 小时 45 分钟前

看到现在 Mi 被围殴得狼狈不堪，拍马赶来踩一脚蹭下热度，没想到翻车了

jonty

8 小时 37 分钟前

我不会 b 你，但是我会给你加个 tag 。

horizon

8 小时 18 分钟前

2023 年你有这个疑问还情有可原
但是现在 2025 了。。。

dabinDev

8 小时 18 分钟前

mdzz

1351161572

8 小时 8 分钟前

大模型月经贴

javapythongo

8 小时 7 分钟前

是不是被某家的千亿营销洗脑了

cheese

7 小时 50 分钟前

技术论坛，就算不做大模型，也好歹跟上技术认知。2025 年了，连蒸馏都没听过，还在问你爸爸是谁。
在小米 AI 出来前你真的用过 AI 吗？
离奇的好笑

ShadowPower

7 小时 24 分钟前

2023 年那会还说谷歌模型抄袭百度文心一言呢

一些小知识：
LLM 模型训练出来之后并不知道自己是谁训练的，自己叫什么名字
通过系统提示词，或者监督微调，可以让模型知道自己是谁训练的，叫什么名字
上面那一步操作，会影响模型在其他方面的性能

dragondove

7 小时 12 分钟前

怀疑楼主是不是程序员了，怎么感觉连开源都没接触过，难绷

skiy

7 小时 6 分钟前

估计 op 也没啥有用的知识分享了。已 block 。

ccpp132

7 小时 1 分钟前

这甚至都不能说明他用了 gemini 做蒸馏。因为训练大模型也不会特意说训练材料里加入你是谁，是谁训练的。你问大模型，他不知道自己是谁，他只会从语料里找一个会训练大模型的来编回答

kylesean

6 小时 58 分钟前

这个模型很烂，工具调用都调用不明白，在我的 agent 里，会把 skills 解析成工具调用，导致输出错误的 xml 格式。其他模型都测试了国产的，gpt 的，都没有，就它有。

shine1996

6 小时 44 分钟前

v2 人均大模型开发专家

maomaosang

6 小时 41 分钟前

「实在抱歉」
给楼主点赞，楼主讲究人儿，知错能道歉。

royzxq

6 小时 18 分钟前

小米要是真套壳你猜第二天千亿营销费用是不是已经上了

JYii

6 小时 13 分钟前

你对这个问题认知不足，这是小问题。你能道歉，这根本不是问题了。

tinydancer

6 小时 13 分钟前

@shine1996 这种问题属于大模型入门级问题，并不需要大模型专家才能理解和回答，能问出这种问题说明连大模型的门都没有摸到

furch

5 小时 58 分钟前

只能说小米活做的糙，套壳是不可能的，不过符合小米一贯风格

gpt5

5 小时 53 分钟前

不死犟到底的 v 友，不多了。

duanxianze

5 小时 31 分钟前

既然你会用 AI 了，还特意用了小米的 AI ，消息不该这么闭塞的，很奇怪

back0893

5 小时 18 分钟前

又来?
虽然我不喜欢小米但是你可以换个方向黑

lance07

5 小时 0 分钟前

新时代没有载你的船了

aduangduang

4 小时 19 分钟前

很好奇，黑小米真的能得到快乐吗？还是这种行为能让你有优越感？（当然如果有人真的给钱，那请务必带上我一起！）
如果是华为的模型，我猜你又要赢 800 次了

xzl

3 小时 25 分钟前

这个建议还是自己删帖或者版主删帖吧，没必要为了黑而黑。

Rickkkkkkk

2 小时 56 分钟前

不如说小米套壳安卓，更合理点。

MidCoder

2 小时 52 分钟前

貌似还套壳了 Kimi ，应该是蒸馏了 Kimi 的数据

might1

2 小时 37 分钟前 via Android

非常感谢 OP 提出问题，然后看回复，发现自己的问题，又总结了一下。我觉得挺好的。我不觉得这种问题没什么意义，反倒是挺有意义的。像我就不知道其中的原理。

coconutwater

2 小时 28 分钟前

@xzl #67 看了删帖规则，题主自身是删不了的

zzlove

2 小时 24 分钟前

和这个帖子有什么区别？都在一个群领的任务？
https://v2ex.com/t/1178410

WuSiYu

26 分钟前

现在所有 LLM 基本都是赛博人体蜈蚣

Grefer

14 分钟前

我还以为能上 V 站的人至少稍微懂点技术，没想到依旧能看到这种博眼球倒垃圾的贴子

Linon

13 分钟前 via Android

你的帖子问题已经被 claude 解决了!https://f.pz.al/pzal/2025/12/25/498ddd4a80229.jpg