
https://i.imgur.com/F4y0Bsk.png
所以应该是套壳吧,提示词都没写好
1 orrinex 10 小时 40 分钟前 大模型本来就是这样的吧...... |
2 Kale 10 小时 40 分钟前 蒸馏。。 |
3 Hilong 10 小时 39 分钟前 大模型都出来多久了还能问出这种问题.他们俩是一个东西吗,那个推理速度也不是一个层级的啊 |
4 coconutwater OP @orrinex #1 试了其他几家的,都没有出现这种问题。并且目前依然可以复现"你爸爸是谁" |
5 si1enceneo 10 小时 36 分钟前 快 2026 年了还在问这种问题,挺无语的 |
6 coconutwater OP |
7 smallparking 10 小时 36 分钟前 via Android 闭源也能套壳吗?我们小米太牛逼了 |
8 miniliuke 10 小时 35 分钟前 谷歌又没开源,怎么套 |
9 tsja 10 小时 34 分钟前 和 DeepSeek 一样是基于主流大模型训练和蒸馏的,DeepSeek 刚出来的时候也一堆人问你是不是 openai ,也能得到肯定的回答。不管技术路径如何,小米赶紧基于此把弱智的小爱提升一下 AI 能力吧 |
10 Yjhenan 10 小时 33 分钟前 |
11 cryptovae 10 小时 32 分钟前 小米罗福莉前 DeepSeek 研究员,加上上面说的,还不懂吗 |
13 keethebest 10 小时 32 分钟前 很正常啊 训练数据问题 以前 gimini 还说自己是百度的模型呢 |
14 brazz 10 小时 31 分钟前 好像没复现出来 https://aistudio.xiaomimimo.com/ |
15 iorilu 10 小时 31 分钟前 小米要能有 flash 水平, 早吹起来了 |
16 coconutwater OP @brazz #14 我是直接接入的 api 调用 |
17 dhb233 10 小时 27 分钟前 哪怕看你的图,也说明不了是谷歌的模型啊,transformer 本来就是所有 AI 的基础啊。 |
18 coconutwater OP 经过 v 友提醒,重新查了相关资料,确实是数据清洗的时候出问题的概率比较大,不能直接说是套壳: "目前的开源或自研模型,为了提升逻辑和对话能力,通常会使用“蒸馏法”即使用更强的模型(如 Google 的 Gemini 、OpenAI 的 GPT-4 )生成的优质对话数据来训练自己的小模型。小米在训练 MiMo v2 时,可能大量使用了 Google 模型生成的合成数据。这些数据里包含了大量“我是 Google 训练的模型”这样的自我介绍语料。" |
20 tanranran 10 小时 16 分钟前 开源的东西,以小米的风评,要是真套壳,早就全网讨伐了 |
21 Lisa9527 10 小时 10 分钟前 还没训练彻底,半成品吧 |
22 MartinYANG06 10 小时 9 分钟前 开始的时候谷歌的模型也说自己是千问、llama 、chatgpt , 说明小米模型的训练数据里用过其他模型的蒸馏数据,然后模型自我认知没有矫正,一开始 Gemini 也是这样的, 兄弟发帖之前最好先百度或者谷歌一下好吧。 |
23 imokkkk 10 小时 9 分钟前 怎么还有人问这种问题,人家上市公司,小米又自带流量 buff ,你觉得可能吗 |
25 majiajia 10 小时 3 分钟前 @coconutwater #6 这不是你一直在提雷军吗 |
26 cyp0633 10 小时 2 分钟前 有这么好的事?小米套出来 Gemini 的 API 给大家免费用?那赶紧冲啊 |
27 xFrye 10 小时 0 分钟前 实在搞不懂为啥有些人看到个新模型,第一时间是问他 ai 的爸爸是谁之类的无聊问题 |
28 boringwheat 9 小时 59 分钟前 建议拉黑这类标题党,如果你不确定,你可以问为什么 mino v2 flash 会自称来自 Gemini ?”而不是一开始起一个耸人听闻的标题,再假模假样的解释,因为这种行为在我眼里只有引战的效果 |
29 issakchill 9 小时 51 分钟前 不止见过一次这样的言论了。。都快 2026 了 还用“你是谁”来让模型回答自己是啥模型。。 |
30 MIUIOS 9 小时 35 分钟前 v2ex 已经不是技术论坛了,纯水论坛,搬屎大论坛,啥人都可以搬屎上来 |
31 MIUIOS 9 小时 33 分钟前 现在的模型基本都做蒸馏,甚至有可能还共用一套数据集,我每次看到小白去问 ai 你是谁你是什么模型这种问题就觉得好笑。 LLM 模型根本没有自己的思维,他只是一个生成式的 AI ,讲大白话就是组词器,前词组后词,词哪里来,不也是训练的数据集。 |
32 zhengluqing13 9 小时 31 分钟前 via Android 评论区一堆神人懂王 |
33 MIUIOS 9 小时 22 分钟前 @zhengluqing13 讲讲你的见解 |
34 coconutwater OP @MIUIOS #30 是的,https://v2ex.com/t/727511 |
35 IlIl 9 小时 6 分钟前 雷子大善人 免费给我们用 Gemini 的 api 雷门 |
36 xeneizes 9 小时 4 分钟前 真套壳的只有盘古套壳 qwen 吧,毕竟这个是内部人员爆料的 |
37 lijintapx 9 小时 1 分钟前 你的求知精神值得肯定,但是探索过程有些低能(客观描述 |
38 argentea 8 小时 58 分钟前 蒸馏其它大模型的数据没啥好喷的,也算是一种节约资源,大家都从头开始训练大模型的话先不说显卡和储存要涨价多少,光电就不知道要多耗费多少 |
40 ninja543 8 小时 52 分钟前 套不套不知道,但是论坛里面米粉蛮多的 |
42 DeYiAo 8 小时 50 分钟前 v 站上 v 友还算是有头脑可以反思的,看到好几个黑小米的帖子了,最后 lz 都能承认表示论据确实有问题。 很多年龄大的社区里,天天转发各种无脑黑的信息,解释了还不听,反而是:就算我转的是谣言,小米就没问题吗? |
43 nrtEBH 8 小时 46 分钟前 结婚 3 个月就生娃 能正常吗 talk is cheap , show me your arXiv link |
44 brookegas 8 小时 45 分钟前 看到现在 Mi 被围殴得狼狈不堪,拍马赶来踩一脚蹭下热度,没想到翻车了 |
45 jonty 8 小时 37 分钟前 我不会 b 你,但是我会给你加个 tag 。 |
46 horizon 8 小时 18 分钟前 2023 年你有这个疑问还情有可原 但是现在 2025 了。。。 |
47 dabinDev 8 小时 18 分钟前 mdzz |
48 1351161572 8 小时 8 分钟前 大模型月经贴 |
49 javapythongo 8 小时 7 分钟前 是不是被某家的千亿营销洗脑了 |
50 cheese 7 小时 50 分钟前 技术论坛,就算不做大模型,也好歹跟上技术认知。2025 年了,连蒸馏都没听过,还在问你爸爸是谁。 在小米 AI 出来前你真的用过 AI 吗? 离奇的好笑 |
51 ShadowPower 7 小时 24 分钟前 2023 年那会还说谷歌模型抄袭百度文心一言呢 一些小知识: LLM 模型训练出来之后并不知道自己是谁训练的,自己叫什么名字 通过系统提示词,或者监督微调,可以让模型知道自己是谁训练的,叫什么名字 上面那一步操作,会影响模型在其他方面的性能 |
52 dragondove 7 小时 12 分钟前 怀疑楼主是不是程序员了,怎么感觉连开源都没接触过,难绷 |
53 skiy 7 小时 6 分钟前 估计 op 也没啥有用的知识分享了。已 block 。 |
54 ccpp132 7 小时 1 分钟前 这甚至都不能说明他用了 gemini 做蒸馏。因为训练大模型也不会特意说训练材料里加入你是谁,是谁训练的。你问大模型,他不知道自己是谁,他只会从语料里找一个会训练大模型的来编回答 |
55 kylesean 6 小时 58 分钟前 这个模型很烂,工具调用都调用不明白,在我的 agent 里,会把 skills 解析成工具调用,导致输出错误的 xml 格式。其他模型都测试了国产的,gpt 的,都没有,就它有。 |
56 shine1996 6 小时 44 分钟前 v2 人均大模型开发专家 |
57 maomaosang 6 小时 41 分钟前 「实在抱歉」 给楼主点赞,楼主讲究人儿,知错能道歉。 |