小米音箱是不是在偷偷把我家里的录音传到小米的服务器里? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
katana97
V2EX    问与答

小米音箱是不是在偷偷把我家里的录音传到小米的服务器里?

  •  1
     
  •   katana97 2020 年 9 月 22 日 15873 次点击
    这是一个创建于 2021 天前的主题,其中的信息可能已经有所发展或是发生改变。

    截屏 2020-09-22 上午 8.51.01.png

    根据路由器里的设备连接时间来看这个应该是最近 36 小时跑掉的流量, 而我周天晚上回来到现在为止没有和它说过一句话,仅仅是当作闹钟来用却跑掉了 1.75GB 的流量。。。

    第 1 条附言    2020 年 9 月 22 日

    截屏 2020-09-22 上午 9.14.22.png

    102 条回复    2022-09-21 23:04:33 +08:00
    1  2  
    id4alex
        1
    id4alex  
       2020 年 9 月 22 日   14
    李彦宏说中国人喜欢用隐私换便捷.

    反正我是不装什么智能音响, 什么摄像头
    terence4444
        2
    terence4444  
       2020 年 9 月 22 日 via iPhone
    可以区分是上传还是下载的流量吗?
    katana97
        3
    katana97  
    OP
       2020 年 9 月 22 日
    @terence4444 有 1.74GB 是上传
    diegozhu
        4
    diegozhu  
       2020 年 9 月 22 日   4
    这还用想? 要不然 随时唤醒是怎么做的。 难不成离线语音识别?
    sunziren
        5
    sunziren  
       2020 年 9 月 22 日   1
    害怕
    LouXiaShiZhu
        6
    LouXiaShiZhu  
       2020 年 9 月 22 日
    应该闲置的时候把本地的数据上传用作分析了
    katana97
        7
    katana97  
    OP
       2020 年 9 月 22 日
    ![截屏 2020-09-22 上午 9.14.22.png]( https://i.loli.net/2020/09/22/uFP7dlCvSrBXzO2.png)
    katana97
        8
    katana97  
    OP
       2020 年 9 月 22 日
    @diegozhu 没做过语音识别,但映像中断网的时候叫唤醒词‘小爱同学’四个字的时候它也会有反应啊,只是接着会提醒无网络
    Aevery
        9
    Aevery  
       2020 年 9 月 22 日
    回去就把这货拔了。。。
    diegozhu
        10
    diegozhu  
       2020 年 9 月 22 日
    @katana97 你这是啥路由器啊。还带统计功能?
    katana97
        11
    katana97  
    OP
       2020 年 9 月 22 日
    @diegozhu 华硕 ax3000
    alienx717
        12
    alienx717  
       2020 年 9 月 22 日
    你不服麽,耍猴雷辛辛苦苦给你远程发功,需要消耗点上传流量,仅此而已
    CRight
        13
    CRight  
       2020 年 9 月 22 日 via Android   1
    我以为买智能音箱的人,都会默认有会上传数据的这个事实,要不然怎么工作
    ylsc633
        14
    ylsc633  
       2020 年 9 月 22 日
    这样说 小爱同学 这个句柄 它是怎么识别的 肯定是一直都在收录和分析


    另外 手机应该也是一样

    至于传不传上去 那是另外一件事了
    katana97
        15
    katana97  
    OP
       2020 年 9 月 22 日   3
    @CRight 唤醒它以后我说的话传上去我觉得没什么,但是在我没唤醒它甚至在说梦话的时候也上传就有点害怕了
    trh
        16
    trh  
       2020 年 9 月 22 日   2
    你在美国用 amazon echo,结果也一样吧?
    iblessyou
        17
    iblessyou  
       2020 年 9 月 22 日
    @katana97 这路由我买后悔了。。。信号很差,照着网上设置后也还是差,
    你说为了辐射标准什么的我可以理解,但不隔墙离两米还经常不满信号是怎么回事。
    经常会卡,还是得手动常重启。。
    Yiki
        18
    Yiki  
       2020 年 9 月 22 日
    你在中国讲隐私 你就默认你啥都没有就行了
    何况个智能音箱
    PbCopy111
        19
    PbCopy111  
       2020 年 9 月 22 日
    我觉得有可能是设备更新。。。我家也有很多这玩意,没这么多流量啊。
    另外,小爱同学我不知道,但苹果什么的,都是固定的那一句唤醒,录在手机或者音箱上。否则离线唤醒怎么实现呢?唤醒以后的操作才联网吧。
    martinsu
        20
    martinsu  
       2020 年 9 月 22 日 via iPhone   2
    我记得苹果和 amazon 的智能音箱有声明过隐私问题,除交互以外不会上传(即使这样,amazon 还出过错误上传的事故)。

    国内智能音箱都没强调过这个,我不抱指望。

    比如天猫精灵,有一次我找手机,应该是“你看见我手机了吗”触发了它,它很“智能”地给我发了条消息问我是不是在找手机,使用天猫精灵说拨打手机能帮我找到。它没让我觉得智能,只让我觉得它无时无刻不在监听我,这很恐怖。
    daozhihun
        21
    daozhihun  
       2020 年 9 月 22 日   1
    这个我觉得很明显是在上传了,如果是识别你是不是在叫它,肯定是离线的而不会要服务器去计算的。不然的话手机上的得耗费多少流量
    Mark24
        22
    Mark24  
       2020 年 9 月 22 日
    识别句柄,应该是协处理器的工作。
    katana97
        23
    katana97  
    OP
       2020 年 9 月 22 日
    @PbCopy111 下载只有 1m 多,其他都是上传,肯定不是更新
    binaryify
        24
    binaryify  
       2020 年 9 月 22 日
    不然怎么训练呢
    Hsueh
        25
    Hsueh  
       2020 年 9 月 22 日
    楼主是小米的重点关注大客户啊,我这边查了每日流量才几十兆,两个加一起还不足百兆!
    ylw
        26
    ylw  
       2020 年 9 月 22 日
    看你设备型号应该是小爱触摸屏那个型号吧 我也有 你可以在设置里面吧麦克风关掉再试试
    我没遇到过这么大的上传流量
    hafuhafu
        27
    hafuhafu  
       2020 年 9 月 22 日   3
    这上传的也太多了吧。不会是在偷偷把空闲带宽当 CDN 或者其他利用上传薅羊毛之类的事吧。
    毕竟有小米路由器 JS 劫持的前车之鉴,对他们的和网络有关的产品不放心。
    katana97
        28
    katana97  
    OP
       2020 年 9 月 22 日
    @ylw 不是触摸屏的,好像是一代经典款吧,18 年在线下店买的
    tsui
        29
    tsui  
       2020 年 9 月 22 日   3
    @trh Amazon Echo 和 Google Home 实测都不会。

    美国 Comcast 每个月流量很多地方 Cap 在 1.2T ,家里厨房客厅卫生间放几个 Echo 每个月跑几百个 G,用户早炸了
    sevenzhou1218
        30
    sevenzhou1218  
       2020 年 9 月 22 日   1
    居然比较和谐...换百度和华为的话...
    hugee
        31
    hugee  
       2020 年 9 月 22 日
    是的,有传一部分,做大数据分析
    katana97
        32
    katana97  
    OP
       2020 年 9 月 22 日   1
    @ylw 我好像也没买过多少小米的东西,现在就一个手环一个音箱。
    现在都有点害怕会不会我哪天在梦话里说了什么我不同意的观点被他录下来以后给我拉清单
    catror
        33
    catror  
       2020 年 9 月 22 日 via Android
    不是普遍现象,反馈一下呗,估计是有 bug
    hugee
        34
    hugee  
       2020 年 9 月 22 日
    @PbCopy111 小米音箱设备去更新服务器给服务器程序升级是吗? 小爱同学是本地程序实现的,相当于一个开关,唤醒之后才是连接网络工开始工作。。
    Nuttertoo1s
        35
    Nuttertoo1s  
       2020 年 9 月 22 日
    @diegozhu 唤醒词还真是离线的,唤醒词唤醒之后才会打开语音识别,我有做过类似的产品
    1wannaooooo
        36
    1wannaooooo  
       2020 年 9 月 22 日   1
    如果是带摄像头的,只有一句建议,请贴住摄像头
    tfdetang
        37
    tfdetang  
       2020 年 9 月 22 日
    @diegozhu 还真的是离线语音识别,这种唤醒语的离线识别非常简单,你自己在树莓派上都可以实现。

    甚至很多设备都是为唤醒专门做个超低功耗的芯片一直监听。通过实时传输音频联网唤醒不但流量爆炸,功耗也非常高 基本不会有人这么做
    Nuttertoo1s
        38
    Nuttertoo1s  
       2020 年 9 月 22 日
    百度的唤醒词功能是免费的,大家可以用来玩下,他家的 demo 第一眼看过去有点懵,就感觉在炫技
    ylw
        39
    ylw  
       2020 年 9 月 22 日
    @katana97 是立方体 那个吧 你找找有一个开关可以关掉麦克风的 ,关掉之后顶部的蓝灯就变成红色的了
    小爱音箱和百度 小度 我家都有 这 2 个产品都设有可以关闭麦克风的功能 天猫精灵没用过不知道
    PbCopy111
        40
    PbCopy111  
       2020 年 9 月 22 日
    @hugee #34 嗯。。我回去要分析一下流量了。。。以前都没注意过。
    whileFalse
        41
    whileFalse  
       2020 年 9 月 22 日 via iPhone
    @diegozhu 瞎猜。随时唤醒是设备层面实现的。云根本没有足够容量做所有设备实时语音识别。
    而且云层面唤醒会时不时有明显延迟。
    whileFalse
        42
    whileFalse  
       2020 年 9 月 22 日 via iPhone
    @martinsu 傻 x 天猫精灵动不动就自己唤醒。如果你不把那个“诶”关了的话会发现它一天诶好几次。
    zzugyl
        43
    zzugyl  
       2020 年 9 月 22 日
    大多数产品唤醒都是做的离线处理。
    唤醒之后有可能上传数据。小爱音箱有个错误反馈,这个功能肯定要上传数据。
    ku9527
        44
    ku9527  
       2020 年 9 月 22 日   5
    我明明在光明正大的上传,你非说我是偷偷上传, 我雷布斯明天就起诉你污蔑
    zhuangku556
        45
    zhuangku556  
       2020 年 9 月 22 日
    国产品牌的智能音箱和路由器你们也真敢用啊……
    namelosw
        46
    namelosw  
       2020 年 9 月 22 日 via iPhone
    @tsui 之前有很多新闻说 Alexa 是有真人听的。流量不大我理解是采样。
    weilaix
        47
    weilaix  
       2020 年 9 月 22 日 via Android   1
    不用国内的智能语音
    justin2018
        48
    justin2018  
       2020 年 9 月 22 日
    那我看日本电影 岂不是小爱都知道了
    gxgxxn
        49
    gxgxxn  
       2020 年 9 月 22 日
    @PbCopy111 这是上传流量,不可能是更新系统
    Revenant
        50
    Revenant  
       2020 年 9 月 22 日
    @diegozhu #3 唤醒词识别了解一下,使用 kaldi 就能训练这类模型,在本地设备识别的,实时语音识别,建议去阿里云了解一下价格,一天 24 小时不间断开启,一年费用上万
    shiji
        51
    shiji  
       2020 年 9 月 22 日 via iPhone
    @diegozhu 唤醒词都是本地额识别的,之后说的的才会上传进行语音识别
    Osk
        52
    Osk  
       2020 年 9 月 22 日 via Android
    微软:欢迎去隐私页面听听我们帮您录制并存储的 cortana 语音片段。

    感觉有点傻,也有点恐怖。

    顺便打听下:楼主用的是啥流量分析工具
    shijingshijing
        53
    shijingshijing  
       2020 年 9 月 22 日
    如果是 CDN or 挖矿还算好了,要是真的 24 小时监控其实更恐怖,从不用各种箱子。
    soFollish
        54
    soFollish  
       2020 年 9 月 22 日
    楼主可以分析一下,小爱用户表示持续关注
    laydown
        55
    laydown  
       2020 年 9 月 22 日   2
    国内这些垃圾东西,根本没有相关法律去监管的,不传白不传。

    太多不上 V2EX 的人会觉得上传这根本不是问题,或者根本毫无这样的认知,就开始用那些“智能”设备了,且用得很开心。
    lslqtz
        56
    lslqtz  
       2020 年 9 月 22 日
    我的 homepod 几乎没上传过
    保持关注
    Nuttertoo1s
        57
    Nuttertoo1s  
       2020 年 9 月 22 日
    我觉得做不到 24 小时监控,没有厂家知道用户买回去会怎么使用,全部全程打开语音识别成本太高了,之前有做语言识别的项目,百度和阿里的语言识别都挺贵的,
    Pandroid
        58
    Pandroid  
       2020 年 9 月 22 日
    @diegozhu 语音交互的唤醒词本来就是离线的啊,你不知道吗?
    lovecy
        59
    lovecy  
       2020 年 9 月 22 日
    @katana97 #13 +1,买这种东西,不就是默认会被收集数据么?你要相信大公司不会害你,就心安理得的用,隐私换遍历哈哈哈哈哈
    souths
        60
    souths  
       2020 年 9 月 22 日
    楼主用什么工具
    Tyuans
        61
    Tyuans  
       2020 年 9 月 22 日
    反正我不用
    katana97
        62
    katana97  
    OP
       2020 年 9 月 22 日
    @souths
    @Osk
    华硕路由器后台自带的
    banmuyutian
        63
    banmuyutian  
       2020 年 9 月 22 日
    那么国内有哪些好用的非国产语音助手吗
    qq515391365
        64
    qq515391365  
       2020 年 9 月 22 日
    是的,小米窃取了你的录音,并传到了他们的服务器[/认真脸].
    liukanshan
        65
    liukanshan  
       2020 年 9 月 22 日
    回去把天猫精灵砸了
    adrianXu
        66
    adrianXu  
       2020 年 9 月 22 日
    7 个钟头传 1.7 个 G 音箱的硬盘也没有 1 个 G 大吧
    cyspy
        67
    cyspy  
       2020 年 9 月 22 日 via Android
    国内不知道,国外不仅上传还有真人听,只是廉价劳动力不知道说话人是谁而已
    Bantes
        68
    Bantes  
       2020 年 9 月 22 日
    实话,只是传服务器去做关键词分析而已。大数据时代了,每个人都标签化了。
    glfpes
        69
    glfpes  
       2020 年 9 月 22 日
    智能靠的就是数据,有多少数据就有多少智能。

    人工神经网络和神经系统的差距还是巨大的,感觉从原理上就是不通的两条路。
    Maskeney
        70
    Maskeney  
       2020 年 9 月 22 日
    什么叫偷偷?楼主去看看用户协议先?
    Dvel
        71
    Dvel  
       2020 年 9 月 22 日
    自从几年前小米路由器在我使用时自动升级,导致我断网 5 分钟,购买小米产品时都会琢磨琢磨。
    mcone
        72
    mcone  
       2020 年 9 月 22 日
    为什么有人会同时有“用着所谓智能音箱”和“担心自己的隐私”两种属性……

    我之前还以为小 ai 啊小 du 啊小 mao 啊的用户都是自愿用自己的隐私换“智能”的……
    propc
        73
    propc  
       2020 年 9 月 22 日
    什么叫偷偷?楼主去看看用户协议先! +10086 手动狗头
    ISVStar
        74
    ISVStar  
       2020 年 9 月 22 日
    天猫精灵 6 天上传流量 560 kB 。没唤醒过,不过看起来没问题。
    iamsk
        75
    iamsk  
       2020 年 9 月 22 日
    终于有人分析了
    supercaizehua
        76
    supercaizehua  
       2020 年 9 月 22 日
    抓包分析一下啊
    azev
        77
    azev  
       2020 年 9 月 22 日
    反正这个所谓的智能音箱 我是不用 京东去年送了个还在包装盒里
    wyfyw
        78
    wyfyw  
       2020 年 9 月 22 日
    有可能是上传固件升级包(固件应该包含一个训练好的网络),现在 Windows 更新不也是像 p2p 一样从本地网络上传下载(可以关闭,刚装系统两天,到关的时候,里面显示上传了 3GB 多)

    如果是上传语音,为啥都选择半夜上传。半夜可能是自动升级之类的。
    wyfyw
        79
    wyfyw  
       2020 年 9 月 22 日
    独居+看视频带耳机,会发现一天讲的话特别少,真的。
    wyfyw
        80
    wyfyw  
       2020 年 9 月 22 日
    用过 Google Mini,在 myactivity.google.com 里,我两年前的互动音频还能听到。
    mokevip
        81
    mokevip  
       2020 年 9 月 22 日
    mokevip
        82
    mokevip  
       2020 年 9 月 22 日
    我的小爱音响还好吧,半个月上传 83Mb,平时也就问问天气啥的。
    不知道楼主是因为啥
    janxin
        83
    janxin  
       2020 年 9 月 23 日
    国产智能音箱是这样的…
    SZP1206
        84
    SZP1206  
       2020 年 9 月 23 日 via iPhone
    @namelosw Siri 也有
    SZP1206
        85
    SZP1206  
       2020 年 9 月 23 日 via iPhone
    @banmuyutian Sonos? 或者海淘。
    594duck
        86
    594duck  
       2020 年 9 月 23 日
    真正的勇士就是敢于将偷窥者放在自己最安全的地方
    meetyuan
        87
    meetyuan  
       2020 年 9 月 23 日 via iPhone
    看完了回答,我感觉好多洗地的
    jerryrib
        88
    jerryrib  
       2020 年 9 月 23 日
    有没有不知道,但是李开复说过:曾在早期帮助旷视科技公司找了包括美图和蚂蚁金服等合作伙伴,让他们拿到了大量的人脸数据
    elfive
        89
    elfive  
       2020 年 9 月 23 日 via iPhone
    https://i.loli.net/2020/09/23/mRcQCEqVesadJr7.jpg
    HomePod 每天回去会听 10 到 15 分钟歌,7 天上传下载一共 470M,平常 Hey, Siri 重度使用。
    hysys32
        90
    hysys32  
       2020 年 9 月 23 日 via iPhone
    @iblessyou 修改为澳大利亚试试
    lithiumii
        91
    lithiumii  
       2020 年 9 月 23 日 via Android   1
    明确告诉你小米音箱是上传的,面试过一个小米出来的人
    DaRenCC
        92
    DaRenCC  
       2020 年 9 月 23 日
    国产肯定是上传的,上次某猫精灵发神经,给我播放了很多奇怪的录音,可以肯定是其他用户的录音,真刺激!
    ryansvn
        93
    ryansvn  
       2020 年 9 月 23 日
    不上传数据怎么分析?不分析怎么知道你说的是啥?不知道你说的是啥,怎么给你回应?
    ladychili
        94
    ladychili  
       2020 年 9 月 23 日
    @DaRenCC #92 艹 这也太恐怖了吧
    NumberB
        96
    NumberB  
       2020 年 9 月 23 日
    @zhuangku556 国外品牌收集数据就不算收集呗。。
    zhuangku556
        97
    zhuangku556  
       2020 年 9 月 23 日
    @NumberB 也不要用啊,什么智能家居,物联网,车联网,被人知道你每天出行路程、吃喝拉撒时间,真的不会觉得难受??
    woyaojizhu8
        98
    woyaojizhu8  
       2020 年 9 月 23 日
    你就当家里住了个保姆呗,把它当真人对待。要说点不能让雷军听到的东西的时候就关了它,如果它没有关机功能,那就扔了吧。
    Howard2000
        99
    Howard2000  
       2020 年 9 月 24 日 via Android
    不会是被劫持当肉鸡做 DDoS 或 CC 攻击了吧
    Hermann
        100
    Hermann  
       2020 年 9 月 24 日
    我也特意到路由器查了一下
    小爱触屏音响,最大的用处就是语音控制开关空调电视等

    9.1-9.24
    小爱触屏音响
    下载:63.49MB
    上传:12.88MB

    Google Home Mini
    下载:26.06MB
    上传:29.32MB
    1  2  
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     846 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 31ms UTC 21:39 PVG 05:39 LAX 14:39 JFK 17:39
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86