
先说结论:大概 1~2 年之后,语音输入在移动设备上将会成为主流的输入方式。文字输入基本被淘汰,就跟现在基本没有人会用手写输入一样。
为什么?因为效率。
一个操作熟练的一般人大概每分钟能打 80~100 个汉字,人的说话速度大概是每分钟 160~240 个汉字。
现在 AI 语音输入法可以识别得非常快,非常准确,基本上可以跟上说话的速度。比如说我写的这一段,用的是豆包的语音输入(利益不相关,纯佩服),一个错别字都没有改过(最多是修改一下标点符号。)甚至一些很生僻的词也能识别出来。
当然,随着这个预测的出现,另外一个是谁能把握到这个语音输入的机会(包括软件和硬件),谁可能就会成为未来输入的统领者。这个预测的一个很大的变数是 AI 时代语音输入法门槛会比较低,做一个九十分的语音输入应该都不是一个很复杂且很费劲的事情。比的是谁能做到 99 分。
你觉得呢?
看到很多留言让我想到 慈禧第一次看见汽车如何评价:跑这么快要吃很多草吧
慢慢来吧,时间会说明一切
一点点小建议:AI 时代,拿3个月之前的东西来说事儿可能都是脱钩的,keep your mind open, keep up and catch up
1 opengps 1 月 27 日 我都不爱说话,让我用语音输入? |
2 lqy2575395 1 月 27 日 不太可能,一天本来就打不了几个字,高频打字的场景也就上班时间,整个办公室都在语音输入,不得不跟菜市场一样 |
3 shadowyue 1 月 27 日 嗓子:我耐久度比手低 |
4 287854442 OP @opengps 不爱说话是个好习惯。 @lqy2575395 没事,所以说是个预测嘛。如果大家都觉得个必然趋势,那我也就没有预测的必要了。 其实说话声音不一定很大,窃窃私语都已经完全够使用了。而且我觉得这个不是个问题。大家都用的时候,就都不奇怪了。想想口罩. |
5 Krylo 1 月 27 日 via iPhone 用嘴表达自己的即时思维,其实有难度。 |
6 night98 1 月 27 日 输入法这玩意我只信任本地模式 |
7 loading 1 月 27 日 via Android 冷知识:大部分输入法按住空格就是语音输入。 能不能别发语音。 |
9 loading 1 月 27 日 via Android 我觉得 op 不知道手机输入法直接就能语音转文字,不用去豆包的。这玩意已经出现很多年了。 |
10 ice000 1 月 27 日 语音相当于广播....... |
12 shortawn 1 月 27 日 不可能。语音输入法的保密性为零,仅凭这一点,绝不可能成为主流。除非什么时候可以发展到仅识别唇形而不采集声音就能完成输入。 |
13 jjianwen68 1 月 27 日 现在法庭上类似书记员的职位淘汰了吗,以及其他类似场景 |
14 liu731 PRO 其实打字有一个优势,就是高密度、快速校验要表达意思。在发送前核对 0.5s 就行 |
15 287854442 OP @loading 知道的,之前苹果自带输入法,微信输入法什么的,我也已经用了很久了,但是它们准确率不太高。有一半的情况都需要再手动改。但是豆包输入法我试用下来基本上是 20 次需要改一次,觉得是可以到一个日常可以使用的级别。 |
16 tetora 1 月 27 日 意念(默读)输入 |
17 dushixiang 1 月 27 日 你的字体怎么有点特殊? |
18 Building 1 月 27 日 罗永浩给你点了个赞 |
19 287854442 OP @shortawn 所以说是个预测,可以等等看,至少在移动设备上,我感觉这个预测的概率还挺高的。 @jjianwen68 我觉得这不是同一个问题。针对你这个问题,我觉得是录像和录音可以完美取代书记员这个职位。 @liu731 校验本身都是要做的。在不出错的情况下还好,出错的情况下,就需要改了。目前输入法的准确率,我觉得都还差一些。 |
20 287854442 OP |
21 lneoi 1 月 27 日 不用语音输入,微信的发送语音就是这领域的代表。看看现在是打字的多还是发语音的多就知道了 |
22 evill 1 月 27 日 ”文字输入基本被淘汰“ 给你一些场景,公共场合比如地铁、公交、办公室 这些场合都不适合语音 |
23 caazshadow 1 月 27 日 via Android 1980 年代的科幻片已经预测过了 |
24 Govin 1 月 27 日 微信语音我几乎不用,跟长辈聊天都是打字的,你跟我说要成为绝对主流? |
25 IIce 1 月 27 日 打字打错了能删除,说错了咋删除呢 |
26 evill 1 月 27 日 还有一个问题,语音转文字就是纯文字 而手打文字会有表情符号、谐音梗、表情包等,这些语音转文字代替不了 |
27 Sawyerhou 1 月 27 日 一两年之内估计比较难,有生之年有可能,不过应该也是个过渡形态,终极形态应该是脑机接口,意识流输入。 |
28 MoonShot 1 月 27 日 语音只能说是辅助输入,最终极的交互还是要到脑机层面 |
29 guqikang 1 月 27 日 “小声点,你吵到我用 TNT 了!” |
30 Gilfoyle26 1 月 27 日 |
31 dawee2y 1 月 27 日 招笑预测 |
32 7gugu 1 月 27 日 确实,特别是用过豆包之后就让我意识到这个可能了。豆包对于中英文数字混合识别的能力,非常强大,很多专业术语可以直接说,豆包都能够正确识别出来。而且分词能力也很强大,能准确的识别语气词和正文,现阶段豆包输入法已经有一部分的功力了。 |
33 renmu 1 月 27 日 via Android 老罗领先世界十年! |
34 shaozelin030405 1 月 27 日 想多了,纸质媒体到现在还没死呢。微信语音都多少年了,你是 gg 还是 mm ? |
35 wu67 1 月 27 日 爱不爱说话是一个问题. 在公共场所说话也是个问题. 有些东西合不合适、内容敏感与否... 在办公室同上... |
36 stinkytofux 1 月 27 日 语音输入法至少已经有十几年的历史了, 最早讯飞就是专门做这个的. 而且现在所有输入法都带语音输入, 甚至 IOS 的右下角常驻语音输入按钮. 跟现在的 AI 根本没有任何关系. 这玩意成不了绝对主流, 也可以说早就成为主流输入方式之一了. 不爱用的人不会用, 爱用的人早就用上了. |
37 location123 1 月 27 日 单纯 vibe coding 或者讨论需求代码 来说 我喜欢语音输入 描述一个需求的时候 我打字只会打一点 剩下让 ai 猜 而语音输入我能说的很详细 |
38 cmdOptionKana 1 月 27 日 via Android 一般人独处的时间不够多,不足以形成语音输入的习惯。 |
39 bruce0 1 月 27 日 还好你限定场景是移动端,要不然我不敢想,每天公司一群人在朗读代码是什么场面 int main() { ...... return 0; } 朗读出来, "因他, 空格, 们, 左括号,有括号,座花括号,..... 瑞 ten 零,分号,右花括号" |
40 sudodo 1 月 27 日 楼主确实听大胆的 |
41 CaptainD 1 月 27 日 绝无可能,最主要的原因是语音效率远低于文字 如果语音的效率更高,那么播客类 app 应该常年是 app store 下载前几,但显然是图文和视频,小红书、抖音、YouTube 就是几个现实例子 视频的效率其实比较低,但胜在简单,而文字,尤其是图文结合效率远大于语音和视频 |
42 DigitaIOcean 1 月 27 日 我语音输入占比 50% |
43 NakeSnail 1 月 27 日 我也是这么认为,至少会需要新的输入方式了,vibe coding 多了就感觉打字也很累 |
45 287854442 OP |
46 Muniesa 1 月 27 日 via Android 正在感冒的我感觉不大行 |
47 hahiru 1 月 27 日 你尝试一下就知道了。输入文字我可以斟词酌句,语音输入是什么情况? 额,这个,然后么,……,反正就,然后吧,卧槽,哎不对,那家伙………………………… 弄成口语化文字的话,除非大模型能准确转译口语为书面语。 而且我自己打错字了我可以忍,因为是我马虎了。你让我回过头检查 AI 有没有理解错误或者打错字,那我不能忍。我还不如自己打字。 |
48 HotieCutie 1 月 27 日 绝对不会是主流,除非大家都不会打字了。打字是可以组织语言的,可以随时删除,但是语音不行,说错一点就得重新来 |
49 zhoiiiii 1 月 27 日 还真别说,我家里现在除了我,发微信都喜欢语音转文字 |
51 287854442 OP ======================= ======================= ======================= ======================= |
52 287854442 OP 这里说的不是 [发语音] ======================= ======================= ======================= ======================= |
53 jjwjiang 1 月 27 日 典型的码农思维想产品,你随便找个上班的人问问,他一天有多少时间可以放肆的说出自己想打出的字? |
54 287854442 OP |
56 zerovoid 1 月 27 日 语音输入早就有了,我记得当年锤子手机就有一个什么语音的功能,影响语音输入的不是识别准确率,而是使用场景,你在公司和家里也用语音输入吗,那不得被人直接轰出去。 |
57 xFrye 1 月 27 日 嘘,吵到我用 tnt 了 |
58 ethusdt 1 月 27 日 跑个题,你这个主题内容和附言字体为什么和其他的(帖)不一样? |
59 YLGG 1 月 27 日 公共场合不适合语音 这就注定不能成为主流 |
60 adimn 1 月 27 日 还是喜欢打字, 因为打字的空余我会想后面该说的话 写代码的人打字快的是不是比打字慢的技术高一样 |
61 @ethusdt 我也想问,为啥这个帖子的文字是宋体。。。 |
62 dajj 1 月 27 日 费嗓子,你能一天说 8 小时吗,加班的时候说 10 小时 |
63 fionasit007 1 月 27 日 总结了一下,这么多问题,op 就没想过吗,还预测 1 ,正确率不可能百分百,中间出错修改成本比手写大; 2 ,语音识别没人的个性,发送其他非常规文字(谐音梗表情包图片之类的),不喜欢加标点符号,加各种标点符号之类的; 3 ,有的文字只会写不会读(现在输入法支持你认一半,会把这个字放进错误拼音里),还有单词也是只会拼不会读; 4 ,用手写和用口读人的表达不一样,一般手写更加完整更好的表达输出人的意图; 5 ,大多数环境语言输入不方便; 6 ,安全与隐私风险和高精度肯定需要网络; |
64 kfpenn 1 月 27 日 你说的是 TNT 吗? |
65 thealert 1 月 27 日 不如相信 脑机接口 |
66 kaishi123 1 月 27 日 反正我一个人或者开车的时候,回微信都是语音转文字。只不过都是最基础的语音识别,没有试过 AI 修改或者润色。 |
67 doruison 1 月 27 日 不可能! 公共场合你想下有些化方便说吗 还有就是,楼上说的思维表达问题,非要书面不可 |
68 WuSiYu 1 月 27 日 没隐私,还吵,不好编辑,全是缺点 |
69 helloeather 1 月 27 日 via iPhone 再高端点,直接读取大脑的输出 |
70 wangsd 1 月 27 日 我感觉不太行,语言输出太快了,大脑来不及思考,打字可以边打边思考。 |
71 cfer 1 月 27 日 未来肯定是脑机接口或者更先进的头戴外设之类的。语音就算了吧,打字都能打错更别说语音了。 |
72 jonty 1 月 27 日 手写输入>语音消息>语音输入 |
73 lizongwu 1 月 27 日 现在的人机交互受限于人的感官,要么视觉,要么听觉,随便乱猜也能 50%概率蒙对。下一次革命性的人机交互肯定是 neuralink 这种,绕过感官直接通过神经信号实现人机交互(拿好你的 tsla )。再说了,输入法就算做上天了又能怎么样 |
74 nightlight9 1 月 27 日 基本同意,豆包语音输入法已经很强了。差不多日常场景 30%会用语音输入 比如我微信聊天经常都是用豆包语音输入文字。 语音 --> 口语 但专业性输出还是得 100%靠打字、代码、文章、文档等。 不过这些应该也不是什么问题,AI 以后应该可以一键把口语化的东西转换成专业性的东西。 语音 --> 口语 --> 专业性输出 |
75 legendBro 1 月 27 日 楼主一定是公共场合刷抖音开外放的那种人 |
76 milkpuff 1 月 27 日 罗永浩时代的语音输入就已经非常准确可用,现在十来年了还没有成为主流。 |
78 JoeJoeJoe PRO @dushixiang 因为我这个节点开了衬线字体样式 |
79 vicalloy 1 月 27 日 和 AI 交互的时候用语音输入确实挺方便的。 不过很多时候不需要这么快的输入速度,用键盘输入,给自己留点思考的时间。 |
80 craftsmanship 1 月 27 日 via Android 我最讨厌的就是微信语音 从来不用 也讨厌所有没有特殊情况就给我发语音的人 |
81 11000111010 1 月 27 日 要说有可能的未来十到二十年或者更久之后 我倒觉得脑机接口有重大突破的话,让人类意识入网 可以通过意识输入文字这种。那个时候可能是主流了 |
82 monkey110 1 月 27 日 via Android 所以安卓语音输入法最准的是哪个? |
83 nancyii 1 月 27 日 上班时候跟老婆聊天语音输入合适吗 |
84 Hudiebbk 1 月 27 日 s 手机端我现在基本都是语音转文字了,电脑端办公室不好一直逼逼 |
85 Hyxiao 1 月 27 日 我还是挺期待语音输入对接 AI Coding 的场景的,虽然现在 cursor 也支持,但只是语音输入识别,而并非真正意义上的即时输入和响应,什么时候可以做到一边说话,代码一边改动,页面一边变化,可以随时打断调整,这体验真的直接拉满了 |
86 june4 1 月 27 日 我就喜欢用语音输入。不过都 ai 时代了,一个能打的都没有。 iOS 自带是垃圾,且 iOS 对第三方语音输入非常不友好。另外目前的语音输入似乎并没有上下文智能。总之改进的余地还是非常大的。 |
87 GodIsJasonBourne 1 月 27 日 朕的黄金铲铲呢?朕要去挑大粪糊醒楼主了 |
88 Dispatcher 1 月 27 日 以后再看到楼主这样逼逼叨叨的,直接一巴掌抽过去。 为什么我相信文字的力量,而不是语音(包括转文字)的力量?因为,楼主这样的人,只单纯关注速度和识别率。 实际上,这是低智能群体的最喜欢的东西,典型的华为思维、小米思维。 抛开隐私,扰民等等索引因素,我只想说,表达速度快,真的就是正确吗? 输入速度快,有什么意义呢?不经思考,脱口而出,只能是废话连篇。 重视文字输入速度的,估计只有速记员。普通一年打字也就那几十万,平均下来一分钟,不论谁一百还是一百五的输入速度,有区别吗?非得你语音输入,二百五的输入速度,显着你了是吧? 除了对线骂街,我是想不出超快速输入文字有何用? |
89 k2g 1 月 27 日 有些人想到的东西可以直接通过语言说出来,但是有些人需要边想边组织成文字才能说出来,这样的话语音输入反而更慢了: 想法 -> 语言 -> 屏幕文字 vs 想法 -> 脑内文字 -> 语言 -> 屏幕文字 |
90 dyxLike 1 月 27 日 只有输入大段句子的时候效率高, 短文本时不如手打 |
91 Awes0me 1 月 27 日 你这个字体好难看啊,怎么弄的 |
92 evan9527 1 月 27 日 你一定知道 QWERTY 键盘的设计初衷确实不是为了追求打字速度,它的诞生是为了“慢”下来。从而降低打字速度,减少机械故障。 如果用上语音输入,这种“故障”就会出现在人脑里,语音输入是一种连续线性的输出,很多人把话说顺畅的能力都没有。语音输入反复修改反而极大的降低效率。 |
93 287854442 OP @Dispatcher 表达想法,不管你赞同不赞同,我觉得都没问题,没必要骂骂咧咧的,上升到人身攻击吧?啥叫“逼逼叨叨”的?啥叫“低智能群体了”?这些还都能忍,竟然“小米思维” 这个忍不了 (哈哈哈哈 @JoeJoeJoe 这里有个有人身攻击的。 |
94 MrLeion 1 月 27 日 开会和地铁上怎么破? |
96 287854442 OP |
98 287854442 OP |
100 JoeJoeJoe PRO |