我觉得目前 AI 大模型存在一个最大的问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
godall

我觉得目前 AI 大模型存在一个最大的问题

  •  
  •   godall 8 天前 1640 次点击
    那就是经常不懂装懂,乱说一通。跟吹牛皮的人一样乱话三千。

    难道就不能像搜索引擎一样,查不到的就说没有吗?因为经常把用户带沟里去。
    15 条回复
    shyrock2026
        1
    shyrock2026  
       8 天前
    一年前的模型?
    HarrisonXn
        2
    HarrisonXn  
       8 天前
    用的什么模型。建议开联网搜索和深度思考
    winnerczwx
        3
    winnerczwx  
       8 天前
    模型和模型之间亦有差距
    woodfizky
        4
    woodfizky  
       8 天前   2
    评论区典中典之上来就质疑你用的什么模型
    你需要理解 LLM 的本质是在向量数据库的数据里去计算/预测下一个输出应该是什么。

    那处理某些提问或者问题的时候,数据不够全,但是又有数据的情况,完全可能让 LLM 输出一些他自己也不懂正不正确的东西。
    它自己都不懂正不正确了,又怎么能自纠错呢?又怎么判断是不是找不到东西呢?
    NewYear
        5
    NewYear  
       8 天前
    大模型两大毛病。

    幻觉+健忘。
    bghtyu
        6
    bghtyu  
       8 天前
    现在的模型相比以前好了很多,而且可以联网,我很久没有遇到幻觉的情况了。
    结果前一天问 Gemini pro 一个问题,它非常确定的给了我一个错误的答案,我让它联网搜索,它也嘴硬不改,让我很无语
    wat4me
        7
    wat4me  
       8 天前
    人类都没解决的问题,现在的 LLM 怎么解决,开联网更完犊子,过两年 GEO 越来越多,等着营销号轰炸你的 AI 吧
    2024
        8
    2024  
       8 天前
    现在的大模型都是基于概率进行回答,而且大模型还有核心的记忆能力没有解决,市面基本所有工具都是为了解决记忆力和幻觉产生,比如 skill 和 agent 等,幻觉可以迭代大模型和细化领域得到更高的准确率,但是记忆力能够像人一样"永久"记忆的效果,理论都没有吧?预测下,如果未来没有新的理论,或许未来存储硬件更便宜时,每个会话分配 1T 内存或者硬盘来解决。每个会话随着对话变成,自动分支一个子模型概率文件,自己维护当前会话的知识概率信息,达到模拟真实的人
    godall
        9
    godall  
    OP
       8 天前
    类似一个置信度。

    目前每个模型每个 token 向量计算只是按照最可能的下一个预测,完全不顾下一个预测置信度很低,所以到后面就胡说八道了,我的建议是可以设定一个最低阈值,不行就返回不会。。
    niubilewodev
        10
    niubilewodev  
       8 天前
    @bghtyu Gemini 3 Pro 的老毛病了,你换成 3 Flash 就没这个问题了。
    3 Pro 非常迷信自己的训练信息。
    qiaobeier
        11
    qiaobeier  
       8 天前
    幻觉虽然是 AI 的老大难问题,但是主流 AI 在一般使用场景下基本无感了,除非你去问那种特别绕的问题,比如前端时间流行的洗车啥的。
    zomco
        12
    zomco  
       8 天前
    叫 AI 回答时附带置信度
    llysr1005
        13
    llysr1005  
       8 天前
    兄弟,吸一下 Opus 4.6 ,这个纯度高, 不要再吸免费的模型了。。
    isnullstring
        14
    isnullstring  
       8 天前
    @wat4me 确实,到时候 AI 搜索功能又变成现在的搜索引擎,能用但要人自己甄别
    wgsgyes
        15
    wgsgyes  
       8 天前
    幻觉才是智能、创造的基础。不让 AI 产生幻觉,AI 就是搜索引擎,你直接使用搜索引擎就好。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     885 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 95ms UTC 20:31 PVG 04:31 LAX 13:31 JFK 16:31
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86