AI 关于字符串回答总是错误的问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
coderMonkey
V2EX    OpenAI

AI 关于字符串回答总是错误的问题

  •  
  •   coderMonkey 2024-05-11 17:25:25 +08:00 2227 次点击
    这是一个创建于 585 天前的主题,其中的信息可能已经有所发展或是发生改变。
    提问 AI ,waterTemperature 总共多少字符,AI 总是会发生错误,换了几个平台都这样

    17 条回复    2024-05-13 10:02:11 +08:00
    chris850527
        1
    chris850527  
       2024-05-11 17:36:51 +08:00
    用了 claude 没问题,你可以试试
    AoEiuV020JP
        2
    AoEiuV020JP  
       2024-05-11 17:38:18 +08:00
    ai 睁着眼镜说瞎话的问题还是没解决,目前依然算是语言模型,只能保证语言正确,
    zsh2517
        3
    zsh2517  
       2024-05-11 18:42:22 +08:00
    @chris850527 顺便测试了一下 poe.com 上的 GPT4 ,也没有问题。
    matrix1010
        4
    matrix1010  
       2024-05-11 20:37:45 +08:00
    你要知道 LLM 是没有智能的, 更不可能去进行准确数学计算。简单的统计 AI 也许能答对, 但稍微复杂点就完全不行了。比如这个:
    how many "r" and "a" in "strawberry"

    Gemini 1.5 Pro 的回答

    Let's count:
    R: There is one "r" in "strawberry".
    A: There are two "a"s in "strawberry".
    yorhaha123
        5
    yorhaha123  
       2024-05-11 22:18:59 +08:00   2
    Procumbens
        6
    Procumbens  
       2024-05-11 22:38:37 +08:00   1
    你要知道在语言模型里看到的不是词 而是 token...
    mightybruce
        7
    mightybruce  
       2024-05-11 22:43:14 +08:00
    出这种蠢的问题,意义何在?为了显示比 AI 聪明?
    这个调用一下函数库就能得到结果,还不如让 AI agent 根据自然语言生成相应的函数调用回答准确。
    R4rvZ6agNVWr56V0
        9
    R4rvZ6agNVWr56V0  
       2024-05-11 23:18:55 +08:00
    @chris850527 Claude 3 Opus 不行,回答也是错误
    R4rvZ6agNVWr56V0
        10
    R4rvZ6agNVWr56V0  
       2024-05-11 23:19:23 +08:00
    我的测试题目是 #4 提供的这道题
    Solix
        11
    Solix  
       2024-05-11 23:19:48 +08:00 via iPhone
    这个写个脚本就行了吧,没必要问大模型
    taotaodaddy
        12
    taotaodaddy  
       2024-05-11 23:49:21 +08:00
    OP 和 4#的问题,poe 上的 GPT4 都能做对,是不是生成并调用了 python 程序做对的呢?
    billccn
        13
    billccn  
       2024-05-11 23:58:33 +08:00
    @taotaodaddy 可能性大,要不然得训练模型记住每个 token 里面多少个字符,还得训练模型做心算。前者好像不值得花这个时间,后者还是个技术难题。
    dayeye2006199
        14
    dayeye2006199  
       2024-05-12 01:42:53 +08:00 via Android
    因为现在主流的 tokenization 是 subword ,没法很好的处理字符串 level 的问题。
    yadam
        15
    yadam  
       2024-05-12 10:45:19 +08:00
    #5 的文章写的很详细, 学习了
    如果 op 的流程里一定依赖这种数长度流程的话, 会不会用 tool calling 可以比较完美的解决?
    Meteora626
        16
    Meteora626  
       2024-05-12 21:18:02 +08:00
    输入是 token ,而且还要切分,现在基本上都是 bpe ,输入文本都不知道被切成啥样了,除非有标识符来标识每个字
    SmiteChow
        17
    SmiteChow  
       2024-05-13 10:02:11 +08:00
    因为目前都是人工智障,别抱太大希望。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5605 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 06:30 PVG 14:30 LAX 22:30 JFK 01:30
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86