Bard (Gemini Pro)排名已升至第 2 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Davy
V2EX    Google

Bard (Gemini Pro)排名已升至第 2

  •  
  •   Davy 2024-01-27 06:29:04 +08:00 10515 次点击
    这是一个创建于 689 天前的主题,其中的信息可能已经有所发展或是发生改变。
    Bard (Gemini Pro)的 elo 排名已升至第 2 ,仅次于 GTP-4-Turbo ,高于 GTP-4-0314 和 GTP-4-0613 。
    https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard
    43 条回复    2024-01-29 13:58:13 +08:00
    disorientatefree
        1
    disorientatefree  
       2024-01-27 06:41:46 +08:00
    Bard 用起来是不错,不过感觉 Google 应该挺省的

    日常感觉大多数问题都没进 LLM ,一瞬间就出结果了。。。 偶尔小众问题他可能没见过会慢一点才像是 LLM
    dnfQzjPBXtWmML
        2
    dnfQzjPBXtWmML  
       2024-01-27 07:03:35 +08:00
    @disorientatefree 可能只是用的人少,所以每个人分到的算力多
    Canglin
        3
    Canglin  
       2024-01-27 07:24:13 +08:00 via Android
    为啥我问点问题它都是会显示各种 csdn 链接或者图片
    takato
        4
    takato  
       2024-01-27 07:53:39 +08:00
    之前用 Bard 的时候感觉 Bard 的错误率明显高于 ChatGPT 3.5 。
    注意我的感受有一定主观性。
    x52S60GIsMZHtJPN
        5
    x52S60GIsMZHtJPN  
       2024-01-27 08:14:39 +08:00 via iPhone
    GPT 不是 GTP
    disorientatefree
        6
    disorientatefree  
       2024-01-27 08:24:01 +08:00
    @dnfQzjPBXtWmML 是行为很像 cache ,问题打进去一瞬间就一大段
    cyio
        7
    cyio  
       2024-01-27 08:35:20 +08:00
    懂的可以解读下这个评测依据,这个 bard votes 数据低,是不是数据相对不足
    icy37785
        8
    icy37785  
       2024-01-27 09:02:07 +08:00 via iPhone   1
    只能说每个人的使用场景不同,这种排名不能代表实际体验。在我的使用场景下体验 gemini pro 甚至感觉不如 gpt3.5 。真的个体差异还挺大的。
    coffeesun
        9
    coffeesun  
       2024-01-27 10:10:07 +08:00 via Android
    bard 我给常把它问死,chatgpt 较少
    Sosocould
        10
    Sosocould  
       2024-01-27 10:14:36 +08:00 via Android
    gemini pro 非常菜,比如 gpt3.5 ,可能英文下稍好一定
    miyuki
        11
    miyuki  
       2024-01-27 10:55:31 +08:00
    bard 经常问死+1 ,不如 chatgpt 3.5
    miyuki
        12
    miyuki  
       2024-01-27 10:55:59 +08:00
    @miyuki 补充,相同的问题 chatgpt 3.5 能多少给出一些结果,bard 是完全拒绝回答
    s4d
        13
    s4d  
       2024-01-27 11:23:15 +08:00
    bard 没有 iOS app 吗?
    ronman
        14
    ronman  
       2024-01-27 11:27:46+08:00 via iPhone
    但实际体验感觉很垃圾
    Aethyr
        15
    Aethyr  
       2024-01-27 11:34:06 +08:00
    bard 只有企业版才是 Gemini Pro 啊,楼上这些点评的都是用企业版?
    Aethyr
        16
    Aethyr  
       2024-01-27 11:34:31 +08:00
    甚至企业版都是少数企业试用
    Davy
        17
    Davy  
    OP
       2024-01-27 11:34:59 +08:00
    @cyio Bard 是去年 12 月 6 日切换到 Gemini Pro 的,所以只有一个多月的数据。
    Davy
        18
    Davy  
    OP
       2024-01-27 11:36:03 +08:00
    @hcx0 现在 Bard 都是 Gemini Pro 了
    Davy
        19
    Davy  
    OP
       2024-01-27 11:37:31 +08:00
    @coffeesun 问死的时候可以叫他 take a deep breath, you can do that.
    houhaibushihai
        20
    houhaibushihai  
       2024-01-27 11:45:50 +08:00
    就日常编程问题而言(就之前问 stackoverflow 的问题,后来改用 3.5 了,再后来试了 bard ,bard 给的结果还不如 3.5 ,当然我是用中文搜的,英文不知道),我的实际体验 bard 不如 3.5
    XnEnokq9vkvVq4
        21
    XnEnokq9vkvVq4  
       2024-01-27 12:37:53 +08:00 via iPhone
    个人使用(英文对话提问)下来最多可以说略胜 gpt3.5 ,但肯定远逊于 gpt4
    coffeesun
        22
    coffeesun  
       2024-01-27 13:02:47 +08:00
    @Davy #19 反正关于质疑宗教的问题他都不咋回答
    Dragonphy
        23
    Dragonphy  
       2024-01-27 13:04:36 +08:00
    @takato 一样,不太行
    NoOneNoBody
        24
    NoOneNoBody  
       2024-01-27 14:27:50 +08:00
    web 版,bard 不等于 Gemini Pro
    试试用中文和英文问一下它是什么模型,我这里中文回答是 bard ,英文回答是 Gemini Pro
    android app 版我没装
    mingtdlb
        25
    mingtdlb  
       2024-01-27 15:40:40 +08:00
    感觉不如 gpt3.5 ,另外 3.5 和 4 我也用不出差别,都大差不差。3.5 不行的,4 也差不多。
    youmilk
        26
    youmilk  
       2024-01-27 18:20:27 +08:00

    一派胡言
    alading11
        27
    alading11  
       2024-01-27 18:24:10 +08:00
    bard 使用起来明显不如 gpt3.5 ,差的很多
    ronman
        28
    ronman  
       2024-01-27 18:36:35 +08:00 via Android
    @youmilk 笑死 我刚去问他 直接回答:周树人没有打鲁迅。
    hotbaidu
        29
    hotbaidu  
       2024-01-27 18:59:56 +08:00 via Android
    https://poe.com/Gemini-Pro
    在 poe 体验,算在其他额度
    aptupdate
        30
    aptupdate  
       2024-01-27 21:27:12 +08:00 via iPhone
    用 Gemeni Pro 感受就是速度是真的快。
    R4rvZ6agNVWr56V0
        31
    R4rvZ6agNVWr56V0  
       2024-01-27 21:59:23 +08:00
    我用 Gemeni Pro 和 Bard 上直接问这个问题,回答的不一样,发现 Gemeni Pro 是准确的。
    @youmilk
    disorientatefree
        32
    disorientatefree  
       2024-01-28 04:00:21 +08:00
    @mingtdlb 是 4 越来越差了,才出的时候很惊艳。 Bard 也是越来越无视上下文

    个人体感是它们都在试图省钱
    justincnn
        33
    justincnn  
       2024-01-28 08:15:47 +08:00
    @Davy 这个确认么?感觉 bard 还是蛮蠢的
    forgetandnew
        34
    forgetandnew  
       2024-01-28 09:37:49 +08:00 via iPhone
    中文版 bard 就是一坨大便
    privateproxies
        35
    privateproxies  
       2024-01-28 10:59:08 +08:00
    你们可以通过 chatgemini.net 感受一下...
    pendulum
        36
    pendulum  
       2024-01-28 11:37:13 +08:00
    用中文提问 bard 应该不是 gemini pro ,除非用 API
    abersheeran
        37
    abersheeran  
       2024-01-28 12:25:58 +08:00
    Gemini Pro 确实可以的,我为了方便用它,写了三个 BOT ,分别可以在 QQ 群、微信公众号和 Telegram 上用。开哪个方便就直接开了。
    cnbatch
        38
    cnbatch  
       2024-01-28 22:28:09 +08:00
    Bard 同样也是一本正经地胡说八道,最终还不如自己搜索
    sud0day
        39
    sud0day  
       2024-01-29 10:18:53 +08:00
    程序方面的问题,感觉还是 Claude 好用
    KorenKrita
        40
    KorenKrita  
       2024-01-29 11:09:12 +08:00
    @privateproxies 非常难绷
    privateproxies
        41
    privateproxies  
       2024-01-29 11:21:19 +08:00
    @KorenKrita 这 GEMINI PRO API....
    KorenKrita
        42
    KorenKrita  
       2024-01-29 11:41:02 +08:00
    @privateproxies #41 所以说一本正经胡说八道啊 之前还有说自己是文心一言百度的来着我记得 就离谱
    kestrelBright
        43
    kestrelBright  
       2024-01-29 13:58:13 +08:00
    不行啊,蓝牙耳机的问题都不会回答
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2918 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 44ms UTC 14:08 PVG 22:08 LAX 06:08 JFK 09:08
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86