Claude 3 Haiku 已经可用 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
neteroster
V2EX    OpenAI

Claude 3 Haiku 已经可用

  •  
  •   neteroster 2024-03-15 11:21:23 +08:00 3668 次点击
    这是一个创建于 664 天前的主题,其中的信息可能已经有所发展或是发生改变。

    前些天,Anthropic 宣布发布 Claude 3 系列模型,包含 Opus (大号),Sonnet (中号)以及 Haiku (小号)三大模型。发布时,只有 Opus 和 Sonnet 立即可用。

    根据 Chatbot Arena[1] 的统计,Opus 当前已经在 95% 置信区间内与 penAI 当前最强模型 GPT4-Turbo 打成平手; Sonnet 也超越了老款 GPT4-0314 与 GPT4-0613 。

    根据个人体验,以及在 X ,Telegram 群组与其他一些来源收集到的体验信息,Opus 在代码能力普遍被认为相对 GPT4-Turbo 具有一定优势。

    昨天,Haiku 正式可用,具有如下主要特点:

    1. 便宜。输出输出分别:0.25$/1.25$ 每百万 Tokens 。相比之下,gpt-3.5-turbo 0.5$/1.5$ 每百万 Tokens 。
    2. 200K Tokens 上下文窗口,远超 gpt-3.5-turbo( 16K )。(单次输出仍然限制为 4K Tokens )
    3. 支持图片输入。
    4. 在各项基准测试中均(显著)领先 gpt-3.5-turbo
    5. 非常快!

    同样地,基于个人体验以及身边的统计学,Haiku 确实表现出了很好的综合能力,在大部分需求中可以替代 GPT 3.5 。

    令我印象最深刻的是,它的识图能力很好。要求其充当 OCR 工具,对中文文本与数学公式的识别准确率远超 gpt-4-vision-preview。除了一些不常见的汉字容易识别出错之外,其余部分都不错。(用过 GPT4V 的应该知道那玩意识别中文烂成啥样)

    [1] Chatbot Arena 基于互联网用户盲测,对模型打分排名,相对贴近实际应用,因而有一定实际参考价值。

    另外,个人角度上,也希望大家能多关注非 OpenAI 的大语言模型,以及各种开源模型,这对这一领域的健康持续发展也是很重要的。

    10 条回复    2024-03-16 05:14:58 +08:00
    neteroster
        1
    neteroster  
    OP
       2024-03-15 11:34:14 +08:00
    这里有一个免费的测试链接(不过没法发图): https://labs.perplexity.ai/
    右下角改为 claude-3-haiku 即可。
    ErYiii
        2
    ErYiii  
       2024-03-15 12:26:43 +08:00
    有没有 Claude 分流规则
    natsunoshion
        3
    natsunoshion  
       2024-03-15 12:37:45 +08:00 via iPhone
    claude 官网老是封我号,不知道什么原因
    Noicdi
        4
    Noicdi  
       2024-03-15 13:10:04 +08:00
    自 claude3 出来我就在用 Sonnet ,不知道是不是每日限额还是啥的,感觉上比 GPT 3.5 好用
    chitanda
        5
    chitanda  
       2024-03-15 13:38:57 +08:00
    Sonnet 确实好用,中文读起来很舒服,gpt4 的中文,味儿太浓了。Claude pro 不知道能不能用国内银行的 visa 开通,怕被封一直没试过
    iyaozhen
        6
    iyaozhen  
       2024-03-15 13:59:33 +08:00
    poe 上的 Sonnet 感觉已经够用了,已经抛弃 GPT 3.5 了
    jetttt
        7
    jetttt  
       2024-03-15 14:25:48 +08:00
    RichardChou
        9
    RichardChou  
       2024-03-15 20:41:14 +08:00
    我也感觉 Claude3 比 GPT 强,不过 Claude 条数比较少,封号又严重
    Contextualist
        10
    Contextualist  
       2024-03-16 05:14:58 +08:00   1
    我的某个创业朋友表示已经把主要业务逻辑从 GPT-4-Turbo 切换到 Claude 3 Opus 了,说是 Opus 在逻辑推理和遵循指令上有明显优势。这让我对 Claude 仅擅长行文修辞的老印象有所改变了。
    经过了之前的低迷期,Anthropic 似乎又支棱起来了啊
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5569 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 30ms UTC 02:48 PVG 10:48 LAX 18:48 JFK 21:48
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86