Gemini 3 Flash 用着挺香,但想找个更便宜的替代 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
wsbqdyhm
V2EX    程序员

Gemini 3 Flash 用着挺香,但想找个更便宜的替代

  •  
  •   wsbqdyhm 11 小时 23 分钟前 2101 次点击
    最近在折腾 OpenClaw (小龙虾)+ n8n 工作流 做一些自动化任务,现在主要是薅 Google 的 $300 API credit 。

    主力模型用的是 Gemini 3 Flash ,整体体验挺好,速度快、工具调用也稳,基本能顶住日常 workflow 。不过 Gemini 3.1 Pro 有调用限额,所以很多任务还是得靠 Flash 。

    现在的问题是:
    想找一个 性能大致对标 Gemini 3 Flash ,但更有性价比的模型 做备用 / 分流。

    另外我本地也有一张 4090 ,所以也在考虑顺便搞个 本地模型做 fallback ,简单任务或者离线的时候用。

    在各大主流 ai 问了一圈,投票如下:

    云端模型(对标 Gemini 3 Flash )

    Kimi K2.5-K2 ( 4 票)

    DeepSeek R1 / V3.2 ( 1 票)

    本地部署( 4090 )

    DeepSeek-R1-Distill-Qwen-32B ( 4bit )( 3 票)

    GLM-4.7-Flash ( 30B A3B MoE )( 2 票)

    目前的思路大概是:

    主力:Gemini 3 Flash

    云端备用:Kimi / DeepSeek

    本地:跑一个 30B 左右模型兜底

    不过我自己还没实际长期跑过这些组合,所以想听听大家的真实使用经验:

    Kimi K2.5 和 DeepSeek V3 / R1 实际体验怎么样?

    有没有 性价比能接近 Gemini 3 Flash 的模型?

    4090 本地模型现在比较稳的是不是还是 32B 这一档?

    欢迎拍砖,主要想听听长期在用的经验。
    22 条回复    2026-03-12 22:17:59 +08:00
    superkkk
        1
    superkkk  
       11 小时 19 分钟前
    千问 3.5 35B A3B 或者千问 coder next ,这俩还行,但是毕竟免费开源的,24g 显存可能不够
    liu731
        2
    liu731  
    PRO
       11 小时 12 分钟前
    比它聪明的没它快,比它快的没它聪明
    wsbqdyhm
        3
    wsbqdyhm  
    OP
       11 小时 6 分钟前
    @liu731 2.5flash 体验怎么样? 之前用了一下 2.5 pro 弱智一样。
    skyemin
        4
    skyemin  
       11 小时 4 分钟前
    $300 API 现在还送吗
    liu731
        5
    liu731  
    PRO
       11 小时 3 分钟前
    @wsbqdyhm 简单任务(<=5K Token )还不错。复杂任务不行
    wsbqdyhm
        6
    wsbqdyhm  
    OP
       10 小时 54 分钟前
    @skyemin 送的,但有各种限额。用 3.1p 一不小心就 API rate limit reached. Please try again later.
    chungon
        7
    chungon  
       10 小时 54 分钟前
    这个我也没找到替代,国产的试了一圈都没有它好用
    resist
        8
    resist  
       10 小时 45 分钟前
    模型我认为目前好用的就是 gemini 和 chatgpt ,其他的都差点意思
    eGlhb2Jhb2Jhbw
        9
    eGlhb2Jhb2Jhbw  
       10 小时 27 分钟前
    今天试了下本地部署 QWen3.5 35B-A3B 可用度很高,https://pinchbench.com/ 上评分超过了 gemini-3-flash-preview
    FengMubai
        10
    FengMubai  
       10 小时 23 分钟前
    3.1 lite
    v2gba
        11
    v2gba  
       10 小时 19 分钟前
    3 flash 跑一天大概多少花费?
    skyemin
        12
    skyemin  
       10 小时 16 分钟前
    @wsbqdyhm 咋操作呀 可以的话我也弄一下
    HaibaraDP
        13
    HaibaraDP  
       10 小时 8 分钟前
    3.1 lite
    xiafengjieying
        14
    xiafengjieying  
       8 小时 29 分钟前 via iPhone
    3.1pro 有调用 api 么?
    wsbqdyhm
        15
    wsbqdyhm  
    OP
       7 小时 43 分钟前 via iPhone
    @xiafengjieying #14 有 3.1 预览版,250 次一天
    wsbqdyhm
        16
    wsbqdyhm  
    OP
       7 小时 42 分钟前 via iPhone
    @skyemin #12 直接卡验证就行,v 卡双币的好像不行,我用的招行万事达可以,
    wsbqdyhm
        17
    wsbqdyhm  
    OP
       7 小时 42 分钟前 via iPhone
    @eGlhb2Jhb2Jhbw #9 4090 能跑不
    Cusox
        18
    Cusox  
       6 小时 57 分钟前
    $300 大概能用多久
    zyqbit
        19
    zyqbit  
       6 小时 39 分钟前
    @Cusox #18 我记得好像是 90 天有效期
    NakanoAzure
        20
    NakanoAzure  
       4 小时 10 分钟前
    现在还能白嫖 api 吗,是不是多注册几个白嫖就行?
    Deshun
        21
    Deshun  
       3 小时 56 分钟前 via Android
    Dear Developer,
    Our review of your Gemini API activity indicates that your project Agent (id: gen-lang-client-0107) is using Gemini API in a manner that violates both the Gemini API Additional Terms of Service and the broader Google APIs Terms of Service for the Google API you are using. As a result of this violation, we have restricted your access to the corresponding APIs.
    You may respond to this decision by submitting an appeal. Please note that you should be logged in as the project owner to access the appeals page.
    Please take a moment to also review the Google APIs Terms of Service, the Gemini API Additional Terms of Service, and the Generative AI Prohibited Use Policy applicable to Gemini API so that you do not violate our terms and policies in the future.
    Deshun
        22
    Deshun  
       3 小时 55 分钟前 via Android
    @Cusox 一天
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1165 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 18:13 PVG 02:13 LAX 11:13 JFK 14:13
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86