指挥 AI 做了一个 LLM API 网关 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
midraos
V2EX    程序员

指挥 AI 做了一个 LLM API 网关

  • /li>  
  •   midraos 22 小时 27 分钟前 1122 次点击

    现在只想到了路由配置、APIKEY 配置、token 统计与限制、限速与并发控制、自动化的封禁规则和监控。

    还有哪些功能能够添加进去?

    route

    Token 统计 token 统计

    14 条回复    2026-03-11 00:19:42 +08:00
    cryptovae
        1
    cryptovae  
       22 小时 8 分钟前
    我缓缓打出了一个?

    为什么我不直接用 oneapi newapi
    midraos
        2
    midraos  
    OP
       22 小时 4 分钟前
    @cryptovae #1 为了满足自己的需求,轻量化、低资源占用与保护真实的 apikey ;
    heimoshuiyu
        3
    heimoshuiyu  
       21 小时 34 分钟前 via Android
    负载均衡,透明重试,首字符超时,缓存识别,解码速度监控,模型别名,http 连接复用,绕过风控的多 key 轮训网络代理
    meeop
        4
    meeop  
       20 小时 56 分钟前
    我倒是有建议:
    1 实现极高可靠性,可靠到你个人和服务器都被物理封禁,服务依然可靠稳定可用,换句话说可保证无视各家 api 地域政策保证可用性
    2 实现 api 供应商的收款支付能力,这样就能构成一个 api 供给和采购的市场
    midraos
        5
    midraos  
    OP
       20 小时 8 分钟前   1
    @heimoshuiyu #3 解码速度监控和 http 连接复用加进来很不错。
    我设计的目标是一个 LLM api 特化的 Nginx 透明代理类型的网关,用于保护与隐藏真实的 apikey ,网关中会拦截 LLM api 中的 apikey 、X-Forwarded-For 和 UA ,其他的都直接进行透传了,所以像重试、首字符超时这些都扔给使用 api 的 client 了;
    加入负载均衡可能会导致 LLM 服务商的输入缓存失效,就没做这个功能了
    fhy1994
        6
    fhy1994  
       19 小时 4 分钟前
    我前一段也用 rust 的 Tauri 做了一个:
    https://github.com/userfhy/SSLProxyManager-Tauri
    fhy1994
        7
    fhy1994  
       18 小时 37 分钟前
    @fhy1994 不好意思 没看仔细 我做的是一个通用的代理管理工具 O(∩_∩)O
    HFX3389
        8
    HFX3389  
       18 小时 5 分钟前
    这也是一个聚合层吗?现在好多聚合层了 metapi 、octopus 、Aether 、axonhub 都是,可以让 AI 参考他们的功能嘛~
    beyondstars
        9
    beyondstars  
       17 小时 56 分钟前   1
    当作一个练手项目我觉得是没问题的,造轮子的学习意义大于实用意义,市面上的确有成熟的方案前面的回复已经有人说了。
    midraos
        10
    midraos  
    OP
       17 小时 29 分钟前
    @HFX3389 #8 可以看作是 axonhub 这类平台的劣化版,好听点叫轻量化,设计目标就是一个轻量级的透明反向代理,针对 LLM 服务进行了特化定制,确实可以借鉴学习这几个项目中对边界的划分
    midraos
        11
    midraos  
    OP
       16 小时 54 分钟前
    @beyondstars #9 和市面上的成熟的平台化产品的叙事角度不太一样,我的设计目标是一个轻量化的透明反向代理,服务跑起来后只占用 20M Ram 和 0.5%的 Cpu ,不算是一个完全自嗨的玩具
    qwer666df
        12
    qwer666df  
       16 小时 46 分钟前
    好奇这个后台也是 AI 做的吗,包含登录注册吗?最近想做一个新的管理后台,需要从老的移植到新的,包括登录/权限,感觉 AI 做不了啊,
    hanguofu
        13
    hanguofu  
       10 小时 52 分钟前
    有意思~ 我可以试用一下吗 ?
    daimaosix
        14
    daimaosix  
       9 小时 14 分钟前 via Android
    @qwer666df 肯定可以啊
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5636 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 01:34 PVG 09:34 LAX 18:34 JFK 21:34
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86