目前用 199+kimi code 的 api ,可以用 openclaw ,但是在 openclaw 想在 discord 发消息识别图片,就没成功
不知有没有大佬知道这个
不知有没有大佬知道这个

1 yukinotech Mar 4 问个问题,楼主有付费过 codex 或者 claude code 吗?其实这些编程 agent 的模型也是能支持多模态的,当然价格偏贵。想知道楼主用 openclaw 识别图片是什么应用场景,比如提取图片的文案还是去水印? |
2 HxmGG Mar 4 不知道你为啥不行,我用 telegram 使用的也是 Kim code 199 订阅,视觉功能是正常的 |
4 27 OP @yukinotech 我有用 claude code ,openclaw 识别图片是什么应用场景 -- 比如发一个截图提取文本的场景,让龙虾知道截图上说了什么 |
6 nazhenhuiyi294 Mar 5 能,kimi 是自带多模态的,但是 kimi 比较菜 |