
开始读书《大模型 RAG 实战》,经过平台好心人推荐,看了下大模型基础这本书,确实更好一些
要做一个支持 AI review 代码的功能,开发同学提交代码的时候就 review ,同时可以给出优化代码的建议,这种应用的架构要如何设计呢,有人做过或者有知道哪些好的项目参考
最近听广播,很多企业都接入了 deepseek ,而且应用在业务中,想了解下,这些业务是如何快速部署和实施的呢
1 Morriaty 287 天前 第 2 个问题的核心是找出完成的上下文 - 先用 git 工具拉出所有的改动部分 - 再用 IDE 工具拉出改动部分的前后调用链、依赖包 - 最好还有一个类似于 issue 的说明文档:这次改动的背景、目标等 然后定义一个 output format ,丢给 AI 就好了 |
2 hmxxmh 287 天前 https://img.picui.cn/free/2025/03/06/67c905fe4d26e.jpg 问了下大模型,可以在流水线里面加一个吧代码发送给大模型去检查,没有实操过,楼主要是成功了也可以分享一下经验 第三个,很多企业接入都是接入了 api 吧,为了股票,私有化部署成本太高,除了大厂没几个 |
3 jokechen 287 天前 via Android 参考 gerrit 的 ai-code-review plugin 。体验还行,不过需要自己去做一些改造 |
4 jokechen 287 天前 via Android 如果实在自己本地用的小工具的话,我想做个 commit hook 可能更好一些。 |
5 highkay 287 天前 可以参考我写的 https://github.com/highkay/codereview-agent ,基本上是重写了 https://github.com/bestK/gitea-ai-codereview 。最近看到了 patchwork 不错,又准备重写一遍了,https://github.com/highkay/ai-codereview-agent ,其实区别有点大,也是不断的用,不断的总结需求。 |
7 kenshinhu 287 天前 到最后你会放成本方向考虑。。。上述应用落地要么花大钱买好的基础模型用量,要不花大力气优化流程 |
8 puppyxxx OP @hmxxmh 嗯,这个是可以理解的,像医院,政府,金融银行,这些数据敏感性高的,还是要私有化部署的吧,单纯的调用 API ,一些问答类智能助手更适合,看到湖北一家医院很快就全面接入了,我猜是不是某个大厂本地化部署,然后提供数据安全的基础上帮忙训练模型,欢迎多交流 |
13 ohoh 287 天前 你可以用这个全套 https://auto-coder.chat/ |
16 l1905 287 天前 我做够类似的 辅助 codereview , 基于内部 gitlab 1. 配置 webhook 2. 合并特定分支,触发 hook 3. 接收到 hook 请求,获取代码变更信息 4. 将代码变更信息提供给 llm 5. 将 llm 的返回内容,作为代码的评论 6. 点开 gitlab merge request 页面,查看 llm 评论内容 |
17 RockStar 287 天前 “看了下大模型基础这本书,确实更好一些” op 具体是哪本书? |
18 hmxxmh 287 天前 @puppyxxx 对,我们也有做私有化部署,不过参数用的小很多的,满血需要的显卡太多了,今天新出的 qwq-32b 看着效果不错,最主要的是参数小,俩个 4090 差不多可以私有化了 |
21 GreenHand 287 天前 简单的 PE 估计效果一般,需要后训练模型 |
23 highkay 287 天前 @puppyxxx 微信 aGlnaGtheQ==,32B 的话,可以考虑 qwen2.5-32B-coder 或者 r1 蒸馏版本,我用的是 deepseek v3 ,数据安全的话,其实还好,就是发出去一些代码片段,你们自己不要把敏感信息写进去就好了(在 ci 里面做一些 check ,直接终止掉流水线),需要指令遵循,严格来讲 code review 是一个封闭问题。 |
27 OHyn 287 天前 医院接入我认为是大模型+知识库,或者针对领域微调的模型+知识库。 公众号上多一个问诊入口,仅此而已。 甚至有知识库的都算是良心了,可能仅仅是 prompt 而已。不要太高看那些一夜之间接入 deepseek 的企业。真懂得用的,不会等到现在才接入。 |
29 andyskaura 287 天前 |
30 puppyxxx OP @andyskaura 接广告试试 |
31 hewitt29 287 天前 加个链接就是接入了。。别想太多,哈哈 |
32 gegewu0927 287 天前 |
33 andyskaura 287 天前 @puppyxxx #30 不太行,现在就接得有 google 广告,国内用户实在是不值钱,点一次 0.01 ,千次展示 0.2 ,半个月了收益还没有 2 块钱。 |
34 AS4694lAS4808 287 天前 我是 VSCODE +continue + 公司 claude 3.5 ,经常给多个文件作为上下文,每个月快上百刀了,除非有低成本质量又 OK 的模型能用,或者本地有大集群(手上有 8*8*A800 机器,跑 qwen2.5-72B 也不是很快),否则瓶颈就是成本了吧。。不知道有中小客户能接受的了么 |
35 puppyxxx OP @gegewu0927 看了下,接入 openai 方案不太行,代码合规是有要求的 |
36 puppyxxx OP @AS4694lAS4808 所以这个东西感觉还是得用调 api,但是我一直怀疑的是数据安全 |
38 liaopen123 287 天前 看了一圈评论感觉没有很好的方案。 |
39 puppyxxx OP @liaopen123 问题 2 因为数据安全问题,打算使用公司内部训练的 agent 来处理了,我个人今天的进度 |
41 highkay 286 天前 @andyskaura 你这个感觉写长文不太行,网文现在 AI 检测力度也很大,但是不写长文( 100W 字以上)没有商业价值,这个还是需要很多功夫的,靠那些 coze 啥的应该不太行。 |
42 nidhogger 286 天前 关注一下 op 的进展。 |
43 puppyxxx OP @nidhogger 拉了一下上面老哥重写的项目,整体代码读了一遍,在试着从源代码 gitea 改成使用 gitlab hook ,感谢关注哈,我这边有进展搞个新的帖子发出来,我是新手可能总是问一些略显蠢的问题,见谅 |
45 llggg 280 天前 @puppyxxx 刚好也在做 ai-codereview ,有兴趣一起交流下吗 临时邮箱 base64: b2xpZGR1aXR5QG1haWxzYmF5LmNvbQ== |
49 liaopen123 278 天前 @l1905 我之前和你做的差不多,主要利用 gitlab api 来做,有 2 个问题,不知道你那边怎么解决,1.提交文件多了,超过 token 该怎么解决。2.你喂给 llm 的只是变更的信息么?还是整个变动的文件,上下文这种的咋考虑。 |
50 liaopen123 278 天前 @llggg 我也给你发邮件了,可以一起讨论一下 |
51 llggg 276 天前 @liaopen123 那个 24 小时邮箱过期了 , 发这个邮箱 czdzZDNyeWpAYW5vbmFkZHkuY29t |