我觉得目前 AI 大模型存在一个最大的问题 - V2EX
首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX
人工智能
我觉得目前 AI 大模型存在一个最大的问题
godall
8 天前
1640 次点击
那就是经常不懂装懂,乱说一通。跟吹牛皮的人一样乱话三千。
难道就不能像搜索引擎一样,查不到的就说没有吗?因为经常把用户带沟里去。
AI
模型
准确
15 条回复
1
shyrock2026
8 天前
一年前的模型?
2
HarrisonXn
8 天前
用的什么模型。建议开联网搜索和深度思考
3
winnerczwx
8 天前
模型和模型之间亦有差距
4
woodfizky
8 天前
2
评论区典中典之上来就质疑你用的什么模型
你需要理解 LLM 的本质是在向量数据库的数据里去计算/预测下一个输出应该是什么。
那处理某些提问或者问题的时候,数据不够全,但是又有数据的情况,完全可能让 LLM 输出一些他自己也不懂正不正确的东西。
它自己都不懂正不正确了,又怎么能自纠错呢?又怎么判断是不是找不到东西呢?
5
NewYear
8 天前
大模型两大毛病。
幻觉+健忘。
6
bghtyu
8 天前
现在的模型相比以前好了很多,而且可以联网,我很久没有遇到幻觉的情况了。
结果前一天问 Gemini pro 一个问题,它非常确定的给了我一个错误的答案,我让它联网搜索,它也嘴硬不改,让我很无语
7
wat4me
8 天前
人类都没解决的问题,现在的 LLM 怎么解决,开联网更完犊子,过两年 GEO 越来越多,等着营销号轰炸你的 AI 吧
8
2024
8 天前
现在的大模型都是基于概率进行回答,而且大模型还有核心的记忆能力没有解决,市面基本所有工具都是为了解决记忆力和幻觉产生,比如 skill 和 agent 等,幻觉可以迭代大模型和细化领域得到更高的准确率,但是记忆力能够像人一样"永久"记忆的效果,理论都没有吧?预测下,如果未来没有新的理论,或许未来存储硬件更便宜时,每个会话分配 1T 内存或者硬盘来解决。每个会话随着对话变成,自动分支一个子模型概率文件,自己维护当前会话的知识概率信息,达到模拟真实的人
9
godall
OP
8 天前
类似一个置信度。
目前每个模型每个 token 向量计算只是按照最可能的下一个预测,完全不顾下一个预测置信度很低,所以到后面就胡说八道了,我的建议是可以设定一个最低阈值,不行就返回不会。。
10
niubilewodev
8 天前
@
bghtyu
Gemini 3 Pro 的老毛病了,你换成 3 Flash 就没这个问题了。
3 Pro 非常迷信自己的训练信息。
11
qiaobeier
8 天前
幻觉虽然是 AI 的老大难问题,但是主流 AI 在一般使用场景下基本无感了,除非你去问那种特别绕的问题,比如前端时间流行的洗车啥的。
12
zomco
8 天前
叫 AI 回答时附带置信度
13
llysr1005
8 天前
兄弟,吸一下 Opus 4.6 ,这个纯度高, 不要再吸免费的模型了。。
14
isnullstring
8 天前
@
wat4me
确实,到时候 AI 搜索功能又变成现在的搜索引擎,能用但要人自己甄别
15
wgsgyes
8 天前
幻觉才是智能、创造的基础。不让 AI 产生幻觉,AI 就是搜索引擎,你直接使用搜索引擎就好。
关于
帮助文档
自助推广系统
博客
API
FAQ
Solana
885 人在线
最高记录 6679
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 95ms
UTC 20:31
PVG 04:31
LAX 13:31
JFK 16:31
Do have faith in what you're doing.
ubao
msn
snddm
index
pchome
yahoo
rakuten
mypaper
meadowduck
bidyahoo
youbao
zxmzxm
asda
bnvcg
cvbfg
dfscv
mmhjk
xxddc
yybgb
zznbn
ccubao
uaitu
acv
GXCV
ET
GDG
YH
FG
BCVB
FJFH
CBRE
CBC
GDG
ET54
WRWR
RWER
WREW
WRWER
RWER
SDG
EW
SF
DSFSF
fbbs
ubao
fhd
dfg
ewr
dg
df
ewwr
ewwr
et
ruyut
utut
dfg
fgd
gdfgt
etg
dfgt
dfgd
ert4
gd
fgg
wr
235
wer3
we
vsdf
sdf
gdf
ert
xcv
sdf
rwer
hfd
dfg
cvb
rwf
afb
dfh
jgh
bmn
lgh
rty
gfds
cxv
xcv
xcs
vdas
fdf
fgd
cv
sdf
tert
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
shasha9178
shasha9178
shasha9178
shasha9178
shasha9178
liflif2
liflif2
liflif2
liflif2
liflif2
liblib3
liblib3
liblib3
liblib3
liblib3
zhazha444
zhazha444
zhazha444
zhazha444
zhazha444
dende5
dende
denden
denden2
denden21
fenfen9
fenf619
fen619
fenfe9
fe619
sdf
sdf
sdf
sdf
sdf
zhazh90
zhazh0
zhaa50
zha90
zh590
zho
zhoz
zhozh
zhozho
zhozho2
lislis
lls95
lili95
lils5
liss9
sdf0ty987
sdft876
sdft9876
sdf09876
sd0t9876
sdf0ty98
sdf0976
sdf0ty986
sdf0ty96
sdf0t76
sdf0876
df0ty98
sf0t876
sd0ty76
sdy76
sdf76
sdf0t76
sdf0ty9
sdf0ty98
sdf0ty987
sdf0ty98
sdf6676
sdf876
sd876
sd876
sdf6
sdf6
sdf9876
sdf0t
sdf06
sdf0ty9776
sdf0ty9776
sdf0ty76
sdf8876
sdf0t
sd6
sdf06
s688876
sd688
sdf86