数据挖掘特征值是什么意思,有没有关于数据挖掘的那些专业名词解释汇总 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
UIHIHUHIU
V2EX    程序员

数据挖掘特征值是什么意思,有没有关于数据挖掘的那些专业名词解释汇总

  •  
  •   UIHIHUHIU 2024-05-20 15:53:53 +08:00 1922 次点击
    这是一个创建于 575 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近在学数据挖掘,有没有关于数据挖掘的那些专业名词解释,比如啥特征值,变异系数,皮尔曼系数啥的,有些完全看不懂,也不教,问 chatGPT 回答不清晰

    11 条回复    2024-05-20 21:01:34 +08:00
    snylonue
        1
    snylonue  
       2024-05-20 16:19:53 +08:00
    看上去像线性代数和统计的术语
    lrigi
        2
    lrigi  
       2024-05-20 16:22:17 +08:00 via iPhone
    买本数据挖掘的书看看,要不就问 gpt ,gpt 要是回答不清楚这么基础的问题 openai 可以关门了
    LXchienne
        3
    LXchienne  
       2024-05-20 16:26:17 +08:00
    可以补补基础,统计学习,数理统计这些
    Pteromyini
        4
    Pteromyini  
       2024-05-20 16:35:51 +08:00   1
    我感觉你应该补的是数理基础,比如线性代数、概率论
    UIHIHUHIU
        5
    UIHIHUHIU  
    OP
       2024-05-20 16:41:19 +08:00
    正在学概率论,线性代数好久没看了,不过确实好像是这里面的词
    ufo5260987423
        6
    ufo5260987423  
       2024-05-20 16:48:33 +08:00
    特征值一般是矩阵的特征值,和特征向量这个概念是有关的。在数据分析的一些场景下,特征值能够表示一些因素的强度、相关性等等。
    皮尔曼系数,如果没记错是描述显著性、相关性的东西。
    变异系数不知道是哪个傻逼翻译的,一查是 coefficient ,是标准差和均值的比,用来描述数据的 variance 。

    你后面这两个都是频率派统计的东西,我个人更多用贝叶斯派的东西。

    前面有位仁兄说买本数据挖掘的书看,well ,绝大多数数据挖掘的书都不咋样。
    然后,如果你是要在具体场景应用数据挖掘,那么知道一些名词背下来,把它和业务强行关联起来就行了。数据挖掘需要科学的管理和成熟、稳定的业务模式,我国绝大多数企业比草台班子都不如的管理水平,谈不上业务模式,更谈不上有充分的数据进行挖掘。

    业务三天两头拍脑门的,别妄图机械降神。
    vivisidea
        7
    vivisidea  
       2024-05-20 16:54:13 +08:00
    这个问题 gpt 回答不清晰?不科学,名词解释算是 AI 最擅长的领域了好吧


    - 大概率是你问法不对
    - 你不理解 gpt 回答的内容,可以追问,可以让它给你举例说明等等
    - 用 gpt4
    UIHIHUHIU
        8
    UIHIHUHIU  
    OP
       2024-05-20 18:33:49 +08:00
    @ufo5260987423 主要还在上学,对这个方向比较感兴趣,想自己学习,但是还没有什么系统的学习规划,不知道有什么前项课程,从哪里开始学
    RichardCheung
        9
    RichardCheung  
       2024-05-20 18:58:18 +08:00
    特征值:看前后文吧,一般有个矩阵的,比如协方差矩阵?

    变异系数:好像是标准差与均值的比值

    皮尔曼系数(Pearson 相关系数):-1 到 1 ,绝对值越趋于 1 越相关,符号代表正负相关。
    ufo5260987423
        10
    ufo5260987423  
       2024-05-20 20:53:15 +08:00
    @UIHIHUHIU #8
    数学你得补课啊,线性代数和概率论必须得学会
    然后结合具体场景,往往还有各种假设,和你就业方向相关。

    我 15 年本科毕业,单纯数据挖掘还有点意思,18 年研究生毕业的时候就感觉不行了。
    Philippa
        11
    Philippa  
       2024-05-20 21:01:34 +08:00 via iPhone
    特征值是指某个维度的数值,可以是连续和不连续的(统计学第一课),数据分析本质上就是不同维度的组合对事情的解释。

    pearson 和 spearman 都是相关系数,pearson 是用数值计算相关系数,但是会对数值很敏感,尤其是数据量少的时候。spearman 是先排序再用名次计算相关性,这个就能避免数值敏感,但当然也默认了数据是均匀的。spearman 类似于非连续数据的 one hot encoding 。

    所以你看这东西很简单,两三下就能解释清楚了。这个基本上不用去看什么书,我更建议从实际例子出发,捉住重点,再回头看书了解细节。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1022 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 18:35 PVG 02:35 LAX 10:35 JFK 13:35
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86