最近要做数据挖掘和数据分析 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
taozhijiangscu
V2EX    程序员

最近要做数据挖掘和数据分析

  •  
  •   taozhijiangscu 2015-11-23 08:37:38 +08:00 4757 次点击
    这是一个创建于 3685 天前的主题,其中的信息可能已经有所发展或是发生改变。

    以前都没搞过,不知道这里的大神能不能指点一下迷津?可以入口的地方。

    拜谢!

    29 条回复    2015-11-23 17:06:19 +08:00
    HunterPan
        1
    HunterPan  
       2015-11-23 08:49:47 +08:00
    神经网络 好多...
    nevin47
        2
    nevin47  
       2015-11-23 09:22:25 +08:00   2
    这个需求给的好模糊,要做什么类别的东西呢?给 LZ 一个图片参考一下路径

    imn1
        3
    imn1  
       2015-11-23 09:26:27 +08:00
    如果有需求的就按需求做
    如果是学习,没什么基础的,从交叉分析和正态分布入门
    binjade
        4
    binjade  
       2015-11-23 09:27:04 +08:00
    这个话题太了,根据需求吧。
    lydhr
        5
    lydhr  
       2015-11-23 09:44:57 +08:00
    推荐 tableau ,数据可视化软件
    alloyapple
        6
    alloyapple  
       2015-11-23 10:04:03 +08:00
    http://datacademy.io/
    学习数据科学的网站
    fxxkgw
        7
    fxxkgw  
       2015-11-23 10:13:55 +08:00
    搜索 elk 搜索 三斗室
    luoqeng
        8
    luoqeng  
       2015-11-23 10:25:40 +08:00
    hive pig storm 之类的
    luman
        9
    luman  
       2015-11-23 10:29:42 +08:00   1
    不基于业务场景的谈技术都是在耍流氓
    Light3
        10
    Light3  
       2015-11-23 10:42:01 +08:00
    我记得这样一个事就是有一个主播买方便面然后天猫超市用大数据分析然后给了他一个赠品是卫生巾 主播是男的
    inFinityzc
        11
    inFinityzc  
       2015-11-23 11:08:17 +08:00
    @Light3 天猫大数据的推荐现在用的深度卷积网络,据说给阿里提升了过亿的效益
    zonghua
        12
    zonghua  
       2015-11-23 11:12:19 +08:00 via iPhone
    不会数学的都是个笑话
    KKKKale
        13
    KKKKale  
       2015-11-23 12:04:08 +08:00
    @alloyapple 服务挂了
    Whoops, looks like something went wrong.

    G_will
        14
    G_will  
       2015-11-23 12:36:13 +08:00
    @jyhmijack fixed
    moxiaotiao
        15
    moxiaotiao  
       2015-11-23 12:42:12 +08:00 via Android
    聚类,分类算法太多
    hqs123
        16
    hqs123  
       2015-11-23 14:07:32 +08:00
    神经网络算法,最大期望算法,贝叶斯模型等等.
    flyingkid
        17
    flyingkid  
       2015-11-23 14:49:59 +08:00
    @Light3 老中医错觉:doge
    taozhijiangscu
        18
    taozhijiangscu  
    OP
       2015-11-23 15:15:52 +08:00
    @imn1 主要是互联网方面的,偏向于自然语言处理,比如客户咨询、客户评价等。
    貌似学习用 weibo 作数据分析的比较多啊。
    taozhijiangscu
        19
    taozhijiangscu  
    OP
       2015-11-23 15:17:14 +08:00
    @alloyapple 卧槽,处处有商机啊。。。
    taozhijiangscu
        20
    taozhijiangscu  
    OP
       2015-11-23 15:18:10 +08:00
    @fxxkgw 好像偏运维啊。。。。
    taozhijiangscu
        21
    taozhijiangscu  
    OP
       2015-11-23 15:18:57 +08:00
    @sunjiayao 比如我有类似狗东的用户咨询,用户评论。怎么做用户数据的价值分析呢?
    taozhijiangscu
        22
    taozhijiangscu  
    OP
       2015-11-23 15:19:33 +08:00
    @inFinityzc 确信么?还有那些消息?
    taozhijiangscu
        23
    taozhijiangscu  
    OP
       2015-11-23 15:20:23 +08:00
    @moxiaotiao
    @hqs123
    这些基础的机器学习算法都知道,关键不知道怎么实践的用起来啊。
    luman
        24
    luman  
       2015-11-23 15:46:59 +08:00
    @taozhijiangscu 得有个目标啊,最后我想要一个什么样的数据?这个数据能给我带来什么价值?我要从什么维度去获取这个数据?
    以上条件都有了 剩下的才是技术的事
    inFinityzc
        25
    inFinityzc  
       2015-11-23 16:50:38 +08:00
    @taozhijiangscu 确信,详情请看今年天猫大数据比赛的结果分析。
    如果你想入门搞数据挖掘的话,建议你听听数据挖掘或者机器学习的公开课先,然后在着手开发。
    PS 需要比较扎实的数学功底。
    mko0okmko0
        26
    mko0okmko0  
       2015-11-23 16:52:49 +08:00
    或是反着来:
    首先你需要知道你有什么数据.
    然后依照数据最多的 kv 去做相关性.
    注意相关性不需要因果关系.只需要局部有接近线性或是可预测性即可.
    但如果你都不知道你的数据内容的栏位意义和值意义,那基本上没戏.
    Zzzzzzzzz
        27
    Zzzzzzzzz  
       2015-11-23 16:56:03 +08:00
    @Light3 在天喵超市消费了十几单的表示还有赠品这回事儿么? 怒, 再也不去了。
    vtea
        28
    vtea  
       2015-11-23 16:58:42 +08:00 via iPhone
    统计分析我只会 spss ,抓关键词分析有时候能发现很多有趣的事
    reverland
        29
    reverland  
       2015-11-23 17:06:19 +08:00
    我倒准备做计算机辅助诊断系统。。。两个月前看病看得纠结。。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1202 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 29ms UTC 23:54 PVG 07:54 LAX 15:54 JFK 18:54
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86