我想问一个悲伤的问题,恳请会大数分析,机器学习的大佬进来一下吧,特别是自学的大佬们 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
jakeyfly
V2EX    问与答

我想问一个悲伤的问题,恳请会大数分析,机器学习的大佬进来一下吧,特别是自学的大佬们

 
  •   jakeyfly 2018-08-15 13:20:52 +08:00 1900 次点击
    这是一个创建于 2683 天前的主题,其中的信息可能已经有所发展或是发生改变。

    本人会 PYTHON 基,会用 FLASK,DJANGO 做网页(不精通)。会写比较复杂的爬虫

    因为爬了许多某方面的数据,就想做分析与机器学习用数据来训练程序。

    以上这些都是自学的,花了半年时。

    现在悲伤的事情来了,数据分析与机器学习,需要概率论,统计学等基础,最要命的是要会高等数学

    作为一个初中数学水平都达不到的吊丝,我是不是可以放弃了!!!!!

    如果我硬要坚持,我该如何补上我缺失的这些基础!!!!

    16 条回复    2018-08-16 20:19:20 +08:00
    starcraft
        1
    starcraft  
       2018-08-15 13:34:36 +08:00 via iPhone
    你学了是为了兴趣,那就从数分 线代慢慢开始啊。你要为了向往招工信息的年薪五六十万,那就洗洗睡吧,梦里什么都有。挤破了头,还有一堆赶热度渣硕在你前面排着。
    jiangnanyanyu
        2
    jiangnanyanyu  
       2018-08-15 13:34:45 +08:00 via Android
    读个本硕出来吧 2333
    noNOno
        3
    noNOno  
       2018-08-15 13:35:34 +08:00
    推荐<<机器学习导论>>
    一遍一遍地看,遇到没见过的知识就去查资料.
    人一能之己百之,人十能之己千之,虽愚必明...
    ballshapesdsd
        4
    ballshapesdsd  
       2018-08-15 13:40:10 +08:00
    想搞算法研发基本不可能,如果你真能投入那么多精力学到能搞算法研发的程度,干别的事挣的钱更多
    imn1
        5
    imn1  
       2018-08-15 15:14:12 +08:00   1
    这个就是创算法和用算法的区别,实际上就是辅助分析还是分析
    搞算法实际上只是辅助分析,因为算法是通用型的(泛分析),但行业分析却是针对特有数据的
    说个俗一点的例子,数学家对老板说:这个结果表明和 A 数据线性相关;但分析员对老板说:这表明 A 产品会定期消耗,所以会持续购买
    现在的行业招聘有点误区,好像都想找数学家,但能分析出实际因果的才是最好的分析员,因为这个分析员只是分析自家产品,不是做个算法给同行共用啊。有能力做算法的人,其实留不住的,他搞定了这个行业的数据分析,自然就想尝试自己的算法能否用到其他行业,一定走的

    搞分析不一定要创算法,会用也是足够的
    当然,能创是最好的,毕竟不是现成的算法都符合你的数据条件
    上世纪早期的市场统计软件,实际上也没多少用户可写的东西,基本上都是把软件提供的模块组合起来用

    但是,一些基本的概念是需要知道的
    例如,交并差(集合)、行列式计算、数据变形(行列式转换)、量化、移动统计……
    实际上这上面说的很多并不需要高数微积分这些也能算,只是用高数算方便快捷,有些直接可用定理推导
    最最基础的一种分析方法叫做交叉分析,实际上就是交并差,基本会数据库 select 的人都会做,只是很多搞数据库的人没入职过市场调查公司,脑子里不知道该 select 谁跟谁交叉而已

    顺带提一下,移动统计还是比较重要的,现在很多数据有 timeline,前一个记录和后一个有相关性,我移动统计用得越来越频繁

    你不需要看懂现成的算法是怎样实现的,但要清楚这个算法做什么,用在什么条件和场合,数据格式如何

    我高数、线代成绩都不怎么样,大学硬着头皮在 DOS 上自己写马氏距离,做聚类分析
    但现在,现成的马氏距离一些工具都内置了,如 scipy,会用就行

    话分两头说,虽然前面吐槽了一些招聘,但现实就是这样,人家要这样招聘,谁能改变他们的想法,这就是市场需求
    只能满足需求才能成交,怎样做到还是自己想,有本事就自己接单,但前期没点业绩也是没人理你的
    ackfin01
        6
    ackfin01  
       2018-08-15 15:19:25 +08:00
    不可能了。
    对于本科高数线代 85+,概率论 95+,学过矩阵论,最优化方法现在的我来说,数学都忘了不少了,想补起来也没觉的那么容易。
    且不说数学,数据结构和算法你弄懂了么。
    fl2d
        7
    fl2d  
       2018-08-15 15:25:26 +08:00
    其实很多问题,遇到了去查书就可以,比如你不用为了知道 l1、l2 是啥意思,就去刷一遍泛函。

    不过真想好好学的话,高数+线代+概率论与统计,一年半载功夫,也能刷一遍了。
    viator42
        8
    viator42  
       2018-08-15 15:36:05 +08:00   1
    即使学会了能捣鼓一些东西,不是科班出身的野生科学家会有公司要么
    怕就怕机会为,怎么努力都没用
    oyosc
        9
    oyosc  
       2018-08-15 15:41:22 +08:00
    为了兴趣爱好就加油,为了挣钱就放弃...
    whereabouts
        10
    whereabouts  
       2018-08-15 16:35:04 +08:00
    自身情况和楼主有好多类似,运维和编程这块都是自学的,当初碰到大数据分析这块要用到高等数学等知识,感觉真要学习的话得有小几年的规划,迫于资金压力的话学习条件有限 学习来可能更困难一些。不过因为大数据这块跟自己的未来职业规划搭边不多+兴趣不大,所以就放弃了,小几年的学习时间学点别的也行。
    3d3ec7a
        11
    3d3ec7a  
       2018-08-15 16:38:52 +08:00
    turicreate 了解一下
    jakeyfly
        12
    jakeyfly  
    OP
       2018-08-15 20:46:37 +08:00
    @imn1 我不是要搞算法呀,我只是用别的库来做自己分析啊!大佬们 我没说我要写算法呀!!我只是要分析数据啊
    jakeyfly
        13
    jakeyfly  
    OP
       2018-08-16 16:00:31 +08:00
    @fl2d 大哥 说的好轻松啊
    jakeyfly
        14
    jakeyfly  
    OP
       2018-08-16 16:05:53 +08:00
    @imn1 谢谢大佬说了这么多,我想这里回复的人只有你是了解我问这人问题的本意的,我其实也就是想会用就行,没有想去创算法,也就是要知道这些模型算法是做什么用的。我了不是为了从事这个行业,只是个人兴趣,有了一个想法想要实现他。按您说的,我应该算是对要分析的数据是比较了解的,等于业内人士,那应该跟你说的相符,那如果要达到你说的那样会用就行,需要什么数学基础呢。
    imn1
        15
    imn1  
       2018-08-16 17:18:00 +08:00
    @jakeyfly
    什么基础难以一一列举
    大致上需要在传入数据到某个算法前,预处理用到的所有相关知识
    因为当你手上的原始数据不符合格式要求,你就必须通过正确的数学方法,「转换」为算法可用的数据格式
    这个转换过程是需要符合逻辑和准确的

    线代和概率论基本是跑不掉的,中间一些定理的推演详解看不明,可以死记硬背前后的形式(最好还是知道大概)
    线代学到线性方程组可以边做边学,概率随机事件可以结合《采样学》一起,学到分布就难了,有实例或者有帮助
    再说下去可以开讲坛了,先搞懂行列式、排列组合、集合、随机取样,到时候你自己就知道下一步要学什么了
    jakeyfly
        16
    jakeyfly  
    OP
       2018-08-16 20:19:20 +08:00
    @imn1 谢谢大佬指点
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     851 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 926ms UTC 20:04 PVG 04:04 LAX 12:04 JFK 15:04
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86