全球分区云图-全球分区云图***
如何学习数据分析?
很高兴回答您的问题。
首先,做数据分析首先得学习数据库,比较数据是最基本的***。
其次,是数据分析相关的理论,为建模或者进行进一步分析打基础。代数和统计知识要求较高。
再次,学习各种软件。Excel是最最最基本的工具,各种函数、插件的学习;SPSS、R至少掌握一种吧,个人认为SPSS更容易上手,当然每个行业有自己相对认可的工具;Python建议掌握,很强大的工具,清洗数据、建模、可视化、爬虫等等都可以完成。最后建议掌握一个可视化软件比如Tableau。当然分析完需要写报告,不管文字功底、概括能力、审美能力,都是有要求的。
最后,模型学习,这个没的说,要知道每个模型是用来干什么,比如决策树做画像是经常会用到的。
特别想说一点,数据分析不能只看数据,还要相对了解业务,脱离业务的数据分析什么都不是。
希望对您有帮助。
学习数据分析可以遵循以下步骤:
- 学习基础数学和统计学知识。数据分析需要掌握一定的数学和统计学知识,包括概率、***设检验、回归分析等。
- 学习数据分析工具。掌握一些数据分析工具,如Excel、Python、R等,可以帮助你更好地进行数据分析。
- 学习数据可视化。学习数据可视化工具,如Tableau、Power BI等,可以将数据分析结果以图形化的方式呈现出来,更加直观地展示数据分析结果。
- 学习实践案例。通过学习实际的数据分析案例,可以更好地理解数据分析的应用场景和方法。
- 参加培训课程。参加一些数据分析相关的培训课程,可以加速学习过程并且获得实践经验。
- 扩展阅读。阅读相关的书籍、文章、博客等,可以帮助你了解更多的数据分析知识和技能。
- 实践练习。通过实践练习,将学到的知识应用到实际项目中,进一步巩固和提高数据分析能力。
谢邀
现在发达城市北上广,已经开始用大数据,运做基金了。而且门槛很高,必须金融和计算机的本科以上人员,研究生择优录取。
可见大数据,发展的力度。很多人不知道大数据怎么交易股票,这这里简单说下,现在好多券商软件支持,大数据自动化交易,也就是说,当你编写好自己的预期策略后,由程序根据你的策略实行,自动化交易。现在名声仅次于巴菲特的詹姆斯.西蒙斯,就是大数据量化交易的先驱,他名下的大奖章基金,就是根据大数据量化交易运行。
大数据量化交易,可以实现。一天成百上千次此交易,只要资金允许。这也是发达发达城市为什么着重研究的对象。还有大数据是未来的趋势。电脑在对市场热度的分析,要强于人工识别。但是论单个交易,人工肯定强于电脑,但是从现在的基金规模来看。电脑交易是主要趋势。不管多厉害的基金经理,精力都是有限的。
目前的大数据都是借助python为主要语言编写的,感兴趣的可以看看相关方面的学习。券商对自动化交易的资金,一般是5w门槛。所以,随着市场的发展。大数据量化交易,会慢慢普及。
以上就是本人对大数据的看法,喜欢的可以加个关注,点个赞。
优秀的数据分析师并不能速成,但是零经验也有零经验的捷径。
市面上有《七周七数据库》,《七周七编程语言》。今天我们就《七周七学习成为数据分析师》,没错,七周。
第一周:Excel学习掌握
如果Excel玩的顺溜,可以略过这一周。但很多人并不会vlookup,所以有必要讲下。
了解sum,count,sumif,countif,find,if,left/right,时间转换等。excel的各类函数很多,完全不需要学全。重要的是学会搜索。我学函数是即用即查,将遇到的问题在网上搜索得到所需函数。
重中之重是学会vlookup和数据***表。这两个对后续的数据转换有帮助。
学会vlookup,SQL中的join,Python中的merge能很快掌握。
学会数据***表,SQL中的group,Python中的groupby也是同理。
这两个搞定,基本10万条以内的数据统计没啥难度,也就速度慢了点。80%的办公室白领都能秒杀。
网上多找些习题做,Excel是熟能生巧。
养成一个好习惯,不要合并单元格,不要过于花哨。表格按照原始数据、加工数据,图表的类型管理。
附加学习:
1、了解中文编码utf-8,ascii的含义和区别
2、了解单元格格式,帮助你了解后期的timestamp,date,string,int,bigint,char,factor等各类格式。
第二周:数据可视化
数据分析界有一句经典名言,字不如表,表不如图。别说平常人,数据分析师自己看数据也头大。这时就得靠数据可视化的神奇魔力了。
以上就是所谓的可视化。排除掉数据挖掘这类高级分析,不少数据分析师的平常工作之一就是监控数据观察数据。
另外数据分析师是需要兜售自己的观点和结论的。兜售的最好方式就是做出观点清晰数据详实的PPT给老板看。如果没人认同分析结果,那么分析也不会被改进和优化,分析师的价值在哪里?工资也就涨不了对吧。
抽空花一段时间学习可视化的基础,如《数据之美》
另外你还需要了解BI的概念。知名的BI产品有Tableau,Power BI,还有国产的FineBI等。都有体验版和免费版能下载,网上找一点数据就能体验可视化的魅力。比Excel的图表高级多了。
BI需要了解仪表盘Dashboard的概念,知道维度的联动和钻取,知道绝大多数图表适用的场景和怎么绘制。比如以下FineBI制作的dashboard。
第三周:分析思维的训练
这周我们轻松一下,学学理论知识。
分析思维首推大名鼎鼎的《金字塔原理》,帮助数据分析师结构化思维。如果金字塔原理让你醍醐灌顶,那么就可以学思维导图,下载一个XMind中文网站,或者在线用百度脑图。
再了解SMART、5W2H、SWOT、4P理论、六顶思考帽等框架。这些框架都是大巧不工的经典。你要快速成为数据分析师,思考方式也得跟着改变。网上搜咨询公司的面试题,搜Case Book。
题目用新学的思维导图做,先套那些经典框架,做一遍,然后去看答案对比。因为要锻炼数据分析能力。所以得结合数据导向的思维。
这里送三条金句:
一个业务没有指标,则不能增长和分析
好的指标应该是比率或比例
好的分析应该对比或关联。
举一个例子:我告诉你一家超市今天有1000人的客流量,你会怎么分析?
这1000人的数量,和附件其他超市比是多是少?(对比)
这1000人的数量比昨天多还是少?(对比)
1000人有多少产生了实际购买?(转化比例)
路过超市,超市外的人流是多少?(转化比例)
这是一个快速搭建分析框架的方法。如果只看1000人,是看不出分析不出任何结果。
第四周:数据库学习
Excel对十万条以内的数据处理起来一点不虚,但是资深的数据分析师还是笑摸狗头,Too Young Too Sample,爷搞得都是百万数据。要百万数据,就得上数据库。
SQL是数据分析师的核心技能之一。有些公司并不给数据库权限,需要分析师写邮件提需求,这非常不好。数据分析师经常有各类***设需要验证,很多时候写十几行SQL就能得到的答案,还得麻烦其他部门导出数据。
SQL学习不需要买书,W3C学习就行了,SQL 教程。大多数互联网公司都是MySQL,我也建议学,性价比最高。
作为数据分析师,只要懂Select相关,增删改、约束、索引、数据库范式全部略过。你的公司心得多大才会给你写权限。
了解where,group by,order by,h***ing,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等即可。
你看,和Excel的函数都差不多。如果时间充裕,则学习row_number,substr,convert,contact等。和Excel一样,学会搜索解决问题。不同引擎的函数也会有差异,例如Presto和phpMyAdmin。
期间你不需要考虑优化和写法丑陋,查询几秒和几分钟对数据分析师没区别,跑数据时喝杯咖啡呗,以后你跑个SVM都能去吃饭了。
网上搜索SQL相关的练习题,刷一遍就行。也能自己下载数据库管理工具,找些数据练习。我用的是Sequel Pro。
第五周:统计知识学习
统计学是数据分析的基础之一。
统计知识会要求我们以另一个角度看待数据。当你知道AB两组的差异用平均值看是多傻的事情,你的分析技巧也会显著提高。
这一周努力掌握描述性统计,包括均值、中位数、标准差、方差、概率、***设检验、显著性、总体和抽样等概念。详细的数学推导不用细看,谁让我们是速成呢,只要看到数据,知道不能怎么样,而是应该这样分析即可。
Excel中有一个分析工具库,简单强大。对列1的各名词做到了解。如果是多变量多样本,学会各种检验。
《统计数字会撒谎》休闲读物,有趣的案例可以让我们避免很多数据陷阱。
深入浅出统计学 (豆瓣)还是经典的HeadFirst系列,适应它一贯的啰嗦吧。
多说一句,老板和非分析师不会有兴趣知道背后的统计学原理,通常要的是分析后的是与否,二元答案。不要告诉他们P值什么的,告诉他们活动有效果,或者没效果。
第六周:业务学习(用户行为、产品、运营)
这一周需要了解业务。对于数据分析师来说,业务的了解比数据方***更重要。当然很遗憾,业务学习没有捷径。
我举一个数据沙龙上的例子,一家O2O配送公司发现在重庆地区,外卖员的送货效率低于其他城市,导致用户的好评率降低。总部的数据分析师建立了各个指标去分析原因,都没有找出来问题。后来在访谈中发觉,因为重庆是山城,路面高低落差比较夸张,很多外卖人员的小电瓶上不了坡…所以导致送货效率慢。
这个案例中,我们只知道送货员的送货水平距离,数据上根本不可能知道垂直距离这个指标。这就是数据的局限,也是只会看数据的分析师和接地气分析师的最大差异。
对于业务市场的了解是数据分析师工作经验上最大优势之一。既然是零经验面试,公司肯定也知道刚入门分析师不会有太多业务经验,不会以这个卡人。所以简单花一周了解行业的各指标。
《增长黑客》
数据驱动业务的典型,里面包含产品运营最经典的AAARR框架,部分非数据的营销案例,
《网站分析实战》
如果应聘的公司涉及Web产品,可以了解流量的概念。书中案例以Google Analytics为主。其实现在是APP+Web的复合框架,比如朋友圈的传播活动肯定需要用到网页的指标去分析。
《精益数据分析》
互联网数据分析的入门书籍,归纳总结了几个常用的分析框架。比较遗憾的是案例都是欧美。
还有一个小建议,现在有不少第三方的数据应用,囊括了不少产品领域的数据分析和统计。自学党们即使没有生产环境的数据,也可以看一下应用Demo,有好处的。
除了业务知识,业务层面沟通也需要掌握。另外建议在面试前几天收集该行业的业务强化一下。
第七周:Python/R学习
终于到第七周,也是最痛苦的一周。这时应该学习编程技巧。是否具备编程能力,是初级数据分析和高级数据分析的风水岭。数据挖掘,爬虫,可视化报表都需要用到编程能力。掌握一门优秀的编程语言,可以让数据分析师事半功倍,升职加薪,迎娶白富美。
这里有两条支线,学习R语言或Python。速成只要学习一条,以后再补上另外一门。
R的优点是统计学家编写的,缺点也是统计学家编写。如果是各类统计函数的调用,绘图,分析的前验性论证,R无疑有优势。但是大数据量的处理力有不逮,学习曲线比较陡峭。Python则是万能的胶水语言,适用性强,可以将各类分析的过程脚本化。Pandas,sklearn等各包也已经追平R。
如果学习R,建议看《R语言实战》,照着书本打一遍代码,一星期绰绰有余。另外还有一本《统计学》,偏知识理论,可以复习前面的统计学知识。
R学习和熟悉各种包。知道描述性统计的函数。掌握DataFrame。如果时间有余。可以再去学习ggplot2。
Python拥有很多分支,我们专注数据分析这块,入门可以学习《深入浅出Python》。
需要学会条件判断,字典,切片,循环,迭代,自定义函数等。知道数据领域最经典的包Pandas+Numpy。
在速成后的很长一段时间,我们都要做调包侠。
这两门语言最好安装IDE,R语言我建议用RStudio,Python我建议用 Anaconda。都是数据分析的利器。
Mac自带Python2.7,但现在Python 3已经比几年前成熟,而且没有编码问题。各类教程也足够多,不要抱成守旧了。Win的电脑,安装Python会有环境变量的问题,是个大坑(R的中文编码也是天坑)。
到这里,刚刚好是七周。如果还需要第八周+,则是把上面的巩固和融会贯通,毕竟速成是以转岗或拿offer为目的。有机会,我会专门写文章讲解每一周的具体知识,并且用爬虫爬一些数据做练习和案例。
一、数据分析前世今生
近年来,越来越多的企业开始出现数据分析师这个岗位,无非可以分为技术类和非技术类,技术类要运用算法搭建模型,非技术类对模型结果进行可视化展现、数据报告撰写等。
二、数据分析的未来
不要把自己单纯地定义为一名数据分析师,企业不乏做表的(初级数据分析师)、搞模型的(高级数据分析师),财务做报表更厉害,程序员比你更容易上手。数据分析一定是一项必备技能,就和PPT、Excel一样,它是来***工作的,而不是工作的全部。
三、学习路线
技术:
Excel
SQL
Python/Spss
可视化
理论:
数据分析思维和方法
统计学
对业务的理解
四、推荐书籍/网站
以下推荐的书籍和网站绝无任何广告嫌疑,只是自己觉得还不错分享给大家。
1、Excel学习:
没有什么推荐的书籍和网站,网上有很多大神的教程,如果时间充裕,就系统的学习一下,如果时间紧张,就用临阵用度娘也是可以解决问题的,当然,学什么都最好能够系统地学习。要记住一点,我们是用Excel进行数据分析的,所以应当从数据获取、数据处理、数据分析和输出几个方面来学习Excel。
之前的文章也有写过这方面的:
用Excel做直方图(1):随机数发生器
用Excel做直方图(2):频率分布直方图
用Excel做控制图
2、SQL学习
建议去W3Sschool自己学习,非常详细,附网址,。如果想要练习的话,可以从SQLZoo去练习,在线版的SQL练习教程,。书的话《SQL必知必会》还不错,很精简,基本可以满足日常表的查询和维护了,想要不仅满足于查询的话,还可以参考《深入浅出MySQL》,数据库开发、优化与管理,600多页。
3、Python学习
对于非程序员出身的新手小白来说入门很简单,精通还是不容易的。如果你仅仅是停留在用Python进行数据处理和分析的阶段上,建议《利用Python进行数据分析》这本书非常不错,不要去学python开发、python编程之类的书,Python可以用来做很多事情,但对于数据分析师而言,我们可能不需要用Python来开发什么游戏、网站等,我们只需要进行数据控制、处理、整理和分析即可,系统地学一下python中的数据科学库是非常有必要的,如:Numpy、pandas等。
4、可视化
有很多可视化的工具,用Excel可以实现可视化,powerBI、Tableau、Python也可以可视化。工具的选择是一方面,另一方面是对于图表的理解,什么场合适用什么样的图表。
用Excel做排列图
5、数据分析的思维和方法
参考书籍《深入浅出数据分析》,把道理方法讲的很透彻的一本书,对于深入理解底层逻辑很友好。《谁说菜鸟不会数据分析》系列,主要是对于方法和工具使用的学习。可参考之前的文章 数据分析方*** 来大概了解。
6、统计学
《深入浅出统计学》非常棒的一本书,对于统计学的基本概念的解释非常直白到位,让小白能够清楚地理解这个公式为什么是这样子的,而不是直接摆公式。底层逻辑明白后,可以参考李航的《统计学习方法》,这是大学课本,有时间的话还是应该好好研究一下系统逻辑的。
7、对业务的理解
推荐《数据挖掘与数据化运营实战》,这本书对业务与数据分析怎么结合有很详细的说明和实例。
[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:83115484@qq.com,我们会予以删除相关文章,保证您的权利。转载请注明出处:http://www.servicehomeload.com/post/8712.html发布于 11-06