分享好友 最新动态首页 最新动态分类 切换频道
数据分析师=7大主题,24份资料
2024-11-07 22:47

大家好,我叫Peter,一名爱好美食的数据分析师,公众号【尤而小屋】的主人,一直在等你的到来喔😊

数据分析师=7大主题,24份资料

18年毕业后自学Python和数据相关的很多内容,转行了数据分析,算是踏入了互联网这个大环境。当然现在也还在继续学习的路上。

286d9a87de151803d9990c653fa5defc.png

如果你想转行数据分析师,你该学习什么,又该怎么学?一张思维导图告诉你

d046616222f630af7f148b110ba5105a.png

下面我将自己使用过或者正在使用的资料以及一丢丢经验分享给大家,希望对大家有所帮助,也欢迎一起交流

  • 技能方面:Python、SQL、Excel、Hive

  • 机器学习算法:常见的机器学习算法,比如:K-近邻、决策树、随机森林、K-means聚类、PCA、支持向量机等

  • 数据可视化:数据的表现形式优先级:图形 > 表格 > 文字,可视化图形尤其是动态的可视化图形能够更好的展现数据结果

  • 数据模型与分析方法:RFM模型、海盗模型、漏斗模型、杜邦分析模型等

  • 统计知识:数据分析是避不开统计的,比如各种数据分布、假设检验、中心极限定理等,重点需要掌握的一个点A/B test

  • 数据运营工具:学习流行的数据分析开源工具,例如:神策、百度统计、Growing IO等

  • 软技能:PPT制作、文档输出、思维导图工具,比如:xmind、draw.io、百度脑图、mindmaster等,甚至Axure等产品工具也需要掌握

首先,作为一名数据分析师需要掌握的技能:Python、SQL、Excel、Hive。

MySQL/SQL

工作中正常的公司都有自己的数据库,必须掌握从业务库中快速获取数据的能力。目前大部分的公司是MySQL和Hive,需要重点掌握它们二者的语法。

资料1:自己在网易云看过的MySQL入门视频:《MySQL入门到精通系列》,真的非常适合小白入门,从MySQL安装,到4种语言,到查询语句等,老师讲解的非常详细。

推荐指数:✨✨✨✨✨

视频地址:https://study.163.com/course/courseMain.htm?courseId=1005092013

6e6cbd4190956b75ed365eb8cccc46d7.png

资料2:视频入门还是挺快的,但经典书籍你也不能错过:《SQL必知必会》,这绝对是你入门SQL不能错过的书籍。

Peter自己看过2遍,写过一篇总结,欢迎阅读:SQL必知必会,万字精华总结

推荐指数:✨✨✨✨✨

资料3:入门了SQL,想提升一下,网上也有很多的资料,但是强烈推荐Peter整理的一份练习题:《MySQL经典50题》。主要是通过4张表来关联练习的。Believe Me,如果坚持做完50题,你的SQL能力会有质的飞跃。

获取方式关注公众号【尤而小屋】,发送MySQL50,Peter会将经典50题的pdf发送给你。

推荐指数:✨✨✨✨✨

f245ece181f396573b41f4f37b35c50c.png

Hive

目前很多公司的数据已经从业务库迁移到了Hive中,所以有些时候我们也可以直接通过hive在ods层进行数据的查询

资料4:B站上面尚硅谷的Hive教程,资料地址:https://www.bilibili.com/video/BV1W4411B7cN?from=search&seid=14258581886020041832

推荐指数:✨✨✨✨

当然还是更推荐官网,毕竟权威,英语不会也要多啃:https://cwiki.apache.org/confluence/display/Hive/LanguageManual

Python

Python真的过于强大:从后端开发、爬虫、数据分析、机器学习、深度学习、测试、金融量化投资、网络安全等不同的领域都有着广泛应用,如果真的是小白,如何入门呢

资料5:首先在B站上面找一套视频,从安装Python环境开始跟着学习。将一整套视频看下来,自己跟着敲,对这门语言有一个整体的概念,推荐一份的视频:https://www.bilibili.com/video/BV1wD4y1o7AS?from=search&seid=6129245389392217030。网上视频也很多,视频最好坚持一套看完。

推荐指数:✨✨✨✨

资料6:看视频入门快,但是看书系统地学习也是必经之路,尤其是Python有很多的经典书籍:《Python编程.从入门到实战》,传说中的蟒蛇书

推荐指数:✨✨✨✨✨

5e9b3388f7aa6480a0bb1e9ebea4db1e.png

资料7:还有另外一本Python的动物书,也是经典之作,自己也在慢慢吸收中:《流畅的Python》,传说中的蜥蜴书

推荐指数:✨✨✨✨✨

7534a4c35564a5456df2331699ef2ac7.png

看完一套视频,加上经典书籍,相信入门Python是不成问题的,慢慢啃呗!Excel不介绍,网上资料数不胜数,相信你自己的百度能力

吴恩达老师

如果你在步入机器学习的路上,吴恩达老师的大名你肯定听过,绝对的大牛。介绍一门他的机器学习入门视频,同样是来自网易云课堂

资料8:《吴恩达机器学习》视频,视频地址:https://study.163.com/course/courseMain.htm?courseId=1004570029

推荐指数:✨✨✨✨✨

下面是Peter曾经整理的章节内容,供参考学习

858b0fa3760236637d0865058b78a713.png

李航博士

现在很多的公司,特别是大厂,如果是数据分析师都要求一些常见的机器学习算法和建模的知识,当然是在你已经入门Python的基础上,最好使用Python做机器学习。下面👇推荐几本入门机器学习的经典书籍,很多大厂的机器学习算法面试题都是出自书中。

资料9:李航老师的《统计学习方法》,目前已经是第二版,超级经典的一本书。讲了很多机器学习的经典算法,从监督学习到无监督学习,推荐一份GitHub上的学习资料,包含代码、学习文档:https://github.com/fengdu78/lihang-code

推荐指数:✨✨✨✨✨

82ec006f9204b85e7c166264c0b32389.png

周志华老师

如果李航老师的书太过于理论,那么看南京大学周志华老师的《机器学习》,各种案例讲解机器学习算法的实战,因为整本书都是以西瓜作为例子,那么一起来吃瓜吧

资料10:周志华老师《机器学习》西瓜书🍉,配套笔记学习更省力:https://github.com/Sophia-11/Machine-Learning-Notes

b3999f62d8660366801aeab8b27c2acc.png

推荐指数:✨✨✨✨✨

不管是李航老师的《统计学习方法》,还是周志华老师的西瓜书,都涉及到了很多的公式,那么由Datawhale,一个开源组织的成员,整理的南瓜书绝对是你的好帮手

资料11:西瓜书的配套参考机器学习公式详解,南瓜书地址:https://github.com/datawhalechina/pumpkin-book

420348c1a2f87b8f1366263400a84767.png

Python数据库

Python之所以强大,就是因为它有很多第三方的库。在机器学习和数据分析方向最为出名的就是numpy和pandas。

numpy主要是进行数值和矩阵运算

资料12:numpy中文官网:https://www.numpy.org.cn/;英文好的话,啃这里:https://numpy.org/devdocs/user/absolute_beginners.html

推荐指数:✨✨✨✨✨

菜鸟教程中关于numpy也还不错的:https://www.runoob.com/numpy/numpy-tutorial.html

推荐指数:✨✨✨✨

e99226b4427f54fc5212d0abf8b89217.png

pandas主要是用于数据处理和数据分析

资料13:官网学习地址:https://pandas.pydata.org/docs/reference/index.html;中文官网地址:https://www.pypandas.cn/

推荐指数:✨✨✨✨✨

2de1dc4fdb45d8e0ee6d8314de2be11e.png

当然,还是希望你跟着Peter的教程来入门和进阶,详细的代码+丰富的案例,图解形式。目前入门教程13篇已经完成,公众号回复:pandas,即可进群领取学习资料。

资料14:Peter的《Pandas入门教程V1.0》,非常适合入门

推荐指数:✨✨✨✨✨

e90f3936d5cbf224aaf4bb52df08de4b.png

机器学习部分介绍完毕。如果你真的能够啃下来,你已经可以往数据挖掘工程师,甚至是机器学习方向发展。但是数据分析师也要熟悉常见的算法,真的就慢慢啃吧!太卷了

俗话说的好一图胜千言。当我们在展示数据的时候,图优于表格,表格优于文字。所以你必须一定的数据可视化表达能力。

Python有很多的可视化库,比如传统且强大的静态库:matplotlib,seaborn等,pandas本身也是支持画一些简单的图形。如果你想学习动态的可视化图形,强烈推荐Peter的plotly教程,一个高级的可视化神器。目前已经完成12篇常见图形的制作。

资料15:Peter的Plotly可视化图形制作专栏。Plotly的文章会坚持下去,以后还会有高级使用方法Dash,计划将来会出一本基于Plotly绘图的Python可视化书籍,敬请期待

推荐指数:✨✨✨✨✨

bcf033aab045aeed569d0da72868363f.png

资料16:另外还推荐一个国产的可视化神器:pyecharts,基于Python+echarts的组合,也是非常厉害,支持国产,中文官网地址:https://gallery.pyecharts.org/#/README

推荐指数:✨✨✨✨✨

数据总是离不开统计的,所以必须掌握常见的统计知识。推荐一个视频和一本书

资料17可汗学院的《统计学》公开课,地址:http://open.163.com/newview/movie/courseintro?newurl=/special/Khan/khstatistics.html

推荐指数:✨✨✨✨

B站上面也可以观看:https://www.bilibili.com/video/BV1i4411e7sT/

这门课是统计学入门课程,将涵盖统计学所有的主要知识,包括:随机变量、均值方差标准差、统计图表、概率密度、二项分布、泊松分布、正态分布、大数定律、中心极限定理、样本和抽样分布、参数估计、置信区间、伯努利分布、假设检验和p值、方差分析、回归分析等内容。

资料18:一本书是《统计学》,魏宗舒,施锡铨等作者翻译的

在这个知乎中问答中提到了很多的经典统计书籍,可以参考:https://zhuanlan.zhihu.com/p/350278749

推荐指数:✨✨✨✨

学完统计的基本知识,重点需要掌握一个知识点,也是很多大厂在面试的时候喜欢提问的一个知识点A/B test

“A/B测试不一定是最好的评估方法。它不是万能的,但不会A/B测试肯定是不行的。”

—— 字节跳动副总裁杨震原

资料19:推荐2篇文章来进行学习

1、A/B Testing:https://www.optimizely.com/optimization-glossary/ab-testing/

2、没有最好,只有A/B测试:https://mp.weixin.qq.com/s/PatFgf7c8QSi0MIAhFuY5A

推荐指数:✨✨✨✨✨

cabc0cf825a537323b5aaf26d8c232ca.png

在数据分析的过程中,我们会接触到很多的数据模型和分析方法

资料20:多种数据分析的模型和分析方法

  • SWOT分析

  • PEST分析

  • 留存分析

  • 群组Corhort分析

  • 海盗模型AARRR

  • 马斯洛需求模型

  • RFM模型

  • 漏斗转化模型

  • 5W3H模型

  • 用户金字塔模型…...

上面👆的模型和分析不展开讨论,可以查询资料学习。重点解释下海盗模型

AARRR是Acquisition、Activation、Retention、Revenue、Refer,这个五个单词的缩写,分别对应这一款移动应用生命周期中的5个重要环节,即获取用户、提高活跃度、提高留存率、获取收入、病毒式传播。

现在很多公司数据的部门会和运营岗位打交道,数据分析师或者数据产品岗位经常会接触到埋点等任务,需要熟悉使用常见的数据运营工具

资料21神策、百度统计、Growing IO

其实当我们接触到数据的时候,更多的是和用户在间接打交道,数据几乎都是用户产生的。

资料22:下面推荐三本书,主要讲解的是数据如何指导用户运营

第一本《增长黑客》,增长黑客之父肖恩的杰作

推荐指数:✨✨✨✨✨

a1f0fa9d024995e977b8660d25130078.png

第二本:《硅谷.增长黑客实战笔记》,作者是肖恩的徒弟曲卉

推荐指数:✨✨✨✨

0ac785ce49e4d0e296e92c0c1f38093e.png

第三本:《运营之光》,黄有璨老师的运营实战经验总结

推荐指数:✨✨✨✨

d0bca0fb5f38a13c7d35fe20c336856b.png

软技能包含很多方面,从PPT制作、文字产出、思维导图工具使用等,都需要我们长期积累和锻炼

  • 如何制作PPT,撰写文案

  • 如何输出一份合格的数据分析报告

  • 如何通过思维导图工具来记录知识点等…...

下面推荐两个自己经常使用的思维导图工具

资料23Xmind+Lighten(Xmind子产品,仅支持ios系统,比如文章开头的思维导图就是用Lighten绘制的;另一个是draw.io,一个在线也可以在本地绘图的工具,支持各种图形,十分强大,比如曾经绘制的数仓分层图形

地址:https://app.diagrams.net/#

推荐指数:✨✨✨✨✨

7c9645455d4e2fdb69c0bb899c6faedf.png

如今的互联网发展太快,很卷!需要学习的东西真的很多,从SQL、Python等的硬技能,到PPT、思维导图等软技能的掌握,都是我们需要学习和提升的点,希望本文对想转行数据分析或者正在转行数据的你有些帮助,欢迎一起交流学习。最后在推荐一本经典书籍

资料24:《精益数据分析》,如何将数据分析运用在商业中。

推荐指数:✨✨✨✨✨

b83abfb4f28685255962c55fb3877212.png

a87b63eb1184e5d0c2e2e840536231d0.gif

推荐阅读

bde8ed46409813699c5def212d086066.gif

生日快乐:尤而小屋两周岁啦

55个案例:吃透Python字符串格式化

图解Pandas重复值处理

Python入门-字符串初相识

图解Pandas的缺失值处理

最新文章
如何有效利用百度购买关键词排名提升网站流量
青衣网络-www.ra0.cn:如何有效利用百度购买关键词排名提升网站流量目录:1. 理解百度关键词购买机制2. 确定目标关键词的策略3. 关键词竞价与优化技巧4. 监控和调整关键词表现5. 避免常见错误和陷阱6. 结语正文:理解百度关键词购买机制在
经验:百度收录规则与机制:运营专家分享亲身经历,提升收录率的秘诀
随着信息化时代的飞速发展,百度收录成为了每一位内容创作者难以避免的难题。本人身为一名具有丰富经验的运营专家,深谙百度收录规则与机制。今日在此,愿将亲身经历与众共享,期盼能为同业者带来有益的启示。百度收录的意义与现状首先要明
微信视频号链接地址怎么提取?4套方法都能用。
3. 点击链接中的保存视频按钮即可将视频保存到您的设备,或者直接提取视频号视频的链接。建议:选择在线视频下载器时,请确保选择合法可靠的网站,以避免安全风险。同时,在选择视频格式和质量时,根据您的需求考虑下载速度和存储空间。方
最新Q/W防洪跳转页面/微信小程序跳转到未备案域名
wwthyn.lanzoup.com/iJJ3f1hpcq2j使用教程: 1.上传插件网站根目录 2.打开khyy文件夹 修改index.php文件中的链接(url前面的0是跳转时间,可自行设置) echo 'html head     meta http-equiv="refre
苹果cms模板_我的主题网【第二十五套】精简宽屏大气苹果CMSv10模板DIY系列拆分版...
苹果cmsv10下载地址:https://www.mytheme.cn/maccms/243.html这款苹果cmsv10模板依然是DIY系列样式,优化重构了前期同系列的不足,添加了更流行的元素和设计风格,这是我们完全自主开发没用任何css框架且只针对影
SEO高手秘籍,网站搜索引擎脱颖而出之道
SEO优化高手通过深入理解搜索引擎算法,精准关键词研究,优化网站结构、内容和外部链接,提升网站质量和用户体验,从而让你的网站在搜索引擎中排名靠前,吸引更多流量。掌握这些技巧,让你的网站脱颖而出。探秘SEO优化基本原理精通SEO优化
seo优化面纱介绍 揭秘SEO优化面纱:提升排名的秘密策略
在当今这个信息爆炸的时代,互联网已成为企业展示自我、吸引客户、拓展市场不可或缺的重要平台而在这片浩瀚的数字海洋中,如何让您的网站脱颖而出,成为用户搜索时的首选,SEO(Search Engine Optimization,搜索引擎优化)优化无疑是一把
分析大型门户网站截取热门流量的SEO策略
一说到热门流量这个词,我想大家都会很快的想到利用热门话题或者热门事件来获取短期的高流量,在SEO里这种方式一般被称为截取流量,也就是利用SEO的方式来在短期内获得热门关键词的较好排名,从而获取短期的热门流量。比如网络上经常会出现
相关文章
推荐文章
发表评论
0评