1. 介绍
大约 1 分钟
数据分析入门。
相关信息
学习视频:
- https://www.bilibili.com/video/BV1NB4y1T7gY,数据分析中的统计学原理
- https://www.bilibili.com/video/BV1xm4y1a7nG,学习 Pandas 和数据分析
1. 什么是数据分析
数据分析 是利用数学、统计学理论相结合的科学统计分析方法、对 Excel 数据、数据库中的数据、收集的大量的数据、网页抓取的数据进行分析,从中提取有从价值的信息并形成结论进行展示的过程。
数据分析主要内容:
- 现状分析:分析已经发生了什么
- 原因分析:分析为什么会出现这种现状
- 预测分析:预测未来可能发生什么
2. 数据分析的重要性
3. 数据分析的基本流程
数据分析的基本流程如下:
- 熟悉工具
- 明确目的
- 获取数据
- 数据处理
- 数据分析
- 验证结果
- 结果呈现
- 数据应用
数据处理方法思维导图:
- 数据规约
- 减少数据规模
- 数据清洗
- 数据探索分析
- 重复数据处理
- 缺失数据处理
- 异常数据处理
- 数据加工
- 数据抽取
- 数据计算
- 数据分组
- 数据转换
4. 数据分析的常用工具
Excel 工具:功能强大,可以创建表格、数据透视表和 VBA 等,适合少量数据。描述性分析阶段,可做对比分析、趋势分析、结构分析等。
Python 语言:功能强大并且灵活,可编写代码执行任何操作。Python 可以实现 Excel 难以实现的应用场景,如专业的统计分析、预测分析。
5. 搭建数据分析环境
安装 Anaconda 环境,其中常见的工具包如下:
- Jupyter Notebook
- NumPy
- Pandas
- Matplotlib
- IPython