跳至主要內容

1. 介绍

Alex Sun大约 1 分钟

数据分析入门。

相关信息

学习视频:

1. 什么是数据分析

数据分析 是利用数学、统计学理论相结合的科学统计分析方法、对 Excel 数据、数据库中的数据、收集的大量的数据、网页抓取的数据进行分析,从中提取有从价值的信息并形成结论进行展示的过程。

数据分析主要内容:

  • 现状分析:分析已经发生了什么
  • 原因分析:分析为什么会出现这种现状
  • 预测分析:预测未来可能发生什么

2. 数据分析的重要性

3. 数据分析的基本流程

数据分析的基本流程如下:

  • 熟悉工具
  • 明确目的
  • 获取数据
  • 数据处理
  • 数据分析
  • 验证结果
  • 结果呈现
  • 数据应用

数据处理方法思维导图:

  • 数据规约
    • 减少数据规模
  • 数据清洗
    • 数据探索分析
    • 重复数据处理
    • 缺失数据处理
    • 异常数据处理
  • 数据加工
    • 数据抽取
    • 数据计算
    • 数据分组
    • 数据转换

4. 数据分析的常用工具

Excel 工具:功能强大,可以创建表格、数据透视表和 VBA 等,适合少量数据。描述性分析阶段,可做对比分析、趋势分析、结构分析等。

Python 语言:功能强大并且灵活,可编写代码执行任何操作。Python 可以实现 Excel 难以实现的应用场景,如专业的统计分析、预测分析。

5. 搭建数据分析环境

安装 Anaconda 环境,其中常见的工具包如下:

  • Jupyter Notebook
  • NumPy
  • Pandas
  • Matplotlib
  • IPython