Python数据分析实战

    TRAINING

课程特色:

使用Python进行数据分析是十分便利且高效的,因此python被认为是最优秀的数据分析工具之一,本课程从理论和实战两个角度对Python数据分析工具进行了介绍,并采用理论分析和Python实践相结合的形式,按照数据分析的基本步骤对数据分析的理论知识以及相应的Python库进行了详细的介绍,让同学在了解数据分析的基本理论知识的同时能够快速上手实现数据分析程序。

课程内容围绕numpy、pandas处理与计算数据,matplotlib、Seaborn对数据进行可视化展开。通过丰富的案例实战,综合所学习的知识,让同学们更深入了解数据分析和挖掘过程;

  

学员对象:

此培训课程适合对数据分析有兴趣的初学者,以及希望提升数据处理、分析和可视化技能的专业人士。课程内容涵盖Numpy、Pandas等基础库的使用数据清洗、重塑和聚合统计,以及Matplotlib、Seaborn、Pyecharts等数据可视化工具的应用,还包括词云制作、关联分析和实战案例分析,适合零售、金融等行业的数据分析从业者参加。 

学员需要具备python编程能力,熟悉python核心语法。具备统计学理论基础,熟练掌握EXCEL应用。


课程安排:5天课程(40课时)


授课形式:  

小班精讲(面授/直播)、案例分析、操作演示、练习实践、课堂即时互动交流答疑;

课后服务(1年内):课程答疑,课件资料升级分享,录播回看,免费重修



单元1   数据分析概念和Numpy

数据分析概述

Anaconda环境搭建和使用

jupyter notebook 使用

numpy概述和常用类型介绍

numpy Ndarray数组创建

random随机函数使用

数组访问

排序

赋值和矢量运算

数组操作(添加、删除、修改、合并)


单元2   Numpy应用实战

文件操作

NAN和INF处理

统计函数

字符串函数

一元函数和二元函数

矩阵运算函数


单元3   pandas 基础 

pandas数据结构-Series

pandas数据结构-Dataframe

读写Excel文件

读写Csv文件

访问Dataframe

使用索引和切片

使用花式索引和布尔索引

DataFrame赋值和计算

数据排序


单元4   pandas 数据重塑和清洗 

列的操作(添加,删除和修改)

行的操作(添加,删除和修改)

使用concat合并dataframe

使用merge连接dataframe

重置索引和修改列名

apply、map和applymap使用

缺失值查找

删除和更新缺失值

异常值查找和处理

重复值查找和处理

分类数据离散化

连续型数据离散化


单元5  pandas 数据分析

描述性统计

使用groupby 聚合统计

使用value_counts计算频次

数据透视表和数据交叉表

环比和同比

相关性分析

数据排列名次

时间序列和时间索引

时间索引重采样-升/降采样


单元6   数据可视化

数据可视化意义

数据可视化matplotlib概述

matplotlib常规配置

Latex常用格式

绘制基本图形(折线图、条形图、饼图、散点图)

绘制基本图形(箱型图、雷达图、面积图)

matplotlib绘图对象

matplotlib子图绘制

seaborn整体风格设置

seaborn基本图形绘制

seaborn高级图形绘制

数据可视化实战


单元7   词云和关联分析

jieba分词

jieba词频和分词字典

词云可视化文本

关联分析概念

Apriori和FP-growth算法

mlxtend包实现关联分析

案例实战:餐厅推荐


单元8   数据可视化之pyecharts

pyechars简介

理解全局配置和系列配置

理解配置逻辑

使用pyecharts绘制基本图形

使用pyecharts绘制:日历、地理坐标、漏斗图

使用pyecharts绘制:时间线、组合图形、词云等


单元9   数据分析实战

数据分析流程

客户细分-RFM模型

客户细分-RFM模型实战


单元10  数据分析项目案例

零售行业分析

拍拍贷互联网金融分析