主讲老师: 卢森煌(培训费:2-2.5万元/天)
工作背景:
曾任职阿里巴巴毕业于北京邮电大学0-1策划多个传播量过亿的互联网营销案例孵化过30个账号,单条百万播放视频过100条操盘互联网渠道销售金额累计10亿前啊喔科技CEO,18个月完成3...
主讲课程:
《制造业数智化转型的机遇与挑战》《ChatGPT原理与移动通信的结合》《基于人工智能进行人物形象设计》《AI在直播和短视频中的应用》

Python应用与大数据分析课程大纲详细内容
课程分类: 大数据
课程目标:
课程对象:
课程时间:
时间 | 培训项目 | 具体内容 |
| ||
第 一 天 上 午 | Python Package 与数据分析 | Numpy/Scipy/Pandas/Matplotlib/Seaborn库 |
| ||
Numpy基础属性与数组创建 |
| ||||
Numpy索引 |
| ||||
Numpy数学运算与常用分布 |
| ||||
Pandas数据处理与分析 |
| ||||
Pandas文件读写和个性化控制 |
| ||||
Pandas的concat与merge |
| ||||
Matplotlib 基本图结构介绍 |
| ||||
基于Matplotlib绘制散点图、柱状图、等高线、3D图等 |
| ||||
多图合并与图片文件存取 |
| ||||
Seaborn/PyEcharts等包的使用 |
| ||||
scikit-learn的介绍和典型使用 |
| ||||
TensorFlow经典应用 |
| ||||
多元高斯分布 |
| ||||
典型图像处理 |
| ||||
多种数学曲线 |
| ||||
多项式拟合 |
| ||||
代码 和案例实践 | 快速傅里叶变换FFT与信号处理 |
| |||
Soble/Prewitt/Laplacian算子与卷积网络 |
| ||||
卷积与(指数)移动平均线 |
| ||||
股票数据分析 |
| ||||
缺失数据的处理和预测 |
| ||||
环境数据异常检测和分析 |
| ||||
快速傅里叶变换FFT |
| ||||
图像处理与奇异值分解SVD |
| ||||
第 一 天 下 午 : 实 践 | 使用numpy、 PIL等包 实现图像的卷积 | 使用Python常用包实现给定图像的卷积输出 |
| ||
比较不同卷积核的效果 |
| ||||
将OpenCV和PIL读取图像的结果比较异同 |
| ||||
使用 TensorFlow/Keras 实现猫狗分类 | 了解TensorFlow的基本流程 |
| |||
学会使用Keras搭建卷积神经网络 |
| ||||
比较padding、stride、卷积核大小对输出图像的影响 |
| ||||
掌握图像分类的方法和步骤 |
| ||||
第 二 天 上 午 | 机器学习基础 与多元回归 | 线性回归 | |||
Logistic/Softmax回归 | |||||
广义线性回归 | |||||
L1/L2正则化 | |||||
Ridge与LASSO | |||||
Elastic Net | |||||
梯度下降算法:BGD与SGD | |||||
特征选择与过拟合 | |||||
Softmax回归的概念源头 | |||||
最大熵模型 | |||||
K-L散度 | |||||
代码 和案例实践 | 鸢尾花数据集的分类 | ||||
股票数据的特征提取和应用 | |||||
泰坦尼克号乘客缺失数据处理和存活率预测 | |||||
环境检测数据异常分析和预测 | |||||
模糊数据查询和数据校正方法 | |||||
PCA与鸢尾花数据分类 | |||||
二手车数据特征选择与算法模型比较 | |||||
广告投入与销售额回归分析 | |||||
第 二 天 下 午 : 实 践 | 实现葡萄酒 三分类数据 的逻辑回归建模 与应用 | 使用Pandas读写文件csv等表格文件 | |||
实现scikit-learn的建模总过程 | |||||
掌握scikit-learn中的常用函数,并学会使用官网查阅帮助文档 | |||||
混淆函数的使用和正确率、准确率、召回率、F1-Measure等的度量 | |||||
基于人口特征 数据预测年收入 | 缺失值、异常值处理 | ||||
One-Hot编码的应用场景分析 | |||||
字符串特征的处理 | |||||
样本不均衡问题的初步理解和使用 | |||||
第 三 天 上 午 | 决策树、 随机森林、 SVM | 熵、联合熵、条件熵、KL散度、互信息 |
| ||
最大似然估计与最大熵模型 |
| ||||
ID3、C4.5、CART详解 |
| ||||
决策树的正则化 |
| ||||
预剪枝和后剪枝 |
| ||||
Bagging |
| ||||
不平衡数据集的处理 |
| ||||
利用随机森林做特征选择 |
| ||||
使用随机森林计算样本相似度 |
| ||||
线性可分支持向量机 |
| ||||
软间隔 |
| ||||
损失函数的理解 |
| ||||
核函数的原理和选择 |
| ||||
SMO算法 |
| ||||
支持向量回归SVR |
| ||||
多分类SVM |
| ||||
代码 和案例实践 | 随机森林与特征选择 |
| |||
决策树应用于回归 |
| ||||
多标记的决策树回归 |
| ||||
决策树和随机森林的可视化 |
| ||||
葡萄酒数据集的决策树/随机森林分类 |
| ||||
泰坦尼克乘客存活率估计 |
| ||||
葡萄酒数据分类 |
| ||||
数字图像的手写体识别 |
| ||||
MNIST手写体识别 |
| ||||
SVR用于时间序列曲线预测 |
| ||||
SVM、Logistic回归、随机森林三者的横向比较 |
| ||||
第 三 天 下 午 : 实 践 | 路透社新闻 语聊的分类 | 文本数据的特征抽取方法 |
| ||
中英文分类模型的区别和联系 |
| ||||
分词系统的使用和优化 |
| ||||
机器学习分类模型的综合运用 |
| ||||
图像 像素聚类 与调色板的应用 | 矢量量化算法的实现 |
| |||
图像通道的综合运用 |
| ||||
自动选择聚类个数与elbow-method |
| ||||
计算聚类指标并比较相互关系 |
|