主讲老师: 卢森煌(培训费:2-2.5万元/天)
工作背景:
曾任职阿里巴巴毕业于北京邮电大学0-1策划多个传播量过亿的互联网营销案例孵化过30个账号,单条百万播放视频过100条操盘互联网渠道销售金额累计10亿前啊喔科技CEO,18个月完成3...
主讲课程:
《制造业数智化转型的机遇与挑战》《ChatGPT原理与移动通信的结合》《基于人工智能进行人物形象设计》《AI在直播和短视频中的应用》
 				Python应用与大数据分析课程大纲详细内容
课程分类: 大数据
课程目标:
课程对象:
课程时间:
时间  | 培训项目  | 具体内容  | 
  | ||
第 一 天 上 午  | Python Package 与数据分析  | Numpy/Scipy/Pandas/Matplotlib/Seaborn库  | 
  | ||
Numpy基础属性与数组创建  | 
  | ||||
Numpy索引  | 
  | ||||
Numpy数学运算与常用分布  | 
  | ||||
Pandas数据处理与分析  | 
  | ||||
Pandas文件读写和个性化控制  | 
  | ||||
Pandas的concat与merge  | 
  | ||||
Matplotlib 基本图结构介绍  | 
  | ||||
基于Matplotlib绘制散点图、柱状图、等高线、3D图等  | 
  | ||||
多图合并与图片文件存取  | 
  | ||||
Seaborn/PyEcharts等包的使用  | 
  | ||||
scikit-learn的介绍和典型使用  | 
  | ||||
TensorFlow经典应用  | 
  | ||||
多元高斯分布  | 
  | ||||
典型图像处理  | 
  | ||||
多种数学曲线  | 
  | ||||
多项式拟合  | 
  | ||||
代码 和案例实践  | 快速傅里叶变换FFT与信号处理  | 
  | |||
Soble/Prewitt/Laplacian算子与卷积网络  | 
  | ||||
卷积与(指数)移动平均线  | 
  | ||||
股票数据分析  | 
  | ||||
缺失数据的处理和预测  | 
  | ||||
环境数据异常检测和分析  | 
  | ||||
快速傅里叶变换FFT  | 
  | ||||
图像处理与奇异值分解SVD  | 
  | ||||
第 一 天 下 午 : 实 践  | 使用numpy、 PIL等包 实现图像的卷积  | 使用Python常用包实现给定图像的卷积输出  | 
  | ||
比较不同卷积核的效果  | 
  | ||||
将OpenCV和PIL读取图像的结果比较异同  | 
  | ||||
使用 TensorFlow/Keras 实现猫狗分类  | 了解TensorFlow的基本流程  | 
  | |||
学会使用Keras搭建卷积神经网络  | 
  | ||||
比较padding、stride、卷积核大小对输出图像的影响  | 
  | ||||
掌握图像分类的方法和步骤  | 
  | ||||
第 二 天 上 午  | 机器学习基础 与多元回归  | 线性回归  | |||
Logistic/Softmax回归  | |||||
广义线性回归  | |||||
L1/L2正则化  | |||||
Ridge与LASSO  | |||||
Elastic Net  | |||||
梯度下降算法:BGD与SGD  | |||||
特征选择与过拟合  | |||||
Softmax回归的概念源头  | |||||
最大熵模型  | |||||
K-L散度  | |||||
代码 和案例实践  | 鸢尾花数据集的分类  | ||||
股票数据的特征提取和应用  | |||||
泰坦尼克号乘客缺失数据处理和存活率预测  | |||||
环境检测数据异常分析和预测  | |||||
模糊数据查询和数据校正方法  | |||||
PCA与鸢尾花数据分类  | |||||
二手车数据特征选择与算法模型比较  | |||||
广告投入与销售额回归分析  | |||||
第 二 天 下 午 : 实 践  | 实现葡萄酒 三分类数据 的逻辑回归建模 与应用  | 使用Pandas读写文件csv等表格文件  | |||
实现scikit-learn的建模总过程  | |||||
掌握scikit-learn中的常用函数,并学会使用官网查阅帮助文档  | |||||
混淆函数的使用和正确率、准确率、召回率、F1-Measure等的度量  | |||||
基于人口特征 数据预测年收入  | 缺失值、异常值处理  | ||||
One-Hot编码的应用场景分析  | |||||
字符串特征的处理  | |||||
样本不均衡问题的初步理解和使用  | |||||
第 三 天 上 午  | 决策树、 随机森林、 SVM  | 熵、联合熵、条件熵、KL散度、互信息  | 
  | ||
最大似然估计与最大熵模型  | 
  | ||||
ID3、C4.5、CART详解  | 
  | ||||
决策树的正则化  | 
  | ||||
预剪枝和后剪枝  | 
  | ||||
Bagging  | 
  | ||||
不平衡数据集的处理  | 
  | ||||
利用随机森林做特征选择  | 
  | ||||
使用随机森林计算样本相似度  | 
  | ||||
线性可分支持向量机  | 
  | ||||
软间隔  | 
  | ||||
损失函数的理解  | 
  | ||||
核函数的原理和选择  | 
  | ||||
SMO算法  | 
  | ||||
支持向量回归SVR  | 
  | ||||
多分类SVM  | 
  | ||||
代码 和案例实践  | 随机森林与特征选择  | 
  | |||
决策树应用于回归  | 
  | ||||
多标记的决策树回归  | 
  | ||||
决策树和随机森林的可视化  | 
  | ||||
葡萄酒数据集的决策树/随机森林分类  | 
  | ||||
泰坦尼克乘客存活率估计  | 
  | ||||
葡萄酒数据分类  | 
  | ||||
数字图像的手写体识别  | 
  | ||||
MNIST手写体识别  | 
  | ||||
SVR用于时间序列曲线预测  | 
  | ||||
SVM、Logistic回归、随机森林三者的横向比较  | 
  | ||||
第 三 天 下 午 : 实 践  | 路透社新闻 语聊的分类  | 文本数据的特征抽取方法  | 
  | ||
中英文分类模型的区别和联系  | 
  | ||||
分词系统的使用和优化  | 
  | ||||
机器学习分类模型的综合运用  | 
  | ||||
图像 像素聚类 与调色板的应用  | 矢量量化算法的实现  | 
  | |||
图像通道的综合运用  | 
  | ||||
自动选择聚类个数与elbow-method  | 
  | ||||
计算聚类指标并比较相互关系  | 
  | ||||

