如何做好计算机视觉的研究工作,迎接更广阔的未来职业发展,能够上手应用,编写属于自己的神经网络和计算机视觉应用?本次课程将围绕着计算机视觉中最常见的RCNN图像识别算法进行极限剖析,从数学理论, 模型框架到实践实操,让你在短时间内从理论到实践,掌握深度学习的基本知识和学习方法。
· 目的:掌握神经网络的基本原理,知其然亦知其所以然(从数学实践到代码的熟练和精通);
· 手段:科学的方法。理论到实践的剖析;
· 成果:掌握计算机视觉的基本方法,从容地应对实践中面临的挑战。
课程大纲:
阶段1 图像预处理
第一课:图像处理基础
知识点:图像处理,灰度值提取,Histogram处理,视觉和图像变换(Warp),图像卷积
第二课:图像处理进阶:图像滤波,特征提取及匹配
知识点:Harris角点检测,Sift,Surf,Orb,图像特征点匹配, 边缘检测算法等(含所有带工具箱代码 和 纯numpy代码)
第三课:实践:利用KNN算法和OpenCV进行手写字符识别
阶段2: 创建自己的图像识别神经网络
第四课:深入理解神经网络的前向传递和反向传播及其物理意义
知识点:Loss function,交叉熵代价函数,梯度下降法求导
第五课:训练你自己的网络,重点为调参和工作中用到的一些技巧
知识点:Loss function,交叉熵代价函数,梯度下降法
第六课:卷积神经网络(RNN)在图像分类识别中的应用(附python编程和算法解析)
知识点:数据输入层,卷积计算层,激励层(Sigmoid,Tanh,ReLu,ELU),池化层,全联接层,Batch Normalization, 学习率
第七课:实践,不使用任何工具包,训练一个属于你自己的神经网络进行手写字符识别
系列3. 深度卷积神经网络进阶
第八课:不同的神经网络类别和应用
知识点:调参基本技巧,向量点积
第九课:深度卷积神经网络原理及实践
知识点,神经网络的迁移学习技巧
第十课:搭建图片搜索系统,深入理解Triplet Loss 及其训练技巧
第十一课:实践:使用Tensorflow/Keras搭建神经网络,进行图像分类
阶段4: 目标检测和LSTM标注法
第十二课: 目标检测算法
知识点:Fast RCNN , Faster RCNN, Yolo, SSD
第十三课:LSTM 标注学习
第十四课:实践:使用Tensorflow/Keras在数据集上进行目标检测
附加:Kaggle竞赛习题讲解
可下载件:
1. 训练数据集(如MNIST,COCO,车辆识别数据集等)
2. 经典教材的pdf版本(如Computer vision in C++ with the OpenCV Library Adrien-Kaebler著)
3. 所有课程所涉及算法的源代码
4. Kaggle数据集部分习题获奖源代码
授课对象:
计算机视觉是人工智能未来三大应用之一,也是人工智能技术应用方向的领头羊,被广泛使用在人脸识别,安防,无人驾驶等领域。目前国内人工智能一批独角兽不断涌出,在欧美各地亦有较多人才缺口,未来十年是计算机视觉技术和应用井喷的十年,本课程面向工业界未来人工智能人才,并传授老师的丰富实践经验。
课程特色:
1. 实战为先: 本课程提供全面的实战代码,让你很快上手相关实战学习的资料,并能从实战中加深对理论的研究
2. “类比”讲解:枯燥的数学公式往往比较抽象,难以达到直观的效果。通过“类比性”解释,比如能量分布解释,交叉熵的“熵”的解释,用物理的概念,更加直观地了解数学公式,也更深入CV学习的核心内容
3. 覆盖全面:图像分类,图像识别,目标检测,图像分割等,会全面讲解所涉及的CNN 以及Yolo 系列等前沿算法,通过NMS进行IOU优化,让学员对于CV有深入浅出的全面认识
4. 结合工作:在实际CV岗位的工作中,涉及到的调参类工作,优化类工作,模型选择类工作,模型优化类工作,图像标注类工作,也会在课程和习题中展现。
