【原创 深度学习与TensorFlow 动手实践系列 - 4】第四课:卷积神经网络 - 高级篇

 

 

 

 

 

提纲:

1. AlexNet:现代神经网络起源

2. VGG:AlexNet增强版

3. GoogleNet:多维度识别

4. ResNet:机器超越人类识别

5. DeepFace:结构化图片的特殊处理

6. U-Net:图片生成网络

7. 实例:剖析VGG,用模型进行模型参数可视化,特征提取,目标预测

 

期待目标:

1. 掌握AlexNet结构特点,神经网络各层之间特征传导关系,模型参数总数计算

2. 了解VGG,GoogLeNet,ResNet等复杂ImageNet模型的结构特点,简单设计思想

3. 针对特殊数据,特殊任务设计的神经网络结构

4. 深度剖析VGG TF代码,学会对已有模型进行参数读取,目标预测,特征提取。

 

 

 

AlexNet:现代神经网络起源

背景介绍:

ImageNet Challenge:1000类物体,每类1000张图片

传统方法思路:

1. 图片特征提取

2. 机器学习分类

 

 

背景介绍:

2010年冠军

System Overview

Dense Grid descriptor:HOG,LBP

Coding:Local coordinate super-vector

Pooling, SPM

Linear SVM

 

 

 2011年冠军:Xerox Lab

1. 特征提取

2. Fisher 压缩

3. SVM分类

 

 

 

 

 

 

 

 

 

 

VGG:AlexNet增强版

1. VGG-AlexNet 对比卷积层 - 卷积群参数个数:138m - 60m

2. 识别率(top5)7.3% - 15.3%

 

 

 

 

VGG作用:

1. 结构简单:同AlexNet结构类似,均为卷积层,池化层,全连接层的组合。

2. 性能优异:同AlexNet提升明显,同GoogleNet,ResNet相比,表现接近。

3. 选择最多的基本模型:方便进行结构的优化,设计,SSD,RCNN,等其他任务的基本模型(base model)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1. 为什么ResNet有效?

1. 前向计算:低层卷积网络高层卷经济网络信息融合;层数越深,模型的表现力越强。

2. 反向计算:导数传递更直接,越过模型,直达各层。

 

 

人脸识别数据特点:

结构化:所有人脸,组成相似,理论上能够实现对齐

差异化:相同位置,形貌不同

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

转载于:https://www.cnblogs.com/licheng/p/7048960.html


评论关闭
IT源码网

微信公众号号:IT虾米 (左侧二维码扫一扫)欢迎添加!