Back to Mvision

yolo v1 版本

darknect/tensorflow/yolo_v1/readme.md

latest974 B
Original Source

yolo v1 版本

Yolo V1 by tensorflow
23个卷积层
输入: 448*448*3  ,  输出: N*1*1470  

每张图片划分 77个网格 每个网格预测 2个框 每个框 5个参数 共同拥有 20个类别预测概率 77*(2*5+20)=1470

1. 448*448*3 图像输入
2. 7*7卷积步长2 64输出 + 2*2最大值池化步长2 
3. 3*3卷积步长1 192输出 + 2*2最大值池化步长2
4. 1*1卷积128输出 + 3*3卷积256输出 + 1*1卷积256输出 + 3*3卷积512输出 + 2*2最大值池化步长2
5. (1*1卷积256输出 + 3*3卷积512输出 )*4次 + 1*1卷积512输出 + 3*3卷积1024输出 + 2*2最大值池化步长2 
6. (1*1卷积512输出 + 3*3卷积1024输出)*2次 + 3*3卷积1024输出 + 3*3卷积步长2 1024输出
7. 3*3卷积1024输出*2次 
8. 全链接层(1*1卷积) 512输出 + 全链接层(1*1卷积)4096输出 + 全链接层(1*1卷积)1470输出

paper