深度学习模型设计

持续更新

Posted on Jan.16, 2020

卷积神经网络的复杂度分析

时间复杂度
1.1 单个卷积层的时间复杂度

M

K

1.2 卷积神经网络整体的时间复杂度

飞线

ElementWise-Add: 需要考虑两个分支的输出是合理的，比如Conv+ReLU的两个分支，进行Add操作是不合理的，因为会导致输出值过大而飞掉。此时Conv+BN+ReLU，因为批归一化的关系，使得值域在小数范围内，Add操作是可以的不会飞。
Concat: 该操作下，需要两个分支的结果分布是一致的。如果不一致的分布concat会导致训练不合理而紊乱。
总而言之，两个分支合并做操作，一定要保证值域或者说分布是合理的。