卷积神经网络 (CNN) 是怎么"看懂"一张图片的?
想象你是一个侦探,要识别一张模糊的照片里写了什么数字。你会怎么做? 你可能会先找边缘(哪里有笔画?),再看形状(是弯的还是直的?),最后综合判断(像一个 7!)。CNN 也是这样工作的——它用"卷积核"找边缘, 用"激活函数"过滤信号,用"池化"压缩信息,最后用"全连接层"做出判断。
👇 在下方画布上写一个数字,然后观察 CNN 是怎么一步步处理它的。
0
输入层:手写数字
28 × 28 像素
示例数字:
在黑色画布上用鼠标/手指写一个数字(0-9)
或点击上方示例数字快速体验
⚙
参数调节
调整参数,观察输出尺寸的变化
检测水平方向的边缘,就像用铅笔横向划过图像,只会留下横向的笔迹
S = 1
步长越大,卷积核滑动越快,输出越小。就像走路:大步走虽然快,但容易错过路边的风景。
P = 0
填充就像给照片加白边:边缘像素也能被充分检测。填充越多,输出越大。
输出尺寸计算
O = (W - K + 2P) / S + 1
= (28 - 3 + 2×0) / 1 + 1
= (25) / 1 + 1
= 26
✏️
请先在上方画布上写一个数字,或点击示例数字
写好后,下方的 CNN 各层可视化会自动展示