# 各层位置关系

1660045681034

卷积核可以表示成一种特殊的多元线性回归的权重矩阵；由于权重矩阵有大量的参数是一样的，且有大量的 0 ，所以可以把权重矩阵的系数都压缩到一个卷积核中又不损失信息。卷积的这种数学操作的特点又保留了图片的空间信息，所以卷积是一种开销小于全连接层，但效果较好的操作。

所以在神经网络学习参数中，可以把对卷积核的拟合视为一种对神经元权重的拟合，只是神经元之间会以某种方式连接并且共享大量参数。

也可以很自然的推导出，如果没有池化层等非线性操作， 那么多层卷积就等同于一层卷积 ，只靠卷积操作无法拟合任意函数

# softmax

1660098073731

1660098331823

1660098649824

1660098696108

1660098731893

交叉熵：计算出来的概率和标签中的值进行交叉熵运算，数值越大代表两种概率模型的相差大

1660099048865

1660099705213

1660099734716

如果某个类别的预测概率为 1，则由对数函数可知，loss 得到的结果为 0

回顾极大似然估计

1660099879880

1660099929311

在样本上预测正确的概率，n 为样本量，因为是独立抽样，使用乘积

1660100071771

取对数加负号得到交叉熵损失函数

1660100159232

一个系统的信息熵是对这个系统平均编码的最小长度

信息的作用是消除不确定性

信息量：字字珠玑，废话连篇

信息量和它能消除的不确定性有关

每次更复杂的模型都是包含前面的小模型的

1660038487976

通过相加的形式来增加层数

1660039171985

Weight layer 为卷积层

1660041646946

右边的加入 1x1 的卷积层是要将 x 变为合适的通道数才能加得上去。

1660041986597

ResNet 最核心的是横着加过去的部分

1660042373930

1660042402196

	from torchvision.io import read_image
	from torchvision.models import resnet50, ResNet50_Weights

	# img 即为 tensor 类型了，torch.Size ([3, 1440, 1920])，但是数据的大小是图片自身的，没有归一到 [0,1] 上
	img = read_image(r"D:\Projects\pytorch-learn\Test6_mobilenet\images\falari.jpg")


	# Step 1: Initialize model with the best available weights
	weights = ResNet50_Weights.DEFAULT # 使用最佳权重
	model = resnet50(weights=weights) # 实例化模型，并使用预训练的参数

	model.eval() # 设置模型的预测模式，输入数据计算时不会改变梯度等参数

	# Step 2: Initialize the inference transforms
	preprocess = weights.transforms() # 实例化推理变换

	# Step 3: Apply inference preprocessing transforms
	# preprocess (img) # 对图片的 w 和 h 进行变换，使得能够输入网络中进行处理
	# unsqueeze (0), 在第一维度处插入一维，因为要向网络中插入 4 维的
	batch = preprocess(img).unsqueeze(0)

	# Step 4: Use the model and print the predicted category
	# model (batch) 得到 torch.Size ([1, 1000])
	# squeeze (0) 去掉第一维
	prediction = model(batch).squeeze(0).softmax(0)

	class_id = prediction.argmax().item() # argmax () 返回的是 Tensor，使用 item () 取出其中的值
	score = prediction[class_id].item()
	category_name = weights.meta["categories"][class_id] # 获得分类的名字
	print(f"{category_name}: {100 * score:.1f}%")