0%

深度学习中的张量的形状是什么?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
张量可以理解为 多维数组:

0 维张量 → 一个标量(单个数字,例如 5)

1 维张量 → 一个向量(数组,例如 [1, 2, 3])

2 维张量 → 一个矩阵(表格,例如 [[1,2],[3,4]])

3 维张量 → 例如一张彩色图片 [高度, 宽度, 通道数]

4 维张量 → 一批彩色图片 [批大小, 高度, 宽度, 通道数]

张量的 形状 就是它的 维度大小,告诉我们张量里有多少数据。

例子:

import torch

x = torch.randn(1, 3, 224, 224) # 随机生成一个张量
print(x.shape)


输出:

torch.Size([1, 3, 224, 224])


解释:

1 → 批量大小(batch size),表示有 1 张图片

3 → 通道数(RGB 三个通道)

224, 224 → 图片的高度和宽度