"Image" (神经网络编码器)
NetEncoder["Image"]
表示一个编码器,将二维图像转换成像素值的三阶张量.
NetEncoder[{"Image",size}]
表示一个编码器,重新调整输入图像为 size.
NetEncoder[{"Image",{width,height}}]
表示一个编码器,重新调整输入图像为指定的维度.
NetEncoder[{"Image",size,"param"val,…}]
表示一个带有预处理指定参数的编码器.
更多信息
- NetEncoder[…][input] 把编码器应用于一个输入,并产生一个输出.
- NetEncoder[…][{input1,input2,…}] 把编码器应用于一个输入列表,并产生一个输出列表.
- 编码器的输入可以是 Image[…] 对象或一个 File[…] 表达式.
- NetEncoder["Image"] 等同于 NetEncoder[{"Image",{128,128}}].
- 在构建网络时,可通过指定 "port"->NetEncoder[…] 将编码器附加到网络的输入端口上.
- 支持下列参数:
-
ColorSpace "RGB" 用于编码的色彩空间 "DataTransposed" False 宽度是否为第一维度 Interleaving False 通道是否交织 "MeanImage" None 相减的均值图像 "VarianceImage" None 归一化的方差图像 Method "Stretch" 怎样使尺寸一致 Resampling Automatic 重新采样的方法 Alignment Center 怎样对齐 Method"Fit" 或 "Fill" 情况下的图像 Padding Black Method"Fit" 的填充方案 - Method 的可能的值为:
-
"Stretch" 通过重新采样拉伸图像以使图像一致 "Fit" 适配整个图像;保持长宽比;必要时进行填充 "Fill" 适配较小的尺寸;必要时对另一尺寸进行剪切 - Interleaving 和 "DataTransposed" 选项将以下列方式影响输出的形状:
- 以下设置可以用于 "MeanImage" 和 "VarianceImage":
-
None 不减任何东西 m 从每个像素相减的值 {m1,m2,…} 从不同通道相减的值 Image[…] 相减的整体图像 - 在相减前,像素被归一化介于 0 和 1 之间.
参数
范例
打开所有单元关闭所有单元范围 (1)
参数 (12)
ColorSpace (1)
设置输出图像的 ColorSpace 为 "Grayscale":
"DataTransposed" (2)
当 "DataTransposed"False 时,输出的高为第一维度:
当 "DataTransposed"True 时,输出的宽为第一维度:
当 "DataTransposed"True 且 InterleavingTrue 时,图像可以缩放到固定高和不同宽:
Interleaving (2)
当 InterleavingFalse,输出的通道维度是维度列表的第一维:
当 InterleavingTrue,输出的通道维度是维度列表的最后一维:
当 InterleavingTrue 时,图像可以缩放到固定宽和不同高: