FeatureExtractor

FeatureExtractor

是一个用于诸如 Classify 等函数的选项,指定特征如何被提取.

更多信息

  • FeatureExtractor 的可能设置包括:
  • FeatureExtractorFunction[]应用给定的提取程序函数
    extractor应用指定的特征提取程序方法
    {extractor1,extractor2,}依次应用提取函数方法序列
    specext将由 spec 指定的提取函数 ext 应用于数据部分
    {spec1ext1,spec2ext2,}将由 speci 指定的提取函数 exti 应用于数据部分
  • 可能的特征提取程序方法包括:
  • Automatic自动提取
    Identity给出无变化的数据
    "ConformedData"一致化的图像、颜色、日期等
    "NumericVector"来自任意数据的数值向量
    f对各个样例应用函数 f
    {extractor1,extractor2,}依次使用一系列提取器
  • 也可对每个数据类型应用其他特征提取方法.
  • 数值数据:
  • "DiscretizedVector"离散化的数值数据
    "DimensionReducedVector"降维的数值向量
    "MissingImputed"缺失值被估算的数据
    "StandardizedVector"Standardize 处理过的数值数据
  • 标称数据:
  • "IndicatorVector"用指示向量独热编码的名义数据
    "IntegerVector"用整数编码的名义数据
  • 文本:
  • "LowerCasedText"每个字符均为小写的文本
    "SegmentedCharacters"分割成字符的文本
    "SegmentedWords"分割成单词的文本
    "TFIDF"词频逆向文件频率向量
    "WordVectors"文字的语义向量序列(仅限英文)
  • 图像:
  • "FaceFeatures"来自人脸图像的语义向量
    "ImageFeatures"图像的语义向量
    "PixelVector"图像像素值向量
  • 音频对象:
  • "AudioFeatures"音频对象的语义向量序列
    "AudioFeatureVector"音频对象的语义向量
    "LPC"音频线性预测系数
    "MelSpectrogram"用对数频次分组的音频频谱图
    "MFCC"音频梅尔频率倒谱系数向量序列
    "SpeakerFeatures"语义说话者向量序列
    "SpeakerFeatureVector"说话人的语义向量
    "Spectrogram"音频频谱图
  • 视频对象:
  • "VideoFeatures"来自视频对象的语义向量序列
    "VideoFeatureVector"来自视频对象的语义向量
  • 图:
  • "GraphFeatures"总结图的属性的数值向量
  • 分子:
  • "AtomPairs"来自原子对的布尔向量以及它们之间的路径长度
    "MoleculeExtendedConnectivity"来自枚举的分子子图的布尔向量
    "MoleculeFeatures"概括分子属性的数值向量
    "MoleculeTopologicalFeatures"来自圆形原子邻域的布尔向量
  • 默认情况下,FeatureExtractor->Identity.
  • 通常,FeatureExtractor 的值被解释为预处理步骤:它不会替换函数使用的其他特征提取程序.
  • 当特征提取程序方法不是 FeatureExtractorFunction[] 或自定义函数时,特征提取将根据数据进行学习.
  • 当设置为 specext{spec1ext1,} 时,specspeci 的可能形式包括:
  • All各样例的所有部分
    i各样例的第 i 个部分
    {i1,i2,}各样例的部分 i1, i2,
    "name"在各样例中具有指定名称的部分
    {"name1","name2",}在各样例中名为 "namei" 的部分
  • 未在 specspeci 提及的部分将出于提取特征的目的而被删除.
  • 在诸如 ClassifyPredictDimensionReductionClusterClassify 这样的函数中, FeatureExtractor"Minimal" 表示内部预处理应尽可能简单.

范例

打开所有单元关闭所有单元

基本范例  (3)

在简单的数据集上训练 FeatureExtractorFunction

Classify 中使用特征提取程序函数作为预处理步骤:

使用提取程序方法 "ImageFeatures" 作为预处理步骤,训练分类器:

对新的图像分类:

使用 FeatureExtractor 产生预测器函数,用自定义函数预处理数据:

添加 "StandardizedVector" 方法至预处理管道:

对新数据使用预测器:

范围  (1)

通过自定义函数和提取器方法对文本预处理训练分类器:

Wolfram Research (2016),FeatureExtractor,Wolfram 语言函数,https://reference.wolfram.com/language/ref/FeatureExtractor.html (更新于 2021 年).

文本

Wolfram Research (2016),FeatureExtractor,Wolfram 语言函数,https://reference.wolfram.com/language/ref/FeatureExtractor.html (更新于 2021 年).

CMS

Wolfram 语言. 2016. "FeatureExtractor." Wolfram 语言与系统参考资料中心. Wolfram Research. 最新版本 2021. https://reference.wolfram.com/language/ref/FeatureExtractor.html.

APA

Wolfram 语言. (2016). FeatureExtractor. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/FeatureExtractor.html 年

BibTeX

@misc{reference.wolfram_2024_featureextractor, author="Wolfram Research", title="{FeatureExtractor}", year="2021", howpublished="\url{https://reference.wolfram.com/language/ref/FeatureExtractor.html}", note=[Accessed: 17-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_featureextractor, organization={Wolfram Research}, title={FeatureExtractor}, year={2021}, url={https://reference.wolfram.com/language/ref/FeatureExtractor.html}, note=[Accessed: 17-November-2024 ]}