FeatureExtract[examples]
使用基于给定示例训练的特征提取器,为每个 example 提取特征.
FeatureExtract[examples,spec]
使用指定的特征提取器方法 spec 提取特征.
FeatureExtract
FeatureExtract[examples]
使用基于给定示例训练的特征提取器,为每个 example 提取特征.
FeatureExtract[examples,spec]
使用指定的特征提取器方法 spec 提取特征.
更多信息和选项
- FeatureExtract 通常用于将原始数据处理为可用特征(例如,用于训练机器学习算法).
- FeatureExtract 可用于许多类型的数据,包括数字、文本、音频、图像、图和时间序列,以及这些类型的组合.
- examples 的可能值有:
-
example 未经训练的单一示例 {example1,…} 训练示例的列表 Dataset[…] Dataset 对象 Tabular[…] Tabular 对象 - 各 examplei 可以是单一数据元素、数据元素列表、数据元素关联或者 Dataset 对象.
- spec 的可能值有:
-
extractor 使用指定的提取器方法 partextractor 对特定示例部分应用提取器 {part1extractor1,…} 为特定部分指定提取器 - 在 FeatureExtract[examples,{part1extractor1,…}] 中,extractori 都分别应用于 examples.
- 可能的特征提取器方法 extractor 包括:
-
Automatic 自动提取 Identity 给出无变化的数据 "ConformedData" 一致化的图像、颜色、日期等 "NumericVector" 来自任意数据的数值向量 "name" 命名提取器方法 f 对各个示例应用函数 f {extractor1,extractor2,…} 依次使用一系列提取器 - 可能的 part 形式有:
-
All 每个示例的所有部分 i 每个示例的第 i
个部分{i1,i2,…} 每个示例的第 i1、i2、… 个部分 "key" 每个示例中具有指定键的部分 {"key1","key2",…} 每个示例中名称为 "keyi" 的部分 - 当明确指定部分时,提取特征时将删除任何未提及的部分.
- FeatureExtract[examples] 等价于 FeatureExtract[examples, Automatic],而这通常又等价于FeatureExtract[examples, "NumericVector"].
- "NumericVector" 方法通常会将示例转换为数值向量,填补缺失数据,并使用 DimensionReduction 降低维度.
- 针对单一数据类型的特征提取器方法仅适用于与其类型兼容的数据元素. 其他数据元素将保持不变而返回.
- 当仅提供一个示例时,并非所有特定的特征提取器都可用——例如,向量处理器将假定列表是标量特征的列表.
- 具体的提取器是:
- 数值数据:
-
"DiscretizedVector" 离散化的数值数据 "DimensionReducedVector" 降维的数值向量 "MissingImputed" 缺失值被估算的数据 "StandardizedVector" 用 Standardize 处理过的数值数据 - 标称数据:
-
"IndicatorVector" 用指示向量“独热编码”的名义数据 "IntegerVector" 用整数编码的名义数据 - 文本:
-
"LowerCasedText" 每个字符均为小写的文本 "SegmentedCharacters" 分割成字符的文本 "SegmentedWords" 分割成单词的文本 "SentenceVector" 文字的语义向量 "TFIDF" 词频逆向文件频率向量 "WordVectors" 文字的语义向量序列(仅限英文) - 图像:
-
"FaceFeatures" 来自人脸图像的语义向量 "ImageFeatures" 图像的语义向量 "PixelVector" 图像像素值向量 - 音频对象:
-
"AudioFeatures" 音频对象的语义向量序列 "AudioFeatureVector" 音频对象的语义向量 "LPC" 音频线性预测系数 "MelSpectrogram" 用对数频次分组的音频频谱图 "MFCC" 音频梅尔频率倒谱系数向量序列 "SpeakerFeatures" 讲话者的语义向量序列 "SpeakerFeatureVector" 讲话者的语义向量 "Spectrogram" 音频频谱图 - 视频对象:
-
"VideoFeatures" 来自视频对象的语义向量序列 "VideoFeatureVector" 来自视频对象的语义向量 - 图:
-
"GraphFeatures" 总结图的属性的数值向量 - 分子:
-
"AtomPairs" 来自原子对的布尔向量以及它们之间的路径长度 "MoleculeExtendedConnectivity" 来自枚举的分子子图的布尔向量 "MoleculeFeatures" 概括分子属性的数值向量 "MoleculeTopologicalFeatures" 来自圆形原子邻域的布尔向量 - 可以给出以下选项:
-
FeatureNames Automatic 赋给 examplei 的元素的名称 FeatureTypes Automatic 对 examplei 的元素要假定的特征类型 RandomSeeding 1234 应该在内部对伪随机数生成器进行什么样的初始化 - RandomSeeding 的可能设置包括:
-
Automatic 每次函数调用时自动重新播种 Inherited 使用外部播种的随机数字 seed 用明确给定的整数或字符串作为种子 - FeatureExtract[…] 等价于 FeatureExtraction[…,"ExtractedFeatures"].
提取器
选项
范例
打开所有单元 关闭所有单元基本范例 (4)
范围 (26)
输入形状 (9)
提取器规范 (8)
在单个文本特征上指定特征提取器 "SentenceVector":
使用 "SentenceVector" 方法提取特征,然后使用 "DimensionReducedVector" 降低维度:
仅在第二个名义变量上通过 "IndicatorVector" 方法提取特征:
使用 Identity 提取程序方法也复制第一个变量:
特征类型 (9)
使用 "IndicatorVector" 方法对名义变量提取特征:
从 DateObject 实例列表中提取特征:
在 Graph 实例列表上训练特征提取器:
在 TimeSeries 实例列表上训练特征提取器:
从 Molecule 数据中提取特征:
从选择的 Audio 实例中提取特征:
选项 (2)
FeatureNames (1)
使用 FeatureNames 命名特征,并在部分规范中引用它们的名称:
FeatureTypes (1)
在简单数据集上通过 "IndicatorVector" 方法提取特征:
第一个特征被诠释为数值型,由于 "IndicatorVector" 方法仅作用于名义特征,第一个特征不变化.
使用 FeatureTypes 执行作为名义第一个特征的诠释:
应用 (1)
数据集可视化 (1)
属性和关系 (2)
提取没有训练示例的特征等价于 FeatureExtraction[None,...]:
FeatureExtract[…] 等价于 FeatureExtraction[…,"ExtractedFeatures"]:
文本
Wolfram Research (2016),FeatureExtract,Wolfram 语言函数,https://reference.wolfram.com/language/ref/FeatureExtract.html (更新于 2025 年).
CMS
Wolfram 语言. 2016. "FeatureExtract." Wolfram 语言与系统参考资料中心. Wolfram Research. 最新版本 2025. https://reference.wolfram.com/language/ref/FeatureExtract.html.
APA
Wolfram 语言. (2016). FeatureExtract. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/FeatureExtract.html 年
BibTeX
@misc{reference.wolfram_2025_featureextract, author="Wolfram Research", title="{FeatureExtract}", year="2025", howpublished="\url{https://reference.wolfram.com/language/ref/FeatureExtract.html}", note=[Accessed: 29-April-2026]}
BibLaTeX
@online{reference.wolfram_2025_featureextract, organization={Wolfram Research}, title={FeatureExtract}, year={2025}, url={https://reference.wolfram.com/language/ref/FeatureExtract.html}, note=[Accessed: 29-April-2026]}