表格数据清理
数据清理是准备数据和消除进一步处理障碍的过程. 数据清理往往在数据科学项目中使用大量资源,因此通过为不同的清理任务提供多种工具,可以使它们成为常规并且更加自动化. Wolfram 语言提供了丰富的数据清理工具集合. 有一些结构清理工具可以更改数据的结构,从拆分和合并列到在列值和名称之间进行透视. 还有一些值清理工具,用于处理那些会阻碍进一步处理的缺失值或异常值.
列健
ColumnKeys — 获取列健
RenameColumns — 设置列健
列类型
ColumnTypes — 获取列健
CastColumns — 设置列健
重新组织列
TransformColumns — 分离或组合列
重组表格值
PivotToColumns — 将值从单个列分布到多个列中
PivotFromColumns — 将值从多个列收集到一列中
处理缺失值
TransformMissing — 如何将缺失值变成插补值等
MissingFallback ▪ MissingValuePattern ▪ Missing
处理极值 »
TransformAnomalies — 如何将极值处理为剪裁值,等
FindAnomalies ▪ DeleteAnomalies ▪ Clip ▪ ...