计算机视觉

主题概览 »

通过使用各种先进方法,Wolfram 语言为图像识别、对象检测和鉴别以及特征提取提供直接函数. Wolfram 语言支持特定的几何特征,例如边缘和拐角,以及用于配准和比较图像的一般关键点.

图像分类

ImageIdentify, ImageInstanceQ 识别图像的内容(可识别 10,000+ 对象)

Classify  ▪  "CountryFlag"  ▪  "NotablePerson"  ▪  ...

对象检测与识别

ImageCases 检测和识别对象类别的子图像

ImageContents  ▪  ImagePosition  ▪  ImageBoundingBoxes  ▪  ImageContainsQ  ▪  TrainImageContentDetector

图像合成与效果

ImageSynthesize 根据文字或视觉提示生成图像

ImageRestyle 图像风格迁移

脸部分析

FindFaces 找到图像中的人脸

FacialFeatures  ▪  FaceRecognize  ▪  FaceAlign

光学字符识别

TextRecognize 从图像中提取字符

BarcodeRecognize  ▪  FindImageText

机器学习 »

Classify 对一组语音信号进行分类

FeatureSpacePlot  ▪  FeatureSpacePlot3D  ▪  FeatureExtractor  ▪  Nearest  ▪  ...

Neural Networks »

NetModel 用预先训练好的网络进行语音分析

NetEncoder  ▪  "Image"  ▪  "Image3D"  ▪  "VideoFrames"

NetChain  ▪  NetGraph  ▪  NetTrain  ▪  ConvolutionLayer  ▪  ...

特征检测 »

ImageGraphics 把图像转换为可缩放的图形

RemoveBackground 从前景中检测背景并将其删除

ImageKeypoints  ▪  ImageCorners  ▪  ImageLines  ▪  ImageMesh  ▪  ImageSaliencyFilter  ▪  ...

特征跟踪

ImageCorrespondingPoints 在图像对中查找相应的关键点

ImageFeatureTrack  ▪  ImageDisplacements

图像配准 »

ImageAlign 对齐或配准两个图像

ImageTransformation  ▪  FindGeometricTransform  ▪  ...

图像转换

Radon, InverseRadon 拉东变换和逆拉东变换

Fourier  ▪  ImagePeriodogram  ▪  DiscreteWaveletTransform