计算机视觉
主题概览 »通过使用各种先进方法,Wolfram 语言为图像识别、对象检测和鉴别以及特征提取提供直接函数. Wolfram 语言支持特定的几何特征,例如边缘和拐角,以及用于配准和比较图像的一般关键点.
图像分类
ImageIdentify, ImageInstanceQ — 识别图像的内容(可识别 10,000+ 对象)
Classify ▪ "CountryFlag" ▪ "NotablePerson" ▪ ...
对象检测与识别
ImageCases — 检测和识别对象类别的子图像
ImageContents ▪ ImagePosition ▪ ImageBoundingBoxes ▪ ImageContainsQ ▪ TrainImageContentDetector
图像合成与效果
ImageSynthesize — 根据文字或视觉提示生成图像
ImageRestyle — 图像风格迁移
脸部分析
FindFaces — 找到图像中的人脸
FacialFeatures ▪ FaceRecognize ▪ FaceAlign
光学字符识别
TextRecognize — 从图像中提取字符
BarcodeRecognize ▪ FindImageText
机器学习 »
Classify — 对一组语音信号进行分类
FeatureSpacePlot ▪ FeatureSpacePlot3D ▪ FeatureExtractor ▪ Nearest ▪ ...
Neural Networks »
NetModel — 用预先训练好的网络进行语音分析
NetEncoder ▪ "Image" ▪ "Image3D" ▪ "VideoFrames"
NetChain ▪ NetGraph ▪ NetTrain ▪ ConvolutionLayer ▪ ...
特征检测 »
ImageGraphics — 把图像转换为可缩放的图形
RemoveBackground — 从前景中检测背景并将其删除
ImageKeypoints ▪ ImageCorners ▪ ImageLines ▪ ImageMesh ▪ ImageSaliencyFilter ▪ ...
特征跟踪
ImageCorrespondingPoints — 在图像对中查找相应的关键点
ImageFeatureTrack ▪ ImageDisplacements
图像配准 »
ImageAlign — 对齐或配准两个图像
ImageTransformation ▪ FindGeometricTransform ▪ ...
图像转换
Radon, InverseRadon — 拉东变换和逆拉东变换
Fourier ▪ ImagePeriodogram ▪ DiscreteWaveletTransform