VideoTranscribe
VideoTranscribe[video]
识别音轨中的语音并将其作为字幕轨道添加到 video 中.
更多信息和选项
- VideoTranscribe 在音轨上执行语音转文本,然后将其作为字幕轨添加到视频中. 通常用于生成视频的隐藏式字幕.
- 可以提供以下选项:
-
AudioTrackSelection Automatic 要转录的音轨 Masking All 感兴趣的间隔 Method Automatic 使用的方法 PerformanceGoal $PerformanceGoal 尝试优化的性能方面 ProgressReporting $ProgressReporting 是否报告计算进度 TargetDevice "CPU" 执行识别的设备 - 默认情况下,识别整个信号中的语音. 使用 Masking->{int1,int2,…} 将识别限制在间隔 inti 内.
- 默认情况下,如果某种方法返回非语音 token(如 [applause]),将在结果中返回这些内容. 可通过 Method{method,"NonSpeechReplacement"replacements} 指定不同的内容进行替换. 也可用 "NonSpeechReplacement""" 删除这些内容.
- VideoTranscribe 使用机器学习. 其方法、训练集以及其中包含的偏差可能会发生变化,并在 Wolfram 语言的不同版本中产生不同的结果.
- VideoTranscribe 可能会下载资源,这些资源将存储在您的本地对象存储中,位置为 $LocalBase,可以使用 LocalObjects[] 列出,并可以使用 ResourceRemove 删除.
范例
打开所有单元关闭所有单元
Wolfram Research (2024),VideoTranscribe,Wolfram 语言函数,https://reference.wolfram.com/language/ref/VideoTranscribe.html.
文本
Wolfram Research (2024),VideoTranscribe,Wolfram 语言函数,https://reference.wolfram.com/language/ref/VideoTranscribe.html.
CMS
Wolfram 语言. 2024. "VideoTranscribe." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/VideoTranscribe.html.
APA
Wolfram 语言. (2024). VideoTranscribe. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/VideoTranscribe.html 年