VideoTranscribe

VideoTranscribe[video]

识别音轨中的语音并将其作为字幕轨道添加到 video 中.

更多信息和选项

  • VideoTranscribe 在音轨上执行语音转文本,然后将其作为字幕轨添加到视频中. 通常用于生成视频的隐藏式字幕.
  • 可以提供以下选项:
  • AudioTrackSelection Automatic要转录的音轨
    MaskingAll感兴趣的间隔
    MethodAutomatic使用的方法
    PerformanceGoal$PerformanceGoal尝试优化的性能方面
    ProgressReporting$ProgressReporting是否报告计算进度
    TargetDevice"CPU"执行识别的设备
  • 默认情况下,识别整个信号中的语音. 使用 Masking->{int1,int2,} 将识别限制在间隔 inti 内.
  • 默认情况下,如果某种方法返回非语音 token(如 [applause]),将在结果中返回这些内容. 可通过 Method{method,"NonSpeechReplacement"replacements} 指定不同的内容进行替换. 也可用 "NonSpeechReplacement""" 删除这些内容.
  • VideoTranscribe 使用机器学习. 其方法、训练集以及其中包含的偏差可能会发生变化,并在 Wolfram 语言的不同版本中产生不同的结果.
  • VideoTranscribe 可能会下载资源,这些资源将存储在您的本地对象存储中,位置为 $LocalBase,可以使用 LocalObjects[] 列出,并可以使用 ResourceRemove 删除.

范例

打开所有单元关闭所有单元

基本范例  (1)

转录视频的第二个音轨并将其添加为字幕:

选项  (1)

AudioTrackSelection  (1)

选择不同的轨道进行转录:

Wolfram Research (2024),VideoTranscribe,Wolfram 语言函数,https://reference.wolfram.com/language/ref/VideoTranscribe.html.

文本

Wolfram Research (2024),VideoTranscribe,Wolfram 语言函数,https://reference.wolfram.com/language/ref/VideoTranscribe.html.

CMS

Wolfram 语言. 2024. "VideoTranscribe." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/VideoTranscribe.html.

APA

Wolfram 语言. (2024). VideoTranscribe. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/VideoTranscribe.html 年

BibTeX

@misc{reference.wolfram_2024_videotranscribe, author="Wolfram Research", title="{VideoTranscribe}", year="2024", howpublished="\url{https://reference.wolfram.com/language/ref/VideoTranscribe.html}", note=[Accessed: 21-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_videotranscribe, organization={Wolfram Research}, title={VideoTranscribe}, year={2024}, url={https://reference.wolfram.com/language/ref/VideoTranscribe.html}, note=[Accessed: 21-November-2024 ]}