What audio and video formats are supported?

MP3, MP4, WAV, M4A, FLAC, OGG, WebM, MOV, and AVI are all supported, up to 2GB per file.

Can I transcribe a YouTube video without downloading it?

Yes. Paste the YouTube, Vimeo, or Instagram URL directly and the tool fetches and transcribes the audio without a manual download step.

What export formats are available?

Transcripts export as SRT, VTT, TXT, PDF, DOCX, or CSV, with or without timestamps. You can also auto-translate the transcript into 100+ languages before exporting.

Does it identify different speakers?

Yes. Automatic speaker identification labels who is speaking, which is useful for interviews, panels, and meetings.

How much does it cost?

6 credits per minute of audio. The credit cost is shown before you confirm the job.

使用 AI 将音频和视频转换为文字，支持 100+ 种语言

上传任意音频或视频文件，粘贴 YouTube、Vimeo 或 Instagram 链接，或直接用麦克风录音。AI 以高准确度将语音转录为文字，自动识别说话人，并支持一键翻译成 100+ 种语言。

打开工作区

100+支持语言数

6每分钟消耗积分

6导出格式数

语音转录

使用 AI 将音频和视频转录为文字，支持 100+ 种语言。

打开完整工作区

6 积分/分钟。

这款工具专为解决什么问题而设计

使用 AI 将音频和视频转录为文字，支持 100+ 种语言。

亮点

专为语音转录打造

说话人识别

AI 驱动的语音识别能检测并标注不同的说话人，让访谈和会议记录清晰易读。

链接与云端导入

粘贴 YouTube、Vimeo 或 Instagram 链接，或从 Google Drive、Dropbox 或 OneDrive 拉取文件 — 无需手动下载。

转录同时翻译

开启自动翻译，即可在获得源语言文字稿的同时得到目标语言版本。

使用流程

语音转录的工作原理

上传、粘贴链接或录音

上传不超过 2GB 的文件，粘贴流媒体链接，或直接在浏览器中录音。

AI 转录音频

语音会被分段、添加时间戳，并按说话人标注，还可选择应用翻译。

导出文字稿

下载为 SRT、VTT、TXT、PDF、DOCX 或 CSV 格式 — 可选是否包含时间戳。

核心能力

目前能出色处理的场景

转录 10+ 种音视频格式，支持 100+ 种语言

粘贴 YouTube、Vimeo 或 Instagram 链接，或从 Google Drive、Dropbox 或 OneDrive 导入

在浏览器中直接录音并立即转录

下载前自动将文字稿翻译成 100+ 种语言

常见用途

大家用语音转录来做什么

播客和访谈转录

从录音生成会议和课堂笔记

视频字幕与说明文字生成

外语音频翻译与转录

常见问题

使用前大家通常会问的问题

支持哪些音视频格式？

支持 MP3、MP4、WAV、M4A、FLAC、OGG、WebM、MOV 和 AVI 格式，单个文件最大 2GB。

可以不下载就转录 YouTube 视频吗？

可以。直接粘贴 YouTube、Vimeo 或 Instagram 链接，工具会自动获取并转录音频，无需手动下载。

有哪些导出格式可选？

文字稿可导出为 SRT、VTT、TXT、PDF、DOCX 或 CSV 格式，可选是否包含时间戳。你还可以在导出前将文字稿自动翻译成 100+ 种语言。

它能识别不同的说话人吗？

可以。自动说话人识别功能会标注出是谁在说话，这对访谈、座谈会和会议记录非常有用。

费用是多少？

每分钟音频消耗 6 积分，确认任务前会显示所需积分。

使用 AI 将音频和视频转换为文字，支持 100+ 种语言

使用 AI 将音频和视频转录为文字，支持 100+ 种语言。

专为 语音转录 打造

说话人识别

链接与云端导入

转录同时翻译

语音转录 的工作原理

上传、粘贴链接或录音

AI 转录音频

导出文字稿

目前能出色处理的场景

大家用 语音转录 来做什么

使用前大家通常会问的问题

支持哪些音视频格式？

可以不下载就转录 YouTube 视频吗？

有哪些导出格式可选？

它能识别不同的说话人吗？

费用是多少？

专为语音转录打造

语音转录的工作原理

大家用语音转录来做什么