如何使用人工智能免费转录文本

如何使用人工智能免费转录文本

早在人工智能被用于生成视频和编写程序之前,它就被用于理解口语并采取行动。人工智能就是你能够与 Alexa、Siri 和 Google Assistant 聊天并让这些应用执行你的命令的原因。

这些算法同样可以帮助你从包含演讲的音频文件创建数字记录,无论这些文件是会议、采访、讲座还是你为自己录制的语音笔记。记录为你提供了所说内容的书面记录,并且可以轻松搜索。

Rev 和 Happy Scribe 等知名转录服务仅提供有限数量的免费转录,但借助 Whisper,您可以免费完成转录工作。这是 OpenAI(因 ChatGPT 而出名)开发的语音转文本引擎,使用起来没有任何限制。

你可以选择使用 Hugging Face 托管的 Web 版应用,它很方便,但在高峰时段通常很忙。你也可以选择在 Windows 上本地安装该软件——这意味着转录速度更快,但你需要一台不错的 PC 来满足 AI 处理需求。

网上悄悄话

网页版 Whisper 使用起来快捷方便。截图:Whisper

前往 Hugging Face 上的 Whisper,您可以直接在浏览器中免费转录音频 - 您甚至不需要注册帐户。您可以选择从计算机上传音频文件,或者如果您连接了麦克风,也可以直接将语音录制到应用程序中。请记住,您的音频可能会用于进一步训练未来的 AI 模型 - 通常情况下,OpenAI 和 Hugging Face 的隐私政策对此并不明确。

要上传并处理音频文件:

  • 打开音频文件选项卡。
  • 选择单击上传
  • 选择一个音频文件。
  • 勾选“转录”框。
  • 单击“提交”

片刻(或更长时间)后,您将在屏幕右侧看到文本输出。处理时间取决于音频文件的长度以及 Hugging Face 服务器的繁忙程度。由于这是一项对所有人开放的免费服务,因此它也非常受欢迎,因此您可能会发现文件需要等待很长时间才能通过队列。

在界面中,你会发现一些有用的工具。例如,点击音频播放栏上方的小笔图标,你可以修剪剪辑的开头和结尾——如果你需要剪掉音频中的静音或不重要的部分,这个功能就很方便了。

您还可以切换到“麦克风”选项卡,直接在 Whisper 界面录制一些音频,或者切换到YouTube选项卡,从任何视频中获取转录。只需粘贴视频 URL,就可以开始了。值得注意的是,YouTube 已经自动为一些视频添加了转录,可以在评论部分找到。

Windows 上的 Whisper

Whisper 使用简单的命令提示符界面。截图:Whisper

如果您在 Whisper Web 应用程序中遇到很多延迟,或者您只是想让您的转录处理更加本地化和私密,您可以在 Windows 计算机上设置 AI 模型。您需要安装支持 CUDA 的显卡(请参阅此处的列表),并且至少有 4GB 的 VRAM,才能处理处理 - 如果您安装了较新的 Nvidia 卡,它可能会符合条件。

这个过程更加复杂,而且用户界面也不多,所以并不适合所有人。不过,它确实具有我们已经提到过的优点,而且你不必排队等待文件处理。如果你喜欢摆弄代码和程序,这也是一个很酷的小项目。

假设您的计算机满足要求,您需要在计算机上安装一些软件:用于编码的 Python(确保在安装过程中选中将python.exe 添加到 PATH )、用于机器学习库的 PyTorch、用于管理软件包的 Chocolatey 和用于音频处理的 FFmpeg。如果您需要,它们都附带相关网站上的安装说明。

然后你就可以安装 Whisper 了:在“开始”菜单上搜索“cmd”,打开“命令提示符” ,然后输入“pip install -U openai-whisper”并按Enter键。安装完成后,你可以像这样转录文件:

  • 在文件资源管理器中打开包含音频文件的文件夹。
  • 点击顶部的地址栏,输入“cmd”,然后按Enter
  • 输入“whisper”,然后输入空格,然后输入音频文件的名称。
  • 再次按Enter 键,处理开始。

文本显示在屏幕上,并作为一系列文本文件保存在与音频相同的文件夹中。如果您需要同时转换多个文件,只需在“whisper”命令后列出所有文件,并用空格分隔每个文件。

即使你不熟悉 Python 或命令提示符,你也不会在启动和运行所有程序时遇到太多麻烦。网上有很多指南可以提供帮助。这是最好的教程之一,它一步步指导你完成每个阶段,并解释一些可用的高级功能(例如切换到不同的 AI 模型)。

<<:  自冷却草皮可以让炎热的运动变得更容易忍受

>>:  青少年的模型火箭实现了 SpaceX 启发的垂直着陆

推荐阅读

弁庆VS牛若:描绘传奇对决的动画的魅力与评价

《弁庆与牛若》:日本动画的开端之作■ 公共媒体剧院■ 原创媒体动漫原创■ 发布日期1939 年 7 ...

《小朋友的时间》~夏日特别版~:了解动人的故事和角色的魅力

儿童之时观 ~儿童之夏时观~的综合评价与推荐概述《孩子的时间观~孩子的夏天时间观~》是根据谏哉薰的人...

彻底评估我们最后是如何成为女主角的!它真的有趣吗?

《我们最后怎么成为女主角的www》全方位测评推荐概述《我们是怎么成为女主角的 LOL》(以下简称“...

工作原理:回收物分离机内部

回收业最令人烦恼的方面——也是其广泛应用的最大障碍之一——是在纸张、玻璃和塑料被扔到路边之前必须将它...

飞机向空中排放的燃油比你想象的要多。这就是它们这样做的原因。

飞机燃油不应该从天而降,但上周在加利福尼亚州库达希就发生了这样的事情。此次事件发生在 1 月 14 ...

月球上的圣诞节是什么样的

阿波罗 8 号于 1968 年 12 月 21 日发射,这可以说是太空时代的圣诞奇迹。 1967 年...

NASCAR 可能是学习物理最快的途径

高速行驶确实令人兴奋。纵观历史,人们总是在努力让自己跑得更快,无论是步行、骑马、乘船还是骑自行车。几...

詹姆斯·韦伯太空望远镜的第一张照片以全新的视角展现了宇宙

这个故事已更新,包含现已发布的第一张图片。它最初于 2022 年 7 月 11 日下午 4:36 发...

我们最终是如何弄清楚恐龙羽毛颜色的

《美丽的进化:达尔文被遗忘的择偶理论如何塑造动物世界和我们》作者:理查德·普鲁姆。Doubleday...

Lucid 从小处着眼,重新发明了电动机。真的很小。

目前电动汽车的终极目标是续航里程超过 500 英里。这是大多数电动汽车制造商努力追求但尚未实现的目标...

充分利用 Whoop 4.0 腕带的 7 个技巧

Whoop 4.0 手环与标准健身追踪器略有不同。它专为那些对训练和锻炼非常认真(因此每月需支付 3...

土星的卫星土卫二现在是生命的最佳候选者

天文学家在土星的卫星之一土卫二上发现了一个液态水海,该海洋被埋在数英里厚的冰层之下。该海洋大约有苏必...

Don Yakuza Suikoden-深入评论和建议点

《黑帮幻想水浒传》:描绘黑帮世界的杰作 OVA 《Don Gokudo Suikoden》是 199...

全面回顾岛耕作的《亚洲新星》第 2 季!这篇特别报道的吸引力究竟在哪里?

志摩耕作的亚洲利士传第 2 季特别报道 - 深度评论和全方位信息■ 公共媒体电视动画系列■ 原创媒体...

《地图:流浪星的传说》评论:一个引人入胜且意义深远的太空冒险故事

《地图:传说中的流浪外星人》:太空冒险的魅力及其背景《地图:传说的流浪外星人》于 1987 年作为 ...