【大音频模型】使用Distille Whisper AI轻松进行音频转录
developer.chat
20 January 2024
在这篇文章中,我们介绍并分解了Distil Whisper:一个新版本,它为音频转录提供了高达6倍的Whisper模型运行速度。
深度学习技术一直在快速发展,并已成为我们日常生活中的关键参与者,尤其是在这个语音到文本应用的时代。无论是为自动人工智能呼叫系统、SIRI或Alexa等语音助手供电,还是与搜索引擎无缝集成:这一功能都显著增强了用户体验。它的广泛采用使它成为我们生活中不可或缺的一部分。
作为开源人工智能领域的有力竞争者,音频语音识别(ASR)模型Whisper by OpenAI获得了巨大的人气。它的有效性水平与其他生产级模型相当,同时用户可以零成本访问。此外,它还为用户提供了一系列预先训练的模型,以利用人工智能的力量转录和翻译任何音频片段。
在这篇文章中,我们将看看最近发布的Distil Whisper项目。Whisper型号的最新迭代提供了高达6倍的运行速度。在本文中,我们将更深入地研究这个模型版本,是什么使它成为可能,然后以代码演示结束。
花点时间浏览Paperspace提供的关于Whisper的综合文章。此外,请点击演示链接,利用Paperspace的免费GPU服务亲身体验该模型。
【知识蒸馏】真棒的知识蒸馏
apaas.dev
30 May 2022
在机器学习中,知识提炼是将知识从大型模型转移到较小模型的过程。虽然大型模型比小型模型具有更高的知识容量,但是可能无法充分利用这种容量。即使模型很少利用其知识能力,评估模型在计算上也可能同样昂贵。知识提炼可将知识从大型模型转移到小型模型,而不会降低有效性。由于较小的模型评估成本较低,因此可以部署在功能较弱的硬件上。