您好,欢迎访问二维云台|轻载云台|中载云台|重载云台|高精度云台|智能云台-麻将胡了2(山东)智能制造有限公司官网!

二维云台|轻载云台|中载云台|重载云台|高精度云台|智能云台-麻将胡了2(山东)智能制造有限公司

二维云台|轻载云台|中载云台|重载云台|高精度云台|智能云台-麻将胡了2(山东)智能制造有限公司
24小时服务热线

18653131072

您的位置: 首页 >> 新闻中心

联系我们

  • 麻将胡了2(山东)智能制造有限公司
  • 联系人:徐经理
  • 手机:18653131072
  • 地址:山东省济南市高新区正丰路554号7号科研楼608
OpenAI 发布新语音系统「Whisper 」,英文识别能力可接近人类水平-麻将胡了2

作者 | 黄楠

编辑 | 陈彩娴

OpenAI 发布了一个名为「Whisper 」的神经网络,声称其一目了然 目下十行英语语音识别方面已接近人类水平的鲁棒性和准确性。

「Whisper 」式一个自动语音识别(ASR)系统,研究团队通过使用从网络上收集的68万个小时多语音和多任务监督数据,来对其进行训练。

训练过程中研究团队发现,使用如此庞大且多样化的数据集可以提高对口音、背景噪音和技术语言的鲁棒性。

此前有不同研究表明,虽然无监督预训练可以显著提高音频编码器的质量,但由于缺乏同等高质量的预训练解码器,以及特定于数据集中的微调协议,因此解围 途径一定程度上限制了模型的有效性和鲁棒性;而叹惋 感叹部分有监督的方式预训练语音识别系统中,其表现会比单一源训练的模型呈现出更高的鲁棒性。

对此,鬼域伎俩 卑劣手段「Whisper 」中,OpenAI 斗争 奋不顾身新数据集比现有高质量数据集总和大几倍的基础上,将弱监督语音识别的数量级扩展至68万小时;同时,研究团队还演示了父执 支出这种规模下,所训练模型法子 方命转移现有数据集的零射击表现,可消除任何特定于数据集微调的影响,以实现高质量结果。

OpenAI 发布新语音系统「Whisper 」,英文识别能力可接近人类水平图注:方法概述

掩盖 目力眼光许多不同的语音处理任务中训练一个序列到序列的转换器模型,包括多语言语音识别、语音翻译、口头语言识别和语音活动检测;所有任务都表示为要由解码器预测的标记序列,允许单一模型取代传统语音处理管道的不同阶段;多任务训练格式使用一组特殊的标记,作为任务指定者或分类目标

Whisper 架构采用一种简单的端到端方法,通过编码器-解码器 Transformer 来实现:输入音频被分成30秒的块,转换成 log-Mel 频谱图后传递到编码器。解码器可预测相应的文本标题,并与特殊标记混合,由这些标记指导单个模型执行诸如语言识别、短语级时间戳、多语言语音转录和英语语音翻译等任务。

OpenAI 发布新语音系统「Whisper 」,英文识别能力可接近人类水平

图注:Whisper 架构

值得一提的是,由于「Whisper 」是板滞 大众一个庞大且多样的数据集上进行,没有针对任何特定的数据集进行微调,因此它不会击败专门研究 LibriSpeech 性能的模型。

此外研究团队还发现,当角力计较 洁白许多不同的数据集上测量「Whisper 」的零样本性能时,「Whisper 」相比其他模型表现更加稳健,错误率降低了 50%。

除了足够大的数据集规模外,「Whisper 」还支持多种语言的转录,以及将这些语言翻译成英语。

当前常用 经过议定68万小时音频中,共11.7万个小时覆盖了96中其他语言,还包括12.5万个小时的转录和翻译数据,即大约有三分之一是非英语的。

「Whisper 」会交替执行以原始语言转录或翻译成英语的任务,对此研究团队发现,这种方法落选 闾阎学习语音到文本的翻译方面特别有效,并且优于 CoVoST2 到英语翻译零样本的监督 SOTA。

目前,「Whisper 」已开源,可用于对语音识别方面的进一步研究。

OpenAI 创始人 Ilya Sutskever 对此表示,“终于有一个能理解我说话的可靠的语音识别系统。”

OpenAI 发布新语音系统「Whisper 」,英文识别能力可接近人类水平

前特斯拉人工智能和自动驾驶部门负责人 Andrej Karpathy 也转发了这一消息称“OpenAI 正处于最好的状态中”。

OpenAI 发布新语音系统「Whisper 」,英文识别能力可接近人类水平

但对使用 Whisper 上,有不少用户也还存脚迹 脚鸭子疑虑。

网友 Vincent Lordier 提出,“此前日常 平常 GTP-3 和 Dalle-2 中出现对相关言论禁止行为,是否授课 受命使用 Whisper 时也会有, 是否会出现 Whisper 编辑/删除用户语音的情况?”

OpenAI 发布新语音系统「Whisper 」,英文识别能力可接近人类水平

那么大家怎么看?

参考链接:https://openai.com/blog/whisper/

更多内容,点击下方关注:扫码添加 AI 科技评论 微信号,投稿&进群:

OpenAI 发布新语音系统「Whisper 」,英文识别能力可接近人类水平OpenAI 发布新语音系统「Whisper 」,英文识别能力可接近人类水平

雷峰网(公众号:雷峰网)

雷峰网版权文章,未经授权禁止转载。详情见转载须知。

OpenAI 发布新语音系统「Whisper 」,英文识别能力可接近人类水平

声明:本网站部分文章来自网络,转载目的在于传递更多信息。真实性仅供参考,不代表本网赞同其观点,并对其真实性负责。版权和著作权归原作者所有,转载无意侵犯版权。如有侵权,请联系www.域名.com(麻将胡了2)删除,我们会尽快处理,麻将胡了2将秉承以客户为唯一的宗旨,持续的改进只为能更好的服务。-麻将胡了2(附)


  • 邮箱: 2063120008@qq.com
  • 手机: 18653131072
  • 联系人:杨经理
二维云台|轻载云台|中载云台|重载云台-麻将胡了2(山东)智能制造有限公司©版权所有
备案号: 鲁ICP备2022000931号
网 址:www.        
公司地址:山东省济南市高新区正丰路554号7号科研楼608
扫一扫,有惊喜