当前位置: 首页 > 科技赋能

腾讯云发布专属语音识别模型,加速金融、音视频行业应用

时间:2024-05-20 00:45:42 科技赋能

4月29日,腾讯云正式发布金融、音视频等领域专属语音识别模型。

新发布的模型不仅大大提高了识别准确率,还增加了对粤语和韩语的支持。

后期会逐步开放对上海话等方言,以及日语、泰语、印尼语等外语的支持。

正式发布金融行业专属模型,词准确率行业领先。

据了解,语音识别在金融行业应用广泛。

但在实际场景中,很多用户使用方言与外呼、客服机器人进行交流。

此外,在金融领域也有大量用户。

目前市场上常见的语音识别模型对于专有句型和词汇的识别存在不准确的问题。

基于这些痛点,腾讯云AI团队与微信智聆共同打造了金融行业专属的语音识别模型。

该模型的推出不仅可以有效解决上述问题,而且可以大大提高识别的准确率。

目前该模式已在金融领域智能外呼、智能客服、电话录音质检等多个场景落地。

根据客户实际测试,单词准确率处于行业领先水平。

率先打造音视频专用语音识别模型,准确率提升10%。

随着互联网直播浪潮的兴起,如何利用智能语音技术快速识别用户的音视频内容,进行精准推荐并过滤不良内容已成为各大直播和内容分享者的核心竞争力。

平台在日益激烈的市场竞争中。

但由于音视频背景环境复杂且属于半远场,需要大量的数据积累才能实现准确识别。

依托在音视频领域的大量数据积累,腾讯云在业界率先推出音视频领域专用语音识别模型。

已在音视频领域的多家直播平台、电商直播平台得到应用。

根据客户实际测试,识别准确率提升近10%。

语言丰富度进一步提升,腾讯云语音识别加速落地。

为了满足不同客户群体的需求,腾讯云语音识别今年在语言丰富度上继续发力,联手微信智聆、腾讯国际商务语音技术实验室、腾讯闽汉翻译等多个人工智能实验室在原有通用语言的基础上,开放了韩语、粤语的识别能力。

后续他们将逐步开放上海话等方言以及日语、泰语、印尼语等外语的语音识别能力。

经过长期训练和效果优化,腾讯云多语言语音识别已广泛应用于会议记录转录、视频字幕、电话录音质检等业务场景。

事实上,腾讯云通过在智能语音领域多年的耕耘,已经得到了众多权威机构的认可。

在Gartner今年首次正式发布的《Magic Quadrant for Cloud AI Developer Services》研究报告中,腾讯云成为国内唯一入选Gartner云AI开发者服务魔力象限的云厂商。

腾讯云AI语音产品负责人周超表示:“腾讯云AI语音团队未来将持续打磨技术,提供业界最具性价比的智能语音产品,推动智能语音的广泛落地在工业互联网领域,用更前沿的技术,更极致的产品体验,帮助合作伙伴和客户打造高效、专属的解决方案,助力各行业数字化、智能化转型。