当前位置: 首页 > 后端技术 > Java

华为机器学习服务语音识别功能,让应用生动

时间:2023-04-01 21:26:36 Java

随着人们对生活仪式感的追求,移动设备、可穿戴设备、智能家居设备、车载信息娱乐系统越来越普及。更流行。在这些应用中,鼠标、键盘等交互方式不再方便,语音是人与人之间最自然的交流方式,语音识别技术成为各大应用的“标配”。语音识别场景应用广泛,如语音输入法、语音搜索、实时字幕、游戏娱乐、社交聊天、人机交互、驾驶模式等,因此在APP中集成语音识别功能不仅可以解放双手的同时,还能获得良好的人机交互体验。1.业务介绍HMSCore机器学习服务实时语音识别服务,支持将短语音输入(时长不超过60秒)实时转换为文本,可实时识别60秒以内的语音时间。该服务使用行业领先的深度学习技术。随着算法和数据的不断迭代,目前在一般理想环境下的识别准确率可以达到95%以上。目前支持普通话(包括中英文混合)、英文、法文、德文、西班牙文、意大利文、阿拉伯文、俄文、泰文、马来文、菲律宾文的识别。DEMOdemo2.场景介绍HMSCore机器学习服务实时语音识别服务覆盖日常生活和工作中的多个领域,并在购物搜索、视频搜索、音乐搜索、导航等场景深度优化识别能力,进一步提升这些此类场景的识别准确率。使用购物APP搜索商品时,可以将语音描述的商品名称或特征识别为文字,从而搜索到目标商品。同样,在使用音乐APP时,可以将语音输入的歌名或歌手识别为文字,然后进行歌曲搜索。此外,当驾驶者在驾车时不便输入文字时,可以将输入的语音转化为文字,进而搜索目的地,让行车更安全。3.特点?支持话词实时输出?提供拾音界面和非拾音界面两种模式?支持端点检测,可准确定位起点和终点?支持静音检测,未说话不发送语音包部分语音?支持数字格式智能转换,例如语音输入“2020”,可智能识别为“2020”。如何接入华为机器学习服务?华为机器学习服务官网为您提供详细的文档指导。更多详情>>访问华为开发者联盟官网获取开发指导文档华为移动服务开源仓库地址:GitHub、Gitee关注我们,第一时间了解HMSCore最新技术资讯~