HMSCore在AI领域有哪些最新技术能力?本次Discovery直播的主题是《与虎墩一起,玩转AI新“声”态》。诚邀HMSCore机器学习服务产品经理、机器翻译资深专家、HMSCore新朋友“虎盾”,为您展示机器学习的创新语音和语言技术,分享机器学习与人工智能相关的宏观发展趋势。让我们一起来回顾一下本期的精彩内容吧!【精彩回顾】1.抖音网红IP“虎盾小保镖”来袭2.同声传译全新亮相,揭秘底层技术3.AI翻译能力升级,语言扩充可播【专家意见】Nicolas,Huawei2012LabTextMachineTranslationSeniorExpert机器翻译暂时不能代替人类。目前,需求低的翻译需求可以依靠机器,但需求高的翻译需求仍然需要人工干预。人工可以实现点对面的全面质量控制,比如语言是否地道,语言是否流畅,也可以为提高机器翻译质量贡献数据和知识。HMSCoreMLKit高级产品经理Hardy人工智能是智能机器的广阔领域,机器学习是人工智能的核心应用之一。它指的是任何能够在没有人类明确规则的情况下自行“学习”的计算机应用程序。未来机器学习技术将更加注重情感体验,并向多模态(语音、文本、视觉)、多技术(VR/AR等)、多平台、多系统方向发展合作。【精彩问答】Q1:什么是TTS音调定制?TTS音调定制与互盾将碰撞出哪些新玩法?A:依托华为的数据积累和成熟算法,语音合成技术支持TTS音色定制。只需提供少量干净的录制数据,即可进行模型训练,获得高还原度、高清晰度、高稳定性。专属音库,助力提升产品特性,快速打造个性化品牌特色。MLKit新技能TTS正在与IP“虎遁小保镖”合作。TTS通过机器训练还原互盾的音色,并将逐步向开发者开放互盾的音色,帮助开发者应用在各种个性化场景中。Q2:机器学习服务提供的翻译和同声传译能力,如何赋能App创造一个新的“声音”状态?A:文本翻译能力解决了用户语言不通导致沟通不畅的痛点。例如,在通话场景中,通过实时语音识别,可以将识别出的文字快速转换为目标语言文字;在阅读场景,支持提示翻译功能,帮助用户快速看到翻译;视频APP集成文字翻译服务后,用户可以流畅体验AI实时字幕功能。通过语音识别、机器翻译、语音合成的有机融合,同声传译能力具有低延迟、高准确率的特点,适用于会议、直播、演讲等高实时性场景,支持应用将音频内容实时输出成目标语言,生成双语字幕,实时播放目标语言文本,降低理解成本,质量和效率兼顾。Q3:除了上述语音和语言能力,机器学习服务还有什么创新能力吗?A:在金融电商领域,机器学习服务也提供活体检测能力。运动检测能力采用人脸关键点定位、人脸追踪等技术,可以通过指令和动作的形式验证用户是否为真人。在银行、证券、借贷等需要实名注册、安全性要求高的金融领域,活体检测可以作为用户远程注册和找回密码过程中的辅助验证,帮助用户识别欺诈行为,有效抵御攻击,保障业务安全。Q4:机器学习的宏观技术发展趋势是什么?A:首先,机器学习会更加注重情感体验。机器将具有识别、理解和表达情绪的能力,识别用户需求和环境信息的变化,理解人的情绪意图,并做出适当的反应;二是发展多式联运。深度学习技术正在从语音、文本、视觉等单一模态向学习多模态智能学习发展。未来甚至可以融合嗅觉、味觉、心理等难以量化的信号,实现多模态联合分析,在更多场景、更多业务中辅助人类工作;再次是VR/AR、元界等多种技术的融合,相信未来AI也将呈现出多平台、多系统协同的态势,实现更广泛的赋能,并结合通用平台、行业平台、端侧应用,以软硬件一体化的方式实现特定应用的功能定制和扩展。.欢迎访问HMSCore机器学习服务首页,了解更多技术细节。更多详情>>访问华为开发者联盟官网获取开发指导文档华为移动服务开源仓库地址:GitHub、Gitee关注我们,第一时间了解HMSCore最新技术资讯~
