当前位置: 首页 > 后端技术 > Java

语音转录可以实时进行,直播也可以同步字幕

时间:2023-04-01 23:14:37 Java

在信息爆炸的时代,高效高质量地组织视频、音频、文本等信息显得尤为重要。会议、讲座、采访、客服电话等场景都需要形成完整的文字记录,音视频文件也必须配上字幕。语音到文本的智能使信息输入变得即时和高效。在直播、会议、笔记等应用中提供实时语音转录功能。例如,在音视频会议中,发言内容可视化,实时生成会议纪要,方便记录和修改,提高会议效率;效果,提升用户观看体验,营造更好的直播氛围;在笔记应用中,支持重点内容捕捉你的每一个想法。HMSCore机器学习服务提供实时语音转录能力,让开发者可以在应用中构建长语音转文本功能。可将会议记录、笔记、总结、直播音视频内容等音频流实时转换为文本流数据结果,实现对语音内容的即时识别并显示相应的文本内容。可支持5小时连续实时长时间语音输入文字,不仅可以输出标点符号,还可以生成带有时间戳的文字信息。无论你是普通话、英语、法语,甚至是中英文混合,你都能很好地识别,满足不同场景的需求。实时语音转录部署效果展示在效果展示中,我们可以看到实时语音转录功能转换后的文本完成后可以立即进行编辑、复制、修改等操作,非常方便。注意?目前法语实时转写服务仅支持华为手机和荣耀手机,中英文实时转写服务支持所有品牌手机。?实时语音转录服务通过接入云端接口完成识别服务。在调测和使用过程中,需要保证设备能够正常上网。开发步骤1.在AppGalleryConnect中配置相关信息。开发应用前,您需要在AppGalleryConnect中配置相关信息。具体开发准备请参考文档2.配置HMSCoreSDK的Maven仓库地址。2.1打开AndroidStudio项目级“build.gradle”文件。2.2添加华为agcp插件和Maven代码库。在allprojects->repositories中配置HMSCoreSDK的Maven仓库地址。allprojects{repositories{google()jcenter()maven{url'https://developer.huawei.com/repo/'}}}在buildscript->repositories配置HMSCoreSDK的Maven仓库地址。buildscript{repositories{google()jcenter()maven{url'https://developer.huawei.com/repo/'}}}在buildscript->dependencies中添加配置。buildscript{dependencies{classpath'com.huawei.agconnect:agcp:1.3.1.300'}}3.创建语音识别器并设置配置。MLSpeechRealTimeTranscriptionConfigconfig=newMLSpeechRealTimeTranscriptionConfig.Factory()//设置语言,目前支持中文、英文、法文转录。.setLanguage(MLSpeechRealTimeTranscriptionConstants.LAN_ZH_CN)//设置标点符号。.enablePunctuation(true)//设置句子的偏移量。.enableSentenceTimeOffset(true)//设置单词偏移量。.enableWordTimeOffset(true).create();MLSpeechRealTimeTranscriptionmSpeechRecognizer=MLSpeechRealTimeTranscription.getInstance();4.为语音识别结果创建监听器回调。//回调实现了MLSpeechRealTimeTranscriptionListener接口,并实现了接口中的方法。ProtectedclassSpeechRecognitionListenerimplementsMLSpeechRealTimeTranscriptionListener{@OverridepublicvoidonStartListening(){//录音机开始接收声音。}@OverridepublicvoidonStartingOfSpeech(){//用户开始说话,即语音识别器检测到用户开始说话。}@OverridepublicvoidonVoiceDataReceived(byte[]data,floatenergy,Bundlebundle){//返回原始PCM音频流和音频能量给用户。该接口不在主线程中运行,返回结果需要在子线程中处理。}@OverridepublicvoidonRecognizingResults(BundlepartialResults){//接收来自MLSpeechRealTimeTranscription的连续语音识别文本。}@OverridepublicvoidonError(interror,StringerrorMessage){//识别错误后调用该接口。}@OverridepublicvoidonState(intstate,Bundleparams){//通知应用程序状态已经改变。}}5。绑定语音识别器。mSpeechRecognizer.setRealTimeTranscriptionListener(newSpeechRecognitionListener());6.调用startRecognizing开始语音识别。mSpeechRecognizer.startRecognizing(配置);7、识别完成后,结束识别,释放资源。if(mSpeechRecognizer!=null){mSpeechRecognizer.destroy();}更多详情>>访问机器学习服务联盟官网获取机器学习服务开发指导文档访问华为开发者联盟官网获取开发指导文档Huawei移动服务开源仓库地址:关注我们的GitHub和Gitee,第一时间了解HMSCore最新技术资讯~