当前位置: 首页 > 科技赋能

音视频AI神器“统一听”重大升级:超长视频可以自由提问,还能制作思维导图

时间:2024-05-19 15:50:08 科技赋能

3月19日,阿里巴巴大模产品“统一听”发布多款新功能。

助手《小武》音视频问答上线。

业内首次实现单记录、跨记录、多语言自由题。

支持单篇长达6小时的内容以及上百个音视频内容的一次性理解。

用户可以回答很长的问题。

通过音频和视频提出问题,让AI总结任何知识点。

此外,针对学习、科研场景对AI工具的强烈需求,同艺音频推出“大学公益计划”,直接向中国大陆高校全体师生捐赠价值数千元的音视频转录小时数。

超长音视频自由提问,AI快速总结知识点、润色口语、做大脑图谱。

音频和视频承载着密集的信息内容,但由于涉及多模态理解、自然语言处理、搜索等多种复杂技术,内容长期以来难以查找、审核和提炼。

阿里巴巴统一听屋产品负责人杨帆介绍,统一听屋就是针对这种需求而诞生的。

“作为勤工俭学的AI助手,统一听屋希望让高附加值的知识音视频能够轻松阅读、整理和分享。

”统一听物对接统一钱文大模型,集成转录、翻译、角色分离、全文摘要、章节概述、演讲摘要、PPT提取等十余种AI功能,并支持高亮和笔记。

被很多用户称为“宝藏AI工具”。

杨帆介绍了同义闻悟的过程。

本次通易听悟升级新增六大功能点。

最重要的是助手《小悟》的音视频问答,直接“问”关键信息。

通过多语言查询处理、长文本理解、指令进化框架优化和检索增强生成算法,小舞在业界率先实现超长音频和多语言自由问答。

视频,并支持音视频内容问答时长和文件数量均超出行业限制。

用户不仅可以在单个记录页面致电小武,就长达6小时、6G大小的音视频上的任何相关话题提出问题,也可以直接要求小武整理金句、整理结论、撰写会议纪要;还可以在首页对所有用户记录进行提问,支持一次性扫描理解上百个音视频内容;你还可以在英文视频上用中文提问,小舞会直接给出中文答案,无需翻译。

作为“懂你”的AI,小舞还可以智能推荐问题。

随时唤醒“小武”阶级。

针对用户需求,同易听力还推出了一键AI重写、思维导图生成等新功能。

例如,一键AI重写,将口语文字转化为书面表达,特别适合组织采访;思维导图自动生成,支持最多五个级别的xmind脑图,适合播客摘要。

通易听力思维导图样本产品的详细体验也进一步升级,包括支持一键将视频时间戳和截图插入笔记、音视频文件自动语言识别等。

教育福利是在线的,您可以通过电子邮件验证获得数小时的空闲时间。

学生和科研团体对新的AI工具有普遍的需求,但目前音视频AI转录工具一般都是收费的,或者只提供少量的免费时间,比如每月1小时。

统一听物推出“大学公益计划”,推动AI算力普惠惠民。

所有中国大陆高校师生通过后缀为edu.cn的教育邮箱认证后,可直接获得免费的转录时间,存储空间已从20G扩展到GB。

以目前市场上语音厂商每小时9.9元的折扣价来看,这项教育福利价值数千元。

通易听力可以听、看、读,还可以实现快读、精听。

它正在成为学术大师的一种新的学习方法。

杨帆介绍,调查发现,大约一半的用户是学生,而且非常活跃。

后台每天都会收到大量“求时间”的私信。

有的学生在课堂和小组会议上“一直听、一直理解”;有的使用统易听力理解倍速网课备考;有的每天阅读“发现”栏目中的数十个播客,以“获取最新最新鲜的新闻观点内容”。

成都管理学博士生蔡在社交媒体上写道,“统一听物绝对是最强大的科研工具。

”她几乎把这款产品推荐给了身边所有的亲朋好友。

距离《统一听屋》发布仅9个月。

她已经使用了近一个小时,平均每天抄写20多个小时,包括分析网络视频进行学术研究,以及随时使用它进行日常学习工作。

这个软件已经成为她积累知识的工具和科研成果的重要平台。

作为国内首个开放公测的大型模型产品,统一听屋自去年6月发布以来,已积累数百万用户,包括学生、教师、白领、记者、律师、金融分析师等群体。

日均活跃用户数音视频转录超过3次,平台每天处理约20亿个字符。