4月20日,出门问问在北京召开了主题为“AGI·降临”的AIGC战略发布会。
会上,出门问问宣布内部测试探索大型模型“序列猴”,并提出CoPilot将无处不在。
同时,在大机型能力的基础上,还同步推出了创作者CoPilot产品矩阵和C端语音升级版。
助理魔题,以及B端企业专用大模型的内测探索。
其中,创作者CoPilot产品矩阵包括四款AIGC产品,分别是AI写作平台“巧文”、AI绘画平台“意画”、AI配音平台“墨印工坊”、数字人视频及直播平台“精彩元”。
自主研发的大型模型“序列猴”帮助AGI“到来”走出去问问题。
大模型“Sequence Monkey”是一个具有多模态生成能力的大语言模型。
该模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”,可同时支持文本生成、图像生成、3D内容生成、语音生成、语音识别等不同任务目前,“序列猴”大模型已经具备一定的自然语言理解、知识、逻辑和推理能力,可以快速准确地回答“湖南和湖北哪个省会人口较多?”等复杂问题。
据介绍,出门问问自主研发的大型模型中文名称“序列猴子”的灵感来自于20世纪初期数学家埃米尔·博雷尔提出的“无限猴子”定理,根据这个定理,如果一个。
一群猴子随机敲打打字机,它们最终会写出一部完整的莎士比亚作品。
这个定理基于概率论和组合数学,说明了概率的统一性。
出门问问自主研发的大模型的构建原理与“无限猴子”类似。
海量文本序列经过出门问问独立算法不断训练,并被大规模算力消化理解,成为“序列猴”。
出门问问创始人兼CEO李志飞表示,大模型不仅仅意味着大参数。
现在的大模型都是对网络文本的深度建模,网络文本是世界知识的映射。
因此,大模型是认知模型,是语言的建模。
语言是思维的边界,所以大模型才有无限的想象空间。
“序列猴”在训练过程中展现了它的“突现”能力。
目前正处于“启蒙”阶段,未来提升的速度会越来越快。
他还认为,成为人类副驾驶将是大型模型最好的“工作”,未来副驾驶将无处不在。
一站式CoPilot产品矩阵,打通内容创作全流程。
基于“序列猴”大模型,出门问问在内测中为创作者探索了多种AIGC产品和应用,为数千名创作者构建了一站式CoPilot产品矩阵,打通了全流程。
整个内容创建过程。
目前,出门问问已实现技术、产品、商业化“三位一体”,全球注册用户超万家,付费用户超百万。
出门问问——你的AI写作助手(write.mobvoi.com)是本次大会上首次亮相的CoPilot产品。
“出门问问”的AI写作能力涵盖职场办公、营销、新媒体和创意写作四大领域。
创作场景可以为用户在撰写年终总结、客服话、脚本、广告文案等时源源不断地提供灵感和创作方向。
为了更好地帮助用户提高内容创作效率,“俏文”开设了八个风格转换、关键点提取、校对纠错、续写、重写、扩展、缩写、翻译等主要AI编辑功能。
“巧文”还可以在书写时自动生成图片,为用户带来图文并茂的书写体验。
出门问问——你的AI绘画助手(paint.mobvoi.com)面对设计师、插画师等对文字以外的设计有强烈需求的事实,出门问问在内测中探索了“语画”AI绘画平台。
《文字绘画》支持二维、蒸汽朋克、插画等8种创作风格。
用户只需输入文字,“文字绘画”即可一次性生成8幅光影逼真、细节丰富的2K高分辨率图像。
除了文字绘图外,它还具备图画绘图、动画生成、个性化头像生成等AI绘图能力,极大丰富了用户的创作方式。
对于企业用户来说,“艺画”还支持专属模型定制,让企业用户可以根据自己的需求定制模型风格,并支持多人协同制作,更好地满足企业的绘图需求。
目前,“一言花”已与家装设计平台酷家乐达成探索意向。
在酷家乐平台上,用户借助“一言花”,只需用文字描述自己的需求,就可以轻松改变自己的装修风格,调整家具的位置等,然后设计出自己喜欢的装修方案。
摸印工场——你的AI配音助手(moyin.com)面向AI配音场景,摸印工场推出了新一代AI配音产品“摸印工场”。
“魔音工坊”(海外版DupDub)是全球领先的全流程一站式AI配音平台,已向用户开放多种音色、多种声音风格、20多种方言及外语语言。
在大模型技术的支持下,“墨印工坊”是全球首个搭载大模型AI写作功能的配音平台,覆盖AI写作、AI配音、编辑等多个场景。
在它的帮助下,用户可以轻松完成影视评论、有声读物、在线教育、新闻播报等文案与配音融为一体的内容创作。
目前,“魔音工坊”已与微信读书、青春Get、大众汽车等多个行业龙头企业达成合作。
为了给用户提供更好的配音体验,“魔音工坊”支持平静、悲伤、快乐等7种情绪调节,以及中年女性、男孩等10种情绪调节。
角色有进行了迁移,节奏调整、本地变速、多人配音等AI声音个性化编辑功能也已开放,让用户可以像用Word编辑文档一样编辑声音。
除了选择和编辑声音之外,“魔音工坊”还将推出基于大规模模型语言生成能力的“捏声音”功能。
用户可以自由选择性别、年龄、语言、风格和情感等声音特征,从0到1创造出自己喜欢的声音。
精彩元-你的AI数字克隆(weta.com)基于文字、图像、声音等生成能力,为了让视频内容创作者更快更好地创作出新颖、活泼、有趣的作品,走出去寻求内测探索 AI数字影像创作及直播平台“精彩缘”上线。
据介绍,“奇妙缘”平台目前拥有100多个数字人、3D数字资产、100多个声音。
凭借多模态生成技术,“妙缘”平台目前支持三种不同形式的数字人生成:图片建模(2D数字人)、视频建模(2.5D数字人)、3D建模(3D数字人)。
。
其图像克隆功能只需要5分钟的直播视频素材,即可1:1再现用户的形象和神态,为用户打造声音一致、动作自然的数字克隆。
从个人到企业,CoPilot 将无处不在。
出门问问在语音助手领域有着深厚的积累。
其对AI语音的研究可以追溯到十年前。
2018年,出门问问发布了首款语音助手“小文助手”。
2018年迭代“小文秘书”,2009年推出全场景VPA,2011年升级VPA。
经过十年的积累和发展,本次大会上出门问问内测探索的CoPilot-Magic小文,可以理解为Siri和ChatGPT的综合体。
“你好,你好,最近的火锅店在哪里?” “你好,能告诉我明天北京的天气吗?”人们习惯在购买衣食住行之前查阅相关信息。
作为一款专为个人用户开发的智能语音助手,“魔问”可以帮助用户查看百科信息、天气、餐厅、酒店,还可以与用户自由对话,让用户更加方便快捷地获取信息。
据出门问问介绍,“CoPilot”源自超级助手的概念。
它将拥有基于大模型的高智能大脑,能够分析海量数据并与人类实时准确地沟通;它还将具有优美的声音、美丽的图像,并且可以配备任何硬件平台,例如手机、手表、车机等;还可以适应数千个行业,成为高素质的教学教师、知识渊博的律师、专业医生、理财客服等,在需要的时候随时随地展现专业知识,与他人分担压力。
“序列猴”基于“序列猴”大模型的底层能力,开放生态,赋能更多行业。
针对B端用户和垂直领域,“出门问问副驾驶”不仅提供通用能力支撑服务和数字人像定制服务,还将开放自身角色能力,不断迭代数据接口。
有需求的企业用户可以登录Web调??用API服务,通过上传文档进行行业内容培训,实现定制化语音交互。
Sequence Monkey 的 URL 是 openapi.mobvoi.com。
目前,出门问问已与汽车、教育、律师事务所、金融、医疗、旅游等十大行业首批内测探索合作伙伴达成合作。
未来,出门问问“副驾驶”将逐步赋能更多行业行业。
,帮助更多企业拥有自己的专属大车型,打造自己的专属“副驾驶”。