当前位置: 首页 > 科技观察

又一巨头宣布入局AIGC,一口气开源数个模型,还道出了它的变现之道

时间:2023-03-17 10:26:09 科技观察

又一家巨头宣布入驻AIGC,一口气开源了多款模型,并透露了如何变现。AIGC(AIGeneratedContent),这个概念在今年可以说是一塌糊涂。比如StableDiffusion,只要你对它说一句话,它就能秒生成画。又如最近火爆的ChatGPT,答题流畅如人,让网友们乐在其中。△左:稳定扩散绘制;右图:ChatGPT回答这两天,AIGC赛道又热闹了起来。因为国内某互联网巨头公司宣布正式入驻AIGC。并且不同于其他玩家的单一路线,它在进入的时候,直接涵盖了四个细分领域:AI图像、AI音乐、AI文字和AI编程。比如在AI图片这件事上,只需要在微信小程序里输入一句话,秒生成一个作品,而且是中英文混搭就能hold住的那种:acateatingnoodle。说实在的,不仅形象逼真,就连小猫的小心机萌也刻画出来了。不仅如此,它还可以生成其他风格的图片:(昆仑天宫-天宫桥辉SkyPaint作品,向左滑动查看更多)AI作曲不是问题,直接上作品欣赏:假日音乐:StarXMusicXLab-AIComposer(显式)在AI文本能力方面,给出上线,秒懂其意,给出对抗的下线:不仅如此,聊天、问答、中英翻译、内容续写其他技能也不是问题。另一个例子是人工智能编程。只需在VSCode上简单安装一个插件,在光标处按下“Tab”键,即可立即提交整个代码:“互联网出海巨人”加持,发布并开源了几大Model,这可以说是今年AIGC赛道上值得关注的一件大事。这个玩家是谁?不拐弯抹角就做出如此大动作的玩家,便是昆仑万维。至于为什么“值得关注”,可以总结为两点。首先是技术的积累。昆仑万维其实早在两年前就组建了200多人的团队,开始布局AIGC。此次推出的“昆仑天宫”机型包括天宫巧慧SkyPaint、天宫乐府SkyMusic、天宫妙笔SkyText、天宫妙笔SkyCode,涵盖了图像、音乐、文字、编程等多模态内容生成能力。另外,熟悉昆仑万维的朋友都知道,2008年成立时,其业务以网页游戏为主,包括自主研发的《三国风云》、《武侠风云》、《千军破》等。于是昆仑万维选择了一条进军海外的道路。除了自主研发外,它还代理了多款全球热门游戏,如《极品飞车:最高通辑2015》、《愤怒的小鸟2》、《皇室战争》等。但说到它的逐渐成长,也是因为到业务和战略的转型,即从单一的游戏平台升级为出海的互联网公司。2016年以来,昆仑万维业务已形成海外资讯分发及元界平台Opera、海外社交娱乐平台StarX、全球手游平台方舟游戏、休闲娱乐平台LeisureEntertainment、投资板块等五大业务。也正是在这个多业务转型的过程中,昆仑万维在今天AIGC所涉及的技术品类上实现了“量的积累”。刚才我们提到,昆仑天宫涵盖的内容是指AIGC的四大热点领域,即图像、音乐、文字和编程。那么具体到AIGC的各个细分领域,昆仑万维开源发布的模型是什么级别的呢?以昆仑天宫的AI图像能力为例,据了解,天宫俏会SkyPaint是一款多语言StableDiffusion分支模型。也就是说,在保留了稳定扩散“理解”英文文本能力的同时,增加了输入中文提示词的能力。不仅如此,平行语料量达到1.5亿,包括常用中英文资料、古诗词中英文资料、字幕、百科全书、图片文字说明等。在训练方面,采用了模型蒸馏方案和双语对齐方案。在使用教师模型提炼学生模型的同时,辅以解码器语言对齐任务辅助模型训练。在实验性能结果上,也优于目前发布的支持多种语言的AI图像模型:在AI音乐方面,天宫乐府SkyMusic是国内首个商业级作曲AI模型。该模型引入全局信息约束,和弦隐式表征,和弦准确率达到92.5%,远超目前业界最好的64.7%;支持中、英、日、韩、法等31种语言,支持旋律生成歌词,文案素材,支持全球多流派。值得一提的是,天宫乐府生成的20首AI音乐已在美国、韩国、印尼等国家和全球180多个音视频平台上线。在AI文本生成领域,昆仑天工基于千亿数据集训练,最终构建了140亿参数的GPT-3生成模型SkyText。该模型的一大特点是涵盖了很多细分任务,包括接续、对话、汉英翻译、内容风格生成、推理、对联等。不仅如此,从实验性能结果来看,也优于目前开源的GPT中文预训练模型:在AI编程领域,昆仑天宫提供了多语言开源编程模型。它支持许多当前主流的编程语言,包括Java、JavaScript、C、C++、Python、Go和Shell。将其“嵌入”到VSCode中后,即可实现代码续传,或者直接给它一个中文注释“喂”。在AI编程中,模型生成的通过率可以说是非常重要的性能指标之一,而昆仑天宫在实验性能结果中依然表现不俗:可见昆仑万维在AIGC上的布局并非如此不是一蹴而就的,而是在长期发展过程中技术积累后的量变。第二点“值得关注”,也归功于昆仑万维本身——资金实力。毕竟搞AIGC,光是前期的研发投入就需要投入大笔资金,并不是小玩家能“玩”到的。这一点,从近期披露的财务数据就可以看出。根据昆仑万维发布的2022年半年度业绩,仅上半年6个月,公司就实现营业收入22.5亿元,整体毛利率进一步提升至79%.如果把时间节点拉长一些,随着昆仑万维拓展多元化业务,不断为其注入人工智能技术,其各个业务板块也发生了重大变化。例如,Opera浏览器已经从传统浏览器成功转型为技术驱动的信息分发和元宇宙平台,由此带来的收入变化也是肉眼可见的。仅今年上半年,Opera就实现营业收入1.5亿美元,同比增长34%,调整后EBITDA为2392万美元,同比增长572%。截至2022年三季度,OperaNews、元界等新兴业务的商业化能力将持续提升。其中,云游戏社区GX.Games已推出超过2000款游戏,OperaGX月活跃用户超过1800万,Opera全球月活跃用户平均3.21亿。又如其海外社交娱乐平台StarX,全球注册用户超过2.8亿,收入保持强劲增长。方舟游戏主打自主研发的MMORPG新品《圣境之塔》,目前最高月流水已超过300万美元。此外,昆仑万维在投资领域也收获颇丰。比如最近刚刚上市的全球最大LGBTQ社交平台Grindr,曾是昆仑万维背后的大股东。仅这笔投资,昆仑万维的收入就超过了33亿元。而此次开源的AIGC模型,也是其不断投入技术研发的必然结果。例如,在AI图像方面,昆仑万维采用目前市面上算力最高的显卡集群A100(80G版),可提供每秒超过2万亿字节的超快显存带宽,能够处理非常大的模型和数据集。AI绘画团队训练模型超过9万显卡小时,可见其研发训练的成本;不仅如此,在AI文本生成方面,也是通过A100GPU集群训练得到的最终模型。据团队介绍,昆仑万维自2020年以来已向AIGC投资数千万,有技术积累,有研发资金,同时也是互联网巨头,昆仑万维的动作值得关注。从另一个角度来看,昆仑万维的入局或许并不是对AIGC赛道的认可。因为有能力的玩家确实在这里大踏步前进。ChatGPT背后的热门AIGC赛道OpenAI,AI圈的新贵,是非常典型的AIGC选手。ChatGPT相当于之前OpenAI提出的3.5版GPT,发布5天用户数就达到了100万。早先的《稳定扩散》仅发行一个月,其背后的公司估值为69亿元。伴随着这种热度,未来的市场规模和前景也被猜测:到2030年,AIGC市场规模或将突破万亿元。除了这两者之外,进入AIGC领域的国外巨头玩家太多,比如Google、Meta、Nvidia等,都将这条赛道作为重点。纵观这些玩家的特点,除了拥有充足的研发资金外,还包括技术、生态、落地场景等。反观国内的发展,可以说还没有进入到真正的AIGC阶段,这一点在qubit智库的《AIGC/AI生成内容产业展望报告》中有提到。虽然在细分赛道上涌现出一些优秀的龙头企业和研究机构,但行业尚未进入大规模验证和系统化发展阶段。比如在场景方面,目前最重要的是内容领域的需求已经比较饱和,降本增效还不够迫切。从细分领域来看,虚拟人行业将成为行业短期增长的关键驱动力。玩家需要寻找容错率高,专业或创意要求有限的场景。但从长远来看,AIGC仍然需要更清晰、更清晰的消费落地场景,比如实时场景(比如实时交互和实时反馈场景)和高度个性化的生成场景。在玩家方面,目前国内的初创玩家数量比较少。细分赛道的初创选手大多在5家以下,且多为与相关业务厂商/研究机构的内部探索项目。由于短期内市场规模相对有限,前期需要较长时间积累渠道和资源,我们认为后期更可能出现行业集中度高的情况。技术方面,除部分企业部署较早外,国内AIGC领域的规模化、稳定生产能力还需进一步提升,完成从尝鲜到正式商业化进入各个场景的转变。据业内人士测算,预计2-3年内,AIGC能力有望在成本可控的前提下实现产业化生产。最后,在变现方面,虽然国内的游戏AI、虚拟人、TTS、结构化文本写作等领域已经形成了稳定的业务合作伙伴关系和收入关系,但行业整体的变现能力还有待进一步证明。并且基本上是项目制/长期项目制,缺乏标准化/平台化产品的开发。因此,经过多方分析,我们可以认为国内AIGC的发展现状还处于试验阶段。大多数情况下,AIGC还没有进入商业场景,流动性有待提升。那么下一个需要讨论的问题就是:昆仑万维的入驻会带来哪些变化?从技术和研发资金的角度来看,正如我们刚才所说,昆仑万维有资格进入AIGC的门槛。从此次四大模型的开源发布来看,昆仑万维的重心在于推动生态的发展建设,而不仅仅是做应用那么简单,而是要从模型层面掌握更多的主动权。首先,从昆仑万维自身来看,其全球月均活跃用户近4亿,其涉足的多元化业务覆盖了AIGC的众多重要场景。这恰恰符合国外巨头玩家“有生态”、“有落地场景”的特点。不仅如此,昆仑万维还对现阶段AIGC在国内最难实现的问题发表了看法:模型开源后不收费,但可以通过诸如此类的方式用于商业支持和云服务。作为MangoDB和Databricks。费用是收入的来源。我们的对标公司有Databricks、MongoDB和成功的StabilityAI,这些公司在资本市场的市值都不低。我们坚信开源的迭代速度远远快于闭源。最终目标是让开源云项目与大公司的SaaS形成互补,为中小开发者、普通开发者提供更好的选择。那么你如何看待国内AIGC新巨头玩家的这套“打法”呢?