当前位置: 首页 > 科技赋能

从短剧、音频到二维社区,大模创业者如何利用AI重塑内容形态和生产模式?

时间:2024-05-19 16:34:22 科技赋能

AI时代,在大模型能力还在不断进化、PMF还在被寻找之前,创业者之间的沟通和共识似乎变得更加重要。

一次成功的尝试,或者对失败的反思;或者最近有新的创业方向和新收获;或者对某个垂直领域的新观察。

……3月23-24日,由上海人工智能产业协会(SAIA)主办的全球开发者大会(GDC)在上海成功举办。

同时,3月22日,朴正恩还邀请了四位创业者围绕大会进行闭门交流分享,谈论他们过去一年在AI创业中的得失,并进行大规模的模式创业审查。

了解碰撞和对齐。

我们摘录了嘉宾分享的一些精彩讨论,内容涉及AI如何影响内容创作者,如何改造不同内容的生产流程,甚至如何满足小众群体的内容闭环。

交流嘉宾介绍: 朱江晶莹科技 创始人&CEO 胡修涵:捏塔创始人 吕睿韬(秀才):喜马拉雅珠穆朗玛峰人工智能产品开发 总监·尹伯昊:猴子是无限的 创始人&CEO 再次特别感谢上海人工智能产业联谊与走出去 询问上海西岸集团对本次活动的支持。

01 AI短剧≠AI+短剧,而是一个全新的内容生态 分享嘉宾:晶影科技创始人&CEO朱江 在这一部分,他分享了目前对AI短剧行业的观察和经验。

今天的短剧和免费小说有很大关系。

最先制作短剧的人是免费小说的广告演员,以及为免费小说做广告的广告公司。

大家发现了,这种短剧其实本身就很过瘾,不一定非得看小说才能看。

从年初就出现了一批先行者,这一年发生了一个关键点,就是抖音和微信小程序的对接。

这使得大量企业通过抖音进行带量采购,然后跳转到微信小程序。

事实证明,做免费小说和新媒体的人都是用短剧来产生投资回报率的。

短剧的前身其实来源于自由小说。

如今短剧的兴起可以说是免费小说的升级版,也就是视频小说。

为什么是小说?因为你可以一次性阅读它,并且需要一遍又一遍地阅读。

抖音短视频的逻辑是不同的。

这是一个很好的分发点。

从体验上来看,AI要往前走,交互也会有新的变化。

如果你仔细想想,这其实已经不再是一部戏剧了。

您可以观看并与之互动。

这是一种新的内容,但现在似乎是基于视频的。

换句话说,如果今天用AI来制作Vision Pro的空间视频,它可能会成为另一种媒介。

但可能还需要一个过程。

在这家初创公司中,我们使用人工智能来生成视频内容,我们也这样做,涵盖从广告到短剧的所有内容。

但我有一个非常大的体会,就是一定要创造高质量的内容。

优质的内容创作在市场上具有价值。

在任何以娱乐为导向且竞争充分的内容市场中,高质量是进入的门票。

没有优质的内容,迟早会被淘汰。

我们可能会觉得竖屏短剧不是短视频,而是一个新事物。

其实是一个很长的视频,但是被剪成一个很短的长度,变成了一系列的剧集,非常密集的呈现。

长视频是关注,短视频是观看,体验不一样。

竖屏短剧的形式是新的发行渠道的机会。

国内外用户在哪里可以观看竖屏短剧?没有人有这种心态,国内外用户也没有固定的渠道。

第二个问题其实更关键,内容供给。

我们设想,如果要达到10000 DAU,需要10000部左右的好剧。

按照目前的点击率,我们需要一万部剧才能起步。

现在中国的总供应量是多少?一年一部剧。

目前的内容消费根本无法支撑这么大的DAU。

所以我的判断是,短剧的需求端得到了验证,但问题出在供给端。

我的判断是,如果没有人工智能的产生,它就不可能成为一个平台。

目前短剧月活跃用户数已达1.2亿。

这些内容一完成就会消失,无法保留。

当你真正想搭建一个内容平台的时候,用现在的工作室方式来拍摄是不可能的。

这与以往的网络小说不同。

对于作家来说,唯一的成本就是时间。

但如果说一堆人聚集在一起,有演员、有服装、有道具、有摄像机,他不可能只是为了好玩而拍一部短剧。

所有队员都要吃饭。

因此,生产者必须付费。

一方面成本高,内容制作效率也很低。

AI的优势在于它不会增加内容限制,但是AI可以将团队的任务变成一个人可以完成的事情。

如果能达到一个高质量的底线,让这些有能力的创作者单独创作,那么内容供应就可以打通。

只有人工智能降本增效到这种程度,平台才会出现。

我认为今天的小品的轨迹只是下半场的开始。

中国市场的真人短剧年产量仅为一半。

我去年就跟客户和投资人说过,未来用户肯定分不清AI和真人拍摄的区别。

未来将是AI内容的时代。

从目前来看,至少从海外平台的角度来看,竞争没有绝对的胜负之道。

这个阶段有一个阶段性的机会,因为Netflix、迪士尼等视频平台现在都需要竖屏短视频的理解还没有达到这个地步。

在中国,大平台可以一下子接管所有的内容团队,就没有机会了。

问:人工智能需要多长时间才能成为视频的创作者?这个问题问得好。

我们认为短剧仍然是PGC,但AI有点不同。

我觉得AI时代不一样了。

这不是PUGC。

PUGC是给专业人士创造的,但AI却让一些非专业人士开始创作。

因为AI解决了下限问题,用户利用AI工具成为可以生产内容的专业人士。

我们会觉得未来的平台其实最终能够取代抖音,现在的AI体验还得往前走,只有AI短剧是不够的。

短剧在AI时代可以是有内涵的笑话,但它们并不是真正的头条或抖音,但它们就在这条路上,并且是其中非常重要的一部分。

其他内容体验的提升有赖于其他AI能力的补充。

问:AI时代的个人创作者会表现出非常强的头部效应吗?坦白说,我们内部也存在分歧。

一种观点认为,超级个体会崛起,强大的人会因为效率提高而变得更强。

另一种观点是,有能力的人也增加了,不会成为像Netflix或爱奇艺上游那样,被少数内容生产者控制的情况。

所以我感觉创作者这个超级内容一开始会上升,但是慢慢会有更多的人进来,最上面可能是百万级别的存在,然后腰部也会有创作者数量的增加。

02 AI让小众群体内容闭环不再是问题。

分享嘉宾:创始人和胡修涵。

在这一部分中,他分享了他对二次元内容社区的观察和判断。

我第一次明白数据驱动不能解决很多事情,包括很多内容问题,是在联合利华工作的时候。

当时,联合利华将创建一个社交工具,供厨师分享食谱,以此来增加调味料的销量。

为什么要建立社区?其实,救国的方式显然有很多不那么复杂:直接发优惠券、线下超市卖货等等。

为什么需要社区?事实上,他们正在整合分散渠道的优质内容,进行社会创新。

如果说菜谱是内容,那么厨师就是创新菜肴的原动力。

除了配料之外,调味料也是食谱的关键要素。

但在这一部分,调味品生产企业其实很难理解如何创新,因为没有那么多的数据反馈和数据驱动,只有销售数据,而销售数据实际上滞后于人们口味的变化。

那么什么样的反馈最快呢?如果一个厨师在一道川菜中加入甜调料并受到好评,他周围的厨师就会很乐意分享这个菜谱。

如果他们能尽快拿到菜谱,就可以创新调味料。

在某种程度上,这是厨师的 Github。

还有为什么Github上没有内容?因为内容Github很难创作,需要大家凝聚共识、互相讨论,但内容是一个非常主观的事情,所以编辑部需要有主编来最终决定核心创作。

但这不再是更高效的人工智能时代内容创新最有效的解决方案。

例如,针对小众爱好的内容创作一直存在内容创新的瓶颈,因为无法建立供给和消费的循环。

人数太少,没有足够的创作者来创造内容,就会导致消费循环失败。

,然后社区就消亡了。

但这件事本身的价值其实是非常大的。

一小部分人的内容可以形成共识,共识就会形成很大的价值。

那么,今天的人工智能可以改变这种情况。

AI改变了内容创作的协作过程,但它不是像Reddit那样像素级的协作,只有行为艺术价值,但结果却毫无价值。

但如果我们在角色上有共同的创作目的,或者基于一定的理念,我相信在人工智能的帮助下,我们可以自下而上地创作出好的内容。

我们花了一年的时间创建了至少30多个新媒体账号,并在小红书和视频号上运行了成功的案例。

而且,这是与非AI内容竞争的结果。

我们认为这是一个突破。

内容市场契合度已经消失。

最重要的一点是人工智能作为作曲家,而不是创造者。

最终的内容还是由专业人士提供。

每个人都参与将角色转变为情节。

该图可能由 PGC 创建或由其他用户提供。

我们可以重新创建角色的世界观、场景和发生的情节。

把它拆开,一点一点控制变量,让AI来弥补,直到足够好为止。

最终的结果还是会是一些人愿意看到的,有足够消费属性的。

这最终会带来真正的人工智能原生内容形式。

比如这张图,其实是有用户提议作为柯南和灰原哀的CP图,然后AI生成了这样一张图。

这张图在B站获得了200多个点赞。

人们会思考事物,但AI可以轻松还原这种想法,甚至带来一些惊喜。

基于这样的形式和内容要求,我们其实早期就进入了奇幻和二次元的范畴。

因为这些品类都有成熟的创意模式,比如Lofter上的粉丝内容。

在此基础上,你会发现这种模式其实并不支持长叙事,只能在一定程度上支持短叙事。

同样是互动叙事,所以橙光模式不太适合,因为橙光的游戏追求长叙事,注重前期引导、后期解密。

什么样的内容适合?像《名侦探柯南》《哆啦A梦》这样长期以剧场版驱动,短期以单元剧为驱动,然后基于人物基础和事件基础来发展的内容核心就非常好。

用户会因为角色或事件而参与,用户对角色的故事情节(角色驱动)有期待,比如成长环境、家庭关系、社交等等,这些都可以枚举和填写,但如果是一个故事分支,Driven(情节驱动),这个分支无法枚举,不可预测。

有这些内容的创作者并不是目前所知的高素质创作者,因为他们(现有的高素质创作者)被他们现在能做的内容和形式所束缚,只能去到他们不去的地方。

被视为高品质的创作者。

挖金子,然后通过各种创意活动或竞赛挖出好苗子,而不是一开始就招募好创作者。

最终,每个人??都可以参与创作,享受阅读故事、阅读自己的故事。

03 大模型的核心是降低用户创作内容的成本。

分享嘉宾:喜马拉雅Everest AI产品开发总监·吕睿韬(秀才)Everest AI今年将推出大型语音模型,在语音生成方面有更强的能力。

秀才从语音生成的角度分享了他对大型模型如何改变内容生产的理解。

根据定义,什么是大模型?我们认为人只是大模特。

从小到大,从无到有,人转变了不同的角色,在不同的能力象限中得到提升。

如果把人拆开,我们认为人是由三部分组成的,即形式+语言+意义。

形是指人的外围设备,包括图像、动作、表情等。

语音是语音交互。

宝宝从出生到成长,一直都是语音交互。

语音信息的40%是文本,60%是丰富的语言信息(情绪、节奏、语气等)。

文本本身是抽象的内容,但言语丰富的语言信息是情感性的、有特色的。

言语更加温暖、多样,所以言语也是人类“成长”过程中的核心部分。

意义就是思想和智慧,构建这部分的是大语言模型。

因此,我们的目标是创建一个具有角色视觉外围、情感和垂直任务能力的大型模型。

一定是垂直任务能力。

只有擅长垂直任务能力,单击突破才有障碍。

凡事都考60分,不如考90分。

选择的核心逻辑是专注。

我们整个模型的思考核心应该是让用户充分利用AI。

这一代大模型的核心是降低创作的边际成本,让用户充分参与。

大模型就是超越用户现有的能力,让用户受益。

那么我们觉得语音线的增益就是让用户拥有超越自身限制的语音和语言能力。

与业界第二代模型相比,我们构建的第三代语音模型不仅大大提高了音色的还原度,而且完美还原了节奏、重音、语气。

它还支持音频提示和文本提示。

调整音频创作效果的方法。

用户使用15秒的声音作为音频提示喂给大模型,可以快速得到原始节奏和重音的完美再现,然后使用文本提示调整输入音频文本的音色,或各种要包含在音频中的元素。

情绪可以直接调节。

这是一个创造性重塑的过程,不断增强创造能力。

大家一定要重视数据工程产品的建设。

与文本标注相比,视频标注和语音标注难度很大。

我们现在将使用模型自动注释来提供计算处理效率和质量。

另外,我们甚至还有多个“音视频总监”来做数据处理管道。

设计,只有专业的人才能产出高质量的数据。

强大的数据工程产品是构建具有强大产品竞争力的多模态大模型的基石。

AI让每个人都成为创造者。

如今,许多公司都致力于数字化创作。

我们对此的思考是,我们认为未来的交互形式,或者说内容形式,一定是由AI产生的。

我觉得未来就只有AIGC了。

PGC和UGC只是AIGC的过程。

它们为AIGC提供营养,未来将被AIGC取代。

对于数字人来说,GPT让我们对文本能力有了更多的上限,打开了我们能力的边际。

我想新年一定是超级个体的元年。

使用人工智能,每个人都将是创造者,并且可以快速创造。

问题:什么是良好的数字人机交互?我们自己也是数字人。

现在的交互是文字、语音、表情、动作四种独立的模态叠加,但效果很一般。

很多用户会更喜欢迪士尼动画中的效果。

里面放的是合成数据、动画和游戏数据,而不仅仅是真人。

数字人并不一味追求真实性,而是追求演绎效果。

盲目恢复并不是用户最终想要的。

用户想要的是表达和演绎的增益,包括图像增益、知识增益、表达增益。

“理解”用户、“成为”用户、“超越”用户。