这几天,在ChatGPT引发的搜索引擎大战中,谷歌和微软擦出了火花。即便我们隔岸观火,也能深刻感受到AIGC的这一波浪潮,或许将永远改变人类社会的运行方式。昨日,以“生成式AI大爆发”为主题的新智谈第二期正式开播。新智谈由新致远创始人杨静女士主持。本期节目嘉宾是英伟达Omniverse中国区负责人何展。生成式AI的爆炸式增长。在主客杨康相继主持之后,新智者谈新一期节目终于开始录制了。本期主题为“GenerativeAIExplosion”。事实上,在计划筹备期间,生成式AI已经经历了几代迭代和进化。可以说它的进化速度比程序编写速度还要快。2022年,就在我们人类滚滚前行的同时,AI也在悄然进化。因此,2022年成为了生成AI爆发的一年。有两件事可以充分证明生成式人工智能的流行。比如国内知名摇滚乐队《杀死那个石家庄人》的作品在B站突然火了一把,原来是因为它的每一句歌词都经过了AI配图。还有一点应该很多人都不陌生。美国的一个游戏设计师,他用AI画了一张图,然后用这张图参加美术比赛,获得了第一名。这也是历史上第一次人工智能在艺术上战胜人类。Nvidia的Omniverse的强大迭代再次反映了这一点。现在,用户可以方便地利用数字化实现数字孪生和虚拟数字人的生产,为元宇宙的构建打下坚实的基础。邓紫棋《跨过红海》,被英伟达虚拟舞台加持的杨静女士提出了一个很有意思的说法:在过去的六个月里,人类被横扫上上下下,其实AI也被横扫了在舞台上。比如在2023年江苏卫视跨年演唱会上,邓紫棋在《启示录》中唱完《Gloria》时,周围突然出现了波浪,这是AIGC的技术和AR技术产生的。这种视觉呈现是为了让中国亿万观众亲眼所见,来自元宇宙的震撼。而这个阶段的背后,还有英伟达的一些黑科技做支撑。贺湛当场解密。比如这个海水特效,就是内容生成的一个重要应用方向。该舞台采用XR技术,结合AIGC最新生成技术,为我们呈现一场华丽的视觉盛宴。在这些技术的背后,还有图形方面的进步。第二个黑科技是对英伟达AI深度学习加速算法的一些优化。在舞台上,是大规模训练模型迭代塑造的效果。例如,海水需要大量的模拟和更多的模型训练数据集。最终登上舞台后,观众可以身临其境地欣赏美妙的歌声。AIGC的三个节点正是基于以上背景。杨静女士问何展:如此快速强大的迭代背后,在这一波生成式AI的浪潮中,人工智能生成内容(AIGC)背后有哪些算法支持?它对算法和算力有什么要求,才能让年轻人用它来冲浪、玩酷?对此,贺湛从多个角度给出了精彩的回答。首先,AIGC和生成式AI的概念离我们并不遥远。有几个历史节点可以让我们更好地把握AIGC的发展历程。早在1957年,就有了第一支由人工智能创作的弦乐四重奏——《伊利亚克组曲》,这是最早的人工智能音乐。时间拨回到2007年,纽约大学出版了一部由人工智能创作的小说。虽然有各种逻辑错误,各种模糊的情节情节,但它是第一部完全由AI完成的小说。下一个时间点是2014年,这一年出现了GAN(生成对抗网络)。这三个时间点恰好是生成式AI或AIGC的不同迭代阶段。这里面有一个很有意思的事情,不知道读者有没有注意到——在AI发展的第一阶段,也就是第一首AI生成的音乐《伊利亚克组曲》的诞生,到第一首AI创作的小说,它已经走过了50年岁月;但从第一部AI生成的小说到GAN网络的出现,仅仅过去了7年。近年来,尤其是过去六个月,生成式人工智能如雨后春笋般涌现。文字转图片的有DALL-E2、Midjourney、StableDiffusion等。这些模型在一两周内迭代,非常快。深度学习技术的快速迭代,包括前面提到的2014年GAN的产生,极大地加速了生成式AIGC技术的发展。年轻人如何利用AIGC的技术?在何展看来,未来充满无限想象。我们都可以看到,涵盖创意内容的工作越来越多。包括前面提到的AI写文章、制作音乐、后期制作等,这些应用可能会给年轻人提供很大的探索和探索空间。年轻人如果拥抱这些变化,不断迭代自己的能力,未来将拥有无限的潜力。2022年万亿级的蓝海是元宇宙大爆发的一年,但在元宇宙还没有过热之前,AIGC这个新概念就以迅雷不及掩耳之势在网络上火了起来。红杉资本的合伙人甚至与GPT-3合着了一篇文章,预测AIGC将形成数万亿美元的新赛道。杨静女士问:为什么AIGC会在2022年在东风的背上爆炸?背后的技术逻辑和产业逻辑是什么?元界与AIGC有何异同?何展解释说,提到GPT-3,就不得不提到它背后的参数——1750亿。当GPT-3首次发布时,许多研究人员和开发人员都惊呆了。而就在一周前,有一篇关于GPT-4预热的报道,其中提到GPT-4的参数可能达到100万亿。对于一个已经进入exascale参数级别的机型,未来它所创造的内容会是什么样子呢?这是所有人都期待的。而元界中的GPT-3和GPT-4承担了内容生产的角色。想要元界应用快速迭代开发,就必须让尽可能多的人参与进来。比如你想让大家参与Omniverse平台,就必须降低技术门槛,让大家可以用它来创作更多的作品。这时候就需要可以快速生成的工具,快、好、低成本。那么生产力从何而来?它是生成式AIGC的一个工具。现在,包括Nvidia在内的许多公司都在研究会议系统。视频会议中有Maxine算法。如果你想边开车边喝水,算法可以在你去喝水的时候把你的脸矫正成一张新脸,让别人以为你一直在盯着屏幕看。.嗯?等等,这不是钓鱼吗?没错,其实这就是钓鱼。几周前,Nvidia也进行了一次有趣的用户交流。有用户表示,想要这样的直播间,也就是自习室,书里一定要有一些相框或者艺术品,相框中有蓝天白云等。其实这种要求并不像演播室阶段那么苛刻,现在完全可以实现。比如书房的墙纸,你可以使用工具输入你想要的任何风格和色调,它会产生实时效果。如今,这些科技的进步,也算是彻底激发了个人的创造力欲望。想象一下,你以前画油画,现在可以直接让AI快速生成,这真是太棒了。2023:AIGC元年杨静女士说,这个想法真的很激动,因为微博和微信上的视频号背后有几千万甚至几亿的用户。如果AI可以用来生成特效或者视频,无疑会激发很多人的创作欲望。那么,这个愿望能否在2023年实现呢?贺占引用了一份知名研究机构的报告。根据这份报告,目前生成人工智能在人工智能的生成中所占比例不到1%。因此,如果能在2025年达到10%,那将是一个了不起的结果。在生物科学和医疗领域,到2050年,人工智能生成的药物和材料的比例可能达到30%。那么,在众多的生成式AI技术中,哪些能够成为杀手锏呢?AIGC何时才能真正走向大众,成为一款超级APP,哪些企业将有机会摘金?何展认为,最关键的一点是要确定这些应用需要哪些杀手级应用。比如你需要设计一个电热水壶,但是你想偷懒,怎么办?现在,其实各大厂商都有很多3D模型生成工具,可以实现这种设计的定制化。比如Google的DreamFusion和Nvidia的Magic3D,你只需要输入一段文字就可以生成你想要的效果。一言以蔽之,只要能满足设计师或工程师的需求,AIGC随时都可以爆发。一键生成酷剧显然,生成AI与内容的结合更加紧密。在电商、媒体、影视等行业,AI可以用来辅助视频脚本创作、游戏场景生成、数字人辅助带货、XR产品展示等。现在,几句话就能生成一个剧本,甚至是短视频,一部小电影。而如果未来AIGC大规模落地,对产业链的哪个环节影响最大?何湛回应说,最近在视频号上火的爽剧就是用爽文拍的。但是这个过程中的生产力实际上是缺乏的。要知道,中国双菊的背后大约有10万生产人员,而这10万人处于整个生产链条的末端。在他们的作品真正成为舞台或屏幕上的作品之前,已经倾注了许多双手。这些制作人很努力,却没有得到多少回报。但是,如果通过AIGC可以快速出酷剧,就会拉来一批人,技术门槛降低了,生产力就上升了,自然就形成了闭环。而且,不仅是编剧,在药物研发、教育等领域,都会有这样一个制作、发行、经济效益的闭环。不过,杨静女士提出了一个非常关键的问题:既然可以一键生成爽文、爽剧,会不会让年轻人过度依赖这类工具而失去想象力?何展表示,可以肯定的是,AI工具不会让人失去想象力。比如去年Nvidia在杭州举办了设计周活动,展示了一款名为“马良”的工艺——NvidiaCanvas。左边勾勒出曲线,右边通过你的输入让AI大脑填一张图。简单地画几笔,右边就会生成一幅真实的照片般的作品。让贺湛感动的是,在场的很多孩子都比大人认真的多,也很专心。而且很多大人都是开玩笑或者害羞的态度。因此,他们画出的画比大人展示的更富想象力。同一个AI工具,产生完全不同的作品。这告诉我们:想象的输入不同,作品达到的效果就完全不同。因此,即使是技术迭代的工具,依然离不开人类的想象力和专注力。因此,生成式AI可以激发年轻人的想象力,让他们的思维不受束缚,让他们的想象力插上翅膀。不管未来的工具有多么神奇,最终的投入还是要靠我们自己。国内玩家争霸说到这里,就不得不提最近谷歌、微软、Meta等大玩家的竞争。而像OpenAI这样的新独角兽最近凭借ChatGPT赢得了足够的关注,并获得了微软超过100亿美元的投资。与此同时,BAT等国内大厂也在AIGC领域走在了前列。哪些球员将成为领跑者?2023年科技发展的最大亮点在哪里?何展相信,国内互联网巨头肯定会有类似ChatGPT的模式。比如阿里的网购,腾讯的社交等,应用之多可想而知,大厂肯定会重金投入。行星级算力可以生成动态的“生命之书”。节目最后,杨静老师讲述了她最近做的一个神奇的梦。梦里,一位同学送给她一本相册,里面用数字和图像生动地呈现了她一生中最难忘的画面,就像一本活生生的生命之书。于是,杨静萌生了一个绝妙的想法:能否利用AIGC技术,自动生成一个人一年或一生的影像虚拟相册?如果我们要回顾自己的微博或者朋友圈,这些回忆一天天很难找到,但是如果我们用AI回看这些图片,自动生成一本生活簿,就会容易很多。何展说问题不大,就像手机有时候会把我们推一下一样,也是一样的道理。我们可以把自己这几年的数据作为输入,然后生成输入。而你可以要求温暖或欢快,生成的相册也会有相应的情绪表达。杨静女士谈到了自己的小狗小豆豆,它在2020年过世了。她曾看到一个广告,将小狗的照片输入产品中,就会生成宠物狗一生的相册。但是找狗狗的照片会很麻烦,所以如果AI能自动从图库中找到它们,肯定能满足很多人的需求。何湛听后十分感动。他还认为,随着工具发展的越来越快,越来越多的人会进入普通人的生活,新的业务肯定会出现。例如,有些人会使用这些工具来制作新的应用程序。杨静说,我们的伙伴、宠物、亲人是我们生命中的软肋,也是我们生命中最柔情的部分。这是人性中最大的财富。除了爽文爽剧,未来的虚拟宇宙还会有大规模的虚拟城市,还有很多性格各异的虚拟明星,连人类都没有。这些虚实明星的数字化身可以生成新的数字相册和虚拟电影,因此生平书数不胜数。AIGC未来是否有能力生成新的数字星球、数字地球,甚至是包罗万象的数字元宇宙??何展相信一切皆有可能。想象一下,所有这些技术最终都会提高生产力。现在,每个人的需求都已经存在,比如生成相册,让人们回顾那些温暖的瞬间。用户需要的是快、好、便宜,比如十几块钱就可以生成一个相册。节目最后,杨静老师总结道:黄仁勋的口头禅是“省钱”,一个快、好、强的生成式AI,一定能颠覆人类的未来。所以,在2023年,感谢生成式AI带我们穿越红海,也带我们重温生活中温暖的回忆,所以我们期待2023年生成式AI的大爆发,带来一个多彩的世界,一个一个充满无限可能和行星级计算能力的元宇宙和新宇宙。
