当前位置: 首页 > 科技观察

李彦宏10年花费超千亿!500万开发者支持中国最大深度学习框架

时间:2023-03-18 17:39:32 科技观察

仰望星空,你在想什么?如果你坚持不懈地提出问题,将会有难以想象的回应。从方寸之内到宇宙之外创造新宇宙的人相信,他们永远看不到天花板。有毅力的人不会因为到达就停下脚步,他们用创造的脚步去衡量未知。百度CREATE2022大会向我们展示了人类设计师与AIGC共同创作的画作。而就像这些画中描绘的场景一样,百度也从未停止过创新。大会伊始,李彦宏提出了一个发人深省的观点:第四次科技革命的标志是深度学习算法。与深度学习相关的重大创新将像汽车和互联网一样对我们的社会产生重大影响。在实际操作中,没有导航地图,只有指南针。而百度,在摸清了大方向之后,在实践的基础上一步步迭代,才走出了有价值的创新。在发布会上,李彦宏展示了这样一幅画。这幅画是他在百度AI绘画平台艺格上创作的,关键词是“危机与希望”。这张图很好地代表了人工智能面临的现状——经历坎坷,但充满希望。是的,李彦宏依然坚持去年的观点——创造者将迎来人工智能的黄金十年。AIGC元年,2022年到来,AIGC全面爆发。DALL·E2让文字生成的图像流行了一整年,随后的StableDiffussion和Midjourney激发了无数人的艺术灵感,甚至震撼了很多画家。DALLE2和谷歌发布的Imagen模型也吸引了众多AI学者参与研究。虽然ChatGPT直到年底才出现,但“强化学习”赋予它的魔力让它在全民狂欢中再次掀起AIGC风暴。事实上,在2022年伊始,百度研究院就已经预测到AIGC在这一年的火爆程度。超大规模预训练模型呈现出知识增强、跨模态统一建模、多种学习方法协同演化的趋势,并逐步走向实用化。比如AIGC(AIgeneratedcontent,人工智能创造内容),借助大模型的跨模态综合技术能力,可以激发创造力,增加内容多样性,降低制作成本,将会实现大规模应用。而且,这并不是百度研究院第一次做出神谕。2020年,它预测的NLP模型将在GPT-3上应验,2021年,它押注的数字人类将爆发。而这一次,对于AIGC领域的趋势,百度也是有一套周全的打算。三位才华横溢的创作者,一键实现你的导演梦在创造2022大会上,百度几乎将AIGC应用到每一个环节。歌曲、场景、语音脑图的创作,这些环节都有AI的参与。???李彦宏生成的以“危机与希望”为主题的画作背后是文心知识增强型跨模态大模型一格,是接下来登场的三位天才创作者之一。创造大会上,百度技术委员会主席吴华介绍了三位能力出众的天才创造者。他们是天才编剧——文心ERNIE3.0Zeus,天才插画师——文心ERNIE-ViLG2.0,剪辑动画大师——VIMER-TCIR。有了这三位才华横溢的创作者,再加上自己设计的化身演员,你也可以当导演,拍出属于自己的影视大作!文心ERNIE3.0Zeus语言模型,陪你聊个不停!作为ERNIE3.0系列模型的最新升级,ERNIE3.0Zeus不仅学习未标注数据和知识图谱,还通过不断学习实现了对100多种不同形式任务数据的全面掌握。经过通识知识和专业知识“双管齐下”后,模型的泛化能力得到显着提升。无论是多语言理解还是生成任务,都能轻松搞定。是名副其实的“多面手”。无论是自主创作、自由答题、命题对话、情感分析,100多个层次提示,ERNIE3.0Zeus都能游刃有余。文心ERNIE-ViLG2.0图像生成大模型,天才画家呢?如果说WenxinERNIE3.0Zeus是语言大师,那么ERNIE-ViLG2.0就是绘画大师。它可以根据句子或描述文本生成一幅美丽的画作。中文提示,想画就直说,只有想不到,没有画不出来,看看这青花瓷战舰,是不是一件精美的作品艺术的?只是不知道真打起来会不会一枪毙命……而要达到这个目的,离不开模型本身背后知识增强的扩散模型。一句话或几句的暗示中,哪些是绘画中需要突出的核心元素,哪些是装饰元素,哪些是锦上添花,不能铺天盖地。这里有知识。为了尽可能做到精准绘画,ERNIEViLG2.0在学习过程中引入了语言、视觉等多源知识,引导模型更加关注文本和图像中的核心语义元素,实现精准细粒度的语义控制。此外,ERNIEViLG2.0还可以针对不同阶段选择不同的网络(如降噪)建模框架,有效解决不同阶段对模型能力要求不一致的问题,减少降噪任务的相互干扰,提高图像生成效率。的质量。无论是写实风、中国风,还是国潮风、国画风,ERNIE-ViLG2.0都能根据简短的中文提示,生成切题、风格各异的生动逼真图像。比如下面这幅华丽典雅的《天宫盛宴》:基于ERNIE-ViLG2.0的文心一格,可以说是综合赋值。整体画风明艳艳丽,不失古朴情调。现在,我们只需要在百度“文心一格”平台上输入几个关键词,分分钟就可以得到独一无二的画作。除了语言和图像,在视频内容的生成和剪辑上,也是文心大模大显身手的地方。在视觉内容生成方面,大视频生成模型可以根据用户提供的描述文字或图片,自动生成高清流畅的视频。在视觉编辑方面,VIMER-TCIR多任务大模型可以利用超分辨率、去噪、去模糊、解压等多任务的联合预训练,实现多种情况的同时修复和编辑。目前,VIMER-TCIR已经在老电影修复等场景落地,大大提升了运行效率。单机每天可修复28.5万帧视频,解决了大部分老电影画面的修复问题。AIGC的浪潮已经到来。未来,可以预见,AI绘画、AI视频创作等很快就会变得像用手机拍照一样简单。随着技术的不断突破,AIGC极有可能颠覆现有的内容生产模式,以十分之一的成本、百倍千倍的生产速度,实现具有独特价值和独立视角的内容创作。全研发资金:百度10年投入超1000亿元。为了让大模型达到如此炫酷的效果,百度在研发上并不吝啬。十年来,累计投入超过1000亿元,其中核心研发投入连续八个季度占核心营收的20%以上。据统计,百度2020年研发投入强度为18.22%,在民营企业500强中排名第一。2021年为20.03%,位列民营企业500强第二位。顺带一提,如此“激进”的投入,也让百度在人工智能底层技术上占据领先优势。毕竟芯片卡好很重要,基础软件也很重要。早在2016年,百度就开始研发号称“人工智能操作系统”的深度学习框架——飞桨。目前已聚集535万开发者,创建模型67万个,构建繁荣的深度学习生态。基于飞桨的大模型还能有效融合自然语言处理、计算机视觉等多模态能力,结合各种业务场景进行优化;开发者还可以像搭积木一样搭建AI应用,大大降低AI的成本。应用阈值。李彦宏:人工智能的黄金十年正如我们在文章开头提到的,李彦宏认为与深度学习相关的重大创新,包括自动驾驶、水电能源领域的智能调度系统等,都将有一个重大的社会影响。创新本身从何而来?在李彦宏看来,创新是由反馈驱动的。百度在业务发展中有很多“反馈驱动创新”的实践经验。例如,百度昆仑芯片在AI芯片中的性能领先,正是因为它针对百度的搜索服务进行了十年的优化。百度搜索服务每天响应数十亿用户真实需求,每天进行1万亿次深度语义推理和匹配。它可以提供最真实及时的反馈,从而倒逼大模型、深度学习框架和芯片的优化。现在,百度是全球为数不多的全栈布局(芯片层、框架层、模型层、应用层)的人工智能公司之一。从高端芯片昆仑,到FlyingPaddle深度学习框架,再到文心预训练大模型,层层都有关键的自研技术,每一层之间都有大量的反馈。通过不断的反馈,实现端到端的优化。.每一层的技术架构,越往下越通用,越往上越具体。人工智能越专业,越能深入行业,赋能实体经济发展。在去年的创客大会上,李彦宏预测:“随着技术应用门槛的不断降低,创客将迎来人工智能的黄金十年。”时至今日,他依然这么认为。2020年,李彦宏刚刚创业的时候,就面临着互联网泡沫的破灭,全球市值蒸发了8万亿元。之后,互联网进入又一个黄金十年,人工智能也将经历同样的风风雨雨。而百度,将继续为社会和行业培养人工智能人才,投入更多资源,与开发者一起为中国人工智能的发展做出最大的努力。EasterEggCreate发布会结束时,虚拟人乐队成员再次出现。主唱/吉他手:席佳佳,鼓手:杜潇潇,贝司:叶悠悠,键盘:林凯凯席佳佳表示很高兴能在发布会开幕式上展示自己的画作!而林开开也过了制片人的瘾。乐呵呵的夸自己在编曲方面很有天赋~叶悠悠说她的设计其实是根据大家的审美来设计的,这让她很满意。那么,她在设计哪一部分呢?杜潇潇猜对了:是“知一”和“万千流”的链接。而杜潇潇则表示,他已经把发布会的新闻稿写好了。在四位成员的共同头脑风暴中,稿件标题脱颖而出——《震惊!这是一场人和机器一场办的大会》。