快手科技副总裁王中元：90%的用户期待使用短视频配乐，快手用“AI+音乐”帮助短视频创造

时间：2023-03-16 11:25:54 科技观察

2021年6月6日全球人工智能技术大会“发展与挑战”专题论坛在杭州举行。快手技术副总裁兼MMU&Y-tech负责人王中元出席论坛并发表主题演讲《音乐与技术的碰撞交融——艺术如何随时代变迁》，分享快手在AI音乐方面的动态与进展，充分展示快手领先的人工智能技术和AI音乐对短视频的强大助力。AI技术+音乐的深度融合，快手持续提升短视频的观影体验作为一款全民性的短视频APP，快手拥有海量的内容、巨大的流量和极高的用户粘性。数据显示，快手用户平均每月上传的短视频数量超过11亿，整体日活达到3.7亿+。用户平均每天在快手平台观看短视频和直播内容的时长接近100分钟。在丰富的快手社区生态中，音乐已经成为激发用户创作的因素之一。在中，76%的快手作品有配乐，90%的快手用户期望大部分短视频有配乐。为什么用户在创作短视频时对音乐的依赖性如此之强？王中源说：“对于短视频的制作体验来说，音乐的正面影响非常重要。比如如果去除了短视频唯美风格的背景音乐，只留下原声，就会减弱它的氛围感，给用户留下了独特的体验。我之前的印象完全不同。对此，王中元进一步剖析了音乐的独特魅力。在他看来，音乐可以与人的思想情感相联系，可以使人感到快乐、悲伤、期待。中国人听到春节的序曲，往往有一种春回大地、万物复苏的感觉。央视春晚主持人的开场白也不自觉地浮现在脑海中。音乐作为一种神奇的艺术表现形式，随着科技的发展也不断产生新的形式。工业化时代，制造工艺的提高，使得乐器所能发出的声音更加丰富、更有层次。在电子时代，电子技术的发展创造了自然机械无法发出的声音，音乐的表现力也更加多样化。在进入人工智能时代的今天，AI技术助力音乐实现全面的个性化和智能化，为音乐和短视频带来新的发展空间。据王中元介绍，前段时间在网络上走红的《蚂蚁呀嘿》是音乐与视觉AI技术的创意融合。用户只需一张照片，即可自动生成妙趣横生的动感歌唱视频，配上神奇的BGM，迅速成为短视频用户争相打造的模板。AI技术推动音乐普及，快手自建模型还原专业级唱功。在科技的加持下，音乐制作进入大众化时代。如何帮助更多用户创作个性化音乐？快手自主研发了AI音乐创作模型和AI歌手。从音乐制作流程来看，大多倾向于流水线化、工程化和模块化。先把握创作动机，然后作词、作曲、编曲，最后录音混音。通过快手建立的AI模型，每一步都可以在AI的帮助下完成。王中元说：“在AI时代，动机变得非常简单。在快手AI音乐模型中输入随机关键词，模型可以将文字转化为动机的表征，甚至是各种初始化的音乐。”OK有了好动力后，就可以使用快手AI模块生成歌词了。在AI歌词方面，快手在已有的数百万首歌曲上重新训练了模型，确保AI能够很好地理解词义，让用户只需要输入一个主题、一种情感、一种风格，就可以生成几十首的歌词。在AI旋律的创作上，快手也采用了类似的方法，建立了数十万曲谱和数百万首歌曲的音频训练模型，然后让模型通过迷你数据库自我监督歌曲的内在关联，从而训练AI旋律生成能力。据了解，快手邀请平台内的音乐人使用AI模式创作新歌，已创作的流行音乐包括《甜甜的味道》《夜》《勇往直前》等。录制一首高质量的成品歌曲，对歌手的唱功要求极高。为了解决部分用户所面临的唱跑调、音色不好等问题，快手推出了AI歌手辅助创作功能，并不断提升其模型的准确率。据介绍，2020年5月，AI歌手的演唱还停留在KTV级别；到2020年12月，普通人很难发现AI歌手演唱的破绽；现在，模型会根据乐谱自动调整音高、节拍和歌词，AI歌手可以真实还原专业歌手的演唱水平。演讲最后，王中元表示：“快手未来会探索更多新技术，丰富生成端的玩法。借助语音识别技术，快手希望AI歌手可以模仿未来的个人音色，AI音乐可以将他们说的话翻译成歌曲，满足用户更加个性化的音乐创作需求，持续助力短视频领域的创作。”

上一篇：25万电信宽带用户迎来大提速

下一篇：如果没有时间重构，我们是否应该为遗留代码编写测试？_0

快手科技副总裁王中元：90%的用户期待使用短视频配乐，快手用“AI+音乐”帮助短视频创造相关文章