2021年6月6日全球人工智能技术大会“发展与挑战”专题论坛在杭州举行。快手技术副总裁兼MMU&Y-tech负责人王中元出席论坛并发表主题演讲《音乐与技术的碰撞交融——艺术如何随时代变迁》,分享快手在AI音乐方面的动态与进展,充分展示快手领先的人工智能技术和AI音乐对短视频的强大助力。AI技术+音乐的深度融合,快手持续提升短视频的观影体验作为一款全民性的短视频APP,快手拥有海量的内容、巨大的流量和极高的用户粘性。数据显示,快手用户平均每月上传的短视频数量超过11亿,整体日活达到3.7亿+。用户平均每天在快手平台观看短视频和直播内容的时长接近100分钟。在丰富的快手社区生态中,音乐已经成为激发用户创作的因素之一。在中,76%的快手作品有配乐,90%的快手用户期望大部分短视频有配乐。为什么用户在创作短视频时对音乐的依赖性如此之强?王中源说:“对于短视频的制作体验来说,音乐的正面影响非常重要。比如如果去除了短视频唯美风格的背景音乐,只留下原声,就会减弱它的氛围感,给用户留下了独特的体验。我之前的印象完全不同。对此,王中元进一步剖析了音乐的独特魅力。在他看来,音乐可以与人的思想情感相联系,可以使人感到快乐、悲伤、期待。中国人听到春节的序曲,往往有一种春回大地、万物复苏的感觉。央视春晚主持人的开场白也不自觉地浮现在脑海中。音乐作为一种神奇的艺术表现形式,随着科技的发展也不断产生新的形式。工业化时代,制造工艺的提高,使得乐器所能发出的声音更加丰富、更有层次。在电子时代,电子技术的发展创造了自然机械无法发出的声音,音乐的表现力也更加多样化。在进入人工智能时代的今天,AI技术助力音乐实现全面的个性化和智能化,为音乐和短视频带来新的发展空间。据王中元介绍,前段时间在网络上走红的《蚂蚁呀嘿》是音乐与视觉AI技术的创意融合。用户只需一张照片,即可自动生成妙趣横生的动感歌唱视频,配上神奇的BGM,迅速成为短视频用户争相打造的模板。AI技术推动音乐普及,快手自建模型还原专业级唱功。在科技的加持下,音乐制作进入大众化时代。如何帮助更多用户创作个性化音乐?快手自主研发了AI音乐创作模型和AI歌手。从音乐制作流程来看,大多倾向于流水线化、工程化和模块化。先把握创作动机,然后作词、作曲、编曲,最后录音混音。通过快手建立的AI模型,每一步都可以在AI的帮助下完成。王中元说:“在AI时代,动机变得非常简单。在快手AI音乐模型中输入随机关键词,模型可以将文字转化为动机的表征,甚至是各种初始化的音乐。”OK有了好动力后,就可以使用快手AI模块生成歌词了。在AI歌词方面,快手在已有的数百万首歌曲上重新训练了模型,确保AI能够很好地理解词义,让用户只需要输入一个主题、一种情感、一种风格,就可以生成几十首的歌词。在AI旋律的创作上,快手也采用了类似的方法,建立了数十万曲谱和数百万首歌曲的音频训练模型,然后让模型通过迷你数据库自我监督歌曲的内在关联,从而训练AI旋律生成能力。据了解,快手邀请平台内的音乐人使用AI模式创作新歌,已创作的流行音乐包括《甜甜的味道》《夜》《勇往直前》等。录制一首高质量的成品歌曲,对歌手的唱功要求极高。为了解决部分用户所面临的唱跑调、音色不好等问题,快手推出了AI歌手辅助创作功能,并不断提升其模型的准确率。据介绍,2020年5月,AI歌手的演唱还停留在KTV级别;到2020年12月,普通人很难发现AI歌手演唱的破绽;现在,模型会根据乐谱自动调整音高、节拍和歌词,AI歌手可以真实还原专业歌手的演唱水平。演讲最后,王中元表示:“快手未来会探索更多新技术,丰富生成端的玩法。借助语音识别技术,快手希望AI歌手可以模仿未来的个人音色,AI音乐可以将他们说的话翻译成歌曲,满足用户更加个性化的音乐创作需求,持续助力短视频领域的创作。”
