当前位置: 首页 > 科技观察

AI作曲的诺亚方舟将何去何从?

时间:2023-03-13 19:35:44 科技观察

10月8日,韩国新人歌手河妍发布了由人工智能作曲机器人EvoM制作的单曲《Eyes on you》,成为全球首位以AI作曲出道的人.人类歌手。EvoM是由韩国光州科学技术研究院人工智能研究生院开发的韩国第一款人工智能组合机器人。它负责在《Eyes on you》的录制过程中作曲和编曲。EvoM的开发者安昌旭表示,他的目标是让人工智能创作的歌曲在K-POP排行榜上名列前茅。起航——自动化音乐制作的野心早在上个世纪,人类就开始探索计算机独立制作音乐的可能性。1956年,在LejarenHiller的实验室里,世界上第一首完全由电脑生成的乐曲——弦乐四重奏《伊利亚克组曲》(IlliacSuite)诞生了。1995年Alpern开发的EMI作曲系统也是较早成熟的古典音乐作曲系统。该系统主要通过拼接来创作再现已故作曲家音乐风格的作品,包括类似巴赫的思想。音乐、器乐协奏曲和组曲,以及类似莫扎特的奏鸣曲和类似肖邦的夜曲。随着人工智能相关技术的发展和普及,近年来,越来越多的企业和机构开始研究这一科技与艺术相结合的奇妙领域。各种作曲算法层出不穷,涌现出了很多虚拟音乐家。《智能相对论》梳理:2016年,谷歌开发的机器学习项目Magentastudio通过神经学习网络创作了一段90秒的钢琴曲。同年,索尼计算机科学实验室(ComputerScienceLaboratories,简称索尼CSL)开发了FlowMachines平台。FlowMachines利用马尔可夫链分析数据库中已有的歌曲,提取旋律和和弦的关键信息,将这些关键信息作为变量来学习音乐风格,让不同风格的歌曲进行转换、整合和优化。它的代表作是甲壳虫乐队的歌曲《爸爸的汽车》(爸爸的车)。此外,索尼CSL还开发了名为“DeepBach(深度巴赫)”的神经网络,使用巴赫创作的352首作品对DeepBach进行训练,最终完成了2503首赞美诗的创作。第一位正式获得世界地位的人工智能虚拟作曲家是2016年诞生的AIVA(人工智能虚拟艺术家)。AIVA通过阅读莫扎特、巴赫、贝多芬等名家的15000首音乐作品进行学习。利用深度学习技术,建立反映自身对音乐理解的数学模型,并利用该模型创作出完全原创的作品。AIVA作为虚拟音乐家,已在法国和卢森堡作曲家协会(SACEM)合法注册,成为该协会首位非人类成员,并拥有自己的签名版权。今年2月,美国数字研究机构Space150模仿知名说唱歌手TravisScott的声音和音乐风格,制作了一个说唱机器人TravisBott。这是一个关于人工智能创造力的实验。研发团队使用额外的神经网络技术(AdditionalNeuralNetwork)创造出“特拉维斯·斯科特风味”的旋律和打击乐伴奏,然后将特拉维斯·斯科特的歌词输入“文本生成器模型(TextGeneratorModel)”,自动得到歌词由机器以Travis的风格生成。至此,TravisBott完成了自己的创作——《Jack Park Canny Dope Man》。最后,研发团队使用基于AI的人体图像合成技术“Deepfake”为这首歌拍摄了MV。就音乐效果而言,特拉维斯·博特对特拉维斯·斯科特的模仿几乎是假的,完全融合了特拉维斯·斯科特作品最重要的外在特征和个人魅力。同时,该项目进一步验证了人工神经网络技术(ArtificialNeuralNetworks)的蓬勃发展,有助于未来探索AI在音乐中的应用价值。造船原理——几种算法模型现代人工智能组合技术包含多种算法模型的组合,包括人工神经网络、马尔可夫链和遗传算法。例如,AIVA和TravisBott使用基于人工神经网络的深度学习技术。人工神经网络是模仿生物神经的网络行为特征,进行分布式并行信息处理的算法数学模型。程序员必须构建一个多层的“神经网络”,并在多层结构中分别对它们进行编程,以处理各个输入输出点之间的信息。作品数据输入后,人工神经网络会从众多输入作品中找出存在的规律,进而形成对音乐旋律、节奏、音调、力度变化的理解和学习。这种学习的主要目的是预测,而不是生成作品。人工智能程序将继续运行其对上述音乐风格的预测,并将遇到下一个验证数据集。这个数据集将决定它的预测是否正确,而正确和错误的反馈都会被AI记住。在不断的高速学习中,AI的预测能力会越来越强,最终在程序员大数据总结后掌握音乐风格,进而创作自己的音乐。人工神经网络为以往的算法组合提供了一种新的途径。它的优点是可以学习到音乐作品的全局特征,但是需要大量的样本进行训练。目前国内外有很多基于该算法的人工智能作曲系统,如LSTM神经网络,可以保证创作音乐的完整性。除了人工神经网络,马尔可夫链在算法组合领域也得到了广泛的应用。马尔可夫链是一种随机选择过程,主要用于生成具有一定风格的旋律。就像是按照一个特定的标准人工构造的换算表依次选择音符,计算并选择下一个音符出现的可能性。这种方法可以模拟作曲家在创作音乐时的思维来控制计算机生成相应的音乐作品,但不能通过马尔可夫链对整个作品的音乐结构进行建模。遗传算法(GeneticAlgorithm)是一种模仿生物进化过程,利用自适应函数进化样本,优化全局的智能计算方法。其中,变异算子可以模拟人类创作中灵感的闪现,相当于留下最有代表性的作品来产生新的旋律。该算法的难点在于自适应函数的设计没有统一的标准。版权的“暗礁”仍然是人工智能作曲家不得不面对的主要问题。因为AI音乐的生成是基于算法模型,让计算机在大量现成的作品中寻找“规律”,并根据这些规律从数据中提取出特定的动作片段。得到的概率重新排列组合,所以人工智能的构成必然涉及到数据库中大量现成作品的版权。AI如何判断研究人员提供的曲库中哪些作品受版权保护?人工智能的构成是否侵犯了学习对象的版权?例如,AIVA最初以古典音乐为学习对象,它使用的莫扎特、贝多芬等人的作品历史悠久,版权时效已经过期,所以不存在这个问题。AIVA研发人员特意选择古典音乐作为学习对象,主要是为了避免版权问题。但是TravisBott使用的TravisScott角色和作品相关素材需要经过授权,TravisBott在此基础上创作的作品算不算抄袭TravisScott?音乐作品抄袭问题屡见不鲜,相关讨论仍不时出现。目前还没有统一明确的判断标准。从版权问题可以看出,目前的人工智能作曲技术依赖于算法,受限于曲库的音乐“规则”,无法产生突破现有规则的作曲思路。这是AI作文面临的另一个技术难题。即使不断优化AI作曲技术,制作出不涉及任何侵权的纯原创作品,这部作品也会面临版权认证的问题。随着人工智能创作相关技术的成熟和普及,一些国家开始在法律上明确界定人工智能作品的著作权归属。1988年,英国正式颁布《版权、设计和专利法案》(Copyright,DesignsandPatentsAct1988),明确规定了计算机创作的内容:“对计算机生成的作品进行必要程序的,视为计算机生成的作品.作品的作者,保护期自作品创作当年的最后一天起50年届满”。规定人工智能作品的著作权属于“履行必要程序的人”,也明确界定了计算机生成作品的“履行必要程序的人”,包括程序员、用户、人工智能系统或设备的投资者等.2017年,世界知识产权组织(WIPO)杂志提到,如果作品是在“人为参与有限或无人参与”的情况下创作的,版权法有两种可能生效的方式——版权法可以“拒绝”计算机生成作品的版权保护也可以将此类作品的作者身份归于程序的创作者。现在国内对这类问题的解决基本上都是按照这个思路。2018年,上海某公司擅自将腾讯研发的自动化写作程序Dreamwriter生成的财务报告复制到公司网站。深圳市南山区法院判决该公司应承担侵犯腾讯著作权的民事责任,并向腾讯公司赔偿1500元。中国目前的《著作权法》并没有明确界定人工智能作品的著作权归属。这一裁决可能是人工智能创造领域的一个重要里程碑。《著作权法》:“著作权是著作权法赋予民事主体对作品及相关客体享有的权利。”其中,民事主体是指公民、法人或者非法人组织。《著作权法》保护的对象是作为民事主体的思想的原始表达。非民事主体的人工智能不能独立享有版权,但可以通过在作者名单中加入人类作曲家或开发者的名字来解决这个问题。虽然人工智能不能成为法律保护的主体,但对其作品的版权保护也开始得到法律的认可。无情的辅助-方舟的历程人工智能作曲技术的成熟,在音乐界掀起了不小的浪潮。虽然人工智能通过阅读和记忆大量乐曲获得规律,计算出音符节奏出现的概率并进行排列组合,从而实现了音乐的“创造”。但音乐的核心不是音乐本身,而是“人”。音乐源于人类情感的流动。《礼记·乐记》对音乐起源的解释非常贴切:“一切声音都源于人心。人心有所动,物有??所成。情因物而动,故形在声;声音有反应,所以变化;形成正方形的变化称为声音。作曲家和演奏家通过旋律和节奏表达情感,观众聆听音乐。这种通过音符,跨越时空和种族的情感交流,就是音乐的存在。这也是莫扎特、贝多芬等音乐家不朽的根本原因。从某种角度来看,既然音乐是人类表达情感的一种方式,那么让没有情感的人工智能来作曲可能是一个伪命题。人工智能没有情感,不理解音符、节奏等音乐表层结构与基于情感表达的音乐深层逻辑之间的对应关系。它产生的音乐只是根据概率排列的音符。无论算法作曲技术多么成熟,由于音乐是人类情感交流的艺术形式之一,人工智能创作的音乐无法完全替代人类音乐作品在社会中的功能和作用,人工智能也无法替代顶级音乐从事创作行业的作家和表演者。不仅在音乐上如此,在艺术、文学和其他艺术创作中也是如此。除了Google、Sony、AIVA之外,现在比较成熟的AI音乐公司还有英国的AIMusical、德国的Melodrive、美国的Humtap、Popgun、SnafuRecords,以及联合成立的人工智能非营利组织OpenAI。很多硅谷大佬,字节跳动的Jukedeck等等。百度、腾讯、阿里、网易云等音乐平台都不同程度地布局了人工智能音乐。即使人工智能暂时无法把握音乐中微妙的情感变化和流动,但基于计算机强大的数据处理能力、计算能力和编排组合大量作品的能力,人工智能作曲的效率要高得多高于人类。在一些注重成本、审美要求不高的应用场景中,AI构图优势明显。因此,一群专业度不够的音乐从业者,可能会面临被淘汰的命运。目前,人工智能作曲技术正逐步向商业应用和辅助创作方向发展。据“智能相对论”介绍,其应用场景主要有视频配乐、游戏配乐、电视预告片、广告、发布会、电影等。以非艺术性的商业音乐为主要市场,打破了音乐市场固有的成本和创作时间的限制。如上所述,AIVA已经开始为电影、视频、电视剧制作音乐。微软(亚洲)互联网工程院研发的小冰乐队,可以自动生成旋律和编曲框架,并为2020世界人工智能大会创作了主题曲《智联家园》。西电风动人工智能与类脑感知产业技术研究院研发的Muses人工智能作曲系统,基于GAN和LSTM的智能作曲算法和视频多元素提取算法,实现自助视频作曲、智能模仿作文助手智能等功能。通过对视频进行内容对象识别、色彩分析、画面节奏分析,生成合适的背景音乐;它还可以通过模仿音乐或用户输入的关键字和句子来激发音符,生成类似风格的音乐。还有专门制作视频配乐的AIEcrettMusic。通过识别不同的视频主题、时间和情绪,可以个性化视频配乐,为视频制作者源源不断地产生不同的节奏。它为一些对创意要求不高、对价格比较敏感的商业音乐创作提供了一种新的解决方案。此外,人工智能作曲技术也在音乐爱好者的创作中起到辅助作用。2019年推出的“哼趣”APP是一款基于人工智能的音乐创作工具。简单地哼一声,AI就会根据哼唱的内容、音调、旋律生成一首完整而悠扬的音乐。此外,您还可以对生成的乐曲进行个性化编辑,一键选择和更改不同的乐器、风格和时长。《HumFun》的核心原理是通过大量的音乐训练,形成一套完整的LSTM神经网络。同时,算法团队解决了MP3和MIDI格式的相互转换和降噪问题,将人声和机器可识别的MIDI语言进行转换,再利用带有音频判断的神经网络生成音乐。使用这样的软件或APP,不仅可以让音乐创作更加方便快捷,也大大降低了普通大众创作音乐的门槛。对于专业的音乐家来说,相对于原来需要通过MIDI键盘输入旋律的创作形式,大大提高了工作效率,减少了重复劳动,降低了与制作人的沟通成本。人工智能作曲随机生成的旋律,也能在创作陷入瓶颈时,为用户提供灵感。作曲工具的发展将进一步释放专业作曲家的创造力。结语AI作曲技术让音乐产业链的运作更加高效,人工智能创作的歌曲登上K-POP排行榜或许不再是天方夜谭。技术创新既是挑战,也是机遇。科技的进步促使人类在探索更多可能性的同时,重新审视自身的价值。