当前位置: 首页 > 技术突破

人工智能与艺术:迈向计算创造力

时间:2024-02-27 18:17:14 技术突破

  计算创造力是对建筑软件的研究,该软件表现出在人类中被视为创造性的行为。这种创意软件可用于自主创意任务,例如发明数学理论,写诗,绘画图片和创作音乐。但是,计算创造力研究也使我们能够理解人类的创造力并制作供创意人士使用的程序,在这些程序中,该软件是创造性的合作者,而不是仅仅是工具。从历史上看,社会很难与那些声称是聪明的机器达成协议,甚至很难承认它们可能具有创造力。即使在计算机科学中,人们仍然对软件的创造潜力持怀疑态度。计算创造力的批评者的典型陈述是“模拟艺术技术也意味着模拟人类的思维和推理,尤其是创造性思维。使用算法或信息处理系统不可能做到这一点。”我们不能再不同意。希望从本文中的示例中可以明显看出,创造力并不是一些神秘的礼物,而不是科学研究,而是可以为社会利益进行调查,模拟和利用的东西。尽管社会可能仍在赶上,但计算创造力是一门学科。近年来,与计算创造力相关的活动量很明显。在我们正在构建的创意软件的复杂性中;在我们的软件生产的文物的文化价值中;最重要的是,在共识中,我们在计算创造力的一般问题上发现。

武术射线,美国,美国(1964)

  霓虹灯,涂有金属,2.4 x 1.65 x 0.45 m,中心蓬皮杜–穆斯穆斯群岛国家d'Art Moderne -CentredeCréationIndustrielle,法国巴黎。

  计算创造力是一个非常活跃的主题领域,仍然有许多问题可以进行辩论。例如,许多人仍然转向图灵测试(图灵,1950年),以近似其软件产生的工件的价值。也就是说,如果一定数量的人无法确定哪些工件是计算机生成的,哪些是人类生成的,那么该软件的状况良好。其他人认为Turing测试不适合创意软件。人们必须问一个问题:“在充分披露后,人们会像人类生产的那样高度重视计算机生产的工件吗?”在某些域中,答案可能是肯定的:例如,无论是由计算机生产的还是笑话仍然很有趣。然而,在其他领域(例如视觉艺术)中,答案很可能是否定的。这凸显了一个事实,即评估艺术品时的生产过程,而不仅仅是结果。因此,人们可能会说,这种图灵风格的测试本质上是将计算机设置为跌落。

  构建创意软件既提供技术挑战,又是社交挑战。为了进一步,我们需要接受一个事实,即计算机不是人类。我们应该为我们的软件生产的工件感到大声而自豪。我们应该庆祝我们采用的人工智能(AI)技术的复杂性,以赋予该软件具有创造性的行为。我们应该通过描述软件创建它们的方法来帮助公众欣赏这些计算机创建的价值。

  创造力似乎是神秘的,因为当我们有创意的想法时,很难解释我们如何获得它们,并且当我们试图解释创造力时,我们经常谈论诸如“灵感”和“直觉”之类的模糊概念。我们没有意识到创意本身如何表现出来的事实并不一定意味着科学的解释不可能存在。实际上,我们不知道我们如何执行其他活动,例如语言理解,模式识别等,但是我们拥有能够复制此类活动的AI技术越来越更好。

  由于空虚不会产生任何东西,因此我们必须理解,每个创造性的工作或创意思想始终始终是历史文化计划。它是文化继承和生活经历的果实。正如玛格丽特·博登(Margaret Boden)在她的书《人工智能与自然人》中所述(Boden,1987):

  起源于思想的新思想可能并不是全新的,因为他们的种子在已经在脑海中的表示中。换句话说,我们文化的胚芽,我们所有的知识和我们的经验都是每个创意的背后。知识和体验越大,找到一种不可思议的关系的可能性就越大。如果我们理解创造力,例如建立我们已经拥有的知识之间的新关系的结果,那么以前的知识就有更多的能力来创造性。

  考虑到这种理解,创造力的操作且被广泛接受的定义是:“创意是一种新颖而有价值的知识组合。”换句话说,物理定律,定理,音乐作品可以从一组有限的现有元素中产生,因此,创造力是解决问题的一种先进形式,涉及记忆,类比,学习和在约束中的推理以及其他等等的推理,以及因此,可以通过计算机复制。

  本文解决了通过一些能够复制创造性行为某些方面的计算机程序示例来实现计算创造力的问题。由于空间的限制,我们无法包括其他有趣的应用领域,例如:讲故事(Gervás,2009年),诗歌(Montfort等,2014),Science(Langley等,1987),甚至幽默(Ritchie,2009年))。因此,本文以不同级别的细节介绍了音乐和视觉艺术领域的某些成就的代表性结果。专注于这些艺术领域的原因是,到目前为止,它们是更多活动,而获得的结果最令人印象深刻。本文以协助和增强人类创造力的方式对创造力民主化的最新趋势进行了一些思考。

  为了进一步阅读有关计算创造力的进一步阅读,我建议AI杂志的计算创造力特刊(Colton等,2009)以及Boden(1991,1994,2009)的书籍,Dartnall(1994),Partridge&Rowe(1994),Bentley&Corne(2002)和McCormack&D'Inverno(2012)。

  音乐中的计算创造力

  自1950年代开始以来,人工智能在计算机音乐的历史上发挥了至关重要的作用。但是,直到最近,大多数努力一直在构图和即兴体系上,并且很少努力致力于表达性能。在本节中,我们回顾了音乐创作,音乐表演和即兴演奏的AI方法的一些重大成就,重点是表达音乐的表现。

  创作音乐

  希勒(Hiller)和艾萨克森(Isaacson)(1958)在《伊利亚克计算机》(Illiac Computer)上的作品是计算机音乐中最著名的开创性作品。他们的主要结果是Illiac Suite,这是一个按照“生成和测试”解决问题的方法组成的弦乐四重奏。该程序通过马尔可夫连锁店生成了伪随机的伪随机。接下来,通过启发式和谐与对立的启发式构图规则对生成的音符进行了测试。只有满足规则的笔记才得以保留。如果没有生成的笔记满足规则,则使用一个简单的回溯过程来删除整个构图,直到该点,然后再次开始了一个新的周期。希勒和艾萨克森的目标排除了与表现力和情感内容有关的任何事物。希勒(Hiller)和艾萨克森(Isaacson)在一次采访中(Schwanauer和Levitt,1993年,第21页)说,在解决表达问题之前,首先需要解决更简单的问题。我们认为,这是1950年代非常正确的观察。在这项开创性的工作之后,许多其他研究人员将计算机组成基于马尔可夫概率过渡,但从旋律质量的角度来看,成功的效果相当有限。确实,过于依赖马尔可夫过程的方法不足以始终如一地产生高质量的音乐。

美国作曲家莱贾伦·希勒(Lejaren Hiller)在伊利诺伊大学音乐学院最近开幕的实验音乐工作室,1958年。

  但是,并非所有关于构图的早期工作都取决于概率方法。一个很好的例子是Moorer(1972)在色调旋律产生方面的作品。Moorer的程序产生了简单的旋律,以及基本的谐波进度,并具有简单的内部重复模式。这种方法依赖于使用启发式技术而不是马尔可夫概率链来模拟人类组成过程。Levitt(1993)还避免了在组成过程中使用概率。他认为“随机性往往会掩盖而不是揭示代表简单音乐结构所需的音乐限制。”他的作品基于基于限制的音乐风格的描述。他开发了一种描述语言,该语言允许通过一系列称为“样式模板”来表达输入的音乐有意义的转换,例如和弦进步和旋律线条。他应用了这种方法来描述传统的爵士步行贝司演奏家模拟以及双手的ragtime钢琴模拟。

  Hiller-Isaacson和Moorer的早期系统都基于启发式方法。但是,可能是早期使用AI技术的最真实的例子是Rader(1974)的作品。Rader在他的音乐巡回演出(例如“FrèreJacques”)中使用了基于规则的AI编程。旋律和和谐的产生是基于描述如何将笔记或和弦放在一起的规则。该系统中最有趣的AI组件是适用性规则,确定旋律和和弦生成规则的适用性,以及加权规则,表明通过权重应用适用规则的可能性。在这项早期工作中,我们已经可以欣赏元知识的使用。

  赫伯特·西蒙(Herbert Simon)或马文·明斯基(Marvin Minsky)等AI先驱者也出版了与计算机音乐有关的作品。Simon and Sumner(1968)描述了音乐的形式模式语言以及一种模式诱导方法,以发现音乐作品中或多或少隐含的模式。可以发现的模式的一个示例是:“开头部分位于C大调,其后是一个占主导地位的部分,然后返回原始键。”尽管该程序尚未完成,但值得注意的是,这是处理重要的音乐建模问题的第一个问题之一,该主题曾经并且仍然经过了广泛的研究。例如,基于生成语法的模型的使用已经并且继续是音乐建模中的一种重要且非常有用的方法(Lerdahl和Jackendoff,1983)。

  马文·明斯基(Marvin Minsky)在他著名的论文“音乐,思想和意义”(1981)中解决了“音乐如何给我们的思想留下深刻印象”的重要问题。他将自己的代理概念及其在代理社会中的作用运用,以此来阐明这个问题。例如,他暗示一个经纪人可能会注意到音乐具有特殊的节奏。其他代理商可能会感知小型音乐模式,例如音调的重复。诸如相同音符序列之类的差异提高了五分之一,依此类推。他的方法还通过能够识别大量音乐部分的高级代理商来解释音乐作品中更复杂的关系。重要的是要澄清,在那篇论文中,明斯基并没有试图说服读者关于他方法的有效性问题,他只是暗示了它的合理性。

  在组成系统中,有大量用于使用多种AI技术自动协调问题的问题。最早的作品之一是Rothgeb(1969)。他写了一个势利节目,以解决协调未配置的低音的问题(给定一系列低音音符,推断出伴随这些低音音符的和弦和配音率),例如:下降一个半音节,然后下一个低音音符排名第六。”Rothgeb的主要目标不是自动协调本身,而是测试18世纪的两个低音协调理论的计算声音。

  关于协调的最完整的作品之一是Ebcioglu(1993)。他开发了一个专家系统,合唱,以J. S. Bach的风格协调合唱。合唱具有旋律,并使用启发式规则和约束产生相应的协调。该系统是使用作者设计的逻辑编程语言实现的。这项工作的一个重要方面是使用一组逻辑基原始人来代表音乐的不同观点(Chords视图,时片视图,旋律视图等)。这样做是为了解决代表大量复杂音乐知识的问题。

  Musact(Bharucha,1993)使用神经网络来学习音乐和谐模型。它旨在捕捉谐波品质的音乐直觉。例如,主流和弦的特质之一是在听众中创造出来的和弦即将听到的期望。预期的越大,滋补和弦的辅音感觉就越大。作曲家可能会选择满足或违反这些期望的程度。Musact能够在给定的谐波背景下学习这种品质并产生分级期望值。

  在Harmonet(Feulner,1993)中,使用神经网络和约束满意度技术的结合来解决协调问题。神经网络了解和弦的谐波功能(和弦可以发挥滋补性,优势,亚尺寸等)的功能,并使用约束来填充和弦的内部声音。关于Harmonet的工作是在Melonet系统中扩展的(H?Rnel和Degenhardt,1997; H?Rnel and Menzel,1998)。Melonet使用神经网络来学习和重现旋律序列中更高级别的结构。鉴于旋律,该系统发明了巴洛克风格的协调和任何合唱声音的变化。根据作者的说法,Harmonet和Melonet共同形成了一个强大的音乐组成系统,该系统产生了变体,其质量与经验丰富的人类风琴师相似。

  Pachet and Roy(1998)还使用约束满意度技术进行协调。这些技术利用了这样一个事实,即旋律和统一知识都对可能的和弦施加了约束。但是,效率是纯粹的约束满意度方法的问题。

  在Sabater等。(1998),使用规则和基于案例的推理的结合来解决协调问题。这种方法基于这样的观察,即纯粹基于规则的协调通常会失败,因为一般而言,“规则没有制作音乐,而是音乐制定规则的音乐。”然后,不仅依靠一组不完善的规则,为什么不利用规则的来源,即构图本身呢?基于案例的推理允许使用已经统一的组成的示例作为新的和谐的案例。该系统通过首先寻找相似的,已经统一的情况来协调给定的旋律。当失败时,它会寻找适用的和谐规则。如果不适用规则,则系统将失败并回溯到先前的决策点。实验表明,规则和案例的组合在寻找适当的协调方面的失败要比单独使用两种技术要少得多。基于案例的方法的另一个优点是,可以记住每个新正确协调的作品,并作为一个新的例子来协调其他旋律。也就是说,发生了一个经验的过程。实际上,系统拥有的示例越多,系统所需的频率就越少,因此失败的次数较少。缪斯(Schwanauer,1993年)也是一种学习系统,它通过学习一组语音规则加倍和声音领导而扩展了一组最初的语音领先限制。它通过重新排序规则议程并制定满足语音领先限制集的规则来学习。缪斯成功地了解了传统的音调音乐书籍中的一些标准语音规则。

  Morales-Manzanares等。(2001年)开发了一种名为SICIB的系统,能够使用身体运动来创作音乐。该系统使用来自舞者附加的传感器的数据,并应用推理规则将手势与音乐实时搭配。

  当然,使用AI的计算机构图上最著名的工作是David Cope的EMI项目(Cope,1987,1990)。这项工作着重于各种作曲家风格的仿真。它成功地以COPE,MOZART,PALERSTRINA,ALBINONI,BRAHMS,DEBUSSY,BACH,RACHMANINOFF,RACHMANINOFF,CHOMIN,Stravinsky和Bartok的方式成功创作了音乐。它通过在给定作曲家的几个(至少两项)作品中搜索复发模式来工作。发现的模式称为签名。由于签名与位置相关,因此EMI使用作曲家的一件作品作为指南,以将其固定在撰写新作品时。为了构成签名之间的音乐动机,EMI使用构图规则分析仪来发现作曲家在作品中使用的约束。该分析仪计算了音乐事件,例如语音指导方向,使用重复说明等,并将其代表为分析作品的统计模型。该程序遵循该模型,以构成要插入签名之间的空空间中的动机。为了正确插入它们,EMI必须处理以下问题:将签名的初始部分和结论部分链接到避免风格异常的周围动机;保持语音动作;在范围内保持笔记,依此类推。通过增强过渡网络实现正确的插入(Woods,1970)。结果虽然并不完美,但与作曲家的风格完全一致。

  综合表达音乐

  计算机生成音乐的主要局限性之一是缺乏表现力,即缺乏“手势”。手势是音乐家所说的表演的细微差别,这些表演是独特而微妙的解释性或换句话说,富有创造力的。

  在音乐中解决表现力的第一个尝试之一是约翰逊(1992)。她开发了一个专家系统,以确定播放“脾气暴躁的克拉维尔”(Clavier)的巴赫(Bach's Fugues)时要应用的节奏和发音。这些规则是从两位专家人类表演者那里获得的。该输出给出了基本节奏值,并提供了有关注释持续时间和发音的性能说明列表,应遵循人类玩家。结果与著名评论版的“脾气暴躁的克拉维尔”的说明非常吻合。该系统的主要局限性是它缺乏通用性,因为它仅适用于写在4/4米上的散文。对于不同的仪表,规则应不同。这种缺乏普遍性的另一个明显后果是规则仅适用于巴赫·芬斯(Bach Fugues)。

  斯德哥尔摩的KTH集团的工作(Friberg,1995; Friberg等,1998,2000; Bresin,2001)是绩效系统上最著名的长期努力之一。他们当前的主任Musices系统结合了限制为MIDI的节奏,动态和发音转换的规则。这些规则是从理论上的音乐知识和实验性培训中推断出来的,特别是使用所谓的逐个合成方法。规则分为三个主要类别:分化规则,从而增强了音阶之间的差异;分组规则,表明色调属于什么;和合奏规则,该规则同步合奏中的各种声音。

  Canazza等。(1997年)开发了一个系统来分析音乐家的表现意图如何反映在表演中。该分析揭示了两个不同的表现力维度:一个与能量(动力学)有关,另一个与零件的动力学(Rubato)有关。作者还开发了一个程序,以根据这两个维度产生表达性能。

  Dannenberg和Derenyi(1998)的作品也是使用手动构造规则进行发音转换的一个很好的例子。他们开发了一个小号合成器,将物理模型与性能模型相结合。绩效模型的目的是通过从分析人类绩效记录的分析中手动提取的规则收集来为物理模型生成控制信息。

  执行节奏和动态转换的另一种方法是使用神经网络技术。在Bresin(1998)中,实施了将符号决策规则与神经网络相结合的系统,以模拟真正的钢琴表演者的风格。神经网络的输出表达时间和响度偏差。这些神经网络扩展了使用反馈算法训练的标准馈电网络,并具有从输出神经元到输入神经元的反馈连接。我们可以看到,除了考虑三个表达资源的KTH集团的工作外,其他系统仅限于两个资源,例如Rubato和Dynamics,或Rubato和Rubato and Wartialution。这种限制与规则的使用有关。的确,基于规则的方法的主要问题是,很难找到足够一般的规则来捕获同一音乐家的不同表演中的多样性,甚至是单个表演中的多样性(Kendall和Carterette,1990)。此外,不同的表达资源相互交互。也就是说,当还考虑了Rubato时,仅动态规则就会改变。显然,由于这种相互依存关系,人们试图建模的表现力越多,找到适当的规则就越困难。

  我们开发了一种名为Saxex的基于案例的推理系统(Arcos等,1998),该程序能够根据代表人类独奏的案例来合成爵士乐的高质量表达萨克斯独奏表演。如上所述,以前基于规则的方法解决该问题的方法不能处理两个以上的表达参数(例如动态和rubato),因为很难找到足够一般的规则,无法捕获表达性能中存在的多样性。此外,不同的表达参数彼此相互作用,从而使考虑这些相互作用的适当规则变得更加困难。

  通过基于案例的推理,我们已经证明可以处理五个最重要的表达参数:动态,rubato,颤音,颤音,表达和攻击。为此,萨克斯(Saxex)使用包含人类表演示例的案例记忆,通过光谱建模技术和背景音乐知识进行了分析。还提供了要执行的作品的分数。该方法的核心是分析每个输入注释(通过背景音乐知识)在其属于的音乐短语中的作用(通过人类表演的案例基础)具有相似的角色,并且最后,转换输入音符,以使其表达性能(动态,rubato,颤音,发音和攻击)与最相似的检索说明相匹配。案例底座中的每个音符都在其在音乐短语中的作用以及其表达价值。此外,案例不仅包含每个笔记上的信息,但它们在短语层面上包括上下文知识。因此,该系统中的案例具有复杂的以对象为中心的表示。

  尽管仅限于单声道表演,但结果非常令人信服,并证明了基于案例的推理是一种非常有力的方法论,可以直接使用人类表演者的知识,这在她的播放示例中隐含了,而不是试图通过以下方式使这些知识显式。规则。可以在以下网址聆听一些音频结果(Arcos和LópezDeMántaras,2001;LópezDeMántaras和Arcos,2002;LópezdeMántaras和Arcos,2012),非常详细地描述了该系统。

  根据Saxex的工作,我们开发了TempoExpress(Grachten等,2004),这是一种基于案例的推理系统,用于将音乐可接受的节奏转换应用于音乐表演的单声音频录音。TempoExpress对表演的音乐表现力有了丰富的描述,不仅包括表演得分音符的时序偏差,而且还代表了更严格的表达性,例如音符装饰,整合和碎片。在节奏转换过程中,调整性能的表达性以使新节奏的结果听起来很自然。先前执行的旋律的病例基础用于推断适当的表现力。改变音乐表演的节奏的问题并不像看起来那么微不足道,因为它涉及很多音乐知识和创造性的思维。的确,当音乐家以不同的节奏表演音乐作品时,表演不仅是彼此的时间标准版本(好像以不同的速度播放了相同的表演)。随着节奏的变化,音乐表达的变化也得到了变化(Desain and Honing,1993)。这种变化不仅会影响音符的时间安排,而且还可能涉及饰有装饰的添加或删除,或说明的合并/碎片。除了节奏之外,其他特定于域的因素似乎在旋律(例如仪表和短语结构)的方式中起着重要作用。节奏转换是在音频实验室手动完成的音频后处理任务之一。因此,自动化此过程可能具有工业利益。

  基于案例的推理到表达音乐的其他应用是铃木等人的推理。(1999年),以及Tobudic和Widmer(2003,2004)。铃木等。(1999)使用示例表达性能的案例来产生具有不同音乐表达的给定作品的多个表演;但是,它们仅处理两个表达参数。Tobudic和Widmer(2003)也将基于实例的学习应用于产生表达性能的问题。他们的方法用于补充一个基于笔记级规则的模型,并在较高的音乐措辞中具有一些预测能力。更具体地说,基于实例的学习组件在短语层面上识别音乐会钢琴家的性能模式,并学习如何以类比的方式将它们应用于新作品。该方法产生了一些有趣的结果,但是正如作者所认识的那样,由于对短语使用属性值表示的限制,这并不是很令人信服。这种简单的表示无法考虑到该作品的相关结构信息,无论是在子词水平还是在角色间层面上。在随后的论文中,Tobudic和Widmer(2004)通过使用关系短语表示,部分成功地克服了这一限制。

  Widmer等。(2009年)描述了一个计算机程序,该程序学会了表达经典的钢琴音乐。该方法是数据密集的,并且基于统计学习。表达音乐的表演肯定需要高水平的创造力,但是作者对一个问题的务实看法是,他们的程序是否可以说是有创造力的,并声称“创造力在情人眼中。”实际上,作者的主要目标是通过AI方法调查并更好地理解音乐表现作为创造性的人类行为。

  计算机表达发挥作用的可能性是所谓的超级启动的基本组成部分。这些仪器旨在增强仪器的声音,并具有如此特殊的细微差别,以使其具有人类的表现力和丰富的现场声音。要制作一个超大型仪器,请采用传统仪器,例如大提琴,然后通过脖子和船首的电子传感器将其连接到计算机;还装备了将弓箭固定传感器的手;并使用类似于Saxex的系统对计算机进行编程,该系统允许根据分数,音乐知识和传感器的读数来分析人类对作品的解释方式。此类分析的结果使超级仪器可以发挥积极作用,改变了音色,音调,节奏和措辞等方面,并产生随附的语音。换句话说,您有一种可以成为自己聪明的伴奏的乐器。麻省理工学院媒体实验室的Tod Machover开发了如此的超赛车,而这位出色的大提琴演奏者Yo-Yo Ma首演,播放由Tod Machover组成的Hyper-Cello,称为“再次开始……”在Tanglewood Festival上几年前。

  即兴音乐

  音乐即兴创作是一个非常复杂的创作过程,也已通过计算建模。它通常被称为“即时构图”,因此,它在创造性上比作曲更复杂,并且可能是这里调查的三种音乐活动中最复杂的。Fry的Flavors Band System(1984)。Flavors乐队是一种程序性语言,嵌入了LISP中,用于指定爵士乐和流行音乐风格。它的程序表示可以通过更改作为输入给出的分数规范来以预先指定的样式生成分数。它允许结合随机函数和音乐限制(和弦,模式等),以产生即兴变化。Flavors乐队最显着的结果是低音线的有趣安排,以及John Coltrane的作品“ Giant Steps”的简易独奏。

  Genjam(Biles,1994)建立了一个爵士音乐家学习以通过遗传算法即兴创作的模型。人类听众通过对后代即兴创作来扮演健身功能的角色。Papadopoulos和Wiggins(1998)还使用了遗传算法来即兴演奏爵士乐的旋律。与Genjam相反,该程序包括一种适应性功能,该功能会自动评估即兴演奏的后代即兴创作质量,即即兴旋律的八个不同方面,例如旋律轮廓,音符持续时间,音符之间的间隔距离等。

  富兰克林(Franklin,2001年)使用经常性的神经网络来学习如何从爵士萨克斯演奏家桑尼·罗林斯(Sonny Rollins)的《独奏即兴创作》中即兴创作爵士乐独奏。增强学习算法用于完善神经网络的行为。奖励功能根据爵士和谐标准和Rollins的风格对系统独奏的评分。

  缺乏与人类即兴演奏者的互动性在上述方法中受到了批评(Thom,2001),理由是他们将音乐家从旋律的身体和自发创造中删除。尽管即兴创作的最基本特征是旋律的自发,实时创建,但确实不是在这些方法中使用交互性,但是它们可以产生非常有趣的即兴创作。汤姆(Thom,2001年)与她的A-Box(BOB)系统一起解决了Bob和人类玩家之间实时互动即兴的问题。换句话说,鲍勃是实时即兴创作的“音乐伴侣”。汤姆(Thom)的方法是约翰逊·拉尔德(Johnson-Laird)(1991)的爵士即兴创作心理理论。这一理论反对即兴创作的观点包括在和谐的限制下重新安装和转换预先修复的“舔”。相反,约翰逊 - 莱尔德(Johnson-Laird)提出了一个基于贪婪搜索的随机模型,该模型是在可能的注释的约束空间上,可以在给定的时间点播放。汤姆(Thom)的非常重要的贡献是,她的系统通过无监督的概率聚类算法从人类玩家那里学习了这些约束,因此从人类玩家那里学习了这些约束。学到的模型用于将独奏录为特定于用户的播放模式。然后将该模型的参数纳入一个随机过程中,该过程响应于人类即兴演奏者的四个Bar独奏而产生独奏。鲍勃(Bob)通过两种不同的风格(Saxophonist Charlie Parker和小提琴手Stephane Grapelli)测试其实时独奏贸易,通过测试其实时独奏。

  Dannenberg(1993)开发了另一个显着的互动即兴体系。与Thom的方法不同,在Dannenberg的系统中,音乐发电主要是由作曲家的目标而不是表演者的目标驱动的。Wessel(1998)的交互式即兴制度更接近Thom的互动,因为它也强调了现场即兴创作的伴奏和增强。

  视觉艺术中的计算创造力

  亚伦(Aaron)是一种机器人系统,由艺术家和程序员哈罗德·科恩(Harold Cohen)(Cohen,1995)开发多年,可以用机器人的手臂拾起画笔,并独自在画布上涂漆。它吸引了人们在植物园中的人们,不仅是制作现有图纸的副本,而且还可以在此主题上产生许多独特的图纸。亚伦从未见过一个人或穿过植物园,但通过规则获得了有关身体姿势和植物的知识。亚伦的知识和亚伦的知识方式不像我们(人类,人类使用和使用的知识计算机没有。但是,就像人类一样,亚伦的知识也是累计获得的。例如,一旦它理解了叶子簇的概念,就可以在需要时使用该知识。亚伦的植物就其大小,四肢的厚度而言,相对于身高的厚度,四肢相对于扩散的速度较薄,分支的程度,分支发生的角度扩散等等。类似的原理对于叶片和叶簇的形成。通过操纵这些因素,亚伦能够产生多种植物类型,并且永远不会两次绘制相同的植物,即使它以相同类型的方式识别出许多植物。此外,亚伦必须知道人体的组成,不同的部分以及它们相对于彼此有多重要。然后,它必须知道身体的部分是如何表达的,每个关节的运动类型和范围是什么。最后,由于一个连贯运动的身体不仅是独立运动的部分集合,因此亚伦必须了解身体运动的协调方式:身体必须做什么才能保持平衡, 例如。从概念上讲,这并不像看上去那样困难,至少对于地面上一只或两只脚的站立位置。这只是将重心置于底座上的重心,并且在必要时使用手臂来实现平衡位置。它还具有有关闭塞的知识四肢。这意味着亚伦不能“违反”规则,也永远不会“想象”用一条腿或其他形式的抽象来绘制人类的可能性。从这个意义上讲,亚伦的创造力是有限的,并且离人类很远。尽管如此,亚伦的绘画还是在伦敦的泰特现代和旧金山现代艺术博物馆中展出的。因此,在某些方面,亚伦(Aaron)通过某种创造性的图灵测试对其作品进行了好处,足以与一些最好的人类艺术家一起展出。

舞蹈推销员,问题(2011年)。

  由称为绘画傻瓜的软件创建的艺术品。

  西蒙·科尔顿(Simon Colton)的《傻瓜》(Colton et al。,2015)比亚伦(Aaron)更加自治。尽管该软件没有物理上的油漆在画布上使用油漆,但它从拼贴到油漆的笔触都以数字方式模拟了许多样式。用科尔顿的话说:

  这幅画傻瓜只需要最小的方向,可以通过在线获取原始资料来提出自己的概念。该软件通过社交媒体网站运行自己的网络搜索并爬网。这个想法是,这种方法将其产生对观众有意义的艺术,因为它本质上是在我们在网络上采取行动,感觉和争论的人类体验。

  例如,在2009年,这幅画是根据新闻报道对阿富汗战争的解释。结果是对阿富汗公民,爆炸和战争坟墓的并置。

  用于绘画和其他视觉艺术的计算创造力的其他示例是Karl Sims和Jon McCormack的作品。Karl Sims的反应扩散介质墙(Sims,2016年)基于对化学物质的交互式模拟,这些化学物质反应和扩散以根据控制生物形态发生的反应扩散方程来产生新兴的动态模式。这项工作在波士顿科学博物馆展出。Karl Sims的先前作品包括将进化计算技术应用于其遗传图像系统中的交互演化图像(Sims,1994)。

  乔恩·麦考马克(Jon McCormack)还探讨了如何成功地应用于他的“自然设计”项目中的创意系统(McCormack,2014年)。在另一个项目“创意生态系统”中,他研究了生物生态系统(McCormack和D'Inverno,2012)的概念和隐喻,以此来增强数字艺术中人类创造力的手段。

  还有许多与视觉艺术有关的例子。报告的不仅是代表性的集合,而且在我看来也是对该领域的最重要贡献。

  支持和增强人类创造力:创造力的民主化

  我们可以使用人工智能来支持人类的创造力和发现吗?一种称为辅助创作的新趋势对创造力具有重要意义:一方面,辅助创造系统使广泛的创造技能更加易于访问。另一方面,协作平台,例如在欧洲项目中为学习音乐而开发的平台(Yee-King和D'Inverno,2014年),使学习新的创意技能变得更加容易。Aprain是一个基于社交网络的学习平台,其中包括人类和智能软件代理,它们会向音乐学生提供有关音乐作品,安排和表演的反馈。学生将解决方案上传到由导师提供的给定课程计划(作品,安排或表演)。然后,智能代理商以及其他同学和导师分析了这些解决方案并提供反馈。例如,如果代理商可能会说:“您的调制听起来不错,但是您可以尝试将所有内容调节为5至8的主要三分之一。”

  就表演而言,其他智能软件代理将学生与老师上传时先前记录的学生的代理人进行了比较。相机捕获了学生的手势,软件代理也提供了有关可能不正确姿势的反馈。这样的工具加速了技能习得的时间,导致一种被称为“创造力民主化”的现象。

  早在1962年,道格拉斯·恩格尔巴特(Douglas Engelbart)(恩格巴特(Engelbart),1962年)就撰写了“写作机器,它将允许您使用新的构图文本[…]的新过程,您可以更轻松地整合新想法,从而更连续地利用创造力。透明恩格巴特的愿景不仅是增强个人创造力。他还想通过提高协作和小组解决问题的能力来增强团体的集体智慧和创造力。一个基本思想是,创造力是可以通过技术增强的社会过程。通过将这些想法投射到未来,我们可以想象一个世界,在这个世界中,创造力易于访问,并且(几乎)任何人都可以在最佳作家的水平上写作,像伟大的大师一样绘画,创作高质量的音乐,甚至发现新形式创意表达。对于没有特定创造力的人来说,通过辅助创建系统获得新的能力是高度赋予力量的。

  尽管上述未来派的场景目前是纯粹的小说,但已经存在一些辅助创作的例子。最有趣的之一是佐治亚理工学院开发的辅助鼓系统(Bretan and Weinberg,2016年)。它由一个可穿戴的机器人肢体组成,该肢体使鼓手可以用三臂踢球。61厘米长(两英尺)的“智能手臂”可以连接到音乐家的肩膀上。它回应了人类的手势及其听到的音乐。例如,当鼓手扮演High Hat Cymbal时,机器人的手臂演习以播放骑行。当鼓手切换到军鼓时,机械臂移到了汤姆。

  辅助创造力的另一个非常有趣的结果是在巴黎的索尼计算机科学实验室开发的音乐风格和和谐转移,流派流派(Martin等,2015; Papadopoulos等,2016),可帮助作曲家协调音乐根据另一种完全不同类型的风格以一种类型的形式进行。例如,以莫扎特风格协调爵士标准。

  总结说:显然还是很有创造力?

  玛格丽特·博登(Margaret Boden)指出,即使人工智能的计算机像巴赫(Bach)或爱因斯坦(Einstein)一样有创造力,对于许多人来说,它显然很有创造力,但并不是真正的创造力。我完全同意她的观点,有两个主要原因,这是:缺乏意图和我们不愿在社会中占据人工聪明的代理人的位置。缺乏意图是西尔(Searle)中国房间论点的直接结果(Searle,1980),该论点指出,计算机程序只能对符号进行句法操纵,但无法给予他们任何语义。通常,可以根据因果关系来解释意图。但是,确实,现有的计算机程序缺乏太多相关的因果关系,无法表现出意图,但也许未来,可能是拟人化的“体现”的“体现”人工智能,也就是说,不仅配备了复杂的软件,而且还配备了不同类型的高级传感器允许他们与环境互动,可能具有足够的因果关系,以赋予符号意义并具有故意。

  关于社会拒绝,我们为什么如此不愿接受非生物学代理人可以具有创造力的原因(即使是生物学的代理人,就像“ nonja”一样,来自维也纳的二十岁画家,他的抽象绘画已经展示,并且在美术馆受到赞赏,但是一旦知道她是维也纳动物园的猩猩,她的作品就不太受到赞赏!)他们在我们的人类社会中没有自然的位置,并且决定接受他们的决定将会具有重要的社会影响。因此,说它们似乎很聪明,创造力等要简单得多,而不是说它们是。总之,这是道德上的不是科学问题。否认创造力对计算机程序的第三个原因是,他们没有意识到自己的成就。的确,机器没有意识,可能永远不会有意识的思维。但是,缺乏意识并不是否认创造力甚至智力潜力的潜力的根本原因。毕竟,计算机不会成为无意识创造者的第一个例子。Evolution是第一个例子,正如斯蒂芬·杰伊·古尔德(Stephen Jay Gould,1996)出色地指出的那样:“如果创造需要一个有远见的创造者,那么盲人进化如何设法建立像我们自己一样出色的新事物?”

  致谢

  这项研究得到了Catalunya Generalitat de Catalunya的2014-SGR-118赠款的部分支持。