当前位置: 首页 > 科技观察

AI继续写小说悄然走红:人类独有的创造力被AI抄袭?

时间:2023-03-11 21:23:45 科技观察

编导:AI人工智能的发展,逐渐让人们对未来有了更多元化的想象,尤其是当AI进入到一个极具创意的领域,AI能否给人们带来不同于以往的内容?在这篇文章中,笔者分析了AI创作对内容创作领域的影响,一起来看看吧。林黛玉埋花时,曹雪芹闯入,与宝玉、袭人展开了一场持续千年的百年大战;鸿门宴重现,项羽高呼“大功告成”与樊哙大战,项庄在混乱中刺死了刘邦;孔融令李氏引发长达十余年的报复,最终酿成一场蓄谋已久的杀人事件;在《桃花源记》中,善良淳朴的村民为了保守桃花源的秘密,竟然设计杀害渔民……这些既熟悉又陌生的内容,不是网友恶搞经典文学作品,而是续作来自AI的故事。今年以来,AI继续把故事写成文字的视频在B站悄然走红,一些UP主利用市面上的AI创作应用,继续创作知名文学作品,再演绎新作品有人声,伴有BGM后制作视频。经过AI的短暂操作,名著变成了畅销小说。之前诸葛亮开战斗机,后来庄子研究“三体”,各种平行世界都信手拈来。AI说废话的能力比过去的地摊文学还强。.事实上,对于相关工具的使用者来说,用AI创作没有技术门槛:只需要输入一些文学作品的片段,AI创作机器就会根据给定文本的内容和风格继续写故事.AI再造的故事往往曲折曲折,情节离奇,与原著大相径庭。这类内容因其标新立异、新颖而受到一些网友的追捧。但话说回来,艺术创作这种极具创造性和个性化的工作,原本被视为“人类最后的一片净土”,是理论上最不可能被人工智能取代的工作之一。发展为艺术创作开辟了新的捷径。本期全美拍(ID:quanmeipai)带来一篇文章,探讨AI创作如何影响内容创作领域。1.什么是AI写作?AI创作也是机器人写作。这是一个拟人化的术语,本质上是指通过一定的计算机程序对输入的信息进行自动分析、处理、处理,从而生成相对完整的文章。总的来说,今天流行的AI续写,其实也算是比较成熟的能力了。随着人工智能技术的飞速发展,自然语言生成(naturallanguagegeneration,NLG)技术在世界范围内得到广泛应用。《纽约时报》、美联社等新闻机构都使用了NLG技术来撰写新闻报道;仅在2014年,科技公司AutomatedInsights就实现了每秒2000多篇新闻报道的生成,全年共发布了10亿多篇新闻报道。[1]AI写作背后的原理非常复杂,其核心是自然语言处理(NLP)技术,还涉及数据挖掘、机器学习、知识图谱等多种人工智能技术。自然语言处理是指赋予机器理解和解释人类语言的能力。目标是让机器在理解语言方面像人类一样智能,并最终弥合人类交流(自然语言)和计算机理解(机器语言)之间的鸿沟。[2]自然语言处理(NLP)涉及两个过程,即自然语言理解(NLU)和自然语言生成(NLG)。市面上大部分的写稿机器人都是NLG系统。目前主要有三个技术方向:模板型、抽取型和生成型。[3]模板写作机器人主要是通过优化算法从预先存储的大量写作模板中选择一个与给定素材相匹配的模板,并结合信息生成文本,是目前最成熟、最容易实现的.一种机器写作的方法。抽取机器人会对文本进行语义分析,识别冗余信息,抽取重要内容,通过抽取或总结的方式对文本进行压缩,形成给定文本的摘要,然后进行计算,保证摘要的连续性。该技术广泛应用于新闻内容摘要和摘要生成。生成式NLG主要通过深度学习和增强学习技术实现。机器通过大量的文学作品样本进行训练,学习各种写作风格,建立写作模型,然后根据输入的文本片段学习任务需求,预测并生成文档的匹配需求输出。从现阶段来看,基于模板和抽取式的写作机器人技术已经成熟,并在市场上得到广泛应用;generativeNLG技术更加智能化,也是当前NLG技术更先进的目标。OpenAI等研究机构在这方面进行了尝试,并在市场上得到了应用。2、我们身边的人工智能写作工具人类人工智能写作在当今社会已经不是什么新鲜事了。早在2011年,《洛杉矶时报》就开始研发地震现场自动化新闻生成机器人Quakebot。2013年3月,Quakebot因率先报告南加州4.4级地震而受到关注:2014年3月,美国洛杉矶发生4.4级地震,Quakebot仅用3分钟完成编写发布的相关报告。同年7月,美联社引进了AutomatedInsights开发的新闻写作机器人,开始使用自动新闻生成技术。此后,《纽约时报》《华盛顿邮报》《卫报》、路透社等媒体走上了新闻自动化发展的道路。[4]Quakebot最近的新闻稿。图片来源:《洛杉矶时报》国内在自动化新闻领域也有很多尝试:2016年5月,四川绵阳发生4.3级地震。中国地震台网研制的地震信息播报机器人,6秒写出560字的速报。报告内容翔实;2017年8月,机器人首次报道了四川省阿坝州九寨沟县7.0级地震,引发广泛讨论和关注。这条消息约540字。新闻内容涵盖速报参数、震中地形、热人口、周边村镇、周边县城、历史地震、震中简介、震中天气等8个方面,并配图5张。只需25秒。在随后的余震报道中,新闻机器人最快的发布速度也只有5秒。[5]除了新闻报道,地震信息播报机器人对九寨沟地震的报道,AI写作也被广泛应用于其他文字创作场景。目前,无需人工干预的机器人写作可以生成诗歌、广告、各种行业分析报告、歌词、小说,甚至剧本。以诗歌为例,微软研发的机器人小冰在2017年出版了诗集《阳光失了玻璃窗》,这是史上第一本人工智能诗集,收录了139首现代诗。[6]如“快点亮灯/有美丽的天空/问村里的水声/我的爱在哪里/因为我的红灯是如此神奇/像一个美丽的秘密/她是一个儿歌/那时候的距离》华丽的辞藻颇具美感,却缺乏逻辑。除了现代诗,市场上还涌现出韵文、藏杂词、词等多种体裁的诗歌创作软件。与新闻相比,故事、小说等连续语义的创作难度会更大,这些都不再是难题。早在2016年的伦敦科幻电影节上,纽约大学研究人员开发的机器人本杰明就创作了一部9分钟的科幻电影《Sunspring》,获得了广泛关注;雪莉,麻省理工学院媒体实验室开发的机器人,全职撰写恐怖故事,并在推特上更新;BotnikLabs使用预测算法制作了《哈利波特》的续集。3、除了写稿子,还有其他形式的AI创作。当AI创作技术应用到写稿子上,就可以诞生机器版的记者、小说家、诗人、编剧等,应用到绘画、音乐、舞蹈等领域,则可以成为画家、作曲家、编舞家。“带大”。1、AI绘画创作大放异彩用机器作画早已被列入人类的梦想清单:早在1770年代,瑞士就有人使用机械臂作画;2016年,谷歌开发的绘画AI在旧金山艺彩拍卖会上大放异彩,其作品一度拍出单幅8000美元的高价;2019年微软小冰独立完成的原画在中央美术学院美术馆展出,2020年将推出个人画集[7]2.AI音乐创作谱写别样的音乐运动AI在音乐创作中的应用比比皆是:2016年,索尼计算机科学实验室CSL的DeepBach项目模仿巴赫风格创作的合唱曲目,曾被专业音乐家误解。被认为是巴赫的作品。除了作曲,AI还可以创作会唱歌的歌曲。CSL实验室的机器人FlowMachine模仿披头士的风格,独立创作了歌曲Daddy'scar。法国计算机科学家PierreBarreau创建的作曲AI应用Aiva可以根据需要创作出不同风格的音乐,甚至可以根据图片作曲。Aiva也于2017年成为“法国和卢森堡作曲家协会”(SACEM)的第一位非人类成员。3.AI舞蹈创作与非凡舞曲演绎许多团队开发了用于舞蹈创作的AI:谷歌研究院成立一个名为AIST++的3D舞蹈运动数据集,基于该数据集训练的AI可以跟随给定的音乐和一段2秒左右的种子运动生成长序列的逼真3D运动。目前,现有的舞蹈创作AI基本上可以根据目标音乐生成匹配的舞步,通过3D建模来表演舞蹈。经过模型构建方式的迭代升级,AI生成的3D舞蹈在动作质量、动作多样性、动作与音乐的关联性等方面都有不错的表现。AIST++舞蹈数据集的示例。图片来源:https://arxiv.org/pdf/2101.08779.pdfOpenAI最新的GPT-3模型开放了API服务。申请者可以调用GPT-3API,进一步开发成论文翻译工具。网页生成工具、前端设计器、聊天机器人甚至游戏开发工具。在GPT-3中,我们看到了AI从某个领域的创造者变成全能者的可能性。[8]第四,AI作为内容生产者的短板是什么?AI创造的力量是强大的,但要想实现大规模的普及和落地,还有一些问题摆在我们面前。首先是AI的价值判断。机器学习只是提取训练集数据的风格特征并进行模仿。机器看似具有“学习”的功能,但本质上还是落入了“一目了然”的陷阱。AI本身对文本创作没有价值判断,所以在AI生成的故事中,我们可以读到讽刺齐王的邹忌为了保住权贵而背叛自己的妃子;猝死……这些光怪陆离的剧情,不仅不符合逻辑,也难以判断正常的价值取向。如果训练内容有问题,或者某些用户输入是故意引导的,那么AI生成内容的道德状况会更糟。二是人工智能创作的版权问题。在目前的技术框架下,AI的训练效果在很大程度上取决于语料库。没有足够的语料库,人工智能就无法学习,更不用说创造了。那么AI制作出来的作品到底应该属于语料库的作者还是属于AI的创作者呢?如果属于语料库的作者,那么对于庞大的网络语料库资源,如何划定作者呢?如果归作者所有,使用相同技术电路和算法的作者是否可以视为抄袭?这些问题仍然需要法律和伦理上的讨论。最后,还有人工智能用户的问题。AI为内容创作提供了更简单便捷的可能,但在一些别有用心的人眼里,AI成了助长抄袭的洗稿工具:输入一句话,AI会重新组织语言结构,用关键词取而代之,从而在短时间内复制网络炸弹……虽然技术是中立的,但不良的使用意图却让技术成为帮凶。自AI诞生以来,关于AI取代人工智能的担忧就层出不穷。显然,AI写的故事虽然有些雷人,但毕竟还是能满足一部分人的内容消费需求,甚至还有爆红的潜力。至于智能机器与内容创作者的关系,最终将走向人机协作共生,而不是相互替代和零和博弈。