自诞生以来,搜索引擎已经从基本的搜索代理发展到基于人工智能(AI)和机器学习(ML)的复杂算法。这些创新技术从两个截然相反的角度影响搜索引擎优化(SEO)空间。一方面,由于新的基于AI的排名算法能够对元数据进行非常深入的扫描,因此推广网站并将其推到SERP的顶部变得更具挑战性。另一方面,由于搜索结果的整体质量有了显着提高,现在使用不同的技巧和黑帽操作来操纵它们变得更加困难(尽管仍然有可能,正如我在下面向您展示的那样)。总而言之,人工智能从根本上改变了SEO的方法。让我们深入探讨AI如何用于搜索引擎营销,以及精通技术的营销人员如何使用AI更好地实现他们的目标并改善关键绩效指标。什么是“人工智能技术”?人工智能技术根据其模仿人类行为和能力的能力进行分类。使用这些特征,所有人工智能技术(现有的和假设的)都可以分为三类:1)人工智能(ANI)或较弱的人工智能。它提供的功能范围很窄。这些系统只能经过训练才能执行特定任务。示例包括谷歌的Rankbrain、苹果的Siri或亚马逊的Alexa。2)人工智能(AGI)或强人工智能。它反映了人类的能力并且具有多功能性,能够解决许多问题并从经验中学习。3)人工超级智能(ASI)或假设的AI。它应该超越人类的智慧。迄今为止,ANI是唯一一种已被人类成功实现的AI类型。为什么需要机器学习?机器学习是人工智能的应用,无需明确编程即可自动学习和改进经验。机器学习是分析不断增加的数据量的结果,因此底层算法不会改变,但用于选择特定答案的代码的内部权重和偏差会改变。当然,事情并没有那么简单。数据科学家通常将用于实现ML的技术称为算法。算法是一系列逐步操作,通常是计算,可以在有限的步骤中解决特定问题。在机器学习中,算法使用有限的一系列步骤通过从数据中学习来解决问题。尽管ML算法会学习,但通常很难找到术语“学习”的确切含义,因为根据ML算法的结构,有不同的方法可以从数据中提取信息。通常,学习过程需要大量数据来提供给定特定输入的预期响应。每个输入/输出对都是一个示例,其他示例使算法更容易学习。这是因为每个输入/输出对对应于定义问题区域的行、集群或其他统计视图。ML是优化模型的过程,它是数据本身的数学一般表示,即使在接收到以前从未见过的输入时,它也可以预测或以其他方式确定适当的响应。模型提供的答案越准确,模型从提供的输入中学习得越好。该算法将模型拟合到数据,这个拟合过程就是学习。机器学习原理机器学习的中心思想是你可以使用算法事先不知道的数学函数来表示现实,但是在查看一些数据后可以猜测(总是以输入和输出对的形式).您可以根据机器学习算法可以找到并用作对其内部数学函数的修改的未知数学函数来表达现实及其所有复杂性。也就是说,每个机器学习算法都基于可修改的数学函数。根据预期结果和输入数据的类型,您可以根据学习风格对算法进行分类。您选择的样式取决于您拥有的数据类型和预期结果。四种学习方式用于创建算法:监督学习——该算法尝试对目标预测输出与输入函数之间的关系和依赖关系建模,以便我们可以根据从先前数据集学习的关系预测新数据的输出。无监督学习——使用未标记数据训练计算机。在学习了数据中的模式之后,计算机可以教你一些新东西。这些算法在我们不知道要在数据中寻找什么的情况下特别有用。半监督学习-在许多实际情况下,标记非常昂贵,因为它需要熟练的专业人员。因此,半监督算法是构建无标签模型的最佳选择。这些方法利用这样的想法,即即使未标记数据组的成员身份未知,数据也会携带有关该组参数的重要信息。强化学习-这种方法使用在与环境交互过程中收集的观察结果来采取行动以最大化奖励或最小化风险。强化学习算法(称为代理)不断地从环境中学习。在此过程中,代理从他在环境中的经验中学习,直到探索所有可能的状态。每一天,我们必须处理的信息量都呈指数级增长。对我们情绪状态的压力也是如此。因此,机器学习已成为人类自动化日常任务、节省时间和提高生产力的必要条件。人工智能如何用于搜索引擎算法?现在,当我们弄清楚AI算法的工作原理以及通常需要它们的原因后,让我们继续讨论SEO及其如何利用AI技术。机器学习的进步推动了基于AI的SEO的发展。尽管该领域自2003年以来一直在探索,但十年后的第一个重大成就是2013年推出的Word2vec,这是一种“使用神经网络模型从大型语料库中学习单词关联文本的自然语言处理(NLP)技术”。两年后的2015年,谷歌使用Word2vec数据库构建并推出了RankBrain作为蜂鸟算法的一部分。RankBrain是一个由人工智能驱动的自学系统,它使谷歌能够加快关键字类别的验证,为用户的搜索查询提供最相关的内容。RankBrain“知道”如何理解文本的意思,如何找到单词之间的联系,学习不熟悉的单词和短语,以及如何具体适应所请求的国家和语言。所有这些都使自然搜索结果更具相关性。谷歌代表指出,与内容质量和链接一起,该算法是现代搜索排名中第三重要的因素。好吧,锦上添花的是2019年发布的GoogleBERT算法。BERT(BidirectionalEncoderRepresentationsfromTransformers)也是一个基于神经网络的NLP学习系统。与其他模型不同,BERT旨在深入理解自然语音。换句话说,BERT应该使机器人能够在给定上下文的每个细节的情况下理解句子中单词的含义。Google使用BERT来更好地理解用户查询并为他们提供真正相关的结果。在SEO内容创建中使用AI的示例AI已经被广泛用于创建内容。一些内容和SEO专业人员为此使用OpenAIGPT-2模型。GPT-2GPT-2是一种基于Transformer的大规模语言模型,具有15亿个参数,在800万个网页的数据集上进行训练,其简单目标是预测下一个单词以匹配上下文。图片来源:GitHub他们说这个转换器编写的文本几乎与人类编写的文本没有区别。我决定仔细检查。作为一名内容营销人员,我的目标之一是提高雇主品牌知名度和思想领导力,以及通过顶级和边缘媒体的客座和幽灵出版物进行口碑传播。为此,我在英国找到了一家优秀的媒体机构来提交我的客座刊物。但是,每篇提交的文章都由真正的人工编辑阅读。如果他们在内容中找不到任何价值,他们就不会发布。我已经使用此转换器创建了一篇文章并将其提交给编辑器以供批准。令我惊讶的是,编辑们接受了它,不明白这是一个机器人写的文本。一般来说,您可以安全地应用GPT-2模型来创建不同语言的文章和评论。GPT-2生成的文本示例如何使用GPT-2模型转至托管工作GPT-2模型的https://inferkit.com。查找所需文本的来源。复制一个简短的(两到三个句子)文本,将其粘贴到表格中,然后单击“全文”按钮。GPT-2将创建三到五个文本段落。如果人工智能创建的结果不适合您,请再次单击“全文”按钮。如果生成的文本符合您的预期,请复制一份。然后将GPT-2写的最后一段粘贴到转换器表格中,再次点击“全文”按钮。GPT-2将继续撰写您的文章。GPT-3OpenAI最近发布了第三代开源语言预测模型GPT-3,它可以让计算机随机生成与示例样本长度和语法结构大致相同的句子。Github用户ManuelAraoz在他早期的GPT-3实验中发现,在bitcointalk.org论坛上发布预测的GPT-3提案引起了其他论坛参与者的积极关注,包括该系统必须非常聪明(和/或讽刺),他在他们的信息中发现了微妙的模式。他认为,通过在其他留言板、博客和社交网络上重新发布GPT-3结果,也可以获得类似的结果。5月的每一天,他都会在bitcointalk.org上发布一篇完全由GPT-3模型生成的有趣技术文章。当用户与他的帖子互动时,GPT-3模型会创建回复甚至预测下一条评论。根据Araoz的说法,每当他以自己的身份在论坛上发帖时,人们经常提到他们认为他必须是一个“机器人”才能如此快速、准确地发帖和/或说与其他人相同的事情。该实验使他相信GPT-3是他迄今为止看到的主要技术进步之一。如何在SEO中使用GPT-3如果内容营销产生了50%或更多的业务成果,那么扩展您的技能以成为更精通AI的营销人员可能是值得的。您可以使用GPT-3模型执行以下任务:大规模创建简短内容(例如产品目录页面上的页脚内容、工具提示等);为遗留内容创建元描述、ALT标签,以及其他缺失的SEO元素创建常青内容——如果您的行业始终有常青主题(例如定义问题、标准流程等),GPT-3可以生成简短大纲并提供工作草案阐述和完善。消除例行任务AI可用于通过使用预建模型来教机器来最大程度地减少例行流程。在我的实践中,我遇到了以下由AI完全或部分自动化的SEO任务。语义聚类;表达式的选择;通过识别问题类型和相关登陆页面对请求类型进行分类;根据截图对网站页面进行分类;反向链接获取自动化,检测和修复薄内容,例如门页、低质量附属页面或内容很少或没有内容的页面;内容计划分析。同样,使用独特的算法,内容营销人员可以更有效地创建和分析他们的内容计划。前阵子,我要求我前雇主的技术团队构建一个机器学习算法,让我们的营销团队能够“过滤”文章,以便在我们自己的付费和免费媒体上发布。这使我们能够准确预测哪个主题最适合Google排名因素,哪篇文章将成为常青树,或者哪个项目最有可能获得Google的精选摘要。这称为“精简内容方法”。语音搜索任何现代SEO专业人员都应具备的一项新技能是知道如何优化语音查询的内容。由于Alexa、Siri、Cortana等AI虚拟助手的流行,语音搜索变得越来越流行。事实上,35%的互联网用户已经使用他们的虚拟助手进行购买,Gartner预测到2021年,30所有网络浏览会话的百分比将在屏幕外完成。人们使用语音搜索来关联他们最喜欢的品牌,并在Internet上搜索产品和企业。图片来源:dialogtech.com如果你想让你的品牌保持竞争力,或者你需要提高你的活动的表现,你需要跟上这个趋势并优化你的语音搜索内容。为了满足算法并获得高排名,您应该使用搜索引擎使用的相同工具和策略。这就是为什么像Moz或Yooast这样的工具在使搜索引擎和语音搜索查询更容易访问内容时非常有用。您可以将AI应用于许多任务。这完全取决于您要做什么以及需要定期处理多少数据。盈利能力的问题始终存在。由于原则上尚未创建AI,因此我们仅限于对弱或窄目标的“模拟”,例如决策树上的梯度提升。使用神经网络的例子有很多,即:基于用户行为的推荐系统;在搜索引擎中确定LSI词的算法;用于语言分析的聊天机器人等。使用deepfake技术处理SEO结果,人们被其他人取代。虽然内容伪造并不是什么新鲜事,但深度造假仍然使用强大的机器学习和人工智能技术来操纵或创建具有高度欺骗性的视觉和音频内容。精通SEO的宣传者可以通过多种方式传播虚假信息并破坏搜索结果,包括:Google轰炸(又名Googlewashing)——通过大量链接的做法,使网站在不相关、不相关或偏离主题的搜索词的SERP上排名靠前;302劫持-使用AI机器人配置从一个站点到另一个站点的临时重定向,这允许重定向的页面开始着陆页应该排名的关键字。例如,在3月英国神经毒剂袭击事件和4月叙利亚化学武器袭击事件发生后,俄罗斯政府宣传媒体RT和Sputnik的文章出现在谷歌搜索的首页。同样,YouTube(归谷歌所有)有一种算法,可以优先考虑用户花在观看内容上的时间,作为确定哪些内容首先出现在搜索结果中的关键指标。这种算法偏好导致顶部出现错误、极端和不可靠的信息,这意味着内容被更频繁地查看并被用户认为更可靠。“来自SEO操纵行业的收入估计达数十亿美元。”--来自布鲁金斯大学工具的AI-PoweredSEO工具。Clearscope是一个基于人工智能的内容优化平台。该工具是付费的。对于任何关键字,该工具都会分析表现最好的有机组成部分,并使用WatsonAI为您提供所有相关术语的细分,按重要性排序。另一个使用AI技术的SEO初创公司是frase.io。与Clearscope一样,它的主要工作是为您的内容收集信息并对其进行优化。该服务是付费的,但有一个免费的测试选项。清楚地了解自己在做什么和想要什么,DatasetsBasicsofmachinelearning(可以阅读BigML博客)。与显示仪表板和图表的其他工具不同,Diib以通俗易懂的语言与您交谈,并描述性地解释您需要采取的所有步骤,以增加自然流量并改进其他关键SEOKPI。1)使用GPT-2和GPT-3模型创建高质量的SEO内容(从长期和长期战略意义上讲社交媒体和常青树的缩写和元)。2)使用谷歌的CloudVision优化图像、检测情绪、理解文本等。3)注意每个页面内容的质量、讲故事的逻辑和用词的上下文。检查上下文合规性是目前最困难和最耗时的任务,因为很少有工具为此使用国家字体。最好的解决方案之一是Sketchengine。它使用来自维基百科的文本语料库。顺便说一句,谷歌BERT也接受了维基百科文本的训练。4)从针对关键字(包括文本搜索查询及其密度)优化页面到优化内容的本质,即:完整性丰富的短语、潜在语义索引(LSI)、用于设置主题的主题关键字、在搜索结果中突出显示(例如featuredsnippets)等。总结在SEO中使用人工智能的话题仍然存在争议,对此有很多不同的看法。然而,否认基于人工智能的技术将影响搜索优化空间是没有意义的。发布了新的搜索引擎算法和工具,使专家能够适应自动化关键字研究和内容编写过程,简化和改进反向链接配置文件和总体用户体验。另一方面,诸如deepfakes之类的AI技术可以大大降低SEO的质量,并通过使用不公平的竞争做法和传播有关您品牌的虚假信息来操纵搜索结果。无论您是白帽SEO专家还是白帽SEO专家(黑帽SEO专家通常是技术的早期采用者,并且是第一个尝试新事物的人)——如果您还没有利用AI,请考虑尽快这样做以保持竞争力,让Make做出明智的决定,并通过相关、有用和高质量的搜索结果取悦您的目标受众。*本文仅代表作者个人观点,不代表AI科技大本营任何立场。原文链接:https://hackernoon.com/ai-and-seo-a-marriage-made-in-heaven-or-hell-eh3w31y9本文由AI技术大本营翻译,转载请注明出处
