当前位置: 首页 > 科技观察

Google搜索算法如何变得更好?

时间:2023-03-13 06:52:52 科技观察

谷歌目前正在对其核心搜索算法进行更改,这可能会影响多达十分之一的搜索结果。谷歌如何修改其搜索算法?关于谷歌的算法修改技术,作者引用了相关文章,在不改变原理的情况下编译。[图片来源:THEVERGEOwner:THEVERGE]据悉,此次修改基于谷歌研究人员开发的尖端自然语言处理技术(NLP),十个月前该技术已应用于其搜索产品。谷歌声称它可以通过更好地理解单词在句子中的相互关系来改善结果。此前,谷歌在新闻发布会上讨论了一个例子,他们的搜索算法能够解析一个短语的含义——“你能为某人药房买药吗?”谷歌研究员兼搜索副总裁潘杜纳亚克表示,谷歌旧的搜索算法是将句子视为“词袋”。因此它会先查看那些重要的词,即“医学”和“药房”,然后再简单地返回本地结果。相反,新算法理解“为某人”这个词的上下文,意识到这是一个关于你是否能得到别人的处方的问题,并返回正确答案。据了解,调整后的算法基于BERT(BidirectionalEncoderRepresentationsfromTransformers),即“BidirectionalEncoderRepresentationsfromTransformers”。重要的是,BERT并没有把句子当作“词袋”,而是把句子中的所有词作为一个整体来对待,这让它意识到“forsomeone”对句子的意义至关重要,不能省略.值得一提的是,BERT通过自学习学会了注意这些词。谷歌拿了一个英文句子语料库,随机删除了15%的单词,然后设置BERT来找出被删除的单词是什么。对此,高级研究员兼研究高级副总裁JeffDean表示,随着时间的推移,这种训练将使NLP模型更有效地理解上下文。此外,谷歌还举了另一个例子——“在没有路缘的山坡上停车”。其中,“否”字对句子的查询至关重要;但是谷歌在实现BRET算法之前的算法忽略了这一点。[图片来源:THEVERGEOwner:THEVERGE]谷歌表示,在过去的几天里,他们推出了一种新算法,应该会影响美国10%的英语搜索查询(其他语言和国家正在尚不可用)。讨论)。雷锋网了解到,所有对搜索的更改都会经过一系列的测试,以确保获得更好的结果。在其中一项测试中,谷歌的人工评审大军通过评估搜索结果的质量来训练公司的算法。不仅如此,谷歌还进行了现场A/现场B测试。请注意,并非每个查询都会受到BERT的影响,它只是谷歌用来对搜索结果进行排名的许多不同工具中的最新工具。他们如何合作仍然是个谜。事实上,谷歌有意将其中一些过程保密,以防止有人使用其系统发送垃圾邮件。另一个重要原因是:当计算机使用机器学习做出决定时,很难知道它为什么做出这些选择。这归结为机器学习的“黑匣子”问题,如果结果在某种程度上是错误的,则很难诊断原因。谷歌表示,他们一直在努力确保将BERT添加到他们的算法中不会增加偏差——这是机器学习的一个常见问题,模型被训练成有偏差。此外,由于BERT是在庞大的英语句子语料库上训练的,而这个语料库也存在先天的偏见,这也是一个问题。谷歌还表示,预计其算法引导的流量不会有任何重大变化,至少在大型出版商看来是这样。事实上,每当谷歌的搜索算法发生变化时,整个网络都会关注。此外,值得一提的是,由于谷歌搜索排名的变化,一些公司也处于困境。事实上,每个靠网络流量赚钱的人都应该注意这一点。在谈到搜索结果的质量时,Payak说:这是最大的……这是我们在过去5年中发生的最积极的变化,并且可能是自开始以来最大的变化之一。本文转载自雷锋网。如需转载,请在雷锋网官网申请授权。