数据和知识是任何企业的核心资产。现代搜索引擎可以利用这些知识,以便员工可以找到其来源和内容。企业可以构建强大的搜索引擎,并专注于企业的应用领域、用户角色和业务目标。谷歌搜索于2016年初宣布终止,标志着为企业提供统一搜索解决方案的错误梦想破灭了。取而代之的是越来越智能的搜索引擎,搜索、分析和评估商业信息的应用程序。这不仅涉及传统文档中的搜索,还涉及数据库中的数据以及语义图中的实体和关系。收集企业内部的所有信息,加上外部环境的其他数据,收集后对搜索、分析、评估应用进行分层计算,形成企业级搜索应用的新天地。随着应用系统越来越复杂,信息量越来越大,传统的关键词搜索技术已经不能满足企业定位和搜索海量数据和各种文件类型的需求。为解决这一难题,本文详细介绍了在开始企业搜索项目时要牢记的10个关键点。要点#1:雄心勃勃,可以比谷歌做得更好许多搜索研发团队都被谷歌在网络搜索方面的成就吓倒了。但只要有志向,就能做得更好!谷歌拥有卓越的技术、硬件和高科技人才大军,每天提供数十亿次的搜索服务。但企业拥有一切:各种文档、产品、内部网站和客户数据。并且企业对自己的发展领域、用户角色和业务目标有更深入的了解,或者亲自与用户交流。谷歌虽然可以在互联网上大行其道,但是搜索研发团队可以深化到企业的应用。第二点:处理搜索当用户在文本框中输入几个词时,应用程序要找出用户真正想要的信息是一个挑战。使用词干提取、同义词和不同范围的关键字等搜索技术来确保您找到所有正确的信息。然后应用语义图来关联现实世界的上下文,就像让知识渊博的图书管理员找书一样。帮助公司了解用户对拼写检查和自动完成搜索建议的需求。在实际使用中,搜索引擎为用户提供清晰的结果汇总,引导用户在适用范围内以高效的方式进行搜索。要点三:处理数据标注数据,方便快速查找。添加元数据:出版日期、作者、关键字和归属;查找和注释实体和属性:人物、地点、公司名称、信用卡号码等。然后对每个文档进行标记并分配不同的权限,从而使搜索过程具有响应性。要点#4:获得更好的搜索结果搜索结果页面不一定只是链接列表。使每个搜索结果包含尽可能多的信息:链接、与搜索关键字匹配的网页的文本摘要以及一些元数据(页面被抓取的时间、网页文件概览、相关关键字的其他网站链接、及其他相关信息)。为了获得更好的搜索结果,请考虑使用带有图像信息的卡片。当这些卡片式信息具有天然的属性分组时,可以通过不同的页面跳转将最终的搜索结果串联起来。添加有关整个结果集的信息:一个信息面板,描述搜索中的主要术语、方面和一些图表。第5点:永远不要重复相同的搜索。对于每个用户最喜欢的搜索集,在他第一次登录时在搜索框中显示结果的摘要。如果用户需要了解一些新的信息,例如:每当有关于止痛药对网球肘影响的新研究时,一旦找到符合搜索结果的信息,将立即向系统返回电子邮件或短信。要点六:追踪关于追踪所有搜索的一切,并追踪这些搜索的结果。搜索“成功”意味着快速将结果返回给用户,单击最上面的结果,阅读并继续。如果搜索失败,调整应用程序、搜索处理和结果数据。通过上述方法调整搜索流程,考虑创建一个特殊的信息面板或登录界面,将用户重定向到搜索。列一个每日清单,然后仔细确定优先顺序。重点七:持续改进适应变化用户的搜索量每天都在变化。数据也是如此,提供给搜索的一些上下文会发生变化。每天改进搜索,不断寻找改善用户体验的方法:为他们提供更加个性化、智能化和数据可见的推荐。要点#8:不要忘记安全一旦企业搜索超出了内联网每个部分的基础,它就必须遵守公司的隐私和安全标准。理想情况下,搜索应用程序将内置到现有的安全基础设施中。第9点:听起来很难,但Google不做Google网络搜索不必处理安全问题,但企业搜索需要。与此相关的其他提示是:谷歌扩大搜索范围;映射一个丰富的搜索结果页面,其中包含有关每个结果和整个结果集的信息;跟踪每次搜索和结果数据,以获得更好的搜索和反馈。谷歌没有做的一件事是注释数据;相反,它记录了网站开发人员应如何注释数据以便Google可以找到它。第十点:如何最终完成搜索引擎的架构?找到一个支持搜索应用程序的程序,而不仅仅是搜索引擎。该平台必须支持上面讨论的所有技术,并且必须能够汇集信息——传统文档、数据和语义图(实体和关系)——这样组织就可以构建一个使用企业中所有信息的搜索应用程序。【本文为专栏作家“李少鹏”原创文章,转载请通过安安牛(微信公众号id:gooann-sectv)获得授权】
