当前位置: 首页 > 科技观察

IBMCloudant开源其集成的Lucene搜索系统

时间:2023-03-13 01:42:52 科技观察

IBMCloudant开源CloudantSearch背后的代码库:Clouseau和Dreyfus,这些代码支持Cloudant的全文搜索系统,结合Cloudant基于ApacheCouchDB?的服务,集成ApacheLucene?文本搜索引擎库。上一篇博客介绍了最新的2.0搜索,它是在现有搜索系统的基础上进行的优化和增强,也就是IBMCloudant现在开源的代码。IBMCloudant计划将Clouseau和Dreyfus贡献给ApacheCouchDB项目,等待他们的批准,但已公开代码。CloudantSearch由两个互补的项目组成:Clouseau使用Scala代码编写,并提供对Lucene库的访问以使用Lucene运行搜索查询。Dreyfus是用Erlang编写的,主要是为了插入现有的CouchDB/Cloudant集群技术,并且可以管理Clouseau节点以提供全文搜索功能。这两个系统使用Erlang的外部术语格式(Clouseau端的Scalang)进行通信。除了提供一些有趣的Scala和Erlang供学习之外,希望这段代码也能证实Lucene接口对其他构建系统的有用性。去年IBMCloudant向CouchDB项目贡献了Mango(一种源自MongoDB的查询语言接口)时,也包含了CloudantSearch,允许声明式查询。IBMCloudant将继续为ApacheCouchDB开发社区做出贡献,让选择部署开源CloudantSearch特性的用户能够得到很好的集成。Mango刚发布的时候就得到了大家的一致肯定:还有一个消息是@Cloudant刚刚开源了MongoDB的查询接口,准备捐给CouchDB!https://t.co/qMJaUwScVG—ApacheCouchDB(@CouchDB)2014年11月17日Mango的优点是用户不再需要了解不同JSON文档的格式来执行查询操作。本文介绍GlynnBird的《CloudantQueryGrowsUptoHandleAdHocQueries》Mango的这一特性。CloudantSearch代码库自2011年以来有两个主要版本,并且已经投入生产4年。有关详细信息,请参阅2.0发行说明、BenjaminYoung的介绍和AlanHoffman的搜索教程。这两个开放存储库都托管在GitHub上:https://github.com/cloudant-labs/clouseauhttps://github.com/cloudant-labs/dreyfusIBMCloudant鼓励大家分叉和修改代码。欢迎任何代码或文档拉取请求,但只接受功能增强和错误修复,不接受新错误。..