倒排索引和正向索引书的索引类似于书的目录。书的章节指向章节关键字es中文档id对应的词。倒排索引的索引类似于以内容为关键字的书籍索引。word指向页数esword对应文档id使用倒排索引通过倒排索引获取关键词的文档id通过正向索引找出对应id的文档返回文档内容倒排索引由单词词典和倒排列表组成单词词典term词典记录了所有文档的单词,并记录了单词与发布列表的关联信息。一般使用B+Tree来实现postinglistpostinglist。postinglist记录了该词对应的文档集,由倒排索引项组成。词移位是指将文本转换成一系列词的过程,也可称为文本分析,在es中称为Analysis。Tokenizeres是一个专门处理分词的组件,英文是Analyzer,组成如下,也是analyzer调用的序列。字符过滤器对原始文本进行处理,例如去除html标签。对处理后的词进行再处理,比如转为小写等。analyzerapies提供了测试分词的api接口,_analyzer可以直接指定analyzer可以指定索引中的字段,可以自定义分词
