AggregationAnalysisAggregationes除了搜索功能外,还提供了丰富的数据统计分析功能,提供了实时性高的bucketmetricpipeline等多种分析方式。所有结果立即返回,而Hadoop等大数据系统是t+1级聚合分析类型bucketbucketing类型类似sql中的groupby语法指标指标分析类型如计算最大值最小值平均值等pipeline管道分析type,根据上层的聚合分析结果进行reanalysismatrixmatrixanalysistypemetricaggregationAnalysissingle-valueanalysisminmaxavgsumcardinalitymulti-valueanalysisstatsextendsstatspercentilepercentileranktophitsbucket聚合分析将文档分类到不同的bucketstermsrangedaterangehistogramhistogram以固定区间策略划分数据日期直方图pipelinepipeline分析结果将输出到原始结果根据输出位置分为两种类型。父结果嵌入到现有的聚合分析结果中。衍生移动平均累积相加结果与现有聚合分析结果处于同一水平。结果集,也可以设置其他范围过滤器设置聚合分析的过滤条件,调整范围不改变整体查询语句post_filter范围文档过滤但聚合分析后生效全局忽略查询过滤条件,并根据所有文档进行分析排序你可以根据key-value排序的原则和精度问题的原因,使用内置的key数据对_count个documents_key进行排序。数据分散在多个分片上。设置shard为1,消除苏韩剧分散的问题。设置shardsize,即每次从shardAdditionaldocumentterms聚合返回以下两个统计值doc_count_error_upper_bound可能遗漏的term的最大值sum_other_doc_count返回除桶内term以外的其他term的文档总数分片大小默认大小如下:size*1.5+10通过调整shardsize的大小,减少doc_count_error_upper_bound提高准确率,增加整体计算量,减少响应时间
