使用bool查询
接收以下参数:
must:文档必须匹配这些条件才能被包含进来。
must _not:文档必须不匹配这些条件才能被包含进来。
should:如果满足这些语句中的任意语句,将增加。score, 否则,无任何影响。它们主要用于修正每个文档的相关性得分。
filter:必须匹配,但它以不评分、过滤模式来进行。这些语句对评分没有贡献,只是根据过滤标准来排除或包含文档。
相关性得分是如何组合的。每一个子查询都独自地计算文档的相关性得分。一旦他们的得分被计算出来,bool 查询就将这些得分进行合并并且返回一个代表整
个布尔操作的得分。
下面的查询用于查找title字段匹配how to make millions并且不被标识为spam的文档。那些被标识为starred或在2014之后的文档,将比另外那些文档拥
有更高的排名。如果两者都满足,那么它排名将更高:
复合查询语句:
#复合查询
GET /lib3/user/_search
{"query": {"bool": {"must": { "match": {"interests": "changge" }},"must_not": { "match": { "interests": "1vyou" }},"should": [{"match": { "address": "bei jing" }},{"range": { "birthday": { "gte": "1996-01-01" }}}]}}
}GET /lib3/user/_search
{"query": {"bool": {"must": { "match": { "interests": "changge" }},"must_not": { "match": { "interests": "1vyou" }},"should": [{"match": { "address": "bei jing" }}],"filter": {"range":{ "birthday": { "gte": "1996-01-01" }}}}}
}
如果没有must语询,那么至少需要能够匹配其中的一条should语句。但,如果存在至少一条 must语句,则对should语句的匹配没有要求。如果我们不想因为文档的时间而影响得分,可以用filter语句来重写前面的例子:
GET /lib3/user/_search
{"query": {"bool": {"must": { "match": { "interests": "changge" }},"must_not": { "match": { "interests": "1vyou" }},"should":[{"match": { "address": "bei jing" }}],"filter":{"bool":{"must": [{"range": { "birthday": { "gte": "1990-01-01" }}},{"range": { "age": { "lte": 30}}}],"must_not":[{ "term": { "age": "29" }}]}}}}
}
通过将range查询移到filter语句中,我们将它转成不评分的查询,将不再影响文档的相关性排名。由于它现在是一个不评分的查询, 可以使用各种对filter查询有效的优化手段来提升性能。bool查询本身也可以被用做不评分的查询。简单地将它放置到filter语句中并在内部构建布尔逻辑:
constant_score查询
它将一个不变的常量评分应用于所有些配的文档。它被经常用于你只需要执行一个filter 而没有其它查询(例如, 评分查询)的情况下。
{ "constant_score":{ filter:{ "term":{ "category": "ebooks" }}}}
term查询被放置在constant_score中,转成不评分的filter.这种方式可以用来取代只有filter 语句的bool查询。
constant_score的用处
当我们不关心检索词频率TF(Term Frequency)对搜索结果排序的影响时,可以使用constant_score将查询语句query或者过滤语句filter包装起来。
检索词频率:检索词在该字段出现的频率。出现频率越高,相关性也越高。字段中出现过5次要比只出现过1次的相关性高。
GET /lib3/user/_search
{"query": {"constant_score": {"filter": {"term": { "interests": "changge" }}}}
}