欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 汽车 > 维修 > 【Elasticsearch】映射:fielddata 详解

【Elasticsearch】映射:fielddata 详解

2025/6/9 15:26:21 来源:https://blog.csdn.net/be_racle/article/details/148503039  浏览:    关键词:【Elasticsearch】映射:fielddata 详解

映射:fielddata 详解

  • 1.fielddata 是什么
  • 2.fielddata 的工作原理
  • 3.主要用法
    • 3.1 启用 fielddata(通常在 text 字段上)
    • 3.2 监控 fielddata 使用情况
    • 3.3 清除 fielddata 缓存
  • 4.使用场景示例
    • 示例 1:对 text 字段进行聚合
    • 示例 2:对 text 字段进行排序
  • 5.fielddata 与 doc_values 的区别
  • 6.注意事项
  • 7.最佳实践

1.fielddata 是什么

fielddata 是 Elasticsearch 中一种数据结构,用于在内存中缓存字段数据,主要服务于以下场景:

  • 聚合操作(Aggregations)
  • 排序(Sorting)
  • 脚本计算(Scripting)
  • 某些类型的查询(如 field 字段上的 term 查询)

当需要对 text 字段或其他非 doc_values 支持的字段执行上述操作时,Elasticsearch 需要将这些字段的值加载到内存中,这就是 fielddata 的作用。

2.fielddata 的工作原理

  • 按需加载:当第一次需要对某个字段执行聚合 / 排序等操作时,Elasticsearch 会从磁盘读取该字段的所有值并构建内存中的数据结构。
  • 存储在 JVM 堆内存fielddata 会占用 JVM 堆内存空间。
  • 字段级启用:默认情况下,text 字段禁用 fielddatakeyword 字段使用 doc_values 而非 fielddata

3.主要用法

3.1 启用 fielddata(通常在 text 字段上)

PUT my_index/_mapping
{"properties": {"my_text_field": { "type":     "text","fielddata": true}}
}

3.2 监控 fielddata 使用情况

GET _nodes/stats/indices/fielddata?fields=*

3.3 清除 fielddata 缓存

POST my_index/_cache/clear?fielddata=true

4.使用场景示例

示例 1:对 text 字段进行聚合

GET my_index/_search
{"size": 0,"aggs": {"my_terms": {"terms": {"field": "my_text_field"  // 需要该字段启用 fielddata}}}
}

示例 2:对 text 字段进行排序

GET my_index/_search
{"sort": [{"my_text_field": {"order": "asc"}}]
}

5.fielddata 与 doc_values 的区别

特性fielddatadoc_values
构建时机查询时按需构建索引时预先构建
存储位置JVM 堆内存磁盘(操作系统缓存)
内存占用
适用字段类型主要为 text 字段主要为 keyword / numeric / date 等字段
默认启用text 字段默认禁用支持的字段默认启用

6.注意事项

  • 内存消耗fielddata 会显著增加内存使用,特别是高基数(大量唯一值)字段。
  • 性能影响:首次加载 fielddata 可能导致查询延迟。
  • 替代方案:对于 keyword / numeric / date 等字段,优先使用 doc_values
  • 熔断机制:Elasticsearch 有 fielddata 熔断器防止内存耗尽。

7.最佳实践

  • 尽量避免在 text 字段上启用 fielddata

  • 如需对文本进行聚合/排序,考虑使用多字段(multi-field)映射:

    "my_field": {"type": "text","fields": {"keyword": {"type": "keyword"}}
    }
    

    然后对 my_field.keyword 进行操作。

  • 监控 fielddata 内存使用,设置合理的熔断阈值。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词