es适合存多长时间的数据?适合短期存储、长期存hdfs?
Elasticsearch
| 作者 sec_master
| 发布于2020年02月22日 | 阅读数:7938
分享到:QQ空间新浪微博微信QQ好友印象笔记有道云笔记
今天在想一个问题,es适合存储多长时间的数据?看es的设计,感觉多久都行,很容易方便水平扩展,存储不是问题。
我的问题:es的定位是搜索,一般存在es的数据,也都是基于时间序列的,一般只会用最近1个月、3个月、半年,最多也就1年的查询、统计。那么,比较久远的数据是不是应该压缩存入hdfs?这样的话才节省存储空间,而且也不浪费es的性能?
比如:如果我的es存了3年的数据,那么每次我使用query查询的时候、其实我只查最近1个月的数据,请求都要转发到每个分片上,包括了去年、前年的分片(索引),岂不是浪费感情?
如果想避免这个问题,那么在我搜索的时候,在url里配置的索引模式,要明确索引范围,比如我数据是按月索引的,log-2019-01、log-2019-02、log-2019-03依次类推,如果我只看1月、2月的时间范围内搜索,那么我的查询的索引模式应该是列出这两个索引,而不能用通用的索引模式如log-2019*,否则03-12的索引也会去处理我的请求,其实完全没必要。
谢谢各位!
2020-02-22
添加评论
没有找到相关结果
已邀请:
与内容相关的链接
提交