使用 OracleJDK
为什么用 OracleJDK?
- 业界主要将 OracleJDK 用在生产环境,而 OpenJDK 用在开发环境,而且 OracleJDK 8 会长期支持到 2025 年;
- OracleJDK 性能好于OpenJDK,原理 OracleJDK 里的组件都是高性能的组件,而OpenJDK 出于开源的考量而去掉这些高性能组件,改为别的开源版本或者直接去掉。
统一了机器的物理配置
一个机器一个节点,力求每个节点的物理配置一致,避免每个节点的外观不一致的情况。
- 配置128G 大内存,JVM优化需要配置到32G内,留足内存给buffer/cache;另外一个原因是机器的CPU架构是NUMA架构,两个芯,每个芯分配64G 内存,这才能保证每个核都有足够的资源,也给后续一台机安装两套节点后续空间;
- 使用了SSD作为数据存储,数据索引是以文件的形式存储到硬盘上,索引文件段才会被存储到内存里,所以用SSD可以大幅度优化速度,同时也会提高读写数据的速度,加速响应;同时,对于很少对数据进行业务场景来说,就会带来更少的SSD重新擦写,使得寿命更长。
采用
Elasticsearch 以前是 5.6.3,现在是 6.2.4。这个是必须的,新版本尤其是大的版本更新通常会伴有性能优化等内容。
调整配置项
限制配置:
# Disabling Swapping
LimitMEMLOCK=infinity
# Specifies the maximum file descriptor number that can be opened by this process
LimitNOFILE=1048575
# Specifies the maximum number of processes
LimitNPROC=4096
# Specifies the maximum size of virtual memory
LimitAS=infinity
# Specifies the maximum file size
LimitFSIZE=infinity
配置 31G JVM 堆空间
-Xms31g
-Xmx31g
服务发现配置:
discovery.zen.ping_timeout: 30s
discovery.zen.fd.ping_interval: 10s
discovery.zen.fd.ping_timeout: 60s
discovery.zen.fd.ping_retries: 6
定期清除缓存和页面
执行下面命令,每小时清理内存,需要注意的是,每台节点机器,不要都配置到0分处理,要随机分开处理
echo '0 * * * * /usr/bin/sync && /usr/bin/echo 3 > /proc/sys/vm/drop_caches' > /var/spool/cron/root
优化效果:
给 API 带来效果:
明显 api 查询耗时毛刺磨了,平均耗时在 200ms,最大耗时也在 6s,未优化前平均耗时出现 6s 的毛刺,最大耗时也出现 60s 的毛刺。
总结:查询耗时大幅度下降,绩效毛刺也磨平。
给分析服务带来效果:
监听服务:
保存耗时由以前的20~50ms缩短到现在3~10ms
分析服务:
观察日志,发现分析耗时基本上都是在50ms内完成分析,最慢1s内完成分析。
总结:分析和监听服务也都没有什么性能细节,分析条件获取也非常快,分析结果保存也非常快。