一、前言

本文介绍采用 clickhouse-exporter + grafana + prometheus 搭建监控 clickhouse 单节点和集群的监控体系。

二、部署 exporter

获取代码并编译

mkdir -p $GO_PATH/src/github.com/Percona-Labcd $GO_PATH/src/github.com/Percona-Labgit clone https://github.com/Percona-Lab/clickhouse_exporter

因为生产环境的系统是基于 Linux,不能直接访问外网。故在自己的 mac 系统先编译成二进制,然后拷贝到生产环境。

在 mac 上编译 clickhouse_exporter,

再下载到源代码目录。

cd $GO_PATH/src/github.com/Percona-LabGO111MODULE=off `CGO_ENABLED`=0 GOOS=linux GOARCH=amd64 go build clickhouse_exporter.go
编译成功会看到二进制文件,
$ ./clickhouse_exporter  -hUsage of ./clickhouse_exporter:  -insecure        Ignore server certificate if using https (default true)  -log.level value        Only log messages with the given severity or above. Valid levels: [debug, info, warn, error, fatal, panic].  -scrape_uri string        URI to clickhouse http endpoint (default "http://localhost:8123/")  -telemetry.address string        Address on which to expose metrics. (default ":9116")  -telemetry.endpoint string        Path under which to expose metrics. (default "/metrics")
配置比较简单,就是指定 scrape_uri=clickhouse_server_ip:port, 

启动 exporter,

./clickhouse_exporter -scrape_uri=http://clickhouse_server_ip:8123/ -log.level=info
在 exporter 机器上查看是否能获取到 clickhouse 的数据。

成功。。

三、配置 prometheus

修改 prometheus.yml 文件,targets 指定 clickhouse_exporter 的 ip 地址和端口号,
  - job_name: 'clickhouse_exporter'    scrape_interval: 10s    static_configs:      - targets:        - "clickhouse_exporter_ip:9116"
修改完配置文件,重新加载,
curl ‘http://localhost:9090/-/reload’ -X POST
监控多个 clickhouse 节点

当然如果监控多个 clickhouse 集群节点要怎么处理?目前测试的 clickhouse_exporter 还不支持,要重写接受参数的处理逻辑。

或者有知道的朋友怎么操作,可以留言交流。

四、配置 grafna 图形

从 https://grafana.com/grafana/dashboards/882 获取 clickhouse 的监控采集数据模板 ,导入模板,选择 prometheus 数据源,监控展示。

五、小结

本文算是浅显的介绍了利用 clickhouse-exporter + grafana + prometheus 部署 clickhouse 的监控。看了 clickhouse 的性能展示模板还是比较粗糙,如果有需要更细粒度的展示 clickhouse 的集群状态,可以基于监控的 metrics 去配置更丰富的指标。

have fun with ClickHouse  ^_^