不知道配置文件上次什么时候修改的、修改了什么内容?改了配置文件还要重新发布项目或者手动触发重启服务?无缘无故发现配置文件错了影响到线上正常部署?你是否正在因为这些问题而困扰?50+线上项目,数百+配置文件,我们经常被这些配置文件虐的生无可恋,是时候作出改变了!本文将带你解决这些问题,喝着咖啡轻松运维
选型的原则:简单,易落地,不挑平台,不挑语言,尽量少的依赖。
对比了Disconf、Apollo等方案,最终选择了Etcd+Confd的方案,基本符合上边的原则,且Etcd我们在部署Kubernetes的时候已经有过使用,算是轻车熟路。
check_cmd
和reload_cmd
命令对配置文件进行检查和重新加载系统环境
服务器地址
1.下载etcd安装包并解压
# wget https://github.com/coreos/etcd/releases/download/v3.3.9/etcd-v3.3.9-linux-amd64.tar.gz
# tar -zxvf etcd-v3.3.9-linux-amd64.tar.gz
2.拷贝程序到/usr/bin目录下方便执行,etcd为go编写,直接可运行,主要有两个文件etcd和ectdctl,
# mv etcd-v3.3.9-linux-amd64/etcd* /usr/bin/
3.创建etcd配置文件目录/etc/etcd
和数据存放目录/home/data/etcd
# mkdir /etc/etcd /home/data/etcd
node1配置
# cat /etc/etcd/etcd.conf
name: 'node1'
data-dir: /home/data/etcd
listen-peer-urls: http://192.168.107.101:2380
listen-client-urls: http://192.168.107.101:2379,http://127.0.0.1:2379
initial-cluster-state: 'new'
initial-cluster-token: 'etcd-cluster-conf'
advertise-client-urls: http://192.168.107.101:2379
initial-advertise-peer-urls: http://192.168.107.101:2380
initial-cluster: node1=http://192.168.107.101:2380,node2=http://192.168.107.102:2380,node3=http://192.168.107.103:2380
node2配置
# cat /etc/etcd/etcd.conf
name: 'node2'
data-dir: /home/data/etcd
listen-peer-urls: http://192.168.107.102:2380
listen-client-urls: http://192.168.107.102:2379,http://127.0.0.1:2379
initial-cluster-state: 'new'
initial-cluster-token: 'etcd-cluster-conf'
advertise-client-urls: http://192.168.107.102:2379
initial-advertise-peer-urls: http://192.168.107.102:2380
initial-cluster: node1=http://192.168.107.101:2380,node2=http://192.168.107.102:2380,node3=http://192.168.107.103:2380
node3配置
# cat /etc/etcd/etcd.conf
name: 'node3'
data-dir: /home/data/etcd
listen-peer-urls: http://192.168.107.103:2380
listen-client-urls: http://192.168.107.103:2379,http://127.0.0.1:2379
initial-cluster-state: 'new'
initial-cluster-token: 'etcd-cluster-conf'
advertise-client-urls: http://192.168.107.103:2379
initial-advertise-peer-urls: http://192.168.107.103:2380
initial-cluster: node1=http://192.168.107.101:2380,node2=http://192.168.107.102:2380,node3=http://192.168.107.103:2380
需要放在后台运行,推荐使用screen
工具
# /usr/bin/etcd --config-file /etc/etcd/etcd.conf
三个节点全部启动完成后,可通过etcdctl member list
命令查看集群列表,确认集群状态
# etcdctl member list
732ca490026f580d: name=node3 peerURLs=http://192.168.107.103:2380 clientURLs=http://192.168.107.103:2379 isLeader=false
bc16d35c3ad1c5ee: name=node2 peerURLs=http://192.168.107.102:2380 clientURLs=http://192.168.107.102:2379 isLeader=true
f7a043d3b65cd4a4: name=node1 peerURLs=http://192.168.107.101:2380 clientURLs=http://192.168.107.101:2379 isLeader=false
1.下载confd并放到/usr/bin/
目录下方便使用
# wget https://github.com/kelseyhightower/confd/releases/download/v0.16.0/confd-0.16.0-linux-amd64
# mv confd-0.16.0-linux-amd64 /usr/bin/confd
# chmod +x /usr/bin/confd
2.新建confd配置文件目录
# mkdir /etc/confd/{conf.d,templates}
3.新建资源文件,.toml
文件结尾已经成了固定格式
# cat /etc/confd/conf.d/nginx.conf.toml
[template]
src = "nginx.conf.tmpl"
dest = "/tmp/nginx.conf"
keys = [
"/conf/project/env/nginx/nginx.conf",
]
check_cmd = "/usr/sbin/nginx -t -c {{.src}}"
reload_cmd = "/usr/sbin/service nginx reload"
这里我们新建了一个nginx配置的资源文件,参数解释:
reload_cmd:在check通过后可以执行这里配置的命令,上一步的check没有问题,就会执行reload命令重新加载配置文件
prefix:配置key的前缀,例如我们的key都是以/conf开头的,那么可以增加个配置prefix="/conf"
,在下边keys里就可以省略掉/conf了
4.新建模板文件
# cat /etc/confd/templates/nginx.conf.tmpl
{{getv "/conf/project/env/nginx/nginx.conf"}}
部署好了etcd集群和confd服务,接下来我们就要测试下他们是否能够正常协同工作了
1.在Etcd服务器新建一个KV值
# etcdctl set /conf/project/env/nginx/nginx.conf 'user www-data;
> worker_processes 4;
>
> pid /var/run/nginx.pid;
> error_log /home/logs/nginx/error.log warn;
>
> events {
> use epoll;
> worker_connections 51200;
> }
>
> http {
> default_type application/octet-stream;
>
> server {
> listen 80;
> server_name domain.com;
>
> root /home/project/webroot;
> index index.shtml index.html;
> }
> }'
# 查看设置key的内容
# etcdctl get /conf/project/env/nginx/nginx.conf
user www-data;
worker_processes 4;
pid /var/run/nginx.pid;
error_log /home/logs/nginx/error.log warn;
events {
use epoll;
worker_connections 51200;
}
http {
default_type application/octet-stream;
server {
listen 80;
server_name domain.com;
root /home/project/webroot;
index index.shtml index.html;
}
}
export ETCDCTL_API=3
来切换到v3版本,v2通过etcdctl -v
可以查看api版本,v3通过etcdctl version
查看api版本2.启动confd
# confd -watch -backend etcd -node=http://192.168.107.101:2379 -node=http://192.168.107.102:2379 -node=http://192.168.107.103:2379
2018-08-23T13:46:13+08:00 onlinegame.i.nease.net confd[17084]: INFO Backend set to etcd
2018-08-23T13:46:13+08:00 onlinegame.i.nease.net confd[17084]: INFO Starting confd
2018-08-23T13:46:13+08:00 onlinegame.i.nease.net confd[17084]: INFO Backend source(s) set to http://192.168.107.101:2379, http://192.168.107.102:2379, http://192.168.107.103:2379
2018-08-23T13:46:13+08:00 onlinegame.i.nease.net confd[17084]: INFO Target config /tmp/nginx.conf out of sync
2018-08-23T13:46:13+08:00 onlinegame.i.nease.net confd[17084]: INFO Target config /tmp/nginx.conf has been updated
配置参数说明
confd --help
命令查看-node:etcd节点地址,有多个节点的话就这么写多个-node就好了,我们etcd是三个节点的集群所以这里写三次'-node'
-onetime:可用来替换上边的-watch
参数,表示运行一次就退出,如果你不想让配置文件实时更新,只是想更新一次,可以用这个参数
-watch
参数,表示每隔多少秒去backend取一次数据,如果想降低etcd服务器压力,又想让客户端配置文件能自动更新,可以通过这个参数来控制3.通过上边日志可以看到/tmp/nginx.conf文件已经正常同步且更新了,查看/tmp/nginx.conf确定内容正确
总不能所有的配置文件更新都通过命令行的方式吧?为了方便管理,花了三天(真的是三天)写了个WebUI,命名为Kerrigan,能够实现目录树,在线查看配置、修改配置、查看配置更新历史等实用功能
配置页面,通过这个页面可以配置etcd的连接信息
首页,左侧项目列表(项目信息同步CMDB)
点击项目列表后,根据对应规则去etcd里边取出目录结构按树状呈现出来
点击配置文件,右侧会展示当前配置文件内容
点击“编辑”按钮可以编辑这个配置,新建页面一样,只是编辑不允许修改路径
点击“历史”按钮,则跳转到配置文件的历史页面,这个页面展示了这个配置文件所有的修改历史