从0到1实战微服务架构

Memcached 缓存服务的运维

如果业务进一步发展，通过"读写分离"、"分库分表"后，数据库的性能依然无法满足高并发读请求，此时就需要缓存出马了。

缓存的原理其实非常简单: 用"存取速度更快的空间"换取"存取速度更慢的时间"。

当然，天下没有免费的午餐，缓存自然也是有代价的。单位容量的内存比磁盘要昂的多。幸运的是，根据数据的局部性原理^{1，我们可以有如下策略:}

只选择少量的"热数据"放入缓存
当缓存空间不够放置"热数据"时，根据策略替换掉缓存中的已有数据。

本节的主角是Memcached，一款高性能的内存缓存，性能可达每秒5万次^2。

Memcached本身是不支持集群的，但可以通常可以部署多台服务。在访问时，可以根据key的哈希值取模进行分片，然后访问不同的Memcached结点。

集群搭建

由于Memcached是全内存的，所以无需创建Volume挂载点。

在这里，我们没有使用Deployment，而是使用了StatefulSet。

StatefulSet与Deployment基本相同，唯一的的区别是，前者认为所有副本是相互独立的，而后者认为所有副本是互为冗余的。

对于微服务的应用场景，每个节点都是完全相同的逻辑、连接完全相同的数据库、执行等同的操作，所以我们用的一直是Deployment。

而对于Memcached，我们会将不同数据分片到不同Memcached结点上，他们是相互独立而不是可替代的，所以我们采用了StatefulSet。

memcached-service.yaml:

apiVersion: v1
kind: Service
metadata:
  name: memcached
spec:
  ports:
  - port: 11211
  selector:
    app: memcached
  clusterIP: None
---
apiVersion: apps/v1
kind: StatefulSet
metadata:
  name: memcached
spec:
  selector:
    matchLabels:
      app: memcached
  serviceName: "memcached"
  replicas: 2
  template:
    metadata:
      labels:
        app: memcached
    spec:
      restartPolicy: Always
      hostname: memcached
      containers:
      - name: memcached-ct
        image: memcached:1.5-alpine
        ports:
        - containerPort: 11211
        args: ["memcached", "-m", "256"]

简单说明下:

我们声明了StatefulSet为memcached，2个独立节点
限定了内存使用为256m

启动下:

kubectl apply -f memcached-service.yaml

然后我们登录一个额外的docker上，尝试ping一下，是可以的，说明启动成功:


ping memcached-0.memcached
PING memcached1 (172.17.0.8): 56 data bytes
64 bytes from 172.17.0.8: seq=0 ttl=64 time=1.014 ms
64 bytes from 172.17.0.8: seq=1 ttl=64 time=0.138 ms
64 bytes from 172.17.0.8: seq=2 ttl=64 time=0.134 ms


ping memcached-1.memcached
PING memcached2 (172.17.0.9): 56 data bytes
64 bytes from 172.17.0.9: seq=0 ttl=64 time=0.076 ms
64 bytes from 172.17.0.9: seq=1 ttl=64 time=0.123 ms
64 bytes from 172.17.0.9: seq=2 ttl=64 time=0.119 ms

注意上面对不同节点的DNS域名为"statefulName-x"."serviceName"

Memcached的配置看起来很简单，但是分片策略还需要进一步思考。

例如，前面提到了利用哈希值取模，可以实现Memcahced在客户端的分片。按照此策略，如果现在要增加一台机器到3台，计算取模的值将发生变化，缓存上的所有的数据都需要清空重新分片。

这种"推倒重来"的策略看起来简单，但可能会导致缓存击穿甚至造成线上故障。

想解决这类问题，可以采用一致性哈系，它可以尽可能地减少机器变动后，造成的数据重分布。

Memcached的日常运维比较简单，常见的操作就是清空全部缓存，可以通过nc指令来完成:

echo 'flush_all' | nc memcached1 11211

OK

提醒一下，线上执行清空操作要非常谨慎，若系统性能严重依赖缓存，那么清空操作往往会导致缓存击穿并造成系统故障。

小结

本节，我们使用StatefulSet，完成了Memcached集群的运维，并介绍了Memcahced集群运维中常见的问题。

分为空间局部性和时间局部性，可参考局部性原理浅析
↩
Memcached性能评测数据
↩

从0到1实战微服务架构

Memcached 缓存服务的运维

集群搭建

小结

http2讲解中文版

http2讲解

im-service 简介

Web前端写给Web设计师的注意事项

进击的Python

前端开发者指南 2018