proxy_cache 运用局部性的原理,备存一些先前被访问过、料将被再度使用的资源,使用户得以由前端服务器直接取得,从而减少后端服务器的资源开销,并缓解整个系统的压力。缓存也是反代的用途之一。本文介绍 Nginx 基本的缓存配置。
要启用缓存,请在顶级 http { } 上下文中添加 proxy_cache_path 指令。重要且强制的第一个参数是缓存内容的本地文件系统路径,keys_zone 参数指定用于存储缓数据的共享内存区域的名称和大小。
1) proxy_cache_path 定义一个缓存目录,路径为 /usr/local/nginx/cache;levels=1:2 采用二级的目录结构;keys_zone 建立一块用于存放缓存键 (cache keys) 和元数据 (metadata) 的共享内存区,名叫 ”the_cache_zone” 且分配 10MB 的内存;inactive 不活跃的缓存文件 1 小时后将被清除;max_size 缓存所占磁盘空间的上限是 512MB;不另设临时目录。
http { ... proxy_cache_path /usr/local/nginx/cache levels=1:2 keys_zone=the_cache_zone:10m inactive=1h max_size=512m use_temp_path=off; ... }
2) 启用缓存。方便除错计,添加一响应头用以指示缓存状态 (MISS / BYPASS / HIT …)。
下列指令请斟酌——
proxy_cache_bypass 用于指定忽略缓存的情况,当其值为空或为零时,使用缓存。
proxy_cache_key 用于生成缓存键,区分不同的资源。要特别留心 Query String。
proxy_cache_min_uses 则规定缓存门槛,请求过多少次才缓存,不缓存低频请求,避免浪费。
在下例中,$is_args 反映请求的 URI 是否带参数(网址中问号后面那一长串),若没有即为空值。$request_uri 近似于 $uri$is_args$args。key 是决定缓存命中率的因素之一。
location / { ... proxy_pass http://www.example.com; proxy_cache the_cache_zone; # proxy_cache_bypass $is_args; # (default) proxy_cache_key $scheme$proxy_host$request_uri; # proxy_cache_min_uses 3; add_header X-Cache-Status $upstream_cache_status; ... }
3) Nginx 作反代时,相对来说也是客户端。若希望抓取的源站内容总是新鲜,还需要忽略上游的缓存期限,即不遵循源站的 Cache-Control 和 Expires 等响应头,然后再来配置自己的缓存期限。
服务端一侧,proxy_cache_valid 控制的是 expiration (有效期),针对不同的 HTTP 状态码可以设定不同的有效期。inactive 决定的是 retention (保留期限),时间一到管你新不新鲜都要丢掉 (refresh)。可以理解为 inactive 要优位于 proxy_cache_valid。
proxy_cache_revalidate 将对客户端传来之 Etag 或 Last-Modified 作出验证,若服务端资源没有变化,则使用“稍早前”缓存页面,无论其有效期为何。有助减少回源次数。
location / { ... proxy_ignore_headers X-Accel-Expires Cache-Control Expires; proxy_cache_valid 301 1h; proxy_cache_valid 200 30m; proxy_cache_valid any 1m; proxy_cache_revalidate on; ... }
4) 缓存一时爽,全家火葬场。一大波缓存同时失效,会导致缓存雪崩 (Cache stampede),使得大批请求涌向源站。如果网站不是特别大、并发要求不是特别高,可以采取加锁排队和暂时返回陈旧数据的方式缓解问题。但根本的还是要各别设定缓存期限,错峰更新缓存,不要一窝蜂。
proxy_cache_lock 对同一资源,未命中一次只回源一次,阻塞后续请求直至当前请求完成。
proxy_cache_lock_age “不能者止”,如果当前请求未能如期完成,就放行后续请求。
proxy_cache_lock_timeout 发生超时,同样放行,但不作缓存。
proxy_cache_use_stale 则是指定“共体时艰”的情境,比如服务器正在更新 (updating) 缓存的时候,或者遭遇 503 服务不可用错误的时候,勉予使用 (inactive 还未清理的) 过期缓存,以保持可用性。
proxy_cache_background_update 返回陈旧数据时,也跟源站要一份新鲜的,下次用。
location / { ... proxy_cache_lock on; # (default) proxy_cache_lock_age 5s; # (default) proxy_cache_lock_timeout 5s; proxy_cache_use_stale error timeout updating http_503; proxy_cache_background_update on; ... }
5) 倘若有手动清除缓存的需求,又用不起 NGINX Plus,不妨考虑 ngx_cache_purge。
下载源码、nginx -V 检视参数、追加参数 --add-module=../ngx_cache_purge-2.3 且重新编译 Nginx,以完成添加模块的动作。
proxy_cache_purge 得回头看前面的配置,使用的缓存路径与 proxy_cache 的对应、缓存键向 proxy_cache_key 的看齐。URI 前面加上 /purge 即为清除缓存接口(最好不要被外部访问)。
location / { ... proxy_cache the_cache_zone; proxy_cache_key $scheme$proxy_host$request_uri; ... } location ~ /purge(/.*) { ... allow 127.0.0.1; deny all; proxy_cache_purge the_cache_zone $scheme$proxy_host$1$is_args$args; ... }