Redis,一款技術研發者們耳熟能詳的內存資料庫。作為資料庫,存儲數據的容量都是有限的,不能超過主機內存的大小。通常而言,一台主機伺服器的內存只有十幾G,較大可達100G或200G。
為了解決Redis存儲瓶頸問題,各大企業紛紛開始尋找解決方案,將數據分片(sharding)存儲在多個Redis實例之中,每一個分片就是一個Redis實例,然後實現多個Redis實例協同運行。這就是Redis集群原理。本篇將圍繞Redis集群方案展開重點介紹。
Redis集群實現方式:
集群的實現方式:
下面我們對三種實現方式展開介紹:
客戶端分片
客戶端分片就是將分片工作放在業務程序端實現,程序代碼根據Redis客戶端預先定義好的路由規則,直接對不同的Redis實例進行分布式訪問,最終再把結果彙集在一起。
這種方案的優勢就在於所有邏輯都是可以控制的,沒有第三方中間件干預,開發人員很清楚如何實現分片及路由規則,實現方法完全由自己掌控。
但是客戶端分片方案的弊端也是令開發者也是十分懊惱的。由於客戶端分片方案是一種靜態的分片方案,無論是增加或是減少Redis實例的數量,都必須要開發者手動調整分片程序,對開發者的依賴很強;其次在運維上,該方案運維性較差,一旦集群數據出現問題,就需要開發人員和運維人員共同解決,在不同的客戶端程序中,維護相同的分片邏輯成本很大,需要消耗巨大的開發成本才能保證兩套業務系統分片邏輯一致。所以,客戶端分片方案並不適合中小型的企業使用。
基於代理的分片
基於代理分片就是客戶端發送請求到一個代理,由代理來解析客戶端的數據,再將請求轉發到正確的節點,最終將結果回復給客戶端。常用的基於代理的分片方案有兩種,Twemproxy、codis。
Twemproxy
Twemproxy是一款由Twitter開源的redis proxy方案,在Twitter、Yahoo都有使用。當Twemproxy工作時,Redis客戶端會把請求發送到Twemproxy,Twemproxy會使用一致性hash算法,根據路由規則發送正確的Redis實例,最後Twemproxy再把結果返給客戶端,從而實現Redis集群。
由於Twemproxy是單線程方案,所以只能使用單核cpu,如果前端含keepalive或haproxy相關代理,可以為Twemproxy做1+1準備。
當Twemproxy應用於多台Redis伺服器時,那麼實現的性能只能達到單台Redis伺服器80%,剩餘20%性能損耗。Redis-Sentinel是Redis官方推薦的一種高可用性解決方案,當用Redis做Master-slave的高可用方案時,如果Master宕機了,Twemproxy會訂閱Sentinel,完成主備切換。由於Redis-sentinel本身是一個獨立運行的進程,它能監控多個master-slave集群,發現master宕機後可以進行自動切換。
Twemproxy優點:
Twemproxy不足:
Codis
Codis是由豌豆莢於2014年11月在GitHub上開源,基於Go和C語言,支持平滑增加Redis實例的集群解決方案。使用Codis時,設置好下屬的Redis實例,在需要連接Redis的地方改為連接Codis,之後Codis會以一個代理的身份接受請求,並使用一致性hash算法,將請求轉接到具體Redis,最後再將結果返回到Codis。作為基於代理的分片,功能與Twemproxy類似。
Codis主要包含四大組件Codis Proxy(codis proxy)、Codis Manager(codisconfig)、Codis Redis(codis-server)和ZooKeeper,每一個組件都可以進行動態擴容。
Codis Proxy:客戶端連接到Redis代理服務,本身已實現了Redis協議,Redis客戶端連接到Codis Proxy可以進行各種操作。Codis Proxy是無狀態的,一個業務可以通過Keepalived等負載均衡軟體部署多個Codis Proxy;
Codisconfig:Codisconfig是Codis的管理工具,支持添加/刪除Redis節點、添加/刪除Proxy節點、發起數據遷移等操作。另外Codisconfig自帶http server,裡面集成一個管理介面,運維人員可以在瀏覽器上觀察Codis集群的運行狀態並進行相關操作;
Codis Redis:Codis Redis基於 redis-2.8.21 分支開發,是Codis項目維護的一個Redis分支,其中加入了slot支持和原子數據遷移指令;
ZooKeeper:Codis通過ZooKeeper來存放數據路由表和Codis Proxy節點的原信息,Codisconfig發起的命令都會通過ZooKeeper同步到各存活的Codis Proxy節點。
路由查詢
路由查詢是指將任務請求發送到任意節點,接收到請求的節點會將查詢請求發送到正確的節點上執行任務。在Redis集群方案中使用的路由查詢方案有Redis cluster。
Redis Cluster由Redis官方推出,是一種伺服器Sharding技術,3.0版本開始正式提供,可線性擴展到1000個節點。在Redis Cluster中,Sharding將所有Key映射到slot中,slot個數一共16384個。Redis集群中,每個節點都會負責16384個slot中的一部分。當動態添加或減少節點時,需要將16384個slot重做分配,slot中對應的Key也要做遷移。這項工作目前是需要人工介入手動操作的。在使用Redis Cluster時,要確保16384個slot對應節點都能正常工作,如果有一個節點發生故障,整個集群都會無法工作。
為了增加集群的可訪問性,Redis官方推薦將節點配置成主從結構(一個master主節點掛多個salve從節點)如果主節點失效,Redis Cluster會根據選舉算法從slave節點中選擇一個上升為主節點,整個集群繼續對外提供服務。
使用Redis cluster時,由於官方並未提供圖形管理工具,所以運維比較複雜。而且集群管理與數據存儲上存在耦合,一旦集群管理出現問題,整個Redis都需要升級整合。Redis Cluster自2015年發布以來,成功使用的企業還並不是很多。
需要的Java架構師方面的資料可以關注之後私信哈,回復「資料」領取免費架構視頻資料,記得要點贊轉發噢!!!