什麼是消息隊列?

2019-12-05     日行四善

前言

公司用到的很多技術,自己之前都沒學過(),於是只能慢慢補了。這次給大家寫寫我學習消息隊列的筆記,希望對大家有幫助。

一、什麼是消息隊列?

消息隊列不知道大家看到這個詞的時候,會不會覺得它是一個比較高端的技術,反正我是覺得它好像是挺牛逼的。

消息隊列,一般我們會簡稱它為MQ(Message Queue),嗯,就是很直白的簡寫。

我們先不管消息(Message)這個詞,來看看隊列(Queue)。這一看,隊列大家應該都熟悉吧。

隊列是一種先進先出的數據結構。

先進先出

在Java裡邊,已經實現了不少的隊列了:

Java的隊列實現類

那為什麼還需要消息隊列(MQ)這種中間件呢???其實這個問題,跟之前我學Redis的時候很像。Redis是一個以key-value形式存儲的內存資料庫,明明我們可以使用類似HashMap這種實現類就可以達到類似的效果了,那還為什麼要Redis?《Redis合集》

  • 到這裡,大家可以先猜猜為什麼要用消息隊列(MQ)這種中間件,下面會繼續補充。

消息隊列可以簡單理解為:把要傳輸的數據放在隊列中

圖片來源:https://www.cloudamqp.com/blog/2014-12-03-what-is-message-queuing.html

科普:

  • 把數據放到消息隊列叫做生產者
  • 從消息隊列裡邊取數據叫做消費者

二、為什麼要用消息隊列?

為什麼要用消息隊列,也就是在問:用了消息隊列有什麼好處。我們看看以下的場景

2.1 解耦

現在我有一個系統A,系統A可以產生一個userId

系統A可以產生一個UserId

然後,現在有系統B和系統C都需要這個userId去做相關的操作

系統A給系統B和系統C傳入userId這個值

寫成偽代碼可能是這樣的:

public class SystemA {

// 系統B和系統C的依賴
SystemB systemB = new SystemB();
SystemC systemC = new SystemC();

// 系統A獨有的數據userId
private String userId = "Java3y";

public void doSomething() {

// 系統B和系統C都需要拿著系統A的userId去操作其他的事
systemB.SystemBNeed2do(userId);
systemC.SystemCNeed2do(userId);

}
}

結構圖如下:

結構圖

ok,一切平安無事度過了幾個天。

某一天,系統B的負責人告訴系統A的負責人,現在系統B的SystemBNeed2do(String userId)這個接口不再使用了,讓系統A別去調它了

於是,系統A的負責人說"好的,那我就不調用你了。",於是就把調用系統B接口的代碼給刪掉了

public void doSomething() {

// 系統A不再調用系統B的接口了
//systemB.SystemBNeed2do(userId);
systemC.SystemCNeed2do(userId);

}

又過了幾天,系統D的負責人接了個需求,也需要用到系統A的userId,於是就跑去跟系統A的負責人說:"老哥,我要用到你的userId,你調一下我的接口吧"

於是系統A說:"沒問題的,這就搞"

系統A需要調用系統D的接口

然後,系統A的代碼如下:

public class SystemA {

// 已經不再需要系統B的依賴了
// SystemB systemB = new SystemB();

// 系統C和系統D的依賴
SystemC systemC = new SystemC();
SystemD systemD = new SystemD();

// 系統A獨有的數據
private String userId = "Java3y";

public void doSomething() {


// 已經不再需要系統B的依賴了
//systemB.SystemBNeed2do(userId);

// 系統C和系統D都需要拿著系統A的userId去操作其他的事
systemC.SystemCNeed2do(userId);
systemD.SystemDNeed2do(userId);

}
}

時間飛逝:

  • 又過了幾天,系統E的負責人過來了,告訴系統A,需要userId。
  • 又過了幾天,系統B的負責人過來了,告訴系統A,還是重新掉那個接口吧。
  • 又過了幾天,系統F的負責人過來了,告訴系統A,需要userId。
  • ……

於是系統A的負責人,每天都被這給騷擾著,改來改去,改來改去…….

還有另外一個問題,調用系統C的時候,如果系統C掛了,系統A還得想辦法處理。如果調用系統D時,由於網絡延遲,請求超時了,那系統A是反饋fail還是重試??

最後,系統A的負責人,覺得隔一段時間就改來改去,沒意思,於是就跑路了。

然後,公司招來一個大佬,大佬經過幾天熟悉,上來就說:將系統A的userId寫到消息隊列中,這樣系統A就不用經常改動了。為什麼呢?下面我們來一起看看:

系統A將userId寫到消息隊列中,系統C和系統D從消息隊列中拿數據

系統A將userId寫到消息隊列中,系統C和系統D從消息隊列中拿數據。這樣有什麼好處

  • 系統A只負責把數據寫到隊列中,誰想要或不想要這個數據(消息),系統A一點都不關心
  • 即便現在系統D不想要userId這個數據了,系統B又突然想要userId這個數據了,都跟系統A無關,系統A一點代碼都不用改。
  • 系統D拿userId不再經過系統A,而是從消息隊列裡邊拿。系統D即便掛了或者請求超時,都跟系統A無關,只跟消息隊列有關

這樣一來,系統A與系統B、C、D都解耦了。

2.2 異步

我們再來看看下面這種情況:系統A還是直接調用系統B、C、D

直接調接口

代碼如下:

public class SystemA {

SystemB systemB = new SystemB();
SystemC systemC = new SystemC();
SystemD systemD = new SystemD();

// 系統A獨有的數據
private String userId ;

public void doOrder() {

// 下訂單
userId = this.order();
// 如果下單成功,則安排其他系統做一些事
systemB.SystemBNeed2do(userId);
systemC.SystemCNeed2do(userId);
systemD.SystemDNeed2do(userId);

}
}

假設系統A運算出userId具體的值需要50ms,調用系統B的接口需要300ms,調用系統C的接口需要300ms,調用系統D的接口需要300ms。那麼這次請求就需要50+300+300+300=950ms

並且我們得知,系統A做的是主要的業務,而系統B、C、D是非主要的業務。比如系統A處理的是訂單下單,而系統B是訂單下單成功了,那發送一條簡訊告訴具體的用戶此訂單已成功,而系統C和系統D也是處理一些小事而已。

那麼此時,為了提高用戶體驗和吞吐量,其實可以異步地調用系統B、C、D的接口。所以,我們可以弄成是這樣的:

此時才用了100ms

系統A執行完了以後,將userId寫到消息隊列中,然後就直接返回了(至於其他的操作,則異步處理)。

  • 本來整個請求需要用950ms(同步)
  • 現在將調用其他系統接口異步化,從請求到返回只需要100ms(異步)

(例子可能舉得不太好,但我覺得說明到點子上就行了,見諒。)

2.3削峰/限流

我們再來一個場景,現在我們每個月要搞一次大促,大促期間的並發可能會很高的,比如每秒3000個請求。假設我們現在有兩台機器處理請求,並且每台機器只能每次處理1000個請求。

削峰的場景

那多出來的1000個請求,可能就把我們整個系統給搞崩了…所以,有一種辦法,我們可以寫到消息隊列中:

寫到消息隊列中,系統從消息隊列中拿到請求

系統B和系統C根據自己的能夠處理的請求數去消息隊列中拿數據,這樣即便有每秒有8000個請求,那只是把請求放在消息隊列中,去拿消息隊列的消息由系統自己去控制,這樣就不會把整個系統給搞崩。

三、使用消息隊列有什麼問題?

經過我們上面的場景,我們已經可以發現,消息隊列能做的事其實還是蠻多的。

說到這裡,我們先回到文章的開頭,"明明JDK已經有不少的隊列實現了,我們還需要消息隊列中間件呢?"其實很簡單,JDK實現的隊列種類雖然有很多種,但是都是簡單的內存隊列。為什麼我說JDK是簡單的內存隊列呢?下面我們來看看要實現消息隊列(中間件)可能要考慮什麼問題

3.1高可用

無論是我們使用消息隊列來做解耦、異步還是削峰,消息隊列肯定不能是單機的。試著想一下,如果是單機的消息隊列,萬一這台機器掛了,那我們整個系統幾乎就是不可用了。

萬一單機的隊列掛掉了

所以,當我們項目中使用消息隊列,都是得集群/分布式的。要做集群/分布式就必然希望該消息隊列能夠提供現成的支持,而不是自己寫代碼手動去實現。

3.2 數據丟失問題

我們將數據寫到消息隊列上,系統B和C還沒來得及取消息隊列的數據,就掛掉了。如果沒有做任何的措施,我們的數據就丟了

數據丟失問題

學過Redis的都知道,Redis可以將數據持久化磁碟上,萬一Redis掛了,還能從磁碟從將數據恢復過來。同樣地,消息隊列中的數據也需要存在別的地方,這樣才儘可能減少數據的丟失。

那存在哪呢?

  • 磁碟?
  • 資料庫?
  • Redis?
  • 分布式文件系統?

同步存儲還是異步存儲?

3.3消費者怎麼得到消息隊列的數據?

消費者怎麼從消息隊列裡邊得到數據?有兩種辦法:

  • 生產者將數據放到消息隊列中,消息隊列有數據了,主動叫消費者去拿(俗稱push)
  • 消費者不斷去輪訓消息隊列,看看有沒有新的數據,如果有就消費(俗稱pull)

3.4其他

除了這些,我們在使用的時候還得考慮各種的問題:

  • 消息重複消費了怎麼辦啊?
  • 我想保證消息是絕對有順序的怎麼做?
  • ……..

雖然消息隊列給我們帶來了那麼多的好處,但同時我們發現引入消息隊列也會提高系統的複雜性。市面上現在已經有不少消息隊列輪子了,每種消息隊列都有自己的特點,選取哪種MQ還得好好斟酌

最後

本文主要講解了什麼是消息隊列,消息隊列可以為我們帶來什麼好處,以及一個消息隊列可能會涉及到哪些問題。希望給大家帶來一定的幫助。


本文來源微信公眾號:Java3y

文章來源: https://twgreatdaily.com/zh-my/XFSe4m4BMH2_cNUgMG6H.html