本站小編為你精心準備了數(shù)據(jù)中心網(wǎng)絡技術(shù)論文參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
1數(shù)據(jù)中心網(wǎng)絡技術(shù)分析
隨著以虛擬化技術(shù)和云計算的發(fā)展和成熟,數(shù)據(jù)中心的應用數(shù)據(jù)急劇增長,數(shù)據(jù)中心與外部網(wǎng)絡之間將承載大規(guī)模的數(shù)據(jù)交流,并且數(shù)據(jù)中心流量是高動態(tài)和突發(fā)的,據(jù)AlbertGreenberg等對數(shù)據(jù)中心的流量分析[3],約80%的流量都是內(nèi)部流量[4],這就要求數(shù)據(jù)中心內(nèi)部網(wǎng)絡必須具有高性能、高穩(wěn)定性、高擴展性以及資源的高利用率。另一方面,虛擬機動態(tài)遷移技術(shù)在數(shù)據(jù)中心也得到了廣泛的應用,它可以使得邏輯服務器在網(wǎng)絡服務異常的情況下,自動將網(wǎng)絡服務動態(tài)遷移到另外一臺邏輯服務器上,并保證前后的IP和MAC地址不變,這就要求邏輯服務器遷移前后的網(wǎng)絡處于同一個二層域中。由于客戶要求虛擬機遷移的范圍越來越大,大型的數(shù)據(jù)中心甚至會在不同機房、不同地域之間動態(tài)遷移,傳統(tǒng)網(wǎng)絡的三層結(jié)構(gòu)及其使用的網(wǎng)絡技術(shù)已經(jīng)不能滿足其要求。新的數(shù)據(jù)中心要求減少網(wǎng)絡層次、實現(xiàn)網(wǎng)絡扁平化管理,數(shù)據(jù)中心的大二層網(wǎng)絡及支撐其運行的網(wǎng)絡技術(shù)隨之誕生了。傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡中二層網(wǎng)絡技術(shù)主要使用xSTP(如生成樹協(xié)議STP、多生成樹協(xié)議MSTP、快速生成樹協(xié)議RSTP等)。用戶構(gòu)建網(wǎng)絡時,為了保證其可靠性,通常會采用冗余鏈路和冗余設備,這樣避讓就會形成網(wǎng)絡環(huán)路。而同一個二層網(wǎng)絡處于同一個廣播域下,廣播報文在環(huán)路中會反復持續(xù)傳送,形成廣播風暴,瞬間即可導致端口阻塞和設備癱瘓。為了防止廣播風暴,就必須防止網(wǎng)絡環(huán)路的形成,但又要保證其可靠性,就只能將冗余設備和冗余鏈路變成備份設備和備份鏈路。即冗余的設備端口和鏈路在正常情況下被阻塞,不參與數(shù)據(jù)報文的轉(zhuǎn)發(fā),只有在當前轉(zhuǎn)發(fā)的設備、端口、鏈路出現(xiàn)故障時,冗余的設備端口和鏈路才會被激活,使網(wǎng)絡能夠恢復正常。自動控制這些功能的就是xSTP。由于基于xSTP的網(wǎng)絡具有收斂時間長、部署復雜、資源使用率低等缺點,不適合用于構(gòu)建大型的數(shù)據(jù)中心網(wǎng)絡。為了解決xSTP技術(shù)帶來的問題,一些新的、適用于大型數(shù)據(jù)中心組網(wǎng)的二層網(wǎng)絡技術(shù)正逐步被標準化并付諸實施。所謂“大二層”是指所有VLAN都可以延展到所有匯聚層、接入層交換機的VLAN結(jié)構(gòu),這與傳統(tǒng)數(shù)據(jù)中心VLAN往往終結(jié)在接入層交換機的做法不同[5]。目前,常用于數(shù)據(jù)中心的網(wǎng)絡技術(shù)主要有交換機虛擬化技術(shù)、TRILL(TransparentInterconnectionoflotsoflinks,多鏈路透明互聯(lián))技術(shù)、SPB(ShortestPathBridging,最短路徑橋接)技術(shù)及其中幾種技術(shù)的融合。
1.1交換機虛擬化技術(shù)二層網(wǎng)絡的核心是環(huán)路問題,而環(huán)路問題是隨著冗余設備和鏈路產(chǎn)生的,那么如果將相互冗余的兩臺或多臺設備、兩條或多條鏈路合并成一臺設備和一條鏈路,從邏輯上形成單設備、單鏈路的網(wǎng)絡結(jié)構(gòu),網(wǎng)絡環(huán)路也就隨之消失。尤其是交換機技術(shù)的發(fā)展,虛擬交換機從低端盒式設備到高端框式設備都已經(jīng)廣泛應用,已經(jīng)具備了相當?shù)某墒於群头€(wěn)定度。交換機虛擬技術(shù)已經(jīng)成為目前應用于數(shù)據(jù)中心網(wǎng)絡解決方案的主要技術(shù)之一。交換機虛擬化技術(shù)又分為交換機橫向虛擬化技術(shù)和交換機縱向虛擬化技術(shù)。1)交換機橫向虛擬化技術(shù)。交換機橫向虛擬化技術(shù)是將同一層次的多臺設備虛擬成1臺邏輯設備,作為1個網(wǎng)元設備進行管理配置,保證突發(fā)流量不丟包,物理/虛擬服務器在1個大二層域下,即插即用,避免部署復雜的STP,支持大容量MAC地址,消除二層網(wǎng)絡環(huán)路,提高二層鏈路利用率;實現(xiàn)跨交換機的負載均衡,交換平臺易于擴展。交換機橫向虛擬技術(shù)的代表是VSS(Cisco)、IRF(H3C)、CSS(華為)、VSU(銳捷),其特點是應用成本低,部署簡單。但這些技術(shù)都是各自廠商獨立實現(xiàn)和完成的,只能在同一廠商的相同系列產(chǎn)品之間才能實現(xiàn)虛擬化。同時,由于高端框式交換機的性能和端口密度越來越高,對虛擬交換機的技術(shù)要求也越來越高,目前交換機的虛擬化密度最高為4:1,即將4臺物理設備虛擬為1臺邏輯設備。2)交換機縱向虛擬化技術(shù)。縱向虛擬化是將下游交換機虛擬成上游交換機的端口,以達到擴展交換機端口能力并且對交換機進行集中控制管理??v向虛擬化結(jié)合傳輸技術(shù)的運用可以實現(xiàn)跨數(shù)據(jù)中心的互聯(lián),實現(xiàn)網(wǎng)絡最大化的簡化配置,其距離僅受限于所選的萬兆以太網(wǎng)光纖長度。目前,較為成熟的縱向虛擬化技術(shù)是Cisco的FEX(FabricExten-der,交換矩陣擴展器)和H3C的VCF(VerticalCon-vergedFramework,縱向融合框架)[6]。
1.2隧道技術(shù)
隧道技術(shù)實際上是數(shù)據(jù)中心網(wǎng)絡在數(shù)據(jù)平面上的虛擬化技術(shù),就是在二層以太網(wǎng)報文外面再封裝一層標識用于尋址轉(zhuǎn)發(fā)。這樣基于外層標識就可以做到多路徑負載均衡和避免環(huán)路等。當前隧道技術(shù)的代表是TRILL[7]和SPB[8],都是通過借用IS-IS[9](IntermediateSystemtoIntermediateSystemRoutingProtocol,中間系統(tǒng)到中間系統(tǒng)路由選擇協(xié)議)的計算和轉(zhuǎn)發(fā)模式來實現(xiàn)二層網(wǎng)絡的大規(guī)模擴展。這些技術(shù)的特點是可以構(gòu)建比虛擬交換機技術(shù)更大的超大規(guī)模二層網(wǎng)絡。
1.2.1TRILL技術(shù)分析TRILL是IETF為實現(xiàn)數(shù)據(jù)中心大二層擴展制定的一個標準。其核心思想是將成熟的三層路由的控制算法引入到二層交換中,對原先的二層報文重新進行隧道封裝后轉(zhuǎn)換到新的地址空間上進行轉(zhuǎn)發(fā)。封裝后的地址具有與IP類似的路由屬性,具備大規(guī)模組網(wǎng)、最短路徑轉(zhuǎn)發(fā)、等價多路徑、快速收斂、易擴展等諸多優(yōu)勢,從而規(guī)避xSTP等技術(shù)的缺陷,實現(xiàn)健壯的大規(guī)模二層網(wǎng)絡。1)TRILL協(xié)議的幾個重要概念RBridges[7、10]:路由橋(RoutingBridge,簡稱RB)。運行TRILL協(xié)議的設備均稱為RB。根據(jù)RB在TRILL網(wǎng)絡中的位置,又可將其分為IngressRB[10](報文進入TRILL網(wǎng)絡的入節(jié)點)、TransitRB[10](報文在TRILL網(wǎng)絡中經(jīng)過的中間節(jié)點)和EgressRB[10](報文離開TRILL網(wǎng)絡的出節(jié)點)。Nickname:RB在TRILL網(wǎng)絡中的地址,也是其在TRILL網(wǎng)絡中的唯一標識。Nickname由系統(tǒng)自動分配,不需配置。VLANX轉(zhuǎn)發(fā)器:對源報文封裝TRILL頭后送入TRILL網(wǎng)絡進行轉(zhuǎn)發(fā)或者將TRILL網(wǎng)絡的報文解封裝還原報文后發(fā)送給目的用戶。2)TRILL的封裝格式TRILL封裝是MAC-in-MAC方式,TRILL數(shù)據(jù)報文在原始以太網(wǎng)報文之前添加了TRILL頭和外層以太網(wǎng)頭。因此,在TRILL公共區(qū)域數(shù)據(jù)報文可以經(jīng)過傳統(tǒng)Bridge和Hub依靠外部Ethernet報頭轉(zhuǎn)發(fā)[11]。TRILL幀封裝格式及報頭格式如圖1所示。3)TRILL工作原理TRILL協(xié)議在各RB之間通過周期性通告Hello報文以建立并維持鄰居關(guān)系,在形成鄰居關(guān)系的RB之間擴散鏈路狀態(tài)包(Link-StatePacket,LSP),最終在全網(wǎng)RB上形成相同的鏈路狀態(tài)數(shù)據(jù)庫(LSDB)。各RB在LSDB的基礎(chǔ)上使用最短路徑優(yōu)先(ShortestPathFirst,SPF)算法生成從自己到其他RB的路由轉(zhuǎn)發(fā)表項,用以指導數(shù)據(jù)報文的轉(zhuǎn)發(fā)。4)TRILL轉(zhuǎn)發(fā)流程TRILL協(xié)議通過在各個RB之間相互發(fā)送Hello報文建立鄰居,通過LSP擴散方式同步LSDB,此時,網(wǎng)絡中每臺RB擁有相同的LSDB,即整網(wǎng)拓撲。然后各RB以LSDB為基礎(chǔ),利用SPF算法計算本地到全網(wǎng)所有RB之間的最短路徑以及出接口、下一跳等信息,結(jié)合LSDB中各RB的nickname信息,最終生成nickname轉(zhuǎn)發(fā)表。TRILL網(wǎng)絡接收到用戶報文時,根據(jù)報文中包含的目的MAC地址,按照不同的轉(zhuǎn)發(fā)流程進行轉(zhuǎn)發(fā):如果MAC地址為單播地址,按照單播報文轉(zhuǎn)發(fā)流程進行轉(zhuǎn)發(fā);如果MAC地址為組播或廣播地址,按照組播報文轉(zhuǎn)發(fā)流程進行轉(zhuǎn)發(fā)。單播報文的轉(zhuǎn)發(fā)過程如圖2所示。(1)當單播數(shù)據(jù)報文進入TRILL網(wǎng)絡時,IngressRB為原始以太網(wǎng)報文先打上TRILL頭,再打上外層以太網(wǎng)頭(類似于IP報文前的MAC頭),由此完成TRILL報文的封裝。(2)此后,類似于IP報文在網(wǎng)絡內(nèi)或網(wǎng)絡間的轉(zhuǎn)發(fā)過程,各RB根據(jù)TRILL頭中的EgressRBNickname將TRILL報文進行逐跳轉(zhuǎn)發(fā),直至送達EgressRB。在此過程中,外層以太網(wǎng)頭在每一跳都要被修改,而TRILL頭中只有HopCount值逐跳遞減。(3)當TRILL報文到達EgressRB后被解封裝還原成原始以太網(wǎng)報文,離開TRILL網(wǎng)絡。當組播流量進入TRILL網(wǎng)絡時,IngressRB負責選取一棵組播分發(fā)樹進行流量轉(zhuǎn)發(fā),當TRILL網(wǎng)絡中的RB設備存在不止一個下一跳時,則將組播報文復制多份,根據(jù)組播轉(zhuǎn)發(fā)表轉(zhuǎn)發(fā)到所有出接口。組播轉(zhuǎn)發(fā)流程如圖3所示。IngressRB(RB1)收到終端A發(fā)送的二層報文后,發(fā)現(xiàn)報文中攜帶的目的MAC地址是組播MAC地址,首先根據(jù)此報文所屬VLAN選定一棵組播分發(fā)樹(RB3)進行TRILL封裝,將TRILL頭部M位置1,即說明該報文為組播報文,然后根據(jù)RootRB的nickname查詢TRILL組播轉(zhuǎn)發(fā)表,獲取出端口列表進行分發(fā);TransitRB4接收到TRILL數(shù)據(jù)報文后,解析TRILL頭部,發(fā)現(xiàn)M=1即判斷該報文為組播報文,再根據(jù)Egressnickname查詢對應的組播轉(zhuǎn)發(fā)表,進行轉(zhuǎn)發(fā);RootRB接收到TRILL數(shù)據(jù)報文后,向所有出接口分發(fā)該報文;EgressRB對TRILL報文進行解封裝,獲取原始二層數(shù)據(jù)報文,然后在本地對應接口轉(zhuǎn)發(fā)出去。由于TRILL網(wǎng)絡中數(shù)據(jù)報文轉(zhuǎn)發(fā)可以實現(xiàn)等價多路徑(EqualCostMultipath,ECMP)和最短路徑(shortestpaths),因此,采用TRILL組網(wǎng)方式可以極大提高數(shù)據(jù)中心數(shù)據(jù)轉(zhuǎn)發(fā)效率,提高數(shù)據(jù)中心網(wǎng)絡吞吐量。
1.2.2SPB技術(shù)分析SPB是IEEE組織針對數(shù)據(jù)中心大規(guī)模二層網(wǎng)絡應用模型定義的一組協(xié)議(IEEE802.1aq),是多生成樹協(xié)議(MSTP)的進一步延伸,旨在構(gòu)建大型扁平的無阻塞二層網(wǎng)絡。與TRILL一樣,也使用IS-IS協(xié)議來共享交換機間的多個學習的拓撲,并迅速學習以太網(wǎng)連接中各端點之間的最短路徑,避免了使用STP帶來的收斂速度慢和部分鏈路利用效率低下的不足。相對于TRILL,SPB最大的優(yōu)勢在于能夠方便地支持VLAN擴展功能。1)SPB協(xié)議族的結(jié)構(gòu)SPB協(xié)議包括SPBV(VLANQinQ模式,Q指IEEE802.1Q)和SPBM(MacinMac模式),無論是SPBV還是SPBM,在控制平面都是基于L2IS-IS實現(xiàn)拓撲發(fā)現(xiàn)、管理。在協(xié)議的具體實現(xiàn)思路方面兩者是一致的[12]。目前主要應用的模式是SPBM。SPBM基于PBB(ProviderBackboneBridge,運營商骨干網(wǎng)橋)協(xié)議。PBB定義了二層網(wǎng)絡中的數(shù)據(jù)轉(zhuǎn)發(fā)流程,但是PBB本身沒有定義控制流程,其二層網(wǎng)絡的拓撲控制、二層環(huán)路管理必須依賴于傳統(tǒng)的STP等技術(shù)。因此,PBB需要定義一套控制流程,使其能夠有效地替代STP協(xié)議管理大規(guī)模二層網(wǎng)絡的拓撲和環(huán)路,SPBM就成為PBB的控制流程協(xié)議。SPBM+PBB構(gòu)成了完整的二層網(wǎng)絡技術(shù),其中SPBM是控制平面協(xié)議,而PBB是數(shù)據(jù)轉(zhuǎn)發(fā)層面協(xié)議。2)SPBM網(wǎng)絡結(jié)構(gòu)模型SPBM網(wǎng)絡模型與IEEE802.1ah定義的MAC-in-MAC網(wǎng)絡模型基本一致。由SPB核心網(wǎng)絡SPBN(ShortestPathBridg-ingNetwork,最短路徑橋接網(wǎng))和用戶網(wǎng)絡(Cus-tomerNetwork)兩部分組成。SPBN由BEB(Back-boneEdgeBridge,骨干網(wǎng)邊緣網(wǎng)橋)和BCB(Back-boneCoreBridge,骨干網(wǎng)核心網(wǎng)橋)設備組成,通過IS-IS協(xié)議完成最短路徑的計算,以保證SPBN無環(huán)路。用戶網(wǎng)絡是通過一臺或者多臺邊緣設備連接到SPBN網(wǎng)絡且具有獨立業(yè)務功能的二層網(wǎng)絡,主要由主機和交換設備組成。3)SPBM報文格式SPBM報文分為兩種:控制報文和數(shù)據(jù)報文??刂茍笪牟捎?02.1Q格式封裝,包括Hello、LSPDU(LinkStatePDU,鏈路狀態(tài)協(xié)議數(shù)據(jù)單元)、SNP,直接封裝在數(shù)據(jù)鏈路層的幀結(jié)構(gòu)中。數(shù)據(jù)報文采用IEEE802.1ah(MAC-in-MAC)定義的封裝格式。其格式如圖4所示。4)SPBM工作原理SPBM由SPBIS-IS協(xié)議和MAC-in-MAC協(xié)議共同完成。其中MAC-in-MAC協(xié)議為數(shù)據(jù)協(xié)議,負責數(shù)據(jù)的封裝及發(fā)送;SPBIS-IS協(xié)議為控制協(xié)議,負責計算數(shù)據(jù)的路由轉(zhuǎn)發(fā)路徑。SPBIS-IS協(xié)議在各BEB、BCB設備之間通過周期性通告Hello報文以建立并維持鄰居關(guān)系,在形成鄰居關(guān)系的設備之間擴散LSPDU,最終在SPBN中的所有設備上形成相同的LSDB。各SPBM設備在LSDB的基礎(chǔ)上使用SPF算法生成從自己到其他設備的最短路徑,其基本思路如下:首先計算任意兩節(jié)點間的最短路徑,并判斷是否存在等價路徑;如存在,則計算各條等價路徑的Key值;然后比較所有等價路徑的Key值,取最小的Key值對應的路徑作為轉(zhuǎn)發(fā)路徑。Key值計算公式為:Key=min{BridgeIDXORMASK[i-1]}其中BridgeID是交換機ID,由用戶直接配置的一個唯一的編號或名字。MASK[i]是一個標準協(xié)議中定義的數(shù)組,其大小為16。由協(xié)議為該數(shù)組指定具體數(shù)據(jù),對應16個不同的實例。當前協(xié)議中定義的數(shù)組是。5)SPBM轉(zhuǎn)發(fā)機制SPBIS-IS協(xié)議僅負責計算SPBN的最短路徑,生成對應的轉(zhuǎn)發(fā)表項。數(shù)據(jù)報文在SPBN中轉(zhuǎn)發(fā)過程如下:(1)入隧道:BEB設備從用戶網(wǎng)絡收到數(shù)據(jù)報文后,學習該報文的源MAC,并為其封裝上MAC-in-MAC頭后將該報文發(fā)送進入SPBN中。(2)隧道中轉(zhuǎn)發(fā):MAC-in-MAC報文在SPBN中傳輸時,BCB設備根據(jù)報文中B-DA,B-VLAN查找轉(zhuǎn)發(fā)表,如果無對應的轉(zhuǎn)發(fā)表則丟棄該報文;有對應的轉(zhuǎn)發(fā)表則按照轉(zhuǎn)發(fā)表進行轉(zhuǎn)發(fā)。報文在轉(zhuǎn)發(fā)過程中,中間設備不會對其源MAC進行學習。(3)出隧道:MAC-in-MAC報文到達隧道終點時,BEB會解封裝MAC-in-MAC報文還原成數(shù)據(jù)報文。BEB學習數(shù)據(jù)報文中的源MAC后,把數(shù)據(jù)報文發(fā)送到用戶網(wǎng)絡。為防止產(chǎn)生環(huán)路,數(shù)據(jù)報文在SPBN中禁止廣播發(fā)送,只支持單播、組播發(fā)送。數(shù)據(jù)報文進入隧道時BEB設備根據(jù)報文中的目的MAC來確定后續(xù)報文在SPBN中以何各方式進行傳輸:若目的MAC為廣播MAC、未知單播MAC或未知組播MAC,則封裝后的報文在SPBN中進行SPBM組播發(fā)送;若目的MAC為已知單播MAC,則封裝后的報文在SPBN中進行SPBM單播發(fā)送。SPBM組播支持兩種模式:頭端復制和核心復制,用戶可根據(jù)實際組網(wǎng)選擇不同的組播模式。SPBM單播轉(zhuǎn)發(fā)過程如圖5所示。首先用戶數(shù)據(jù)由用戶網(wǎng)絡1進入BEB1后,BEB1對報文進行封裝,寫入B-MAC、B-VLAN、I-SID等信息;然后,按照計算出的轉(zhuǎn)發(fā)路徑,路徑上的交換機按照報文中的B-MAC和B-VLAN等信息進行轉(zhuǎn)發(fā);當報文到達BEB2后,由BEB2進行解封裝,去掉報文中的B-MAC、B-VLAN、I-SID等信息,進入用戶網(wǎng)絡2。SPBM組播轉(zhuǎn)發(fā)流程SPBM的組播與傳統(tǒng)的三層網(wǎng)絡組播管理基本類似,都是基于單播管理。在單播管理形成的轉(zhuǎn)發(fā)路徑上計算組播路徑。SPBM在不同的實例中,定義不同層次的組播樹,相互獨立;每個實例中,每個節(jié)點都有以自己為根的獨立組播樹。
1.2.3TRILL與SPB技術(shù)對比(見表1)SPB是純軟件的解決方案,不需要更新轉(zhuǎn)發(fā)芯片去支持,與現(xiàn)有的MSTP兼容,但也造成了目前SPB應用中的最大困擾。由于轉(zhuǎn)發(fā)路徑靠軟件算法保障,在多路徑負載分擔時,對CPU計算能力的要求也就遠遠超過TRILL。
1.3存儲網(wǎng)絡技術(shù)-FCoE
在傳統(tǒng)的數(shù)據(jù)中心里,存儲網(wǎng)絡與數(shù)據(jù)網(wǎng)絡是各自獨立的。在大部分數(shù)據(jù)中心都部署了專門的存儲區(qū)域網(wǎng)絡(FCSAN),這種基于FC協(xié)議的SAN雖然在性能、可靠性等方面能夠充分滿足用戶的需求,但作為目前SAN的光纖通道協(xié)議FC,它的底層發(fā)展受到很大的限制,FCoE(FibreChanneloverEth-ernet,以太網(wǎng)光纖通道)可將光纖通道(FibreChan-nel,F(xiàn)C)信息封裝到以太網(wǎng)信息內(nèi),光纖通道請求和數(shù)據(jù)可以通過以太網(wǎng)絡傳輸,是專門為低延遲性、高性能、二層數(shù)據(jù)中心網(wǎng)絡所設計的網(wǎng)絡協(xié)議,是一種利用以太網(wǎng)實現(xiàn)高效塊存儲的技術(shù)。FCoE技術(shù)融合了現(xiàn)有的傳統(tǒng)局域網(wǎng)(LocalAreaNetwork,LAN)和存儲區(qū)域網(wǎng)(StorageAreaNetwork,SAN),擴展了SAN的傳輸帶寬,減少了數(shù)據(jù)中心的I/O接口,可以在高速以太網(wǎng)鏈路上同時傳輸IP和FCoE數(shù)據(jù)分組。
1.3.1FCoE協(xié)議棧FCoE保留了FC協(xié)議棧中FC-2以上的協(xié)議棧,把FC中的FC-0和FC-1用以太網(wǎng)的鏈路層取代。FC協(xié)議中,F(xiàn)C-0定義承載介質(zhì)類型,F(xiàn)C-1定義幀編解碼方式,這兩層是在FCSAN網(wǎng)絡傳輸時需要定義的方式。由于FCoE運行在以太網(wǎng)中,所以不需要這兩層處理,而是用以太網(wǎng)的鏈路層取代這兩層處理。
1.3.2FCoE報文封裝如圖6所示,F(xiàn)CoE報文是在以太幀內(nèi)增加4字節(jié)的802.1Q報頭、2字節(jié)的以太網(wǎng)類型(FCoE對應0X8906)。在普通以太網(wǎng)絡中,幀最大為1518字節(jié),但FC幀最大約大為2112字節(jié),為了保證FCoE端到端傳輸?shù)牧鲿承?,使?巨型幀"來進行數(shù)據(jù)封裝,它允許以太網(wǎng)幀在長度上最大可以達到9000字節(jié),最大的巨型幀可以實現(xiàn)在一個以太網(wǎng)幀下封裝4個光纖通道幀。但要保證巨型幀在以太網(wǎng)絡中能正常傳遞,網(wǎng)絡內(nèi)所有以太網(wǎng)交換機和終端設備必須支持一個公共的巨型幀格式。隨著FCoE技術(shù)應用的普及,除接入層交換機、服務器外,匯聚核心層交換機、存儲設備也逐漸支持FCoE接口,磁盤陣列可直接連接到數(shù)據(jù)中心交換機上,從而實現(xiàn)了數(shù)據(jù)中心內(nèi)端到端的FCoE網(wǎng)絡。
2大二層技術(shù)在數(shù)據(jù)中心的應用
通過對交換機虛擬化(VSS/IRF/CSS/VSU)、TRILL和SPB等大二層網(wǎng)絡技術(shù)的分析,各種技術(shù)都有其優(yōu)勢和適用的范圍。一個數(shù)據(jù)中心的建設也不可能只使用一種技術(shù)來實現(xiàn),通常是兩種或多種技術(shù)的融合。下面就通過IRF+TRILL技術(shù)給出一個具有較為適用的中型數(shù)據(jù)中心的基本網(wǎng)絡架構(gòu)。如圖7所示。核心層:2臺核心設備通過兩條40G鏈路連接,運用IRF虛擬化技術(shù)對核心設備橫向整合,將2臺核心物理設備虛擬成1臺邏輯設備,整合后的虛擬化設備具備跨設備鏈路聚合功能,所有鏈路都參與以太幀轉(zhuǎn)發(fā),這樣2臺核心既能負載均衡,又能實現(xiàn)“雙活”。TRILL網(wǎng)絡:又分為TRILL網(wǎng)絡核心層和TRILL網(wǎng)絡接入層。核心層RB只負責TRILL幀的高速轉(zhuǎn)發(fā),不提供主機接入。每個接入層RB通過2個萬兆端口分別接入到2臺核心層RB上,此時服務器接入交換機的上聯(lián)網(wǎng)絡帶寬就可達20G。存儲網(wǎng)絡:通過FCoE技術(shù)直接將存儲設備接入核心網(wǎng)絡的2臺核心交換機。使用FCoE技術(shù),可以突破傳統(tǒng)FC網(wǎng)絡的距離限制,將存儲網(wǎng)絡延展到任何地點,為以后的容災備份中心的建立打下基礎(chǔ)。同時融合后的數(shù)據(jù)中心只存在一個網(wǎng)絡,存儲網(wǎng)絡和以太網(wǎng)絡統(tǒng)一管理、統(tǒng)一維護,大幅減少了管理人員的工作量。通過IRF+TRILL技術(shù)以及FCoE技術(shù)部署的數(shù)據(jù)中心,具有以下幾方面的優(yōu)點:1)高可用性:虛擬化技術(shù)通過核心交換機N:1的橫向整合,既實現(xiàn)了核心設備的負載均衡,又使2臺核心保持“雙活”,保證了核心網(wǎng)絡的高可用性。2)高擴展性:服務器通過該種方式接入TRILL網(wǎng)絡可跨越交換機,不存在二層環(huán)路,使得網(wǎng)絡接入層具有良好的擴展能力。3)高效性:由于TRILL網(wǎng)絡中數(shù)據(jù)報文轉(zhuǎn)發(fā)可以實現(xiàn)ECMP和最短路徑,因此,采用TRILL技術(shù)可以極大提高數(shù)據(jù)的轉(zhuǎn)發(fā)效率,提高數(shù)據(jù)中心網(wǎng)絡吞吐量。4)更高的靈活性和可靠性:統(tǒng)一的架構(gòu)是實現(xiàn)下一代虛擬化數(shù)據(jù)中心架構(gòu)的關(guān)鍵因素,在這種架構(gòu)中,服務器、存儲和其他資源都可以動態(tài)分配,以適應變化中的工作負荷和新的應用程序,而且無需進行頻繁的物理設備變動。對于數(shù)據(jù)中心虛擬化和自動化來說,這中架構(gòu)是非常好的。
3總結(jié)
隨著數(shù)據(jù)中心應用及規(guī)模的不斷擴張,各種數(shù)據(jù)行為也在不斷發(fā)生改變,這也要求數(shù)據(jù)中心的基礎(chǔ)架構(gòu)必須適應其發(fā)展,不僅需要高密度、大容量網(wǎng)絡設備,還需要合適的技術(shù)來支撐。目前,虛擬化、TRILL、SPB、FCoE等技術(shù)會將數(shù)據(jù)中心帶向大二層網(wǎng)絡架構(gòu),數(shù)十萬臺設備都可能會在一個大二層網(wǎng)絡中。不管采用哪種新二層技術(shù),未來的數(shù)據(jù)中心網(wǎng)絡結(jié)構(gòu)必然會更為簡化、更為高效、更易于管理。
作者:胡法紅闞惠強單位:蘭州交通大學現(xiàn)代信息技術(shù)與教育中心甘肅省高等學校招生辦公室信息科