標(biāo)簽:服務(wù)器,云計(jì)算,數(shù)據(jù)中心,
在過去二十年中,行業(yè)標(biāo)準(zhǔn)服務(wù)器設(shè)計(jì)取得了重大進(jìn)展,從1993年推出首款機(jī)架式服務(wù)器開始。從那時(shí)起,半導(dǎo)體制造和微處理器架構(gòu)的技術(shù)進(jìn)步推動(dòng)了服務(wù)器設(shè)計(jì)的邊界,該行業(yè)多年來一直推動(dòng)性能,功率效率和成本節(jié)省的持續(xù)改進(jìn)。按摩爾定律推動(dòng),這一進(jìn)步速度已經(jīng)成為企業(yè)信息技術(shù)從2000年代初開始增長(zhǎng)和近年來公有云崛起的基石之一。
未來,隨著行業(yè)加速從企業(yè)向云計(jì)算的轉(zhuǎn)變,正在使用全球規(guī)模的公有云服務(wù)來構(gòu)建新的解決方案,為客戶提供全新的產(chǎn)品體驗(yàn)。提供這種全球規(guī)模服務(wù)的數(shù)據(jù)中心基礎(chǔ)設(shè)施也在快速發(fā)展,硬件技術(shù)的相應(yīng)創(chuàng)新水平不同于之前在行業(yè)中所見到的。在公有云的快速增長(zhǎng)和擴(kuò)展工作負(fù)載的推動(dòng)下,我們現(xiàn)在處于計(jì)算架構(gòu)革命的臨界點(diǎn),這將徹底重新定義“服務(wù)器”的經(jīng)典概念。
新的超高速工作負(fù)載的出現(xiàn)
公有云現(xiàn)在在三個(gè)主要方面發(fā)展:企業(yè)工作負(fù)載到云遷移的基礎(chǔ)架構(gòu)即服務(wù)(IaaS),用于構(gòu)建云本機(jī)應(yīng)用程序的平臺(tái)即服務(wù)(PaaS)專為全球規(guī)模的容錯(cuò)而設(shè)計(jì),以及軟件即服務(wù)(SaaS),可提供全面的交鑰匙解決方案的云產(chǎn)品。云計(jì)算的初始需求主要由IaaS驅(qū)動(dòng),但最近PaaS和SaaS正在成為破壞性創(chuàng)新的關(guān)鍵點(diǎn),以便在各種市場(chǎng)垂直領(lǐng)域使用這些服務(wù)。如用于圖像,視頻和語音處理的機(jī)器學(xué)習(xí)算法的認(rèn)知服務(wù),用于諸如噴氣發(fā)動(dòng)機(jī)和連接汽車的商業(yè)場(chǎng)景的物聯(lián)網(wǎng)(IoT)服務(wù)。
新興的云服務(wù)與傳統(tǒng)的“遺留”IaaS應(yīng)用程序在如何利用底層硬件資源方面截然不同。這些高度并行的工作負(fù)載在數(shù)據(jù)中心的數(shù)百臺(tái)(有時(shí)甚至數(shù)千臺(tái))機(jī)器上運(yùn)行,需要大量的網(wǎng)絡(luò)帶寬和計(jì)算資源。其中一些工作負(fù)載流量大量實(shí)時(shí)數(shù)據(jù),需要在存儲(chǔ)之前立即執(zhí)行。大多數(shù)這些工作負(fù)載可以完全在服務(wù)器的輸入/輸出(I/O)中運(yùn)行,并且在很多情況下操作不能很好地映射到當(dāng)前微處理器設(shè)計(jì)的架構(gòu)。這些數(shù)據(jù)中心工作負(fù)載的另一個(gè)屬性是在大規(guī)模服務(wù)器與服務(wù)器間通信(也稱為數(shù)據(jù)中心開銷)時(shí),對(duì)于所有數(shù)據(jù)傳輸和閑置數(shù)據(jù)進(jìn)行集中操作(如壓縮和加密)所產(chǎn)生的處理開銷。
這些下一代云工作負(fù)載正在推動(dòng)對(duì)有效地托管這種分布式橫向擴(kuò)展應(yīng)用程序所需的計(jì)算架構(gòu)和硬件架構(gòu)的全面重新思考。
超越經(jīng)典的馮諾依曼瓶頸
設(shè)計(jì)高性能硬件來承載這種超高速服務(wù)需要重新評(píng)估底層計(jì)算架構(gòu)的基本原理。當(dāng)前的服務(wù)器系統(tǒng)基于馮諾依曼(Von Neumann架構(gòu)起源于1945年),并且由連接到服務(wù)器的計(jì)算,內(nèi)存和輸入/輸出(I/O)設(shè)備之間的明顯分隔來定義(見圖1)
▲
在這樣的機(jī)器中,馮諾依曼瓶頸被定義為由計(jì)算發(fā)生在哪里和存儲(chǔ)數(shù)據(jù)的“chokepoint”產(chǎn)生的對(duì)性能的限制。
▲
迄今為止,硬件行業(yè)已經(jīng)使用諸如更大的微處理器高速緩存,多線程,多核和3D封裝等技術(shù)解決了這個(gè)瓶頸。但瓶頸依然存在,并導(dǎo)致摩爾定律對(duì)晶體管的收益效率低下。最終的結(jié)果是,目前的服務(wù)器設(shè)計(jì)無法使用過去運(yùn)行良好的“一刀切”的方法有效地執(zhí)行全面的云計(jì)算工作負(fù)載。這對(duì)數(shù)據(jù)中心基礎(chǔ)設(shè)施的總體擁有成本(TCO)有重要的影響,業(yè)界勢(shì)必要將計(jì)算范式和相關(guān)的硬件設(shè)計(jì)發(fā)展到超越當(dāng)今馮?諾依曼(Von Neumann)架構(gòu)的局限。
前方的路
為了滿足這些新的計(jì)算挑戰(zhàn),硬件行業(yè)正在響應(yīng)各種各樣的架構(gòu)選擇,每個(gè)都針對(duì)特定Hyperscale工作負(fù)載的高性能執(zhí)行進(jìn)行調(diào)整。一些示例是用于加速計(jì)算和網(wǎng)絡(luò)處理的FPGA,用于機(jī)器學(xué)習(xí)的GPU和數(shù)據(jù)流引擎,用于高吞吐量模式處理的內(nèi)存處理設(shè)計(jì)和用于人工智能的神經(jīng)元計(jì)算。雖然沒有一個(gè)單一的“銀彈”體系結(jié)構(gòu)可以很好地映射到所有的工作負(fù)載,但是觀察到的趨勢(shì)是經(jīng)典的馮·諾依曼(Von Neumann)架構(gòu)與其他計(jì)算架構(gòu)的創(chuàng)新融合。
這是引領(lǐng)行業(yè)步入破壞性創(chuàng)新和大規(guī)模實(shí)驗(yàn)的新時(shí)代。創(chuàng)業(yè)公司正在獲得資助,以探索具有定制芯片設(shè)計(jì)的系統(tǒng)的突破性想法,硅供應(yīng)商正在大力投資來解決這些新工作負(fù)載并擴(kuò)大其產(chǎn)品路線圖,而大型云服務(wù)提供商(CSV)正在部署這樣的混合計(jì)算架構(gòu),以提供全新的云服務(wù),同時(shí)提高運(yùn)營利潤。這樣的趨勢(shì)已經(jīng)導(dǎo)致很多的兼并和收購,因?yàn)楝F(xiàn)有的玩家需要保持領(lǐng)先并保護(hù)其細(xì)分市場(chǎng)。隨著這種趨勢(shì)的進(jìn)展,“服務(wù)器”的經(jīng)典概念被重新定義為以前難以想象的方式。
在過去二十年中,服務(wù)器行業(yè)已經(jīng)取得了可預(yù)測(cè)的節(jié)奏,隨著摩爾法律的增長(zhǎng)而逐漸改善。隨著基于新興Hyperscale服務(wù)的云計(jì)算和垂直解決方案的增長(zhǎng),未來幾年將見證從傳統(tǒng)服務(wù)器設(shè)計(jì)到針對(duì)大規(guī)模計(jì)算優(yōu)化的創(chuàng)新型新架構(gòu)范式的根本性變化。預(yù)計(jì)這種趨勢(shì)將進(jìn)一步加速公有云服務(wù)的采用,因?yàn)橹挥写笮虲SV才能擁有規(guī)模和能力來維持有效設(shè)計(jì)和提供下一代數(shù)據(jù)中心基礎(chǔ)架構(gòu)所需的大量研發(fā)投入。我們正處于計(jì)算架構(gòu)革命的邊緣,我們現(xiàn)在所知道的“服務(wù)器”將不再存在于這個(gè)新興的超級(jí)服務(wù)領(lǐng)域。
作者:微軟Azure硬件基礎(chǔ)架構(gòu)總經(jīng)理Kushagra Vaid
|