2020云巨頭宕機(jī)事件頻發(fā),云技術(shù)面臨新的挑戰(zhàn)
目前,云計(jì)算已被很多企業(yè)采用,但是,在此過程中也出現(xiàn)了許多問題。僅2020年一年,全球主流云計(jì)算廠商曾發(fā)生數(shù)十起宕機(jī)事故。以下是2020年規(guī)模巨大的十大宕機(jī)事件,隨著這些問題的出現(xiàn)和解決,云計(jì)算技術(shù)正面臨著新的挑戰(zhàn)和機(jī)遇。
1、3月,微軟發(fā)生兩次大規(guī)模宕機(jī)
3月3日,微軟位于美國(guó)東部的數(shù)據(jù)中心發(fā)生了服務(wù)中斷,持續(xù)六小時(shí),導(dǎo)致美國(guó)北部的客戶無法使用Azure云服務(wù)。
微軟稱,這次故障應(yīng)歸咎于冷卻系統(tǒng)故障。發(fā)生故障的樓宇自動(dòng)化控制導(dǎo)致氣流減少,隨后整個(gè)數(shù)據(jù)中心的溫度達(dá)到峰值,影響了網(wǎng)絡(luò)設(shè)備的性能,使得計(jì)算和存儲(chǔ)都無法繼續(xù)使用。
3月24日-26日,Azure Pipelines發(fā)生故障,這是DevOps團(tuán)隊(duì)使用的持續(xù)交付服務(wù),接下來的幾天,軟件開發(fā)管道遇到了嚴(yán)重的延遲,開發(fā)人員受到的影響特別大。
微軟證實(shí),由于全球疫情爆發(fā),需求激增,虛擬機(jī)容量受限使得設(shè)備重新映像的時(shí)間增加,導(dǎo)致可用代理的等待時(shí)間也隨之增加。
2、3月,Google多個(gè)云服務(wù)出現(xiàn)無法訪問
3月26日,Google多個(gè)云服務(wù)出現(xiàn)無法訪問的問題。Google用戶發(fā)Twitter稱,他們遇到了Google 500和502錯(cuò)誤代碼——500代碼代表因內(nèi)部錯(cuò)誤導(dǎo)致請(qǐng)求失??;502代碼則代表網(wǎng)關(guān)出現(xiàn)故障。
Google最終將這次故障歸咎于“基礎(chǔ)設(shè)施組件”問題。據(jù)Downdetector稱,美國(guó)東部沿海地區(qū)的Google客戶受到的影響最大。
3、4月,GitHub多次宕機(jī)
微軟旗下的源代碼存儲(chǔ)庫GitHub在4月底發(fā)生了多次宕機(jī)。
4月21日,多個(gè)GitHub服務(wù)出現(xiàn)訪問異常,持續(xù)了一個(gè)半小時(shí)。4月22日,服務(wù)再次出現(xiàn)中斷,持續(xù)時(shí)間至少兩小時(shí)。4月23日,多個(gè)GitHub服務(wù)也遇到了各種問題的影響,持續(xù)了近三小時(shí)。軟件工程師經(jīng)常使用的API請(qǐng)求、Webhooks等服務(wù)被標(biāo)注為 '已降級(jí)'。
官方?jīng)]有提供任何原因,也沒有公布恢復(fù)過程的信息。雖然GitHub網(wǎng)站上更新了微軟試圖修復(fù)各種故障的情況,但并沒有提供任何關(guān)于問題的細(xì)節(jié),開發(fā)者們?cè)赥witter上抨擊微軟缺乏透明度。
4、6月,IBM Cloud遭遇了重大宕機(jī)故障
6月9日,IBM Cloud 遭遇了重大宕機(jī)故障,平臺(tái)上托管的多項(xiàng)服務(wù)也因此中斷,其中就包括知名科技新聞聚合網(wǎng)站 Techmeme。本次宕機(jī)事件從下午2點(diǎn)30分左右開始,并快速蔓延至全球。
IBM Cloud頁面也在故障發(fā)生期間短暫關(guān)閉,然后在下午6:30之后報(bào)告稱一系列問題已經(jīng)得以解決。
IBM網(wǎng)站解釋到,INM網(wǎng)絡(luò)運(yùn)營(yíng)團(tuán)隊(duì)調(diào)整了路由策略,處理了第三方提供商引入的問題,這次故障也得以解決。
5、8月,Zoom發(fā)生了部分中斷
8月24日,Zoom發(fā)生了部分中斷,導(dǎo)致用戶無法訪問其離線會(huì)議和在線視頻會(huì)議,本次中斷持續(xù)了3小時(shí)。Zoom并未解釋造成中斷的原因,他只是在狀態(tài)頁面上說找到并解決了問題。
6、9月,Microsoft 365和Azure出現(xiàn)故障
9月29日,Microsoft Office 365辦公軟件和Azure云產(chǎn)品出現(xiàn)故障,導(dǎo)致部分用戶服務(wù)中斷數(shù)小時(shí)。
微軟表示,故障涉及Outlook電郵服務(wù)和Teams辦公協(xié)作工具的部分用戶,其中Teams具備聊天和視頻會(huì)議功能,在新冠疫情期間其用戶增長(zhǎng)迅速。微軟表示,一些用戶無法登錄這些服務(wù),但已經(jīng)登錄上去的不受影響。
當(dāng)天,Azure云計(jì)算用戶也遭遇了與Office365套件類似的問題。Azure是微軟的大規(guī)模云計(jì)算系統(tǒng),許多企業(yè)都依靠其存儲(chǔ)和分析數(shù)據(jù)。
7、11月,亞馬遜云服務(wù)出現(xiàn)中斷
11月25日,亞馬遜云服務(wù)出現(xiàn)中斷,大量網(wǎng)站和服務(wù)受到影響。本次宕機(jī)持續(xù)約5小時(shí)。
AWS發(fā)布通知稱,處理流媒體數(shù)據(jù)的Kinesis服務(wù)出現(xiàn)問題,大量網(wǎng)站受到影響,錯(cuò)誤率上升。并且,宕機(jī)還影響了它向狀態(tài)頁發(fā)布更新的能力。
據(jù)了解,此次宕機(jī)導(dǎo)致亞馬遜智能安全子公司Ring、Roku、軟件開發(fā)商Autodesk紐約大都會(huì)運(yùn)輸署的地鐵網(wǎng)站,論壇出版集團(tuán)旗下的《芝加哥論壇報(bào)》和《巴爾的摩太陽報(bào)》等一些公司或機(jī)構(gòu)的服務(wù)受到了影響,網(wǎng)站頻頻出現(xiàn)錯(cuò)誤。
8、12月,Google Cloud全球宕機(jī)
12月14日晚間,Google服務(wù)器又一次全球宕機(jī)。這是近5個(gè)月來第3次全球宕機(jī)。
Google旗下的YouTube、Gmail、Google Drive、Google Search等服務(wù)出現(xiàn)死機(jī),用戶無法正常使用,全球多個(gè)國(guó)家及地區(qū)用戶均受到影響。
Google隨后發(fā)推文確認(rèn),由于內(nèi)部存儲(chǔ)配額問題,Google身份驗(yàn)證系統(tǒng)中斷。宕機(jī)45分后問題得以解決,現(xiàn)在所有服務(wù)都已恢復(fù)。
互聯(lián)網(wǎng)時(shí)代對(duì)系統(tǒng)的可靠性提出了更高的要求。為了妥善解決停機(jī)和計(jì)劃外的中斷問題,服務(wù)器托管提供商必須先了解此類事件的主要原因。除了人為的錯(cuò)誤之外,其他主要停機(jī)原因還包括維護(hù)措施和生命周期策略不佳,以及數(shù)據(jù)中心選址,風(fēng)險(xiǎn)緩解措施不足等。
隨著云計(jì)算技術(shù)和應(yīng)用的快速發(fā)展,云端存儲(chǔ)已經(jīng)變得越來越方便了??墒?,為了防止意外的發(fā)生,對(duì)重要數(shù)據(jù)進(jìn)行備份還是非常重要的。除此之外,由于宕機(jī)事故無法杜絕,應(yīng)該提前做好宕機(jī)應(yīng)急方案,以將事故危害降到最低。同時(shí),日常維護(hù)檢查也是必不可少的一項(xiàng):http://www.xinnet.com/cs/cs.html
聲明:免責(zé)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),也不承認(rèn)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,請(qǐng)發(fā)
送郵件至:operations@xinnet.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。本站原創(chuàng)內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)
需注明出處:新網(wǎng)idc知識(shí)百科