×

幫助中心

常見問題
域名類
?  域名介紹
?  注冊(cè)/續(xù)費(fèi)
?  域名管理
?  域名過戶
?  域名轉(zhuǎn)移
?  增值服務(wù)
?  域名交易
?  通用網(wǎng)址
?  產(chǎn)品更新日志
郵局類
?  產(chǎn)品簡介
?  產(chǎn)品管理
?  郵件客戶端
?  郵箱用戶操作指南
?  郵箱管理員操作指南
?  產(chǎn)品使用手冊(cè)
?  代理商控制臺(tái)操作指南
?  產(chǎn)品更新日志
云虛機(jī)類
?  購買與升級(jí)
?  FTP
?  主機(jī)管理
?  技術(shù)問題
?  數(shù)據(jù)庫
?  產(chǎn)品更新日志
ECS云主機(jī)類
?  產(chǎn)品更新日志
會(huì)員類
?  會(huì)員注冊(cè)
?  信息修改
?  忘記密碼
?  賬戶實(shí)名認(rèn)證
?  產(chǎn)品更新日志
財(cái)務(wù)類
?  后付費(fèi)計(jì)費(fèi)
?  在線支付
?  線下匯款
?  發(fā)票問題
?  匯款單招領(lǐng)
?  退款問題
?  充值業(yè)務(wù)
?  產(chǎn)品更新日志
ICP備案
?  備案問題快速咨詢通道
?  備案介紹
?  備案賬號(hào)
?  ICP備案前準(zhǔn)備內(nèi)容
?  ICP備案流程
?  ICP備案操作指導(dǎo)
?  ICP備案信息查看
?  備案合規(guī)核查要求
?  資料下載
?  公安聯(lián)網(wǎng)備案與經(jīng)營性備案
?  各地管局備案通知
?  常見問題
服務(wù)類
?  ICP備案
?  小新服務(wù)
?  產(chǎn)品更新日志
網(wǎng)站定制類
?  網(wǎng)站定制問題
?  網(wǎng)站訪問問題
新辦公類
?  常見問題
?  操作手冊(cè)下載
云推送
?  云推送常見問題
速成建站
?  網(wǎng)站訪問問題
?  網(wǎng)站使用問題
?  產(chǎn)品更新日志
SSL證書
?  SSL證書常見問題
?  產(chǎn)品更新日志
新網(wǎng)云產(chǎn)品類
?  新網(wǎng)云WEB應(yīng)用防火墻
?  新網(wǎng)云DDoS防護(hù)
?  云數(shù)據(jù)庫
?  云產(chǎn)品運(yùn)維
?  內(nèi)容分發(fā)網(wǎng)絡(luò)CDN
?  對(duì)象存儲(chǔ) S3
?  網(wǎng)絡(luò)
資料下載
新手上路

云服務(wù)器ECS Linux系統(tǒng)帶寬和CPU跑滿或跑高排查

  • 作者:新網(wǎng)
  • 文章來源:新網(wǎng)
  • 點(diǎn)擊數(shù):100
  • 更新時(shí)間:2019-02-21 17:53:13

 CPU跑滿或跑高

如果服務(wù)器上的CPU持續(xù)跑高,則會(huì)對(duì)系統(tǒng)穩(wěn)定性和業(yè)務(wù)運(yùn)行造成影響。以下對(duì)CPU占用率較高問題的排查分析做簡要說明。

使用vmstat 查看系統(tǒng)緯度的 CPU 負(fù)載   

您可以通過vmstat從系統(tǒng)維度查看CPU資源的使用情況。

用法說明:

命令:

1.  vmstat -n 1

2.  # -n 1 表示結(jié)果一秒刷新一次。

示例輸出:

圖片1.png

返回結(jié)果中的主要數(shù)據(jù)列說明:

r:表示系統(tǒng)中 CPU 等待處理的線程。由于 CPU 每次只能處理一個(gè)線程,所以,該數(shù)值越大,通常表示系統(tǒng)運(yùn)行越慢。

us:用戶模式消耗的 CPU 時(shí)間百分比。該值較高時(shí),說明用戶進(jìn)程消耗的 CPU 時(shí)間比較多,比如,如果該值長期超過 50%,則需要對(duì)程序算法或代碼等進(jìn)行優(yōu)化。

sy:內(nèi)核模式消耗的 CPU 時(shí)間百分比。

waIO 等待消耗的 CPU 時(shí)間百分比。該值較高時(shí),說明IO等待比較嚴(yán)重,這可能磁盤大量作隨機(jī)訪問造成的,也可能是磁盤性能出現(xiàn)了瓶頸。

id:處于空閑狀態(tài)的 CPU 時(shí)間百分比。如果該值持續(xù)為 0,同時(shí) sy 是 us 的兩倍,則通常說明系統(tǒng)則面臨著 CPU 資源的短缺。

使用top查看進(jìn)程緯度的CPU負(fù)載

您可以通過top從進(jìn)程緯度來查看其CPU、內(nèi)存等資源的使用情況。

用法說明:

命令:

1.  top

示例輸出:

圖片2.png

回顯說明:默認(rèn)界面上第三行會(huì)顯示當(dāng)前CPU資源的總體使用情況,下方會(huì)顯示各個(gè)進(jìn)程的資源占用情況。

可以直接在界面輸入大寫字母P,來使監(jiān)控結(jié)果按CPU使用率倒序排列,進(jìn)而定位系統(tǒng)中占用CPU較高的進(jìn)程。最后,根據(jù)系統(tǒng)日志和程序自身相關(guān)日志,對(duì)相應(yīng)進(jìn)程做進(jìn)一步排查分析,以判斷其占用過高 CPU 的原因。

操作案例

使用top直接終止CPU消耗較大的進(jìn)程

如前面所述,可以通過top命令查看系統(tǒng)的負(fù)載問題,并定位耗用較多CPU資源的進(jìn)程。

您可以直接在top運(yùn)行界面快速終止相應(yīng)的異常進(jìn)程。說明如下:

1.想要終止某個(gè)進(jìn)程,只需按下小寫的k鍵。

2.輸入想要終止的進(jìn)程PID(top輸出結(jié)果的第一列)。比如,如下圖所示,假如想要終止 PID 為 23 的進(jìn)程,輸入 23后按回車。

圖片3.png

3. 如下圖所示,操作成功后,界面會(huì)出現(xiàn)類似 Send pid 23 signal [15/sigterm] 的提示信息讓用戶進(jìn)行確認(rèn)。按回車確認(rèn)即可。

圖片4.png

CPU使用率較低但負(fù)載較高

問題描述

Linux 系統(tǒng)沒有業(yè)務(wù)程序運(yùn)行,通過 top 觀察,類似如下圖所示,CPU 很空閑,但是 load average 卻非常高,如下圖所示。

圖片5.png

處理辦法

load average 是對(duì) CPU 負(fù)載的評(píng)估,其值越高,說明其任務(wù)隊(duì)列越長,處于等待執(zhí)行的任務(wù)越多。出現(xiàn)此種情況時(shí),可能是由于僵死進(jìn)程導(dǎo)致的。可以通過指令 ps -axjf 查看是否存在 D 狀態(tài)進(jìn)程。

D 狀態(tài)是指不可中斷的睡眠狀態(tài)。該狀態(tài)的進(jìn)程無法被 kill,也無法自行退出。只能通過恢復(fù)其依賴的資源或者重啟系統(tǒng)來解決。

圖片6.png

 

kswapd0 進(jìn)程占用 CPU 較高

操作系統(tǒng)都用分頁機(jī)制來管理物理內(nèi)存,操作系統(tǒng)將磁盤的一部分劃出來作為虛擬內(nèi)存,由于內(nèi)存的速度要比磁盤快得多,所以操作系統(tǒng)要按照某種換頁機(jī)制將不需要的頁面換到磁盤中,將需要的頁面調(diào)到內(nèi)存中,由于內(nèi)存持續(xù)不足,這個(gè)換頁動(dòng)作持續(xù)進(jìn)行,kswapd0是虛擬內(nèi)存管理中負(fù)責(zé)換頁的,當(dāng)服務(wù)器內(nèi)存不足的時(shí)候kswapd0會(huì)執(zhí)行換頁操作,這個(gè)換頁操作是十分消耗主機(jī)CPU資源的。如果通過top發(fā)現(xiàn)該進(jìn)程持續(xù)處于非睡眠狀態(tài),且運(yùn)行時(shí)間較長,可以初步判定系統(tǒng)在持續(xù)的進(jìn)行換頁操作,可以將問題轉(zhuǎn)向內(nèi)存不足的原因來排查。

問題描述

kswapd0 進(jìn)程占用了系統(tǒng)大量 CPU 資源。

處理辦法

Linux 系統(tǒng)通過分頁機(jī)制管理內(nèi)存的同時(shí),將磁盤的一部分劃出來作為虛擬內(nèi)存。而 kswapd0 是 Linux 系統(tǒng)虛擬內(nèi)存管理中負(fù)責(zé)換頁的進(jìn)程。當(dāng)系統(tǒng)內(nèi)存不足時(shí),kswapd0 會(huì)頻繁的進(jìn)行換頁操作。而由于換頁操作非常消耗 CPU 資源,所以會(huì)導(dǎo)致該進(jìn)程持續(xù)占用較高 CPU 資源

如果通過 top 等監(jiān)控發(fā)現(xiàn) kswapd0 進(jìn)程持續(xù)處于非睡眠狀態(tài),且運(yùn)行時(shí)間較長并持續(xù)占用較高 CPU 資源,則通常是由于系統(tǒng)在持續(xù)的進(jìn)行換頁操作所致。則可以通過 free 、ps 等指令進(jìn)一步查詢系統(tǒng)及系統(tǒng)內(nèi)進(jìn)程的內(nèi)存占用情況,做進(jìn)一步排查分析。

如問題還沒有解決,請(qǐng)?zhí)峤还握?qǐng)技術(shù)幫忙協(xié)助排查。

 

帶寬跑滿或跑高

對(duì)于正常進(jìn)程導(dǎo)致的帶寬跑滿或跑高的問題,需要對(duì)服務(wù)器的帶寬進(jìn)行升級(jí)。對(duì)于異常進(jìn)程,有可能是由于惡意程序問題,或者是部分 IP 惡意訪問導(dǎo)致,也可能是服務(wù)遭到了 CC 攻擊。

通常情況下,您可以使用 iftop 工具或 nethogs 查看流量的占用情況,進(jìn)而定位到具體的進(jìn)程。

使用iftop工具排查

1.在服務(wù)器內(nèi)部安裝iftop流量監(jiān)控工具。

yum install iftop -y

圖片7.png 

2.服務(wù)器外網(wǎng)帶寬被占滿時(shí),如果通過遠(yuǎn)程無法登陸,可通過VNC登錄到服務(wù)器內(nèi)部,運(yùn)行下面命令查看流量占用情況:

iftop -i eth1 –P

注意:-P參數(shù)將會(huì)顯示請(qǐng)求端口。執(zhí)行 iftop -i eth0 –P命令,可以查看通過服務(wù)器哪個(gè)端口建立的連接,以及內(nèi)網(wǎng)流量。舉例如下:

圖片8.png

在上圖中,您可以查看到流量高耗的是服務(wù)器上 53139 端口和 115.205.150.235 地址建立的連接。

3. 執(zhí)行 netstat 命令反查 53139 端口對(duì)應(yīng)的進(jìn)程。

netstat -tunlp |grep 53139

圖片9.png

4.經(jīng)反查,服務(wù)器上 vsftpd 服務(wù)產(chǎn)生大量流量,您可以通過停止服務(wù)或使用 iptables 服務(wù)來對(duì)指定地址進(jìn)行處理,如屏蔽 IP 地址或限速,以保證服務(wù)器帶寬能夠正常使用。

使用nethogs進(jìn)行排查

1.在服務(wù)器內(nèi)部安裝nethogs流量監(jiān)控工具。

yum install nethogs -y

2.通過nethogs工具來查看網(wǎng)卡上進(jìn)程級(jí)的流量信息,若未安裝可以通過yum、apt-get等方式安裝。舉例如下:

a.  eth1 網(wǎng)卡跑滿,執(zhí)行命令 nethogs eth1。

b. 查看每個(gè)進(jìn)程的網(wǎng)絡(luò)帶寬情況以及進(jìn)程對(duì)應(yīng)的 PID。

c. 確定導(dǎo)致帶寬跑滿或跑高的具體進(jìn)程。

圖片10.png

3. 若進(jìn)程確定是惡意程序,可以通過執(zhí)行 kill -TERM <PID> 來終止程序。

說明:如果是 Web 服務(wù)程序,您可以使用 iftop 等工具來查詢具體 IP 來源,然后分析 Web 訪問日志是否為正常流量。日志分析可以使用 logwatch 或 awstats 等工具進(jìn)行。

如問題還沒有解決,請(qǐng)?zhí)峤还温?lián)系技術(shù)為您處理。

技術(shù)問題

免費(fèi)咨詢獲取折扣

Loading