Linux被廣泛用于服務(wù)器系統(tǒng),很多線上服務(wù)在上線前要做壓力測試,對發(fā)現(xiàn)的性能問題要進一步排查和開發(fā)優(yōu)化性能。
比如通過 top 、iostat 等命令找到了引起資源異常的進程后,就要進一步對該進程/線程的內(nèi)存占用、文件系統(tǒng)IO系統(tǒng)調(diào)用次數(shù)、Socket和網(wǎng)絡(luò)通訊阻塞問題等做跟蹤分析。由于此時往往更希望接近真實場景的運行方式,所以除了采用代碼斷點調(diào)試的方式外,最保真、最快速跟蹤到實際環(huán)境問題根源的就是用Linux系統(tǒng)自帶的strace軟件啟動問題軟件,獲得直接的數(shù)據(jù)實現(xiàn),故障分析、性能分析。
這是一款Linux下瑞士軍刀級別的工具,開發(fā)者、運維人員如果不熟悉,那么非常有必要繼續(xù)往下看。學會后可以事半功倍地解決工作中遇到的各類軟件開發(fā)和軟件運維問題。
統(tǒng)計異常系統(tǒng)調(diào)用耗時、系統(tǒng)調(diào)用次數(shù)過多的情況:使用strace跟蹤vs code 這個代碼編輯器的運行(軟件文件路徑為 /usr/bin/code )為例:
sudo strace -o strace.log -T -S time -k -O1ns -C -v /usr/bin/code --no-sandbox --user-data-dir /root/data
除了輸出啟動過程從哪些目錄,加載了什么動態(tài)庫,用到了什么系統(tǒng)調(diào)用(系統(tǒng)接口函數(shù)),函數(shù)調(diào)用返回值,入?yún)⒅档榷加写蛴 S捎谏厦鎱?shù)中使用了-C也就是要求打印匯總報告,所以在最后會列出vs code啟動過程中涉及到多少系統(tǒng)調(diào)用、每個系統(tǒng)調(diào)用的時間百分比、時間總計、調(diào)用次數(shù)、錯誤次數(shù)、系統(tǒng)調(diào)用的函數(shù)名。
并在最后一行列出匯總值。
假如我們的業(yè)務(wù)代碼中有個功能存在bug,過多調(diào)用了系統(tǒng)調(diào)用(次數(shù)維度),或者傳入的參數(shù)不科學導致系統(tǒng)調(diào)用執(zhí)行時間過長(時間維度),那么,通過strace 的報告我們可以馬上觀察到線索。再翻看 strace 的 -o strace.log 逐個系統(tǒng)調(diào)用跟蹤的日志記錄文件,就可以具體排查以下多方面:
最后總結(jié)下:
sudo strace -o strace.log -T -S time -k -O1ns -C -v /usr/bin/code --no-sandbox --user-data-dir /root/data
這個示例命令中參數(shù)的意思:
本文鏈接:http://www.www897cc.com/showinfo-26-51230-0.html如何快速分析軟件運行瓶頸在哪里?推薦Linux下的一個強大命令工具
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 老后端被借調(diào)去寫Java了,含淚總結(jié)的Java多線程編程基礎(chǔ)
下一篇: C語言中的柔性數(shù)組解析