日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 軟件

零拷貝并非萬能解決方案:重新定義數據傳輸的效率極限

來源: 責編: 時間:2023-09-18 21:42:11 312觀看
導讀/ PageCache 有什么作用? /在我們前面講解零拷貝的內容時,我們了解到一個重要的概念,即內核緩沖區。那么,你可能會好奇內核緩沖區到底是什么?這個專有名詞就是 PageCache,也被稱為磁盤高速緩存。也可以看下 windows 下的緩

/ PageCache 有什么作用? /

在我們前面講解零拷貝的內容時,我們了解到一個重要的概念,即內核緩沖區。那么,你可能會好奇內核緩沖區到底是什么?這個專有名詞就是 PageCache,也被稱為磁盤高速緩存。也可以看下 windows 下的緩存區:如圖所示:CYx28資訊網——每日最新資訊28at.com

圖片圖片CYx28資訊網——每日最新資訊28at.com

零拷貝進一步提升性能的原因在于 PageCache 技術的使用。接下來,我們將詳細探討 PageCache 技術是如何實現這一目標的。CYx28資訊網——每日最新資訊28at.com

讀寫磁盤相比讀寫內存的速度慢太多了,但我們可以采取一種方法來改善這個問題,即將磁盤數據部分緩存到內核中,也就是將其存儲在 PageCache 緩存區中。這個過程實際上是通過 DMA(直接內存訪問)控制器將磁盤數據拷貝到內核緩沖區中。CYx28資訊網——每日最新資訊28at.com

然而,需要注意的是,由于內存空間較磁盤空間有限,因此存在一系列算法來確保 pageCache 占用的內存空間不過大。我們在程序運行時都知道存在一種「局部性」,即剛剛被訪問的數據在短時間內很可能再次被訪問到,概率很高。因此,pageCache 被用作緩存最近訪問的數據??梢詫?pageCache 看作是 Redis,而磁盤則類似于 MySQL。此外,pageCache 還使用了內存淘汰機制,在內存空間不足時,會淘汰最近最久未被訪問的緩存。CYx28資訊網——每日最新資訊28at.com

當在項目中使用 Redis 時,你一定知道如何使用它。和 Redis 類似, PageCache 的工作原理也是一樣的。在進程需要訪問數據時,它會首先檢查 PageCache 是否已經存儲了所需的數據。如果數據已經存在于 PageCache 中,內核會直接返回數據;如果數據未被緩存,則會從磁盤讀取并將數據緩存到 PageCache 中,以備下次查詢時使用。這種方式可以有效提高訪問效率。CYx28資訊網——每日最新資訊28at.com

然而,pageCache 還具有另一個優點,即預讀功能。當訪問并讀取磁盤數據時,實際上需要定位磁盤中的位置。對于機械硬盤而言,這意味著磁頭必須旋轉到數據所在的扇區位置,然后開始順序讀取數據。然而,旋轉磁頭這種物理操作對計算機而言非常耗時。為了降低其影響,就出現了預讀功能。通過預讀功能,可以提前預讀下一扇區的數據,減少等待磁頭旋轉的時間。CYx28資訊網——每日最新資訊28at.com

比如 read 方法需要讀取 32KB 的字節的數據,使其在讀取 32KB 字節數據后,繼續讀取后面的 32-64KB,并將這一塊數據一起緩存到 pageCache 緩沖區。這樣做的好處在于,如果后續讀取需要的數據在這塊緩存中命中,那么讀取成本會大幅降低??梢灶惐扔?redis 中提前緩存一部分分布式唯一 id 用于插入數據庫時的分配操作,這樣就無需每次插入前都去獲取一遍 id。然而,一般情況下,為了避免可能出現的"毛刺"現象,我們通常會使用雙緩存機制來處理。這個雙緩存機制可以進一步優化讀取操作的效果。CYx28資訊網——每日最新資訊28at.com

因此,PageCache 的優點主要包括兩個方面:首先,它能夠將數據緩存到 PageCache 中;其次,它還利用了數據的預讀功能。這兩個操作極大地增強了讀寫磁盤時的性能。CYx28資訊網——每日最新資訊28at.com

但是,你可以想象一下如果你在傳輸大文件時比如好幾個 G 的文件,如果還是使用零拷貝技術,內核還是會把他們放入 pageCache 緩存區,那這樣不就產生問題了嗎?你也可以想一下如果你往 redis 緩存中放了一個還幾個 G 大小的 value,而且還知道緩存了也沒用,那不就相當于 redis 形同虛設了嗎?把其他熱點數據也弄沒了,所以 pageCache 也有這樣的一個問題,一是大文件搶占了 pageCache 的內存大小,這樣做會導致其他熱點數據無法存儲在 pageCache 緩沖區中,從而降低磁盤的讀寫性能。此外,由于 pageCache 無法享受到緩存的好處,還會產生一個 DMA 數據拷貝的過程。CYx28資訊網——每日最新資訊28at.com

因此,最佳的優化方法是針對大文件傳輸時不使用 pageCache,也就是不使用零拷貝技術。這是因為零拷貝技術會占用大量的內存空間,影響其他熱點數據的訪問優化。在高并發環境下,這幾乎肯定會導致嚴重的性能問題。CYx28資訊網——每日最新資訊28at.com

/ 大文件傳輸用什么方式實現? /

那針對大文件的傳輸,我們應該使用什么方式呢?CYx28資訊網——每日最新資訊28at.com

讓我們首先來觀察最初的示例。當調用 read 方法讀取文件時,進程實際上會被阻塞在 read 方法的調用處,因為它需要等待磁盤數據的返回。如下圖所示:CYx28資訊網——每日最新資訊28at.com

圖片圖片CYx28資訊網——每日最新資訊28at.com

在沒有使用零拷貝技術的情況下,我們的用戶進程使用同步 IO 的方式,它會一直阻塞等待系統調用返回數據。讓我們回顧一下之前的具體流程:CYx28資訊網——每日最新資訊28at.com

  1. 應用程序發起 read 系統調用,用戶進程開始進行阻塞等待結果返回。
  2. 此時內核會向磁盤發起 I/O 請求,磁盤收到請求后,開始尋址。當磁盤數據準備好后,就會向內核發起 I/O 中斷,告知內核磁盤數據已經準備好。
  3. 內核收到中斷信號后,將數據從磁盤控制器緩存區拷貝到 pageCache 緩沖區。
  4. 最后,內核會將 pageCache 中的數據再次拷貝到用戶緩沖區,也就是用戶態的內存中,然后 read 調用返回。

我們知道,既然有同步 IO,就一定有異步 IO 來解決阻塞的問題。異步 IO 的工作方式如下圖所示:CYx28資訊網——每日最新資訊28at.com

圖片圖片CYx28資訊網——每日最新資訊28at.com

它將讀操作分為兩個部分:CYx28資訊網——每日最新資訊28at.com

  1. 第一部分是用戶進程發起 IO 請求給內核,然后進程就不再關心該 IO 操作,而是繼續處理其他任務。
  2. 第二部分是當內核接收到中斷信號后,將數據直接拷貝到用戶緩沖區,并通知用戶進程操作成功。然后用戶進程開始處理數據。

我們發現在這個過程中,并沒有涉及到將數據拷貝到 pageCache 中,因此使用異步方式繞開了 pageCache。直接 IO 是指繞過 pageCache 的 IO 請求,而緩存 IO 是指使用 pageCache 的 IO 請求。通常,對于磁盤而言,異步 IO 只支持直接 IO。CYx28資訊網——每日最新資訊28at.com

正如前面所提到的,對于大文件的傳輸,不應該使用 PageCache,因為這可能會導致 PageCache 被大文件占據,從而使得"熱點"小文件無法充分利用 PageCache 的優勢。CYx28資訊網——每日最新資訊28at.com

因此,在高并發的場景下,對于大文件傳輸,我們應該采用"異步 I/O + 直接 I/O"的方式來代替零拷貝技術。CYx28資訊網——每日最新資訊28at.com

直接 I/O 有兩種常見的應用場景:CYx28資訊網——每日最新資訊28at.com

  1. 首先,如果應用程序已經實現了磁盤數據的緩存,就不需要再次使用 PageCache 進行緩存,這樣可以減少額外的性能損耗。例如,在 MySQL 數據庫中,可以通過參數設置來開啟直接 I/O,避免重復的緩存操作,默認情況下是不開啟的。
  2. 其次,在傳輸大文件時,由于大文件很難命中 PageCache 的緩存,而且會占滿 PageCache 導致"熱點"文件無法充分利用緩存,增加了性能開銷。因此,在這種情況下,應該使用直接 I/O 來繞過 PageCache 的緩存,以提高性能。

需要注意的是,直接 I/O 繞過了 PageCache,因此無法享受內核的兩項優化。CYx28資訊網——每日最新資訊28at.com

  1. 首先,內核的 I/O 調度算法會在 PageCache 中緩存盡可能多的 I/O 請求,然后將它們合并成一個更大的 I/O 請求發送給磁盤,以減少磁盤的尋址操作。
  2. 其次,內核會預讀后續的 I/O 請求并將其放入 PageCache 中,同樣是為了減少對磁盤的操作。這些優化在直接 I/O 中無法享受到。

于是,當我們需要傳輸大文件時,我們可以利用異步 I/O 和直接 I/O 的組合來實現無阻塞的文件讀取。這種方式可以有效避免 PageCache 的影響,提高文件傳輸的效率。CYx28資訊網——每日最新資訊28at.com

因此,在文件傳輸過程中,我們可以根據文件的大小來選擇不同的優化方式,以提高傳輸效率。對于大文件,使用異步 I/O 和直接 I/O 可以避免 PageCache 的影響;而對于小文件,則可以使用零拷貝技術來減少數據拷貝次數,提高傳輸速度。CYx28資訊網——每日最新資訊28at.com

在 Nginx 中,我們可以通過以下配置來根據文件的大小選擇不同的優化方式:CYx28資訊網——每日最新資訊28at.com

location /video/ {     sendfile on;     aio on;     directio 1024m; }

在這個配置中,我們開啟了 sendfile 選項,這允許 Nginx 使用零拷貝技術來傳輸文件。同時,我們也啟用了 aio 選項,這使得 Nginx 可以使用異步 I/O 來提高文件傳輸的效率。CYx28資訊網——每日最新資訊28at.com

而通過設置 directio 參數為 1024m,我們告訴 Nginx 當文件大小超過 1024MB 時,使用直接 I/O 來進行文件傳輸。這意味著在傳輸大文件時,Nginx 將使用異步 I/O 和直接 I/O 的組合來實現無阻塞的文件讀取,避免了 PageCache 的影響。而對于小文件,Nginx 將繼續使用零拷貝技術,以減少數據拷貝次數,提高傳輸速度。CYx28資訊網——每日最新資訊28at.com

/ 總結 /

至此,我們的計算機基礎專欄就結束了,不知道大家有沒有發現,操作系統底層提供了豐富的解決方案來支持應用程序的復雜性和可擴展性。對于任何工作中遇到的問題,我們都可以從操作系統的角度尋找解決方法。CYx28資訊網——每日最新資訊28at.com

今天這一篇其實就是來打破零拷貝的方案神話的,沒有一種技術是最好的,只有最合適的方法。我們需要根據具體的需求和情況來選擇適合的解決方案,以提高應用程序的性能和可擴展性。謝謝大家的閱讀和關注,希望這個專欄能對大家有所啟發和幫助!CYx28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-26-10483-0.html零拷貝并非萬能解決方案:重新定義數據傳輸的效率極限

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 竟然可以在一個項目中混用 Vue 和 React?

下一篇: JsonPath詳細使用教程,你了解多少?

標簽:
  • 熱門焦點
  • 對標蘋果的靈動島 華為帶來實況窗功能

    繼蘋果的靈動島之后,華為也在今天正式推出了“實況窗”功能。據今天鴻蒙OS 4.0的現場演示顯示,華為的實況窗可以更高效的展現出實時通知,比如鎖屏上就能看到外賣、打車、銀行
  • 直屏旗艦來了 iQOO 12和K70 Pro同臺競技

    旗艦機基本上使用的都是雙曲面屏幕,這就讓很多喜歡直屏的愛好者在苦等一款直屏旗艦,這次,你們等到了。據博主數碼閑聊站帶來的最新爆料稱,Redmi下代旗艦K70 Pro和iQOO 12兩款手
  • Java NIO內存映射文件:提高文件讀寫效率的優秀實踐!

    Java的NIO庫提供了內存映射文件的支持,它可以將文件映射到內存中,從而可以更快地讀取和寫入文件數據。本文將對Java內存映射文件進行詳細的介紹和演示。內存映射文件概述內存
  • 如何通過Python線程池實現異步編程?

    線程池的概念和基本原理線程池是一種并發處理機制,它可以在程序啟動時創建一組線程,并將它們置于等待任務的狀態。當任務到達時,線程池中的某個線程會被喚醒并執行任務,執行完任
  • 只需五步,使用start.spring.io快速入門Spring編程

    步驟1打開https://start.spring.io/,按照屏幕截圖中的內容創建項目,添加 Spring Web 依賴項,并單擊“生成”按鈕下載 .zip 文件,為下一步做準備。請在進入步驟2之前進行解壓。圖
  • 一文搞定Java NIO,以及各種奇葩流

    大家好,我是哪吒。很多朋友問我,如何才能學好IO流,對各種流的概念,云里霧里的,不求甚解。用到的時候,現百度,功能雖然實現了,但是為什么用這個?不知道。更別說效率問題了~下次再遇到,
  • 華為Mate60標準版細節曝光:經典星環相機模組回歸

    這段時間以來,關于華為新旗艦的爆料日漸密集。據此前多方爆料,今年華為將開始恢復一年雙旗艦戰略,除上半年推出的P60系列外,往年下半年的Mate系列也將
  • 2納米決戰2025

    集微網報道 從三強爭霸到四雄逐鹿,2nm的廝殺聲已然隱約傳來。無論是老牌勁旅臺積電、三星,還是誓言重回先進制程領先地位的英特爾,甚至初成立不久的新
  • 由于成本持續增加,筆記本產品價格預計將明顯上漲

    根據知情人士透露,由于材料、物流等成本持續增加,筆記本產品價格預計將在2021年下半年有明顯上漲。進入6月下旬以來,全球半導體芯片缺貨情況加劇,顯卡、處理器
Top 主站蜘蛛池模板: 孝昌县| 威海市| 闵行区| 西华县| 双流县| 连云港市| 如东县| 新泰市| 洪泽县| 高尔夫| 嘉义县| 朝阳县| 红原县| 安图县| 浦东新区| 佳木斯市| 黄梅县| 宜兰县| 北流市| 中山市| 甘洛县| 武定县| 徐汇区| 霍林郭勒市| 阿拉尔市| 郧西县| 雷州市| 资源县| 凌海市| 方城县| 霍邱县| 南阳市| 福州市| 铁力市| 华阴市| 修水县| 司法| 兰溪市| 昭苏县| 池州市| 舞阳县|