當前位置：首頁 > 科技 > 軟件

使用懶加載 + 零拷貝后，程序的秒開率提升至99.99%

來源：責編：時間：2024-01-15 09:22:08 222觀看

導讀一、5秒鐘加載一個頁面的真相今天在修改前端頁面的時候，發(fā)現(xiàn)程序中有一個頁面的加載速度很慢，差不多需要5秒，這其實是難以接受的，我也不知道為什么上線這么長時間了，沒人提過這個事兒。我記得有一個詞兒，叫秒開率。秒開率是

一、5秒鐘加載一個頁面的真相

今天在修改前端頁面的時候，發(fā)現(xiàn)程序中有一個頁面的加載速度很慢，差不多需要5秒，這其實是難以接受的，我也不知道為什么上線這么長時間了，沒人提過這個事兒。

我記得有一個詞兒，叫秒開率。

秒開率是指能夠在1秒內(nèi)完成頁面的加載。

查詢的時候，會訪問后臺數(shù)據(jù)庫，查詢前20條數(shù)據(jù)，按道理來說，這應該很快才對。

追蹤代碼，看看啥問題，最后發(fā)現(xiàn)問題有三：

表中有一個BLOB大字段，存儲著一個PDF模板，也就是上圖中的運費模板。
查詢后會將這個PDF模板存儲到本地磁盤。
點擊線上顯示，會讀取本地的PDF模板，通過socket傳到服務器。

大字段批量查詢、批量文件落地、讀取大文件并進行網(wǎng)絡傳輸，不慢才怪，這一頓騷操作，5秒能加載完畢，已經(jīng)燒高香了。

二、優(yōu)化四步走

1、“懶加載”

經(jīng)過調(diào)查發(fā)現(xiàn)，這個PDF模板只有在點擊運費模板按鈕時才會使用。

優(yōu)化1： 在點查詢按鈕時，不查詢PDF模板。
優(yōu)化2： 點擊運費模板時，根據(jù)uuid去查詢，這樣既能觸發(fā)索引，也不用按時間排序，只是查詢單條，速度快了很多很多，我愿稱你為“懶加載”。
優(yōu)化3： 通過異步，將文件保存到磁盤中。

2、線上顯示 = 就讀取一個文件，為什么會慢呢？

打開代碼一看，居然是通過FileReader讀取的，我了個乖乖~

這有什么問題嗎？都是從百度拷貝過來的，百度還會有錯嗎？而且也測試了，沒問題啊。

嗯，對，是沒問題，是可以實現(xiàn)需求，可是，為什么用這個？不知道。更別說效率問題了~

優(yōu)化4：通過緩沖流讀取文件。

三、先從上帝視角，了解一下啥子是IO流

Java I/O (Input/Output) 是對傳統(tǒng) I/O 操作的封裝，它是以流的形式來操作數(shù)據(jù)的。

InputStream 代表一個輸入流，它是一個抽象類，不能被實例化。InputStream 定義了一些通用方法，如 read() 和 skip() 等，用于從輸入流中讀取數(shù)據(jù)。
OutputStream 代表一個輸出流，它也是一個抽象類，不能被實例化。OutputStream 定義了一些通用方法，如 write() 和 flush() 等，用于向輸出流中寫入數(shù)據(jù)。
除了字節(jié)流，Java 還提供字符流，字符流類似于字節(jié)流，不同之處在于字符流是按字符讀寫數(shù)據(jù)，而不是按字節(jié)。Java 中最基本的字符流是 Reader 和 Writer，它們是基于 InputStream 和 OutputStream 的轉換類，用于完成字節(jié)流與字符流之間的轉換。
BufferedInputStream 和 BufferedOutputStream 是 I/O 包中提供的緩沖輸入輸出流。它們可以提高 I/O 操作的效率，具有較好的緩存機制，能夠減少磁盤操作，縮短文件傳輸時間。使用 BufferedInputStream 和 BufferedOutputStream 進行讀取和寫入時，Java 會自動調(diào)整緩沖區(qū)的大小，使其能夠適應不同的數(shù)據(jù)傳輸速度。
可以讀取或寫入 Java 對象的流，比較典型的對象流包括ObjectInputStream 和 ObjectOutputStream，將 Java 對象轉換為字節(jié)流進行傳輸或存儲。

在上一篇 《增加索引 + 異步 + 不落地后，從 12h 優(yōu)化到 15 min》中，提到了4種優(yōu)化方式，數(shù)據(jù)庫優(yōu)化、復用優(yōu)化、并行優(yōu)化、算法優(yōu)化。

其中Buffered緩沖流就屬于復用優(yōu)化的一種，這個頁面的查詢完全可以通過復用優(yōu)化優(yōu)化一下。

四、寫個栗子，測試一下

1、通過字符輸入流FileReader讀取

FileReader連readLine()方法都沒有，我也是醉了~

private static int readFileByReader(String filePath) {    int result = 0;    try (Reader reader = new FileReader(filePath)) {        int value;        while ((value = reader.read()) != -1) {            result += value;        }    } catch (Exception e) {        System.out.println("readFileByReader異常：" + e);    }    return result;}

2、通過緩沖流BufferedReader讀取

private static String readFileByBuffer(String filePath) {    StringBuilder builder = new StringBuilder();    try (BufferedReader reader = new BufferedReader(new FileReader(filePath))) {        String data = null;        while ((data = reader.readLine())!= null){            builder.append(data);        }    }catch (Exception e) {        System.out.println("readFileByReader異常：" + e);    }    return builder+"";}

通過循環(huán)模擬了150000個文件進行測試，F(xiàn)ileReader耗時8136毫秒，BufferedReader耗時6718毫秒，差不多相差1秒半的時間，差距還是相當大的，俗話說得好，水滴石穿。

同樣是read方法，只不過是包了一層，有啥不同呢？

BufferedReader 是一個緩沖字符輸入流，可以對 FileRead 進行包裝，提供了一個緩存數(shù)組，將數(shù)據(jù)按照一定規(guī)則讀取到緩存區(qū)中，輸入流每次讀取文件數(shù)據(jù)時都需要將數(shù)據(jù)進行字符編碼，而 BufferedReader 的出現(xiàn)，降低了輸入流訪問數(shù)據(jù)源的次數(shù)，將一定大小的數(shù)據(jù)一次讀取到緩存區(qū)并進行字符編碼，從而提高 IO 的效率。

如果沒有緩沖，每次調(diào)用 read() 或 readLine() 都可能導致從文件中讀取字節(jié)，轉換為字符，然后返回，這可能非常低效。

就像取快遞一樣，在取快遞的時候，肯定是想一次性的取完，避免再來一趟。

FileReader就相當于一件一件的取，樂此不疲；
BufferedReader就相當于，你盡可能多的拿你的快遞，可是這也有個極限，比如你一次只能拿5件快遞，這個 5 就相當于緩沖區(qū)，效率上，提升數(shù)倍。

對 FileRead 進行包裝變成了BufferedReader緩沖字符輸入流，其實，Java IO流就是最典型的裝飾器模式，裝飾器模式通過組合替代繼承的方式在不改變原始類的情況下添加增強功能，主要解決繼承關系過于復雜的問題，之前整理過一篇裝飾器模式，這里就不論述了。

3、再點進源碼瞧瞧。

（1）FileReader.read()源碼很簡單，就是直接讀取

public int read(char cbuf[], int off, int len) throws IOException {   return in.read(cbuf, off, len);}

（2）BufferedReader.read()的源碼就較為復雜了，看一下它的核心方法fill()

private void fill() throws IOException {   int dst;    if (markedChar <= UNMARKED) {        /* No mark */        dst = 0;    } else {        /* Marked */        int delta = nextChar - markedChar;        if (delta >= readAheadLimit) {            /* Gone past read-ahead limit: Invalidate mark */            markedChar = INVALIDATED;            readAheadLimit = 0;            dst = 0;        } else {            if (readAheadLimit <= cb.length) {                /* Shuffle in the current buffer */                System.arraycopy(cb, markedChar, cb, 0, delta);                markedChar = 0;                dst = delta;            } else {                /* Reallocate buffer to accommodate read-ahead limit */                char ncb[] = new char[readAheadLimit];                System.arraycopy(cb, markedChar, ncb, 0, delta);                cb = ncb;                markedChar = 0;                dst = delta;            }            nextChar = nChars = delta;        }    }    int n;    do {        n = in.read(cb, dst, cb.length - dst);    } while (n == 0);    if (n > 0) {        nChars = dst + n;        nextChar = dst;    }}

核心方法fill()：

字符緩沖輸入流，底層有一個8192個元素的緩沖字符數(shù)組，當緩沖區(qū)的內(nèi)容讀完時，將使用 fill() 方法從硬盤中讀取數(shù)據(jù)填充緩沖數(shù)組。
字符緩沖輸出流，底層有一個8192個元素的緩沖字符數(shù)組，使用flush方法將緩沖數(shù)組中的內(nèi)容寫入到硬盤當中。
使用緩沖數(shù)組之后，程序在運行的大部分時間內(nèi)都是內(nèi)存和內(nèi)存直接的數(shù)據(jù)交互過程。內(nèi)存直接的操作效率是比較高的。并且降低了CPU通過內(nèi)存操作硬盤的次數(shù)。
關閉字符緩沖流，都會首先釋放對應的緩沖數(shù)組空間，并且關閉創(chuàng)建對應的字符輸入流和字符輸出流。

既然緩沖這么好用，為啥jdk將緩沖字符數(shù)組設置的這么小，才8192個字節(jié)？

這是一個比較折中的方案，如果緩沖區(qū)太大的話，就會增加單次讀寫的時間，同樣內(nèi)存的大小也是有限制的，不可能都讓你來干這個一件事。

很多小伙伴也肯定用過它的read(char[] cbuf)，它內(nèi)部維護了一個char數(shù)組，每次寫/讀數(shù)據(jù)時，操作的是數(shù)組，這樣可以減少IO次數(shù)。

（3）buffer四大屬性

mark：標記。
position：位置，下一個要被讀或寫的元素的索引，每次讀寫緩沖區(qū)數(shù)據(jù)時都會改變改值，為下次讀寫作準備。
limit：表示緩沖區(qū)的當前終點，不能對緩沖區(qū) 超過極限的位置進行讀寫操作。且極限是可以修改的。
capacity：容量，即可以容納的最大數(shù)據(jù)量；在緩沖區(qū)創(chuàng)建時被設定并且不能改變。

4、緩沖流：4 次上下文切換 + 4 次拷貝

傳統(tǒng) IO 執(zhí)行的話需要 4 次上下文切換（用戶態(tài) -> 內(nèi)核態(tài) -> 用戶態(tài) -> 內(nèi)核態(tài) -> 用戶態(tài)）和 4 次拷貝。

磁盤文件 DMA 拷貝到內(nèi)核緩沖區(qū)。
內(nèi)核緩沖區(qū) CPU 拷貝到用戶緩沖區(qū)。
用戶緩沖區(qū) CPU 拷貝到 Socket 緩沖區(qū)。
Socket 緩沖區(qū) DMA 拷貝到協(xié)議引擎。

五、NIO之FileChannel

NIO中比較常用的是FileChannel，主要用來對本地文件進行 IO 操作。

1、FileChannel 常見的方法有

read，從通道讀取數(shù)據(jù)并放到緩沖區(qū)中。
write，把緩沖區(qū)的數(shù)據(jù)寫到通道中。
transferFrom，從目標通道中復制數(shù)據(jù)到當前通道。
transferTo，把數(shù)據(jù)從當前通道復制給目標通道。

2、關于Buffer 和 Channel的注意事項和細節(jié)

ByteBuffer 支持類型化的put 和 get, put 放入的是什么數(shù)據(jù)類型，get就應該使用相應的數(shù)據(jù)類型來取出，否則可能有 BufferUnderflowException 異常。
可以將一個普通Buffer 轉成只讀Buffer。
NIO 還提供了 MappedByteBuffer，可以讓文件直接在內(nèi)存（堆外的內(nèi)存）中進行修改，而如何同步到文件由NIO 來完成。
NIO 還支持通過多個 Buffer (即 Buffer 數(shù)組) 完成讀寫操作，即 Scattering 和 Gathering。

3、Selector(選擇器)

Java 的 NIO，用非阻塞的 IO 方式?？梢杂靡粋€線程，處理多個的客戶端連接，就會使用到Selector(選擇器)。
Selector 能夠檢測多個注冊的通道上是否有事件發(fā)生，如果有事件發(fā)生，便獲取事件然后針對每個事件進行相應的處理。這樣就可以只用一個單線程去管理多個通道，也就是管理多個連接和請求。
只有在連接/通道真正有讀寫事件發(fā)生時，才會進行讀寫，就大大地減少了系統(tǒng)開銷，并且不必為每個連接都創(chuàng)建一個線程，不用去維護多個線程。
避免了多線程之間的上下文切換導致的開銷。

4、selector的相關方法

open();//得到一個選擇器對象。
select(long timeout);//監(jiān)控所有注冊的通道，當其中有 IO 操作可以進行時，將對應的 SelectionKey 加入到內(nèi)部集合中并返回，參數(shù)用來設置超時時間。
selectedKeys();//從內(nèi)部集合中得到所有的 SelectionKey。

六、內(nèi)存映射技術mmap

1、文件映射

傳統(tǒng)的文件I/O操作可能會變得很慢，這時候mmap就閃亮登場了。

mmap（Memory-mapped files）是一種在內(nèi)存中創(chuàng)建映射文件的機制，它可以使我們像訪問內(nèi)存一樣訪問文件，從而避免頻繁的文件I/O操作。

使用mmap的方式是在內(nèi)存中創(chuàng)建一個虛擬地址，然后將文件映射到這個虛擬地址上，這個映射的過程是由操作系統(tǒng)完成的。

實現(xiàn)映射后，進程就可以采用指針的方式讀寫操作這一段內(nèi)存，系統(tǒng)會自動回寫到對應的文件磁盤上，這樣就完成了對文件的讀取操作，而不用調(diào)用 read、write 等系統(tǒng)函數(shù)。

內(nèi)核空間對這段區(qū)域的修改也會直接反映用戶空間，從而可以實現(xiàn)不同進程間的文件共享。

2、Java中使用mmap

在 Java 中，mmap 技術主要使用了 Java NIO （New IO）庫中的 FileChannel 類，它提供了一種將文件映射到內(nèi)存的方法，稱為 MappedByteBuffer。MappedByteBuffer 是 ByteBuffer 的一個子類，它擴展了 ByteBuffer 的功能，可以直接將文件映射到內(nèi)存中。

根據(jù)文件地址創(chuàng)建了一層緩存當作索引，放在虛擬內(nèi)存中，使用時會根據(jù)的地址，直接找到磁盤中文件的位置，把數(shù)據(jù)分段load到系統(tǒng)內(nèi)存(pagecache)中。

public static String readFileByMmap(String filePath) {    File file = new File(filePath);    String ret = "";    StringBuilder builder = new StringBuilder();    try (FileChannel channel = new RandomAccessFile(file, "r").getChannel()) {        long size = channel.size();        // 創(chuàng)建一個與文件大小相同的字節(jié)數(shù)組        ByteBuffer buffer = ByteBuffer.allocate((int) size);        // 將通道上的所有數(shù)據(jù)都讀入到buffer中        while (channel.read(buffer) != -1) {}        // 切換為只讀模式        buffer.flip();        // 從buffer中獲取數(shù)據(jù)并處理        byte[] data = new byte[buffer.remaining()];        buffer.get(data);        ret = new String(data);    } catch (IOException e) {        System.out.println("readFileByMmap異常：" + e);    }    return ret;}

3、內(nèi)存映射技術mmap：4 次上下文切換 + 3 次拷貝

mmap 是一種內(nèi)存映射技術，mmap 相比于傳統(tǒng)的緩沖流來說，其實就是少了 1 次 CPU 拷貝，變成了數(shù)據(jù)共享。

雖然減少了一次拷貝，但是上下文切換的次數(shù)還是沒變。

因為存在一次CPU拷貝，因此mmap并不是嚴格意義上的零拷貝。

RocketMQ 中就是使用的 mmap 來提升磁盤文件的讀寫性能。

七、sendFile零拷貝

零拷貝將上下文切換和拷貝的次數(shù)壓縮到了極致。

1、傳統(tǒng)IO流

將磁盤中的文件拷貝到內(nèi)核空間內(nèi)存。
將內(nèi)核空間的內(nèi)容拷貝到用戶空間內(nèi)存。
用戶空間將內(nèi)容寫入到內(nèi)核空間內(nèi)存。
socket讀取內(nèi)核空間內(nèi)存，將內(nèi)容發(fā)送給第三方服務器。

2、sendFile零拷貝

在內(nèi)核的支持下，零拷貝少了一個步驟，那就是內(nèi)核緩存向用戶空間的拷貝，這樣既節(jié)省了內(nèi)存，也節(jié)省了 CPU 的調(diào)度時間，讓效率更高。

3、sendFile零拷貝：2 次上下文切換 + 2次拷貝

直接將用戶緩沖區(qū)干掉，而且沒有CPU拷貝，故得名零拷貝。

重置優(yōu)化4：通過零拷貝讀取文件

八、總結

經(jīng)過4次優(yōu)化，將頁面的加載時間控制在了1秒以內(nèi)，實打實的提升了程序的秒開率。

批量查詢時，不查詢BLOB大字段。
點擊運費查詢時，單獨查詢+觸發(fā)索引，實現(xiàn)“懶加載”。
異步存儲文件。
通過緩沖流 -> 內(nèi)存映射技術mmap -> sendFile零拷貝讀取本地文件。

通過一次頁面優(yōu)化，收獲頗豐：

通過業(yè)務優(yōu)化，將BLOB大字段進行“懶加載”。
異步存儲文件。
系統(tǒng)的學習了Java IO流，輸入輸出流、字符流、字符流、轉換流。
通過NIO的FileChannel讀取文件時，較于緩沖流性能上顯著提升。
內(nèi)存映射技術mmap 相比于傳統(tǒng)的緩沖流來說，其實就是少了 1 次內(nèi)核緩沖區(qū)到用戶緩沖區(qū)的CPU 拷貝，將其變成了數(shù)據(jù)共享。
sendFile零拷貝，舍棄了用戶空間內(nèi)存，舍棄了CUP拷貝，完美的零拷貝方案。
通過代碼實例，橫向對比了FileReader、BufferedReader、NIO之FileChannel、內(nèi)存映射技術mmap、sendFile零拷貝之間的性能差距。

本文鏈接：http://www.www897cc.com/showinfo-26-60995-0.html使用懶加載 + 零拷貝后，程序的秒開率提升至99.99%

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： WebSocket 是什么原理？為什么可以實現(xiàn)持久連接？

下一篇： Jetpack數(shù)據(jù)綁定DataBinding，你學會了嗎？

標簽：

熱門焦點

MIX Fold3包裝盒泄露新機本月登場

小米的全新折疊屏旗艦MIX Fold3將于本月發(fā)布，近日該機的真機包裝盒在網(wǎng)上泄露。從圖上來看，新的MIX Fold3包裝盒在外觀設計方面延續(xù)了之前的方案，變化不大，這也是目前小米旗艦
28個SpringBoot項目中常用注解，日常開發(fā)、求職面試不再懵圈

前言在使用SpringBoot開發(fā)中或者在求職面試中都會使用到很多注解或者問到注解相關的知識。本文主要對一些常用的注解進行了總結，同時也會舉出具體例子，供大家學習和參考。注解
如何使用JavaScript創(chuàng)建一只圖像放大鏡？

譯者 | 布加迪審校 | 重樓如果您曾經(jīng)瀏覽過購物網(wǎng)站，可能遇到過圖像放大功能。它可以讓您放大圖像的特定區(qū)域，以便瀏覽。結合這個小小的重要功能可以大大改善您網(wǎng)站的用戶體驗
從零到英雄：高并發(fā)與性能優(yōu)化的神奇之旅

作者 | 波哥審校 | 重樓作為公司的架構師或者程序員，你是否曾經(jīng)為公司的系統(tǒng)在面對高并發(fā)和性能瓶頸時感到手足無措或者焦頭爛額呢？筆者在出道那會為此是吃盡了苦頭的，不過也得
花7萬退貨退款無門：誰在縱容淘寶珠寶商家造假？

來源：極點商業(yè)作者：楊銘在淘寶購買珠寶玉石后，因為保證金不夠賠付，店鋪關閉，退貨退款難、維權無門的比比皆是。“提供相關產(chǎn)品鑒定證書，支持全國復檢，可以30天無理由退換貨。&
東方甄選單飛：有些鳥注定是關不住的

作者：彭寬鴻來源：華爾街科技眼&zwj;&zwj;&zwj;&zwj;&zwj;&zwj;&zwj;&zwj;&zwj;&zwj;東方甄選創(chuàng)始人俞敏洪帶隊的“7天甘肅行”直播活動已在近日順利收官。成立后一
認真聊聊東方甄選：如何告別低垂的果實

來源：山核桃作者：財經(jīng)無忌爆火一年后，俞敏洪和他的東方甄選依舊是頗受外界關心的“網(wǎng)紅”。7月5日至9日，為期5天的東方甄選“甘肅行”首次在自有App內(nèi)直播，
蘋果MacBook Pro 2021測試：仍不支持平滑滾動

據(jù)10月30日9to5 Mac 消息報道，蘋果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后獲得了不錯的評價，亮點包括行業(yè)領先的性能，令人印象深刻的電池續(xù)航，精美豐
由于成本持續(xù)增加，筆記本產(chǎn)品價格預計將明顯上漲

根據(jù)知情人士透露，由于材料、物流等成本持續(xù)增加，筆記本產(chǎn)品價格預計將在2021年下半年有明顯上漲。進入6月下旬以來，全球半導體芯片缺貨情況加劇，顯卡、處理器

使用懶加載 + 零拷貝后，程序的秒開率提升至99.99%

一、5秒鐘加載一個頁面的真相

二、優(yōu)化四步走

1、“懶加載”

2、線上顯示 = 就讀取一個文件，為什么會慢呢？

三、先從上帝視角，了解一下啥子是IO流

四、寫個栗子，測試一下

1、通過字符輸入流FileReader讀取

2、通過緩沖流BufferedReader讀取

3、再點進源碼瞧瞧。

（1）FileReader.read()源碼很簡單，就是直接讀取

（2）BufferedReader.read()的源碼就較為復雜了，看一下它的核心方法fill()

（3）buffer四大屬性

4、緩沖流：4 次上下文切換 + 4 次拷貝

五、NIO之FileChannel

1、FileChannel 常見的方法有

2、關于Buffer 和 Channel的注意事項和細節(jié)

3、Selector(選擇器)

4、selector的相關方法

六、內(nèi)存映射技術mmap

1、文件映射

2、Java中使用mmap

3、內(nèi)存映射技術mmap：4 次上下文切換 + 3 次拷貝

七、sendFile零拷貝

1、傳統(tǒng)IO流

2、sendFile零拷貝

3、sendFile零拷貝：2 次上下文切換 + 2次拷貝