讀取文件是在軟件開(kāi)發(fā)中遇到的最常見(jiàn)的操作之一。加載配置文件、處理文件等通常是構(gòu)建的軟件用例的一部分。
與其他編程語(yǔ)言一樣,在Rust中有多種讀取文件的方法。然而,這些方法都有其優(yōu)點(diǎn)和缺點(diǎn),理解在哪種情況下使用哪種方法是至關(guān)重要的。
在本文中,你將了解Rust最常用的讀取文件的方法。
這種方法除了處理文件和處理其內(nèi)容之外,不需要擔(dān)心任何事情。將整個(gè)文件讀入String的優(yōu)點(diǎn):
另一方面,這種方法也有它的缺點(diǎn):
下面的例子展示了如何將整個(gè)文件讀入String:
use std::fs;fn read_file_content_as_string(path: &str) -> Result<String, Box<dyn std::error::Error>> { let string_content = fs::read_to_string(path)?; Ok(string_content)}
如果不處理String內(nèi)容,但需要處理某種形式的二進(jìn)制格式,則可以將整個(gè)文件讀入字節(jié)向量。不過(guò),這個(gè)方法仍然適用于字符串內(nèi)容。你必須自己實(shí)例化它,而不是直接從方法調(diào)用中接收String。如果你不處理字符串內(nèi)容,則不需要這樣做。
這個(gè)方法的優(yōu)點(diǎn)是:
缺點(diǎn)是:
下面的例子演示了如何將整個(gè)文件讀入字節(jié)向量:
use std::fs;fn read_file_as_bytes(path: &str) -> Result<Vec<u8>, Box<dyn std::error::Error>> { let byte_content = fs::read(path)?; Ok(byte_content)}
如果將字節(jié)向量轉(zhuǎn)換為String,可以這樣做:
use std::fs;use std::str;fn read_file_as_bytes(path: &str) -> Result<String, Box<dyn std::error::Error>> { let byte_content = fs::read(path)?; let string_content = str::from_utf8(&byte_content)?; Ok(string_content.to_string())}
如上所述,如果處理大文件,一次讀取整個(gè)文件可能會(huì)導(dǎo)致問(wèn)題。在這種情況下,最好使用逐行方法處理這些文件。當(dāng)然,這主要適用于具有String內(nèi)容的文件。
Rust在其標(biāo)準(zhǔn)庫(kù)中有一個(gè)方便的結(jié)構(gòu)體,它去掉了一些較低級(jí)別的細(xì)節(jié),稱為BufReader。這種方法可以處理以下特點(diǎn)的文件:
然而,這種方法也有一些缺點(diǎn):
下面的示例展示了如何逐行讀取文件:
use std::fs::File;use std::io::{BufReader, BufRead};fn read_file_line_by_line(path: &str) -> Result<(), Box<dyn std::error::Error>> { let file = File::open(path)?; let reader = BufReader::new(file); for line in reader.lines() { match line { // line是字符串 Ok(line) => process_line(line), Err(err) => handle_error(err), } } Ok(())}
前一種方法是逐行讀取文件,而將要介紹的這種方法允許你從BufReader處理的文件中讀取單個(gè)字節(jié)。
使用這種方法你需要:
它的缺點(diǎn)包括:
下面的例子演示了如何以單個(gè)字節(jié)逐步讀取文件:
use std::fs::File;use std::io::{BufReader, Read};fn read_file_as_single_bytes(path: &str) -> Result<(), Box<dyn std::error::Error>> { let file = File::open(path)?; let reader = BufReader::new(file); for byte in reader.bytes() { match byte { // byte正好是一個(gè)字節(jié) Ok(byte) => process_byte(byte), Err(err) => handle_error(err), } } Ok(())}
如果需要更大的靈活性,可以使用BufReader從文件中讀取塊。說(shuō)實(shí)話,BufReader也在底層進(jìn)行了優(yōu)化,當(dāng)使用它的.bytes()方法時(shí),它不會(huì)單獨(dú)讀取每個(gè)字節(jié)。它以塊的形式讀取它們,然后從Iterator返回單個(gè)字節(jié)。
但是,當(dāng)你想要自己處理塊時(shí),這并沒(méi)有多大幫助。當(dāng)然,也可以在使用bytes()時(shí)手動(dòng)緩沖字節(jié)。
像其他方法一樣,以字節(jié)塊的形式讀取文件內(nèi)容既有優(yōu)點(diǎn)也有缺點(diǎn)。它的優(yōu)點(diǎn)是:
當(dāng)然,這種方法也存在一些已知的缺陷:
下面的例子展示了如何以字節(jié)塊的形式讀取文件:
use std::fs::File;use std::io::{BufReader, BufRead}const BUFFER_SIZE: usize = 512;fn read_file_in_byte_chunks(path: &str) -> Result<(), Box<dyn std::error::Error>> { let file = File::open(path)?; let mut reader = BufReader::with_capacity(BUFFER_SIZE, file); loop { let buffer = reader.fill_buf()?; let buffer_length = buffer.len(); if buffer_length == 0 { break; } do_something_with(buffer); // 沖緩沖區(qū)中消耗所有字節(jié) reader.consume(buffer_length); } Ok(())}
讀取文件是開(kāi)發(fā)軟件時(shí)常見(jiàn)的操作,本文介紹了在Rust中讀取文件(包括字符串和原始二進(jìn)制格式)的五種常用方法。所有方法都有優(yōu)點(diǎn)和缺點(diǎn),需要選擇適合你的特定情況和用例的方法。
如果是小文件并處理String內(nèi)容,將整個(gè)文件讀入String是一個(gè)很好的選擇。另一方面,如果文件變大或者根本不處理String內(nèi)容,則該方法不是最好的。
如果文件很小,并且要處理任意的原始內(nèi)容,那么將整個(gè)文件讀入字節(jié)向量是一個(gè)不錯(cuò)的選擇。但是,如果文件變大并且有內(nèi)存限制,則不能使用此功能。
如果處理String內(nèi)容并且不希望內(nèi)存增長(zhǎng)太多,那么逐行讀取文件是一個(gè)很好的選擇。如果不處理String內(nèi)容,并且文件將想要的內(nèi)容分散到多行,那么該方法就不夠用了,這需要你自己緩沖行。
以單個(gè)字節(jié)逐步讀取文件是最基本的方法之一。如果你想要靈活性和大量的控制,這是一個(gè)很好的選擇。另一方面,如果需要將多個(gè)字節(jié)合并為更有意義的內(nèi)容,可能還要自己進(jìn)行數(shù)據(jù)緩沖。
最后,以字節(jié)塊讀取文件比單獨(dú)讀取每個(gè)字節(jié)要靈活一些。它提供了對(duì)數(shù)據(jù)處理的完全控制,也可以動(dòng)態(tài)調(diào)整。但同樣,需要處理原始數(shù)據(jù),并且可能需要一些時(shí)間來(lái)微調(diào)分塊。
本文鏈接:http://www.www897cc.com/showinfo-26-70423-0.htmlRust讀取文件的五種方法,你知道哪種?
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com