其他分享
首页 > 其他分享> > c – 如何将二进制文件读入无符号字符的向量中

c – 如何将二进制文件读入无符号字符的向量中

作者:互联网

最近我被要求编写一个函数,将二进制文件读入std :: vector< BYTE>其中BYTE是unsigned char.我很快就找到了这样的东西:

#include <fstream>
#include <vector>
typedef unsigned char BYTE;

std::vector<BYTE> readFile(const char* filename)
{
    // open the file:
    std::streampos fileSize;
    std::ifstream file(filename, std::ios::binary);

    // get its size:
    file.seekg(0, std::ios::end);
    fileSize = file.tellg();
    file.seekg(0, std::ios::beg);

    // read the data:
    std::vector<BYTE> fileData(fileSize);
    file.read((char*) &fileData[0], fileSize);
    return fileData;
}

这似乎是不必要的复杂,并且在调用file.read时我被迫使用的char *的显式强制转换并没有让我感觉更好.

另一种选择是使用std::istreambuf_iterator

std::vector<BYTE> readFile(const char* filename)
{
    // open the file:
    std::ifstream file(filename, std::ios::binary);

    // read the data:
    return std::vector<BYTE>((std::istreambuf_iterator<char>(file)),
                              std::istreambuf_iterator<char>());
}

这很简单,但我还是要使用std :: istreambuf_iterator< char>即使我正在阅读std :: vector< unsigned char>.

最后一个看起来非常简单的选项是使用std::basic_ifstream<BYTE>,它明确地表达了“我想要一个输入文件流,我想用它来读取BYTE”:

std::vector<BYTE> readFile(const char* filename)
{
    // open the file:
    std::basic_ifstream<BYTE> file(filename, std::ios::binary);

    // read the data:
    return std::vector<BYTE>((std::istreambuf_iterator<BYTE>(file)),
                              std::istreambuf_iterator<BYTE>());
}

但我不确定basic_ifstream在这种情况下是否合适.

将二进制文件读入向量的最佳方法是什么?我也想知道“幕后”发生了什么,以及我可能遇到的问题是什么(除了流不能正常打开,可以通过简单的is_open检查来避免).

有没有什么理由让人更喜欢在这里使用std::istreambuf_iterator
(我能看到的唯一优势就是简单)

解决方法:

在测试性能时,我会包含一个测试用例:

std::vector<BYTE> readFile(const char* filename)
{
    // open the file:
    std::ifstream file(filename, std::ios::binary);

    // Stop eating new lines in binary mode!!!
    file.unsetf(std::ios::skipws);

    // get its size:
    std::streampos fileSize;

    file.seekg(0, std::ios::end);
    fileSize = file.tellg();
    file.seekg(0, std::ios::beg);

    // reserve capacity
    std::vector<BYTE> vec;
    vec.reserve(fileSize);

    // read the data:
    vec.insert(vec.begin(),
               std::istream_iterator<BYTE>(file),
               std::istream_iterator<BYTE>());

    return vec;
}

我的想法是方法1的构造函数接触向量中的元素,然后read再次触及每个元素.

方法2和方法3看起来最有希望,但可能遭受一个或多个调整大小.因此在阅读或插入之前保留的原因.

我也会测试std :: copy:

...
std::vector<byte> vec;
vec.reserve(fileSize);

std::copy(std::istream_iterator<BYTE>(file),
          std::istream_iterator<BYTE>(),
          std::back_inserter(vec));

最后,我认为最好的解决方案将避免运算符>>来自istream_iterator(来自运算符的所有开销和优点>>尝试解释二进制数据).但我不知道如何使用它可以直接将数据复制到矢量中.

最后,我使用二进制数据进行的测试显示ios :: binary没有得到尊重.因此,来自< iomanip>的noskipws的原因.

标签:c,vector,file-io,binaryfiles
来源: https://codeday.me/bug/20190923/1814881.html