其他分享
首页 > 其他分享> > C unordered_map查找,无需构造字符串

C unordered_map查找,无需构造字符串

作者:互联网

我有C代码,用于调查BIG字符串并匹配许多子字符串.我尽量避免通过编码像这样的子字符串来构造std :: strings:

char* buffer, size_t bufferSize

但是,在某个时候,我想在其中之一中查找子字符串:

std::unordered_map<std::string, Info> stringToInfo = {...

因此,为此,我去:

stringToInfo.find(std::string(buffer, bufferSize))

唯一的目的就是构造一个std :: string.

我觉得我可以通过以下方式进行优化:将unordered_map的键类型更改为某种临时字符串冒名顶替者,像这样的类……

class SubString
{
    char* buffer;
    size_t bufferSize;

    // ...
};

…的逻辑与std :: string相同,以进行哈希和比较,但销毁后不释放其缓冲区.

所以,我的问题是:是否有办法让标准类做到这一点,还是我自己编写此类?

解决方法:

您要执行的操作称为异构查询.从C 14开始,它已被std::map::findstd::set::find支持(请注意函数的版本(3)和(4),这些版本在查找值类型上进行了模板化).对于无序容器而言,这更加复杂,因为需要告知它们或为所有键类型找到散列函数,这些键类型将为相同的文本产生相同的散列值.正在考虑一项有关未来标准的提案:http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2018/p0919r0.html

同时,您可以使用另一个已经支持异构查找的库,例如boost::unordered_map::find.

如果您要坚持使用std :: unordered_map,则可以通过将std :: string成员存储在unordered_map旁边,然后将其重新分配值,然后传递该字符串来查找,从而避免创建太多的字符串临时对象.您可以将其封装在自定义容器类中.

另一种方法是编写一个自定义类以用作您的无序容器密钥:

struct CharPtrOrString
{
    const char* p_;
    std::string s_;

    explicit CharPtrOrString(const char* p) : p_{p} { }
    CharPtrOrString(std::string s) : p_{nullptr}, s_{std::move(s)} { }

    bool operator==(const CharPtrOrString& x) const
    {
        return p_ ? x.p_ ? std::strcmp(p_, x.p_) == 0
                         : p_ == x.s_
                  : x.p_ ? s_ == x.p_
                         : s_ == x.s_;
    }

    struct Hash
    {
        size_t operator()(const CharPtrOrString& x) const
        {
            std::string_view sv{x.p_ ? x.p_ : x.s_.c_str()};
            return std::hash<std::string_view>()(sv);
        } 
    };
};

然后,您可以从std :: strings构造CharPtrOrString,以在无序容器键中使用,但是每次调用find时,都可以从const char *中廉价地构造一个.请注意,上面的operator ==必须确定您做了什么(所使用的约定是,如果指针的nullptr则使用std :: string成员),因此它将使用中的成员进行比较.哈希函数必须确保具有特定文本值的std :: string会产生与const char *相同的哈希(默认情况下,在GCC 7.3和/或Clang 6中不这样做)-我使用两者并记住一个有问题,但没有一个.

标签:unordered-map,c,c11,string
来源: https://codeday.me/bug/20191010/1888471.html