C unordered_map查找,无需构造字符串
作者:互联网
我有C代码,用于调查BIG字符串并匹配许多子字符串.我尽量避免通过编码像这样的子字符串来构造std :: strings:
char* buffer, size_t bufferSize
但是,在某个时候,我想在其中之一中查找子字符串:
std::unordered_map<std::string, Info> stringToInfo = {...
因此,为此,我去:
stringToInfo.find(std::string(buffer, bufferSize))
唯一的目的就是构造一个std :: string.
我觉得我可以通过以下方式进行优化:将unordered_map的键类型更改为某种临时字符串冒名顶替者,像这样的类……
class SubString
{
char* buffer;
size_t bufferSize;
// ...
};
…的逻辑与std :: string相同,以进行哈希和比较,但销毁后不释放其缓冲区.
所以,我的问题是:是否有办法让标准类做到这一点,还是我自己编写此类?
解决方法:
您要执行的操作称为异构查询.从C 14开始,它已被std::map::find
和std::set::find
支持(请注意函数的版本(3)和(4),这些版本在查找值类型上进行了模板化).对于无序容器而言,这更加复杂,因为需要告知它们或为所有键类型找到散列函数,这些键类型将为相同的文本产生相同的散列值.正在考虑一项有关未来标准的提案:http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2018/p0919r0.html
同时,您可以使用另一个已经支持异构查找的库,例如boost::unordered_map::find
.
如果您要坚持使用std :: unordered_map,则可以通过将std :: string成员存储在unordered_map旁边,然后将其重新分配值,然后传递该字符串来查找,从而避免创建太多的字符串临时对象.您可以将其封装在自定义容器类中.
另一种方法是编写一个自定义类以用作您的无序容器密钥:
struct CharPtrOrString
{
const char* p_;
std::string s_;
explicit CharPtrOrString(const char* p) : p_{p} { }
CharPtrOrString(std::string s) : p_{nullptr}, s_{std::move(s)} { }
bool operator==(const CharPtrOrString& x) const
{
return p_ ? x.p_ ? std::strcmp(p_, x.p_) == 0
: p_ == x.s_
: x.p_ ? s_ == x.p_
: s_ == x.s_;
}
struct Hash
{
size_t operator()(const CharPtrOrString& x) const
{
std::string_view sv{x.p_ ? x.p_ : x.s_.c_str()};
return std::hash<std::string_view>()(sv);
}
};
};
然后,您可以从std :: strings构造CharPtrOrString,以在无序容器键中使用,但是每次调用find时,都可以从const char *中廉价地构造一个.请注意,上面的operator ==必须确定您做了什么(所使用的约定是,如果指针的nullptr则使用std :: string成员),因此它将使用中的成员进行比较.哈希函数必须确保具有特定文本值的std :: string会产生与const char *相同的哈希(默认情况下,在GCC 7.3和/或Clang 6中不这样做)-我使用两者并记住一个有问题,但没有一个.
标签:unordered-map,c,c11,string 来源: https://codeday.me/bug/20191010/1888471.html