其他分享
首页 > 其他分享> > Vector底层实现

Vector底层实现

作者:互联网

Vector底层实现

vector的三个私有成员

:_start   记录初始位置
, _finish 记录有效字符
, _endofstoage  记录容量大小

vector会存储的类型不同,所以要用模版来定类型 

typedef T* iterator;

iterator _start;
iterator _finish;
iterator _endofstoage;

也就是T*

 

构造函数的方法很多 可以用迭代器的范围来构造

//用迭代器构造的构造函数

传过来的是它的迭代器的类型 我们也用它的类型来接收 不比加* &

 三个属性先初始化

只要根据传过来的范围来push_back()即可

push_back函数后面会实现

        //用迭代器构造的构造函数
        template <class InputIterator>
        vector(InputIterator first, InputIterator last)
            : _start(nullptr)
            , _finish(nullptr)
            , _endofstoage(nullptr)
        {
            while (first != last)
            {
                push_back(*first);
                ++first;
            }
        }

 

构造是 也可以根据n分val来构造 所以这个功能也需要提供

传过来的是n个 用size_t接收 因为n必须是>=0的  而val是根据类型 所以用模版类型接受  

有些情况下 val会不传参  那么我们就会提供他的默认构造  (注意 在C++中,内置类型也是有默认构造的)

三个属性初始话

先用reserve函数创建n个空间

在分别push_back()添加val

        //构造n个val的构造函数
        vector(size_t n, const T& val = T())
            : _start(nullptr)
            , _finish(nullptr)
            , _endofstoage(nullptr)
        {
            reserve(n);
            for (size_t i = 0; i < n; ++i)
            {
                push_back(val);
            }
        }

 

因为某些情况 第一个参数是int  第二个参数也是int 会调用到迭代器的函数 因为这两个类型更加适配,所以会出问题,所以需要再提供一个第一个参数为int的相同函数,来避免这种情况

    //构造n个val的构造函数
        //因为用int会调用到其他函数 所以为了区分 单独写出一个第一个为int
        vector(int n, const T& val = T())
            : _start(nullptr)
            , _finish(nullptr)
            , _endofstoage(nullptr)
        {
            reserve(n);
            for (int i = 0; i < n; ++i)
            {
                push_back(val);
            }
        }

 

swap函数

这个函数是用来给拷贝构造使用

交换类的三个属性成员

        //交换
        void swap(vector<T>& v)
        {
            std::swap(_start, v._start);
            std::swap(_finish, v._finish);
            std::swap(_endofstoage, v._endofstoage);
        }

 

拷贝构造

拷贝的本质是把一个有数据的拷贝给一个无数据的,只需要用这个无数据的迭代器去调用迭代器构造,给一个临时tmp,最后再用这个无数据的与临时tmp交换  即可

因为传过来的是另一个vector 所以必须用vector<T> 接收  C++传参是特别需要注意的,真的很容易乱

        //拷贝构造
        vector(const vector<T>& v)
            : _start(nullptr)
            , _finish(nullptr)
            , _endofstoage(nullptr)
        {
            vector<T> tmp(v.begin(), v.end());//复用用迭代器构造的构造函数
            swap(tmp);
        }

 

赋值重载

v1=v2  是两个vector的数据赋值 所以它的返回值必须是vector<t>  而传参数时 也必须是vector<t> 

函数本质也是交换,所以直接调用swap  这里之所以能直接调用 而不影响到v2 是因为函数是用传值传参,它是不会影响到v2本体的,(现代写法)

返回时是返回本体 (*this)

    vector<T>& operator=(vector<T> v)//赋值重载   不用引用  现代写法
        {
            swap(v);//现代写法 
            return *this;
        }

 

析构函数

判断是否为空 当不为空时才需要析构  如果为空 去析构 会崩溃

把数据释放,并且它三个属性置空

    // 资源管理
        ~vector()
        {
            if (_start)
            {
                delete[] _start;
                _start = _finish = _endofstoage = nullptr;
            }
        }

 

迭代器部分

vector的迭代器本质就是指针  根据传进来的类型  iterator就是这个类型的指针

并且迭代器分为const版本和非const版本 

所以需要提供两个版本

        //迭代器
        typedef T* iterator;
        typedef const T* const_iterator;

 

注意 end返回的是你的实际有效字符 而不是你的的空间多大

        iterator begin()
        {
            return _start;
        }

        iterator end()
        {
            return _finish;
        }

        const_iterator begin() const
        {
            return _start;
        }

        const_iterator end() const
        {
            return _finish;
        }

 

size 

你的有效字符 _finish  而_finish实际上是有效字符的下一个位置

所以需要减去初始的位置 得到它真正的有效字符

        size_t size() const
        {
            return _finish - _start;
        }

 

capacity

计算的是vector的空间大小 也就是你的记录空间大小减去初始位置

        size_t capacity() const
        {
            return _endofstoage - _start;
        }

 

【】重载

vector是支持随意访问的,所以【】的重载必不可少

返回的是vector里存储的类型  实际上就是模版类型  因为传出去也代表它需要改变 所以需要传引用

        T& operator[](size_t n)
        {
            assert(n < size());
            //return *(_start + n);
            return _start[n]; //这个也可以
        }

 

【】重载 有些地方是需要提供const版本 不允许更改的版本

        const T& operator[](size_t n) const
        {
            assert(n < size());
            //return *(_start + n);
            return _start[n]; //这个也可以
        }

 

reserve

扩容空间  但不初始化

这里需要注意扩容后的三个属性更新出现的问题  正常运行会崩溃。  问题的关键:开辟一个新空间时,他们三个的类型是指针!而不是下标,一个地址更新,去用以前的指针,去更改这个新的地址,是会崩溃的,而下标是固定位置,地址在怎么更新,下标的位置就是固定的。

 

我们需要记录原先的有效字符个数

正常比较和扩容,只是这里用memcpy函数时,出现嵌套情况时,会出现浅拷贝情况

需要用赋值 深拷贝

 

另外两个要更新时,要用预先存储好的数据来更新 详情看注释!

        void reserve(size_t n)
        {
            size_t sz = size();
            if (n > capacity())
            {
                T* tmp = new T[n];
                if (_start)  //如果_start为空时 就不需要拷贝数据了
                {
                    //memcpy(tmp, _start, size() * sizeof(T));//把_start的数据拷贝到tmp  //这样做 在嵌套时,会发生浅拷贝
                    for (size_t i = 0; i < size(); i++)//正确做法是直接赋值  在vector<vector> 这种嵌套时 是深拷贝
                    {
                        tmp[i] = _start[i];
                    }
                    delete[] _start;
                }
                _start = tmp;//更新过后 _start就不再是nullptr
            }
            //_finish = _start + size();//×  结果为空 解引用无地址 赋值会崩溃 ==_start+(_finish-_start)  这里的_finsih最后是等于空  
            //而跳出函数后 _finish解引用再赋值会崩溃 因为空地址无法赋值

            _finish = _start + sz;//√ 结果为_start有地址。解引用能赋值   ==_start+0 ==  这里先让原先的_finish-_start==0  再+上0  因为_start已经更新过了 所以需要在开头记录_size的大小 
            //而更新过的_start不是空 这时候在调用size _finish-_start就不是0了 而是其他值了
            _endofstoage = _start + n;
        }

 

resize

扩容,但会初始化数据

要扩容的大小 大于实际 空间大小(不是实际字符大小!) 时,我们先开需要大小空间即可

如果n大于实际字符大小时

我们需要在实际字符的位置后开始不断添加val(要初始化的值)

如果n小于实际字符大小

那么就把实际字符大小改为  n个  即 初始值+n

        void resize(size_t n, T val = T())
        {
            if (n > capacity())
            {
                reserve(n);
            }

            if (n > size())
            {
                while (_finish < _start + n)
                {
                    *_finish = val;
                    ++_finish;
                }
            }
            else
            {
                _finish = _start + n;
            }
        }

 

push_back()

添加字符

只要需要添加字符的函数,基本是需要检查空间是否足够的

一种情况为 实际空间为0 还未扩容时 默认给它开4个空间,如果有空间,但满时,扩二倍即可(为什么扩容二倍?没什么!因为合适 或者1.5倍,扩容其他倍数要么太小,要么太大,1.5和2的倍数是适应性最好的

扩容好后,或者空间足够时

直接在有效字符的位置添加字符 (为什么不先++?因为前面说过,实际字符的指针实际上是指向实际字符的后一位,所以你要添加,直接在实际字符指针添加即可)

最后添加好后,实际字符++ (这也是返回真实字符时,不直接返回_finish,而是返回_finish-_start

 

因为嵌套的作用,此函数在insert函数实现后,可以直接复用insert就可以了

        void push_back(const T& x)
        {
            /*if (_finish == _endofstoage)
            {
                size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
                reserve(newCapacity);
            }

            *_finish = x;
            ++_finish;*/

            insert(end(), x);
        }

 

pop_back()

此函数只需要把实际字符--即可

先判断合法性,实际字符必须大于初始值

 

因为嵌套的作用,此函数在erase函数实现后,可以直接复用erase就可以了

        void pop_back()
        {
            /*        if (_finish > _start)
                    {
                        --_finish;
                    }*/
            erase(end() - 1);
        }

 

insert

注意此函数会有迭代器失效问题!

通常此函数是不需要返回的,但因为迭代器失效问题,所以必须有返回值,因为返回的就是此指向此函数的指针 也就是T* 模版类型指针  所以用重命名的iterator即可  

pos是指向要插入的位置,这个函数都是用指针来指针,所以没办法使用下标,这也是它的失效的问题之一!

首先判断是否需要扩容

上面的reserve提到过,扩容后,_start的地址是会变的,而pos也是迭代器,它也是指向这个地址的指针,它不会跟着更新地址而变化。

所以这个pos它指向的位置,是原来_start的位置,而这个位置已经被释放了,所以再去使用这个pos时,是会崩溃的! 

所以为了防止这种情况,我们需要先记录这个pos的位置,等待_start的地址更新好后,我们要根据原先这个存储好pos的位置,在去用_start的地址,去更新新的pos位置,并且pos的位置不变。

 

然后开始移动pos后的数据 给pos位置开出空间,能让val插入

最后在pos的位置插入val

再++实际空间

最后需要放回插入后的位置

那么我们在使用是,需要用迭代器去接收,才能防止迭代器的失效,因为原先的迭代器已经失效,需要根据这个返回值,来更新迭代器。

    while (it != v1.end())
    {
        if (*it % 2 == 0)
        {
            it = v1.insert(it, 100);//因为迭代器更新数据会失效 所以要用it接收 防止失效
            ++ it;//返回的是插入的位置 再次++会再次遇到原来的位置 所以插入后 要自增++一次
        }
        ++it;
    }

 

erase

此函数存在迭代器失效的问题

正常删除即可

只是返回必须返回删除后的下一个值

使用这个函数时,也是需要迭代器用函数返回值接收,来更新迭代器

    while (it != v.end())
    {
        if ((*it) % 2 == 0)
        {
            it = v.erase(it);
        }
        else
        {
            ++it;
        }

    }

 

clear

置空功能,只需要把有效字符置为初始值即可。

        //置空
        void clear()
        {
            _finish = _start;//把有效字符改为初始
        }

 

 

接下来是源码

#pragma once
#include<iostream>
#include<assert.h>
using namespace std;

namespace moxuan
{
    template<class T>
    class vector
    {
    public:
        //迭代器
        typedef T* iterator;
        typedef const T* const_iterator;

        //默认无参构造
        vector()
            :_start(nullptr)
            , _finish(nullptr)
            , _endofstoage(nullptr)
        {}

        //用迭代器构造的构造函数
        template <class InputIterator>
        vector(InputIterator first, InputIterator last)
            : _start(nullptr)
            , _finish(nullptr)
            , _endofstoage(nullptr)
        {
            while (first != last)
            {
                push_back(*first);
                ++first;
            }
        }

        //构造n个val的构造函数
        vector(size_t n, const T& val = T())
            : _start(nullptr)
            , _finish(nullptr)
            , _endofstoage(nullptr)
        {
            reserve(n);
            for (size_t i = 0; i < n; ++i)
            {
                push_back(val);
            }
        }

        //构造n个val的构造函数
        //因为用int会调用到其他函数 所以为了区分 单独写出一个第一个为int
        vector(int n, const T& val = T())
            : _start(nullptr)
            , _finish(nullptr)
            , _endofstoage(nullptr)
        {
            reserve(n);
            for (int i = 0; i < n; ++i)
            {
                push_back(val);
            }
        }

        //交换
        void swap(vector<T>& v)
        {
            std::swap(_start, v._start);
            std::swap(_finish, v._finish);
            std::swap(_endofstoage, v._endofstoage);
        }

        //拷贝构造
        vector(const vector<T>& v)
            : _start(nullptr)
            , _finish(nullptr)
            , _endofstoage(nullptr)
        {
            vector<T> tmp(v.begin(), v.end());//复用用迭代器构造的构造函数
            swap(tmp);
        }

        vector<T>& operator=(vector<T> v)//赋值重载   不用引用  现代写法
        {
            swap(v);//现代写法 
            return *this;
        }

        // 资源管理
        ~vector()
        {
            if (_start)
            {
                delete[] _start;
                _start = _finish = _endofstoage = nullptr;
            }
        }

        iterator begin()
        {
            return _start;
        }

        iterator end()
        {
            return _finish;
        }

        const_iterator begin() const
        {
            return _start;
        }

        const_iterator end() const
        {
            return _finish;
        }

        size_t size() const
        {
            return _finish - _start;
        }

        size_t capacity() const
        {
            return _endofstoage - _start;
        }

        void reserve(size_t n)
        {
            size_t sz = size();
            if (n > capacity())
            {
                T* tmp = new T[n];
                if (_start)  //如果_start为空时 就不需要拷贝数据了
                {
                    //memcpy(tmp, _start, size() * sizeof(T));//把_start的数据拷贝到tmp  //这样做 在嵌套时,会发生浅拷贝
                    for (size_t i = 0; i < size(); i++)//正确做法是直接赋值  在vector<vector> 这种嵌套时 是深拷贝
                    {
                        tmp[i] = _start[i];
                    }
                    delete[] _start;
                }
                _start = tmp;//更新过后 _start就不再是nullptr
            }
            //_finish = _start + size();//×  结果为空 解引用无地址 赋值会崩溃 ==_start+(_finish-_start)  这里的_finsih最后是等于空  
            //而跳出函数后 _finish解引用再赋值会崩溃 因为空地址无法赋值

            _finish = _start + sz;//√ 结果为_start有地址。解引用能赋值   ==_start+0 ==  这里先让原先的_finish-_start==0  再+上0  因为_start已经更新过了 所以需要在开头记录_size的大小 
            //而更新过的_start不是空 这时候在调用size _finish-_start就不是0了 而是其他值了
            _endofstoage = _start + n;
        }

        void resize(size_t n, T val = T())
        {
            if (n > capacity())
            {
                reserve(n);
            }

            if (n > size())
            {
                while (_finish < _start + n)
                {
                    *_finish = val;
                    ++_finish;
                }
            }
            else
            {
                _finish = _start + n;
            }
        }

        void push_back(const T& x)
        {
            /*if (_finish == _endofstoage)
            {
                size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
                reserve(newCapacity);
            }

            *_finish = x;
            ++_finish;*/

            insert(end(), x);
        }

        void pop_back()
        {
            /*        if (_finish > _start)
                    {
                        --_finish;
                    }*/
            erase(end() - 1);
        }

        T& operator[](size_t n)
        {
            assert(n < size());
            //return *(_start + n);
            return _start[n]; //这个也可以
        }

        const T& operator[](size_t n) const
        {
            assert(n < size());
            //return *(_start + n);
            return _start[n]; //这个也可以
        }

        //插入 注意会有迭代器失效问题!
        iterator insert(iterator pos, const T& val)
        {
            assert(pos >= _start && pos <= _finish);
            if (_finish == _endofstoage)
            {
                size_t n = pos - _start;//因为更新start后 pos无法跟着更新 所以要记录pos的位置
                size_t newsize = capacity() == 0 ? 4 : capacity() * 2;
                reserve(newsize);
                pos = _start + n;
            }
            iterator cur = _finish - 1;
            while (cur >= pos)
            {
                *(cur + 1) = *cur;
                --cur;
            }
            *pos = val;
            ++_finish;
            return pos;
        }

        //删除
        iterator erase(iterator pos)//返回删除后的下一个位置
        {
            assert(pos >= _start && pos < _finish);
            iterator it = pos+1;
            while (it != _finish)
            {
                *(it-1) = *it;
                ++it;
            }
            --_finish;
            return pos++;//返回删除后的下一个位置
        }

        //置空
        void clear()
        {
            _finish = _start;//把有效字符改为初始
        }

    private:
        iterator _start;
        iterator _finish;
        iterator _endofstoage;
    };

 

接下来是用来测试这个vector的可行性  杨辉三角

大家可以源码拿去编译器上,然后调用这个test4函数即可

    class Solution {
    public:
        vector<vector<int>> generate(int numRows) {
            vector<vector<int>> vv;
            vv.resize(numRows);
            for (size_t i = 0; i < vv.size(); ++i)
            {
                // 杨辉三角,每行个数依次递增
                vv[i].resize(i + 1, 0);

                // 第一个和最后一个初始化成1
                vv[i][0] = 1;
                vv[i][vv[i].size() - 1] = 1;
            }

            for (size_t i = 0; i < vv.size(); ++i)
            {
                for (size_t j = 0; j < vv[i].size(); ++j)
                {
                    if (vv[i][j] == 0)
                    {
                        // 中间位置等于上一行j-1 和 j个相加
                        vv[i][j] = vv[i - 1][j - 1] + vv[i - 1][j];
                    }
                }
            }

            for (size_t i = 0; i < vv.size(); ++i)
            {
                for (size_t j = 0; j < vv[i].size(); ++j)
                {
                    cout << vv[i][j] << " ";
                }
                cout << endl;
            }
            cout << endl;

            return vv;
        }
    };

    void test4()
    {
        vector<vector<int>> ret = Solution().generate(5);

        for (size_t i = 0; i < ret.size(); ++i)
        {
            for (size_t j = 0; j < ret[i].size(); ++j)
            {
                cout << ret[i][j] << " ";
            }
            cout << endl;
        }
        cout << endl;
    }
}

 

这就是本文章的全部内容,感谢您能观看到这里,如有问题请评论或私信。感谢观看!

标签:vector,finish,const,实现,nullptr,start,Vector,底层,size
来源: https://www.cnblogs.com/LonelyMoNan/p/16647533.html