其他分享
首页 > 其他分享> > docker容器数据管理

docker容器数据管理

作者:互联网

Docker容器数据卷

Docker中的数据可以存储在类似于虚拟机磁盘的介质中,在Docker中称为数据卷(Data Volume)。

数据卷可以用来存储Docker应用的数据,也可以用来在Docker容器间进行数据共享。

数据卷呈现给Docker容器的形式就是一个目录,支持多个容器间共享,修改也不会影响镜像。

使用Docker的数据卷,类似在系统中使用 mount 挂载一个文件系统。

原理:将容器内部的配置文件目录,挂载到宿主机指定目录下

操作Docker数据卷,需要理解以下几点:
1)一个数据卷是一个特别指定的目录,该目录利用容器的UFS文件系统可以为容器提供一些稳定的特性或者数据共享。数据卷可以在多个容器之间共享。
2)创建数据卷,只要在docker run命令后面跟上-v参数即可创建一个数据卷,当然也可以跟多个-v参数来创建多个数据卷,当创建好带有数据卷的容器后,就可以在其他容器中通过--volumes-froms参数来挂载该数据卷了,而不管该容器是否运行。也可以在Dockerfile中通过VOLUME指令来增加一个或者多个数据卷。
3)如果有一些数据想在多个容器间共享,或者想在一些临时性的容器中使用该数据,那么最好的方案就是你创建一个数据卷容器,然后从该临时性的容器中挂载该数据卷容器的数据。这样,即使删除了刚开始的第一个数据卷容器或者中间层的数据卷容器,只要有其他容器使用数据卷,数据卷都不会被删除的。
4)不能使用docker export、save、cp等命令来备份数据卷的内容,因为数据卷是存在于镜像之外的。

备份方法: 创建一个新容器,挂载数据卷容器,同时挂载一个本地目录,然后把远程数据卷容器的数据卷通过备份命令备份到映射的本地目录里面。
5)可以把一个本地主机的目录当做数据卷挂载在容器上,同样是在docker run后面跟-v参数,不过-v后面跟的不再是单独的目录了,它是[host-dir]:[container-dir]:[rw|ro]这样格式的,其中host-dir是一个绝对路径的地址,如果host-dir不存在,则docker会创建一个新的数据卷,如果host-dir存在,但是指向的是一个不存在的目录,则docker也会创建该目录,然后使用该目录做数据源。

Docker Volume数据卷可以实现:
绕过“拷贝写”系统,以达到本地磁盘IO的性能(比如运行一个容器,在容器中对数据卷修改内容,会直接改变宿主机上的数据卷中的内容,所以是本地磁盘IO的性能,而不是先在容器中写一份,最后还要将容器中的修改的内容拷贝出来进行同步。)
绕过“拷贝写”系统,有些文件不需要在docker commit打包进镜像文件。
数据卷可以在容器间共享和重用数据
数据卷可以在宿主和容器间共享数据
数据卷数据改变是直接修改的
数据卷是持续性的,直到没有容器使用它们。即便是初始的数据卷容器或中间层的数据卷容器删除了,只要还有其他的容器使用数据卷,那么里面的数据都不会丢失。

Docker数据持久化:
容器在运行期间产生的数据是不会写在镜像里面的,重新用此镜像启动新的容器就会初始化镜像,会加一个全新的读写入层来保存数据。如果想做到数据持久化,Docker提供数据卷(Data volume)或者数据容器卷来解决问题,另外还可以通过commit提交一个新的镜像来保存产生的数据。

一、创建一个数据卷

#-v在容器内创建数据卷

docker run -it --name test1 -v /var/www:/data1 centos:7 bash

ls

echo "hello" > /data1/test.txt

exit

宿主机查看

cd /var/www

cat test.txt

 

 创建一个容器作为数据卷容器

docker run -it --name test2 -v /data1 -v /data2 centos:7 bash

echo "this is data1" > /data1/test.txt #容器内创建测试文件1

echo "this is data2" > /data2/test.txt #容器内创建测试文件2

使用--volumes-from来挂载test2容器中的数据卷到新的容器

docker run -it --name test3 --volumes-from test2 centos:7 bash          #创建并进入容器

cat data1/test.txt                                                                                   #查看测试数据是否同步

cat data2/test.txt

 

 

二、容器互联

容器互联是通过容器的名称在容器间建立一条专门的网络通信隧道。

#创建源容器test01并运行

docker run -itd -P --name test01 centos:7 /bin/bash

#创建源容器test02并运行,使用--link选项指定连接容器以实现容器互联

docker run -itd -P --name test02 --link test01:mylink centos:7 /bin/bash                    #--link容器名:连接的别名

#进入test02容器,ping test01

docker exec -it test02 bash

ping test01

 

 

三、镜像创建

1.基于现有镜像创建

先启动一个镜像,在容器里做修改

docker create -it centos:7 bash

docker ps -a

docker start 4a151cf3138d bash

 

docker exec -it 4a151cf3138d

yum install net-tools -y                     # 可以在容器里面安装net-tools工具

exit

 

 如果遇到这种情况:

 

 需要

添加IPv4转发配置
vi /etc/sysctl.conf 或者 vi /usr/lib/sysctl.d/00-system.conf

添加一行配置 net.ipv4.ip_forward=1

使用 systemctl restart network 重启 network服务

使用sysctl net.ipv4.ip_forward查看是否修改成功 ,如果返回为 net.ipv4.ip_forward = 1 则表示修改成功

重启Docker容器,问题解决

将修改后的容器提交为新的镜像,需要使用该容器的ID号创建新镜像

docker commit -m "centos" -a "123" 4a151cf3138d centos:bash

#常用选项:

-m                    说明信息:

-a                     作者信息;

-p                     生成过程中停止容器的运行

docker images

 

 2.基于本地模板创建

wget http://download.openvz.org/template/precreated/debian-7.0-x86-minimal.tar.gz        #下载模板

cat debian-7.0-x86-minimal.tar.gz | docker import - debian:test                                         #导入为镜像

 

 

3.基于Dockerfile创建

联合文件系统

UnionFS(联合文件系统) : Union文件系统(UnionFS)是一种分层、轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下。AUFS、OberlayFS及Devicemapper都是一种UnionFS。

Union文件系统是Docker镜像的基础。镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。

特性:一次同时加载多个文件系统,但从外面看起来,只能看到一个文件系统,联合加载会把各层文件系统叠加起来,这样最终的文件系统会包含所有底层的文件和目录。

我们下载的时候看到的一层层的就是联合文件系统。

如下所示:

 

 镜像加载原理

Docker的镜像实际上由一层一层的文件系统组成,这种层级的文件系统就是UnionFS.

bootfs主要包含bootloader和kernel,bootloader 主要是引导加载kernel,Linux刚启动时会加载bootfs文件系统。

在Docker镜像的最底层是bootfs,这一-层与我们典型的Linux/Unix系统是一样的,包含boot加载器和内核。

当boot加载完成之 后整个内核就都在内存中了,此时内存的使用权已由bootfs转交给内核,此时系统也会卸载bootfs。

rootfs,在bootfs之上,包含的就是典型Linux系统中的/dev, /proc, /bin, /etc等标准目录和文件。rootfs 就是各种不同的操作系统发行版,比如Ubuntu, Centos等等。

我们可以理解成一开始内核里什么 都没有,操作一个命令下载debian,这时就会在内核上面加了一层基础镜像;再安装一个emacs,会在基础镜像上叠加一层image;接着再安装一个apache,又会在images.上面再叠加一层image。

最后它们看起来就像一个文件系统即容器的rootfs。在Docker的体系里把这些rootfs叫做Docker的镜像。但是,此时的每一层rootfs都是read-only的,我们此时还不能对其进行操作。

当我们创建一个容器,也就是将Docker镜像进行实例化,系统会在一层或是多层read-only的rootfs之上分配一层空的read-write的rootfs。

 

 

3)为什么Docker里的centos的大小才200M?

因为对于精简的OS,rootfs可以很小,只需要包含最基本的命令、工具和程序库就可以了,因为底层直接用宿主机的kernel,自己只需要提供rootfs就可以了。

由此可见对于不同的linux发行版,bootfs基本是一致的,rootfs会有差别,因此不同的发行版可以公用bootfs。

4)Dockerfile

Docker镜像是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数 (如匿名卷、环境变量、用户等)。

镜像不包含任何动态数据,其内容在构建之后也不会被改变。

镜像的定制实际上就是定制每一层所添加的配置、文件。

如果我们可以把每一层修改、安装、构建、操作的命令都写入一个脚本,用这个脚本来构建、定制镜像,那么镜像构建透明性的问题、体积的问题就都会解决。这个脚本就是Dockerfile.

Dockerfile是一个文本文件,其内包含了一条条的指令(Instruction),每一条指令构建一层,因此每一条指令的内容,就是描述该层应当如何构建。

有了Dockerfile,当我们需要定制自己额外的需求时,只需在Dockerfile.上添加或者修改指令,重新生成image即可,省去了敲命令的麻烦。

除了手动生成Docker镜像之外,可以使用Dockerfile自动生成镜像。Dockerfile是由 多条的指令组成的文件,其中每条指令对应Linux中的一条命令,Docker 程序将读取Dockerfile中的指令生成指定镜像。

Dockerfile结构大致分为四个部分:基础镜像信息、维护者信息、镜像操作指令和容器启动时执行指令。Dockerfile每行 支持一条指令,每条指令可携带多个参数,支持使用以“#“号开头的注释。

5)Docker镜像结构的分层

镜像不是一个单一的文件,而是有多层构成。容器其实是在镜像的最上面加了一层读写层,在运行容器里做的任何文件改动,都会写到这个读写层。如果删除了容器,也就删除了其最上面的读写层,文件改动也就丢失了。

Docker使用存储驱动管理镜像每层内容及可读写层的容器层。

(1) Dockerfile 中的每个指令都会创建一个新的镜像层;

(2)镜像层将被缓存和复用;

(3)当Dockerfile的指令修改了,复制的文件变化了,或者构建镜像时指定的变量不同了,对应的镜像层缓存就会失效;

(4) 某一层的镜像缓存失效,它之后的镜像层缓存都会失效;

(5) 镜像层是不可变的,如果在某一层中添加一个文件,然后在下一层中删除它,则镜像中依然会包含该文件,只是这个文件在Docker容器中不可见了。

四、Dockerfile操作常用的指令:

(1) FROM 镜像

指定新镜像所基于的镜像,第一条 指令必须为FROM指令,每创建一个镜像就需要一条FROM 指令

(2) MAINTAINER 名字

说明新镜像的维护人信息

(3) RUN 命令

在所基于的镜像上执行命令,并提交到新的镜像中

(4) ENTRYPOINT [“要运行的程序”,“参数1”,“参数2”]

设定容器启动时第一个运行的命令及其参数。

可以通过 使用命令docker run --entrypoint 来覆盖镜像中的ENTRYPOINT指令的内容

(5) CMD [“要运行的程序”,“参数1”,“参数2”]

上面 的是exec形式, shell形式: CMD命令 参数1 参数2

启动容器时默认执行的命令或者脚本,Dockerfile只 能有一条CMD命令。如果指定多条命令,只执行最后一条命令。

如果在docker run时指定了命令或者镜像中有ENTRYPOINT,那么cmd就会被覆盖。

CMD可以为ENTRYPOINT指令提供默认参数

(6) EXPOSE 端口号

指定新镜像加载到Docker 时要开启的端口

(7) ENV 环境变量 变量值

设置一个环境变量的值,会被后面的RUN使用

(8) ADD 源文件/目录 目标文件/目录

将源文件复制到镜像中,源文件要与Dockerfile 位于相同目录中,或者是一个URL

有如下注意事项:

1.如果源路径是个文件,且目标路径是以/结尾, 则docker会把目标路径当作一个目录,会把源文件拷贝到该目录下

如果目标路径不存在,则会自动创建目标路径

2.如果源路径是个文件,且目标路径是不是以/结尾,则docker会把目标路径当作一个文件

如果目标路径不存在,会以目标路径为名创建一“个文件,内容同源文件

如果目标文件是个存在的文件,会用源文件覆盖它,当然只是内容覆盖,文件名还是目标文件名

如果目标文件实际是个存在的目录,则会源文件拷贝到该目录下。注意, 这种情况下,最好显示的以/结尾,以避免混淆

3.如果源路径是个目录,且目标路径不存在,则docker会自动以目标路径创建一个月录,把源路径月录下的文件拷贝进来

如果目标路径是个已经存在的目录,则docker 会把源路径目录下的文件拷贝到该目录下

4.如果源文件是个归档文件(压缩文件),则docker会自动帮解压

URL"下载和解压特性不能一起使用。任何压缩文件通过URL拷贝,都不会自动解压

(9) COPY 源文件/目录 目标文件/目录

只复制本地主机.上的文件/目录复制到目标地点,源文件/目录要与Dockerfile 在相同的目录中

(10) VOLUME [“目 录"]

在容器中创建一个挂载点

(11) USER 用户名/UID

指定运行容器时的用户

(12) WORKDIR 路径

为后续的RUN、 CMD、 ENTRYPOINT指定工作目录

(13) ONBUILD 命令

• 指定所生成的镜像作为一个基础镜像时所要运行的命令

• 当在一个Dockerfile文件中加上ONBUILD指令, 该指令对利用该Dockerfile构建镜像(比如为A镜像)不会产生实质性影响

• 但是当编写一个新的Dockerfile文件来基于A镜像构建一-个镜像( 比如为B镜像)时,这时构造A镜像的Dockerfile文件中的ONBUILD指令就生效了,在构建B镜像的过程中,首先会执行ONBUILD指令指定的指令,然后才会执行其它指令

(14 ) HEALTHCHECK

健康检查

在编写Dockerfile时,有严格的格式需要遵循:

●第一行必须使用FROM指令指明所基于的镜像名称

●之后使用MAINTAINER 指令说明维护该镜像的用户信息

●然后是镜像操作相关指令,如RUN指令。每运行一条指令,都会给基础镜像添加新的一层

●最后使用CMD指令指定启动容器时要运行的命令操作

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

标签:容器,数据,数据管理,镜像,docker,Dockerfile,Docker
来源: https://www.cnblogs.com/xhx1991874414/p/16468582.html