# Docker入门——理解Docker的核心概念

# 1 前言

相信不少人听过这么一句话:

人类的本质是复读机。

在软件开发领域也一样,我们总是想寻找更好地方式复制优秀的逻辑或系统。最核心的方法是抽取通用逻辑和组件,把差异化的东西接口化或配置化,达到复用的效果。如JavaBuild Once, Run Everywhere,还有Spring的强大的抽象能力。这是应用层面的复用,Docker则在系统层面作文章,让我们可以快速复制一个系统(如CentOS)或一个服务(如Kafka)。

# 2 Docker的便利与优势

利用Docker,我们可以很快的使用别人已经建立好的镜像来发布一个完整的系统或某个组件。它至少提供了以下便利:

  • 提供一致的运行环境。从同一个镜像文件创建容器,应用运行环境相同,保持开发环境、测试环境和生产环境的一致。这能减少许多因环境差异和配置差异带来的问题。测试提了Bug,开发再也不能第一时间回:是你环境没配好吧?是你不会用吧?
  • 弹性的系统。因Docker可快速启动/停止,使系统能根据请求量/数据量动态的改变运行的服务数量,以提供伸缩可变的系统服务。
  • 微服务开发。容器可以非常轻量级,而且可快速动态启停,非常适用于微服务架构。一台物理机器也能运行多个容器,不一定需要物理集群。

复制一个系统,我们可以通过增加一台物理机,或者通过虚拟机技术运行多个系统,现在有了Docker,还可以通过它来启动一个系统。与其它方式相比,Docker有以下优势:

  • 启动速度快,秒级的启动速度;

  • 性能好,近似物理机的性能,不会有过多资源损失和性能浪费;

  • 体量小,镜像可以做得更小(MB级),不像虚拟机的几GB;

  • 跨平台,能在Linux/Unix/Mac/Windows系统下运行;

  • 利于CI/CD,有成熟的技术实践;

  • 社区活跃,有大公司背书,应用广泛,镜像资源丰富。

# 3 Docker核心概念

# 3.1 镜像Image

说起镜像,不由想起当年拿着U盘捣鼓各种系统的日子。那时会找各种系统的iso文件,下载速度还特别慢,几GB的文件呢。那些iso文件,就是镜像文件。但这些镜像文件是相对于物理机系统或虚拟机技术而言的,而不是Docker的镜像文件。

对于Docker而言,镜像会被统一管理,在本地有特定的地方存放镜像,不同的系统位置不一样。一般而言,是无须自己管理镜像文件的,Docker会有效地管理和组织。列出所有镜像命令如下:

docker images
或docker image ls

Docker由镜像启动容器,就像通过iso文件安装启动系统一样。镜像是通用的,因此也是可以共享的。一般我们可以通过复用别人做好的优秀镜像来提高开发效率。我们只需要在别人镜像的基础上做定制开发即可。例如我们可拉取一个带JDKLinux镜像,然后把自己的Java应用添加上去,形成自己新的镜像。

为了提高复用率与速度,我们将镜像分层,如下图所示:

如镜像B是基于镜像A打包而成的,则镜像B比镜像A多一层。镜像B包含了镜像A的所有层级。这样做的好处是,不用管理一个大的镜像,而管理层级变化。假如本机已经下载了镜像E,则本机已经有(A, B, C, E),当需要拉取F的时候,不再需要拉取(A, B)了。这利用了Docker的缓存技术,另外,在构建新镜像时,同样也使用了缓存。

标签Tag是镜像的重要概念,一般用于标记版本号,对于同一个镜像源名,可以有多个标签,如redis:5.0.8redis:latest5.0.8latest都是标签名,默认使用latest

# 3.2 容器Container

有了镜像后,就可以创建容器了。启动一个容器,就像启动一个进程一样快速,可以通过docker run命令启动,如下:

$ docker run hello-world

Hello from Docker!
This message shows that your installation appears to be working correctly.

To generate this message, Docker took the following steps:
 1. The Docker client contacted the Docker daemon.
 2. The Docker daemon pulled the "hello-world" image from the Docker Hub.
    (amd64)
 3. The Docker daemon created a new container from that image which runs the
    executable that produces the output you are currently reading.
 4. The Docker daemon streamed that output to the Docker client, which sent it
    to your terminal.

To try something more ambitious, you can run an Ubuntu container with:
 $ docker run -it ubuntu bash

Share images, automate workflows, and more with a free Docker ID:
 https://hub.docker.com/

For more examples and ideas, visit:
 https://docs.docker.com/get-started/

容器提供了软件硬件环境,会消耗物理机资源,同时它还具有状态,相互隔离。可以从一个镜像启动多个不同的容器,如从Ubuntu镜像启动多个Ubuntu系统。可以通过命令docker ps查看当前运行的容器,已经停止的容器不会显示出来。当容器停止时,容器文件并不会消失,可以通过docker ps -a查看所有容器。

可以简单理解镜像与容器的关系:

镜像是容器的模板,是没运行没状态的文件,启动容器需要镜像。容器是运行着的、带状态的相互隔离的服务。可以由一个镜像启动多个容器,也可以从一个容器创建一个镜像,但这并不说明两者是可逆的相互转换。

# 3.3 仓库Repository

仓库很容易理解,就是存放镜像的地方。既然镜像是通用的,可以共享,那就需要一个共享的地方,仓库承担着这样一个责任。这跟mavennpm等是同样的道理。最大、最常用的仓库当然是官方仓库Docker Hub,但国内访问速度也相当感人,可以通过使用国内仓库解决这个问题,如使用阿里的仓库。这跟GitHubmaven也是何其相似。

我们可以从仓库拉取别人的镜像,也可以把自己构建的镜像推送到仓库上。

# 4 总结

本次主要讲解一下Docker的概念,实践与命令以后再一一道来。

上次更新: 2023/8/18 23:39:36