docker入门不完全指南,这玩艺儿不用则废!
简介
简单地说,docker
是一个开放平台,你可以基于它开发、迁移代码以及运行应用。
docker
提供了在独立的环境中打包(package
)和运行应用的能力,而这种松散(loosely
)独立的环境我们一般把它叫做容器(container
)。
有了容器,我们可以将我们项目所需要的环境全部一起打包,然后在另一个带有docker
的环境比如云服务器上直接安装镜像运行容器,而这个过程我们不需要再去做额外的比如环境搭建之类的。
我们的容器中已经自带了环境了。而且我们可以同时运行多个不同环境的容器,也不用担心它们之间会有环境污染,因为容器之间是相互独立的。
另外docker
和CI/CD
(continuous integration and continuous delivery
)工作流也很搭。
docker的架构
docker
使用的是client-server
的架构, 客户端也就是提供给用户api
的工具(docker compose
[3] 也是一个客户端,用于管理多个容器),它会和docker daemon
相当于中间层沟通(后面就叫守卫或者dockerd
了),它侧重于构建、运行以及分发容器,中间层可以是同个系统的,也可以是远程的。
客户端和守卫之间是通过基于UNIX socket或者网络接口的REST API
来联系的。
img_client_server
docker daemon
docker
守卫(dockerd
)会监听请求以及管理docker
对象,比如镜像(images
)、容器(containers
) 、网络以及卷积(volumes
)。它也能够和其它守卫建立联系来管理docker
服务。
docker client
客户端(docker
)是用户主要用来和docker
交互的方式,我们输入指令,它会发送给dockerd
,然后dockerd
会执行它。客户端可以和多个dockerd
建立联系。
Docker Desktop
一个可视化应用,支持win/mac/linux
三个操作系统,我们可以可视化的创建、构建容器应用和微服务(microservices
)。它包含了以下这些内容:Docker daemon (dockerd)
, the Docker client (docker)
, Docker Compose
, Docker Content Trust
, Kubernetes, and Credential Helper
。
docker registries
docker
有一个注册表用来存储镜像。Docker Hub
是一个公共的注册表,任何人都可以从上面下载镜像。而客户端默认也是从这里面下载镜像。当然,你也可以搞一个私有注册表用来放你自己的镜像。
docker objects
前面提到过的镜像、容器、网络、卷积等都是docker
对象。
镜像
镜像是一个只读的模板,它提供了创建容器的api
。一般情况下,一个镜像是在另一个镜像的基础上自定义的。
比如我们创建的镜像可能是在ubuntu
的基础上构建的,不过在这个基础上,我们加了自定义的内容,比如Apache
的web
服务器以及我们的应用程序,当然还有相关的配置信息。
后面我们会学习到通过Dockerfile
批量执行docker
指令,然后会在镜像之上创建一个layer
,当我们重新构建镜像的时候只会去构建这个layer
。
容器
容器是可运行的镜像实例,你可以创建、开始、停止、移除容器。另外我们还可以通过网络来获取容器里的数据,甚至是基于当前容器里的数据再创建一个镜像。
默认情况下,容器是独立的,各容器之间不会有联系。我们可以通过暴露出来的网络端口/数据或者其他容器/主机的底层子系统来操作容器。
容器的定义取决于镜像以及你创建/开启容器时设置的配置项。当容器被移除,任何改变state
的数据都将不会被存储。
我们可以用docker run
指令创建一个基于某个镜像的容器。比如我们基于ubuntu
镜像来创建一个容器
docker run -i -t ubuntu /bin/bash
这里假设我们用的是默认的配置项。当运行完这条指令之后,一个基于ubuntu
镜像的容器就创建好了(你可以通过docker ps -a
来查看容器是否创建)。
这一条指令执行过程中涉及到了如下几个几步:
ubuntu
镜像,那么Docker
就会自动帮你从docker registries
上面pull
下来,相当于你手动docker pull ubuntu
。docker
创建一个新的容器,相当于你手动docker container create
。docker
分配一个读写文件系统(read-write filesystem
)给这个新容器,作为它最终的layer
。这一步允许了我们的容器创建或者修改本地文件系统的文件和文件夹。docker
给容器创建了一个网络接口,这样就能和默认的网络连接上。这里面包含了给容器分配IP
地址。默认情况下,容器可以通过主机的网络连接来连接额外的网络。docker
开启容器和调用/bin/bash
执行容器。我们这里用到了-i
和-t
两个标志位,所以容器是可通过终端交互的,你可以通过输入关键字来和容器交互,交互的log
会被输出在终端。exit
(一般ctrl + c
也行)来终止交互,这样容器就停止了(注意没有移除)。底层技术
docker
是使用go
语言编写的并且使用linux
内核(kernel
)的一些特性来提供功能。docker
使用了一种叫namespaces
的技术来提供独立的工作空间,即容器。当运行一个容器的时候,docker
会给这个容器创建一系列命名空间。而这些命名空间提供了一个独立的layer
。容器的每一部分都运行在一个单独的命名空间并且它的访问受限于这个命名空间。
安装
咱本机可以选择安装可视化工具docker desktop
。
我这本机是window
,所以接下来操作都基于window
下的docker desktop
。
由于docker
底层使用到了linux
内核的部分特性,所以我们并不能直接在window
上安装docker
。
window上安装linux
官方文档:安装 WSL | Microsoft Learn
另外可以搭配:Windows 11 安装 WSL2 - 知乎 (zhihu.com)
这一点如果你在window
上安装过redis
应该就知道如何处理了。win10
在某个版本之后就支持了将linux
系统作为子系统,也就是WSL
。
系统版本要求
img_required
满足先决条件之后打开控制面板的程序的启用或关闭Windows功能


勾上这几个项,我的电脑是win11
的,没有Hyper-V
,也不影响。
注意这个虚拟机平台
必须勾上,不然可能会遇到无法运行ubuntu
应用的问题。
接着打开mcrosoft store
,搜索ubuntu
,选择评分最高那个
img_download_ubuntu
当然你也可以按传统的方式下载ubuntu
wsl --install -d Ubuntu
安装完之后还不能直接打开,由于当前内核的版本并不是最新的,我们还需要升级下版本
通过管理员方式打开powershell
,然后输入
bcdedit /set hypervisorlaunchtype auto
wsl --update
稳妥点重启下电脑
然后打开这个ubuntu
应用,最开始会让你设置用户名和密码,root
并不能直接使用。
img_open_success
这样就表示在window
上安装linux
成功了。
然后你也可以用hostnamectl
看下当前版本。
docker desktop
回到我们最开始的点,我们是想安装docker desktop
。
直接到这点击下载应用:Install Docker Desktop on Windows | Docker Documentation
然后安装即可。
img_docker_desktop
docker engine(Ubuntu)
当然,你也可以在之前安装的ubuntu
应用打开后通过命令行的方式去安装docker
:Install Docker Engine on Ubuntu | Docker Documentation
sudo apt-get update
sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
然后测试下是否正常安装
sudo docker run hello-world
如果你之前安装过了,你可能需要在安装之前先移除旧版本
for pkg in docker.io docker-doc docker-compose podman-docker containerd runc; do sudo apt-get remove $pkg; done
另外移除docker
并不会移除原来的容器等,所以如果你不想要之前的数据,你可以执行以下操作
sudo rm -rf /var/lib/docker
sudo rm -rf /var/lib/containerd
其中/var/lib/docker
存放的是镜像、容器、卷积和网络等。具体可见:Install Docker Engine on Ubuntu | Docker Documentation
get started
接下来我们将通过以下的几步来了解和学习docker
的用法:
- 构建镜像和运行镜像的容器
- 使用
docker hub
分享你的镜像 - 使用具有数据库的多个容器部署 Docker 应用程序
- 使用
Docker Compose
运行程序
不过在开始之前,我们需要再加深对容器和镜像概念的理解。
什么是容器?
容器实际上是一个在你主机上独立、有别于其它进程的沙盒(sandboxed
)进程。
如何实现的独立,前面说过是基于linux
内核的namespace
技术,具体可见:Demystifying Containers - Part I: Kernel Space | by Sascha Grunert | Medium
总之,容器具有以下特性:
- 是镜像的可运行实例,你可以使用
create、start、stop
以及delete
这几个api
来操作容器 - 可以运行在宿主机、虚拟机和云端部署
- 便携式的(
portable
),可以运行在所有OS
中 - 独立于其它容器,运行它自己软件、二进制(
binaries
)以及配置
什么是镜像?
前面我们知道了容器是运行在镜像之上的文件系统,而容器又可以跑你的应用。那么作为容器的基础:镜像自然就需要包含所有容器需要的东西,比如依赖、配置等。
我们后面会深入了解到镜像。
(我怀疑简介和这一章不是同一个老哥写的)
打包(containerize
)一个应用镜像
接下来我们将搞一个web
前端应用,基础环境自然就是nodeJS
的。
什么?你没用过nodejs
?请出门左拐:Node.js
噢,你先别拐,咱这只是将它作为环境依赖安装下,并不会用到里面的api
等。
先在本机创建一个docker-study
的文件夹, 然后拉个官方给的demo
mkdir docker-study
cd docker-study
git clone https://github.com/docker/getting-started.git
这个git
分支貌似需要开魔法才能拉下来。。。
img_menu
这应该是一个workspaces
。我们的目标在app
文件夹里。
项目里的代码我们不用去探究了解,我们的目的是知道如何打包和运行。
我们在app
根目录创建一个Dockerfile
文件。
t# syntax=docker/dockerfile:1
FROM node:18-alpine
WORKDIR /app
COPY . .
RUN yarn install --production
CMD ["node", "src/index.js"]
EXPOSE 3000
这里面几行是在干啥我们暂时不分析,现在我们可以开始构建镜像了。
docker build -t getting-started .
docker build
:构建容器镜像的指令-t
:tag
,也就是你镜像的名字.
:这最后一个点表示需要在当前目录下查找Dockerfile
img_building
img_build_success
这时你的docker desktop
里应该就会看到我们刚打包的镜像

打包的过程中可能下载了一堆的layer
,这是因为我们前面在Dockerfile
里FROM node:18-alpine
,我们需要nodejs
环境,如果你电脑没有,就会先下载对应的镜像。
然后我们回过头来分析下Dockerfile
里的内容:
FROM
[13]node:18-alpine
:我们希望基于node:18-alpine
这个镜像上开始构建镜像。
FROM [--platform=] [AS ]
// or
FROM [--platform=] [:] [AS ]
// or
FROM [--platform=] [@] [AS ]
WORKDIR
[14]/app
:工作目录,其余指令比如RUN/CMD
等的执行目录,可以指定多个,下面这样的相当于/a/b/c
WORKDIR /a
WORKDIR b
WORKDIR c
RUN pwd
COPY
[15]. .
:复制新文件(夹)到目标目录,目标目录作为容器的文件系统目录
COPY [--chown=:] [--chmod=] ...
COPY [--chown=:] [--chmod=] ["",... ""]
RUN
[16]yarn install --production
: 执行yarn install
指令,--production
是参数。这个api
执行时会在最顶层创建一个layer
,然后把执行的结果提交出去给下一步指令。
RUN // (shell form, the command is run in a shell, which by default is /bin/sh -c on Linux or cmd /S /C on Windows)
RUN ["executable", "param1", "param2"] // (exec form)
CMD ["node", "src/index.js"]
:调用node
运行src/index.js
文件。 一个Dockerfile
只能有一个CMD
,如果你写了多个则按最后一个为准。 你可能觉得这个CMD
和RUN
作用有些类似,实际上两者做的事情并不一样,CMD
是作为执行容器的默认值,而RUN
则是容器执行前的一系列操作。 你也可以用ENTRYPOINT
进行覆盖,格式均为JSON
数组。
CMD ["executable","param1","param2"] // (exec form, this is the preferred form)
CMD ["param1","param2"] // (as default parameters to ENTRYPOINT)
CMD command param1 param2 // (shell form)
EXPOSE
[17]3000
: 容器监听的端口,默认是TCP
的,也可以设置成UDP
。 实际上这里并没有真正的暴露端口,而是相当于文档类型一样。如果有着需要,docker run
的时候你可以带上-p
参数。
EXPOSE [/...]
//example
EXPOSE 80/tcp
EXPOSE 80/udp
比如:
docker run -p 80:80/tcp -p 80:80/udp ...
这个例子如果带上-p
,会同时创建两个端口,一个tcp
和一个udp
的。
运行容器[18]
现在我们已经有了镜像,要创建并运行容器只需要简单的一个指令。
docker run -dp 127.0.0.1:3000:3000 getting-started
-dp
:是-d
和-p
的简写-p
:前面说过了,是--publish
的缩写-d
:是--detached
的缩写,这样你的容器就可以在后台运行127.0.0.1:3000:3000
:格式为HOST: CONTAINER
。127.0.0.1:3000
是Host
,表示主机的地址加端口,这个端口你可以用来暴露到公网等,而后面的3000
则表示容器监听的端口,这俩端口不必一致,实际上是做了一层映射。getting-started
:我们的镜像名字
img_run_container
img_containers
然后我们直接访问localhost:3000

这样我们的容器就在后台跑起来了
下面我们来更新下我们的应用
更新应用[19]
首先我们来修改下项目的代码
找到src/static/js/app.js
文件
- No items yet! Add one above!
+ You have no todo items yet! Add one above!
然后回到app
文件夹里,我们需要重新构建一次镜像。
docker build -t getting-started .
构建完之后先暂时不要执行运行容器的指令,由于镜像已经被占用了,所以这个时候你运行容器可能会失败,因为当前镜像已经有一个运行中的容器了。
我们需要先删除对应的容器
docker-desktop
中直接找到container
那一栏删掉对应的容器即可,命令行的如下
docker stop //
docker rm //
img_remove_container
移除之前需要先停止容器运行。
然后再重新执行容器运行的指令
docker run -dp 127.0.0.1:3000:3000 getting-started
img_update_container_success
这样就完成了。
分享应用[20]
我们可以把我们的app
上传到docker hub
上,这样别人或者自己的另一台机器上就可以下载你这个app
了。
在我们上传自己的app
之前,我们需要先注册一个docker
账号:https://www.docker.com/pricing?utm_source=docker&utm_medium=webreferral&utm_campaign=docs_driven_upgrade&_gl=1*115ovx7*_ga*NjcwMzA0MTY3LjE2ODAxODI2MzY.*_ga_XJWPQMJYHQ*MTY4NzU3MDU3Mi4xNi4xLjE2ODc1NzI5NjkuMjcuMC4w
然后来这创建一个仓库:
img_create_respositories
注意要选择public
,这样别人才能pull
的到你的镜像。

当然,我们一般都是自己用的(要钱)。。
name
:是你发布的镜像的名字
设置完了点击create
。
创建好了屏幕右边可以看到一个指令提示
docker push [yourname]/[respository]:[tag]
tag
:这个指的是版本,默认是latest
respository
:这个要和你的镜像名字对应上yourname
:这个是你的用户名,记得先登录docker desktop
,如果你是用命令行的,你需要使用一下指令进行登录
docker login -u YOUR-USER-NAME
我们回到我们的项目中执行如下指令
docker push [yourname]/[respository]
然后你会发现报错了
image_not_existed
没有对应的镜像
这个时候我们就需要用到tag
[21]修改已有镜像的名字
docker tag getting-started YOUR-USER-NAME/getting-started
img_rename_image
然后我们再重新执行push
指令
但这里我们又遇到另一个问题
img_requested_access_is_denied
这个问题是因为我们先用docker desktop
登陆了,所以我们现在需要先logout
,然后重新登录
docker logout
docker login -u "mazeyqian" -p "Password" docker.io
docker push [yourname]/getting-started
img_push_success
img_push_success
这样就发布成功了,我们在本机也可以用docker search
的方式查看
docker search [yourname]/getting-started
img_search_image
然后我们可以将它拉下来运行,如果你有另一台机器,你可以在那台机器上试下,或者来到官方提供的线上平台试下:Play with Docker
流程和之前一样的,我这里就不演示了
持久化数据库[22]
目前我们的数据是非持久性的,每次重新创建容器之后数据就都没了,前面说过容器之间是独立的(即使是基于同一个镜像的容器数据也不共享),所以默认数据是不会出现在容器外的。
我们现在来将数据同步到本机来实现持久化。
项目中使用的数据库是SQLite
[23] , 默认数据是存储在/etc/todos/todo.db
里面,所以如果我们有个东西把里的数据包裹起来放到本机,那么即使镜像都没了我们的数据也不会丢失。
这个时候就需要用到挂载(mount)卷积(valumes[24])了
docker volume create todo-db
docker run -dp 127.0.0.1:3000:3000 --mount type=volume,src=todo-db,target=/etc/todos getting-started
--mount
:用于指定要挂载到的对应卷积/etc/todos
:卷积挂载的对象,在容器里。
这样数据就可以持久了,我们可以重新创建容器和运行,然后随便搞点数据之后再移除容器,然后再创建一个容器并运行,这个时候你就会看到之前的数据还保留着
img_persist_data
现在我们的数据就被保留在卷积中了。
然后我们可以通过docker volume inspect
指令去查看卷积存放的位置,确保数据是有持久化的。
docker volume inspect todo-db
[
{
"CreatedAt": "2019-09-26T02:18:36Z",
"Driver": "local",
"Labels": {},
"Mountpoint": "/var/lib/docker/volumes/todo-db/_data",
"Name": "todo-db",
"Options": {},
"Scope": "local"
}
]
(在公司,没有配置环境,所以直接用官方给的例子了。。)
Mountpoint
:磁盘存放的位置,也就是我们持久化的数据所在位置。
使用bind的方式挂载[25]
实际上我们还可以自定义存放的位置,通过bind
的方式将主机本机的文件夹绑定到容器里,当分享的文件夹内容发生变化的时候会立即同步容器里的数据。
我们先来看下这两种方式的区别
具名卷积(named volumes) | 绑定挂载(Bind mounts) | |
---|---|---|
主机位置(Host location) | 由docker选择 | 开发者设备 |
挂载例子 (using --mount) | type=volume,src=my-volume,target=/usr/local/data | type=bind,src=/path/to/data,target=/usr/local/data |
使用容器内容填充新的卷积 | 是 | 否 |
支持卷驱动程序 | 是 | 否 |
回到我们的app
文件夹中,我们来试下
docker run -it --mount type=bind,,target=/src ubuntu bash // linux/unix
docker run -it --mount "type=bind,src=$pwd,target=/src" ubuntu bash // windows powerShell
--mount
:通知docker
我这里是使用的绑定挂载的方式-it
:会创建一个伪的可交互终端,我们这就是一个ubuntu
的容器终端src
:当前工作文件夹target
:容器里你想绑定的文件夹
执行了指令之后我们会直接进入容器的文件系统
img_ubuntu_terminal
然后我们进入src
文件夹中,创建一个test.txt
文件,这个时候你就会看到这个文件在我们的设备上也是同时生成的。

然后我们在设备上直接删除这个test.txt
文件再在终端输入ls
这个时候就看不到之前创建的test.txt
文件了
img_delete_test.txt
这么一看我们的文件夹确实绑定好了容器src
文件夹了
终结终端使用Ctrl + D
。
这种方式下有些东西比如工具之类的我们并不需要单独去安装,都是会同步的。
然后我们再来将我们的app
做一波这个流程,不过在这之前,我们需要先docker ps -a
看下是否存在运行中的getting-started
容器,如果有,先移除。
// linux/unix
docker run -dp 127.0.0.1:3000:3000
-w /app --mount type=bind,,target=/app
node:18-alpine
sh -c "yarn install && yarn run dev"
// windows
docker run -dp 127.0.0.1:3000:3000 `
-w /app --mount "type=bind,src=$pwd,target=/app" `
node:18-alpine `
sh -c "yarn install && yarn run dev"
-dp
:前面说过了,就是-d
和-p
的简写-w
:指定工作目录,这里指定的是app
文件夹作为执行后续指令的文件夹node:18-alpine
:不多说,就是基于node
镜像搭建容器sh -c "yarn install && yarn run dev"
:调用sh
来执行安装依赖和运行的指令,alpine
没有bash
的。nodemon
[26]:dev
这个指令执行的是nodemon src/index.js
。这个nodemon
是一个node
工具,可以在程序内容发生变化的时候自动重新运行程序。
然后我们可以docker ps -a
看下容器是否正常运行
img_ps_a
或者直接浏览器或者curl
访问localhost:3000
看是否正常。
如果没正常运行起来,我们可以通过docker logs -f
的方式来查看错误信息
img_log_container
可以看到我这里是正常的log
然后我们随便找个文件getting-startedappsrcstaticjsapp.js
修改内容,注意要在本机修改
img_edit
然后直接回到之前打开的localhost:3000
,刷新下,这个时候按钮的文案就变了。

当我们开发完毕之后,我们直接删掉这个容器,打包镜像发布就完事了
docker build -t getting-started .
当然,这个nodemon
并不能做到热更新的效果,如果真要开发直接用webpack/vite
即可。
多容器应用[27]
前面我们的项目里涉及到的东西都是直接放到同一个容器里的,比如数据库数据等,而实际上应该把他们拆开,尽量做到专注于某部分,因为如果不同技术涉及到的环境、环境变量、工具等会使得这容器变得复杂,维护成本高。
现在我们再搞个MySQL
的容器来运行我们的数据库。
img_multi_containers
不过这里还有个问题,那就是网络。由于容器之间相互独立隔离,它们并不知道彼此,所以也不能直接联系。这个时候我们可以使用network
,如果这俩都在同一个网络下,那么它们就可以做到相互联系。
docker network create todo-app
创建一个叫做todo-app
的网络
然后我们创建一个MySQL
容器并指向这个网络
// linux/unix
docker run -d
--network todo-app --network-alias mysql
-v todo-mysql-data:/var/lib/mysql
-e MYSQL_ROOT_PASSWORD=secret
-e MYSQL_DATABASE=todos
mysql:8.0
// windows
docker run -d `
--network todo-app --network-alias mysql `
-v todo-mysql-data:/var/lib/mysql `
-e MYSQL_ROOT_PASSWORD=secret `
-e MYSQL_DATABASE=todos `
mysql:8.0
-v
:是--volume
的简写
-e
:设置环境变量MYSQL_ROOT_PASSWORD
:MySQL
的密码MYSQL_DATABASE
:指定的数据库,环境变量相关的具体可见:MySQL Docker Hub listing.--network-alias
: 搞个别名,这样比较好分辨,虽然还是同一个network
image
:这个service
的镜像command
:这个服务开启后要执行的指令,非必要,也不需要固定顺序,不过一般都放在image
下面ports
:服务端口,这个项有两种写法,一种简洁,另一种详细,具体可见:short syntax,long syntaxvolumes
:卷积的位置,相对于working_dir
,这个也有长和短的两种写法,具体可见:short,longsenvironment
:环境变量定义- 减少镜像体积,只包含程序运行需要的。