君匡
2022/07/24阅读:448主题:自定义主题1
Docker系列四DockerFile打造Python镜像
前言
起因是在更新博客的时候,发现可以用更优雅的方式来实现原有的目的,所以重新整理后,将原文改成了两篇,都收录在了该系列中。
构建Docker镜像,简单来说分为以下两种:
-
拉取CentOS的操作系统镜像并生成容器,然后在里面安装各种需要的环境,诸如SSH、Python等。好处就是容器内东西够多,几乎就是又一台服务器,想怎么玩都行。坏处就是吃机子服务器的性能,以我之前的某次作死为例,光镜像文件就得四个G,哪怕是备份文件也得七百兆起步。/捂脸 -
直接拉取Python镜像,简单粗暴,当然,也是需要自己手动安装各种环境的。好处就是容器偏小,备份和恢复起来较为方便。
我接下来会介绍如何将Python
项目使用DockerFile
创建成为镜像,此时又根据项目的复杂程度,分为单文件和多文件的两种情况。

运行一次性的python脚本
首先编写一个基础脚本test.py
。
#!/usr/bin/python
import sys
print(sys.version)
print("Hello, World!")
将脚本test.py
放入指定的目录/home/keen/docker/python3.7
,运行得到结果后,再删除镜像。
export Temp=python-temp
# 运行容器
docker run \
--name $Temp \
-v /home/keen/docker/python3.7:/usr/src/myapp \
-v /etc/localtime:/etc/localtime:ro \
-w /usr/src/myapp \
python:3.7-slim-buster \
python3 test.py
#删除并销毁容器
docker stop $Temp && docker rm $Temp
但是有前提,这个脚本所需要的环境必须是存在于镜像中的,否则在里面运行会报错的。但是一般来说,官方镜像里面很难保证会有我们编写代码的所有依赖,所以必须要考虑在容器中新增指定依赖。但是总不能每次新启动容器就要重新下一遍依赖吧。
易经上说,穷则变,变则通,通则久。在这里不敢说长久能用,但是努把劲儿,至少得不穷了吧?
单文件创建镜像
适用于单文件创建镜像,一般是新手练手用,或者是功能真的很简单,只需要一个文件就能实现所有功能。
项目文件路径
任意路径建立一个文件夹,此时文件夹名称可以随意起名,我这里做例子起名为test1
,跟多文件创建镜像的文件夹分开。

接下来使用命令创建文件夹和文件。其中keen_test1.py
是我们的脚本文件,requirements.txt
则是依赖和依赖的版本,Dockerfile
指定了生成镜像的配置和运行命令。
# 创建文件夹
mkdir -p /home/keen/docker/test1/
# 生成脚本文件
touch /home/keen/docker/test1/keen_test1.py
# 生成依赖文件
touch /home/keen/docker/test1/requirements.txt
# 生成Dockerfile文件
touch /home/keen/docker/test1/Dockerfile
编写脚本文件
编写一个基础脚本keen_test.py
,假设会需要引用第三方依赖,且会将计算结果保存到容器的绝对路径/out/中。
vim /home/keen/docker/test1/keen_test.py
脚本内容如下。
#!/usr/bin/python
import numpy as np
import matplotlib.pyplot as plt
x = np.arange(-10, 10, 0.01)
y = x**2
plt.plot(x, y)
# 将图片保存到容器的绝对路径/out/中
plt.savefig("/out/b.png")
# 将变量保存到文件
log = open("/out/a.txt",mode="a",encoding="utf-8")
print(x,file = log)
print(y,file = log)
log.close()
编写依赖文件
这个样例简单么,所以手动编写requirements.txt
文件。
vim /home/keen/docker/test1/requirements.txt
依赖内容如下。
numpy==1.21.3
matplotlib==3.4.3
编写Dockerfile文件
编写Dockerfile
文件新建镜像,是需要一个镜像作为基础,然后基于此继续构建新容器。比如此次我就是基于python:3.7
的镜像来搭建新镜像,但是即使本地没有这个镜像也不用提前拉取,因为docker会自动拉取的。
vim /home/keen/docker/test1/Dockerfile
文件内容如下。
# syntax=docker/dockerfile:1
# 第一行是解析器指令,始终用版本1语法的最新版本
#基础镜像
FROM python:3.7-slim-buster
# 设置工作目录文件夹
WORKDIR /code
# 复制依赖文件
COPY requirements.txt requirements.txt
# 安装依赖
RUN pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
# 复制其他的脚本文件
COPY . .
#当启动容器时候,执行change_step.py程序
CMD ["python", "keen_test.py"]
-
# syntax=docker/dockerfile:1
:别看第一个字符是#
就以为他是注释,也可能是解释器指令,意义是使用dockerfile版本1的语法来运行当前脚本 -
FROM 镜像名称:版本号
: 指明基础镜像 -
WORKDIR
: 指明工作目录 -
COPY
: 将宿主机的文件复制到镜像中 -
RUN
: 运行后面的命令,安装依赖。 -
CMD
: 这是将镜像打包完并且生成镜像成功后才会运行的命令。
生成镜像
生成docker镜像,其中--tag
会指明镜像名称和版本号。
docker build \
--tag keen-dockerfiletest:1.0.3 \
/home/keen/docker/test1

用镜像生成容器
创建并且运行容器,在当前目录新建out
文件夹,并且将之映射成为容器的out
文件夹。
docker run \
-v ${PWD}/out:/out \
keen-dockerfiletest:1.0.3

项目级创建Python镜像
这个则是部署Python项目的时候,用的多些。其实与上面相比,只不过是项目文件会出现层级,在Dockerfile里面要特别地指明添加哪些项目中的哪些内容。
项目文件路径
我这里做例子起名为test2
,跟单文件创建镜像的文件夹分开。
接下来使用命令创建文件夹和文件。其中branch1
下面的__init__.py
是为了把这个文件夹声明成为包。
# 创建文件夹
mkdir -p /home/keen/docker/test2/
# 创建文件夹,并声明为包
mkdir -p /home/keen/docker/test2/branch1/
touch /home/keen/docker/test2/branch1/__init__.py
# 生成脚本文件
touch /home/keen/docker/test2/branch1/keen_test1.py
touch /home/keen/docker/test2/keen_test2.py
touch /home/keen/docker/test2/keen_test3.py
# 生成依赖文件
touch /home/keen/docker/test2/requirements.txt
# 生成Dockerfile文件
touch /home/keen/docker/test2/Dockerfile
编写脚本文件
总共要写三个脚本文件,第一个脚本文件存在一个方法,方法体是写信息进入TXT文件;第二个脚本文件是调用第三方库计算并生成图片,并且调用第一个脚本的方法;第三个文件是多余的,不应该被引入到镜像中的文件。
vim /home/keen/docker/test2/branch1/keen_test1.py
vim /home/keen/docker/test2/keen_test2.py
脚本文件keen_test1
内容如下。
#!/usr/bin/python
class Keen:
def keen_say(self):
log = open("/out/a.txt",mode="a",encoding="utf-8")
print("keen_test1",file = log)
log.close()
脚本文件keen_test2
内容如下。
#!/usr/bin/python
import numpy as np
import matplotlib.pyplot as plt
x = np.arange(-10, 10, 0.01)
y = x**2
plt.plot(x, y)
# 将图片保存到容器的绝对路径/out/中
plt.savefig("/out/b.png")
# 查看文件和文件夹
import os
print(os.listdir())
# 调用方法
from branch1.keen_test1 import Keen
p = Keen()
p.keen_say()
脚本文件keen_test3
没有内容,但是生成的容器里面不应该有这个文件
编写依赖文件
这个样例简单么,所以手动编写requirements.txt
文件。
vim /home/keen/docker/test2/requirements.txt
依赖内容:
numpy==1.21.3
matplotlib==3.4.3
编写Dockerfile文件
编写Dockerfile
文件新建镜像,是需要一个镜像作为基础,然后基于此继续构建新容器。比如此次我就是基于python:3.7
的镜像来搭建新镜像,但是即使本地没有这个镜像也不用提前拉取,因为docker会自动拉取的。
vim /home/keen/docker/test2/Dockerfile
文件内容:
# syntax=docker/dockerfile:1
# 第一行是解析器指令,始终用版本1语法的最新版本
#基础镜像
FROM python:3.7-slim-buster
# 设置工作目录文件夹
WORKDIR /code
# 复制依赖文件
COPY requirements.txt requirements.txt
# 安装依赖
RUN pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
#将文件添加到文件夹中,一个一个复制其实也可以的
ADD ./branch1/keen_test1.py /code/branch1/
ADD ./branch1/__init__.py /code/branch1/
ADD ./keen_test2.py /code/
#当启动容器时候,执行change_step.py程序
CMD ["python", "keen_test2.py"]
-
ADD
: 将指定的文件复制到镜像的指定目录中
生成镜像
生成docker镜像,其中--tag
会指明镜像名称和版本号。
docker build \
--tag keen-dockerfiletest:1.0.5 \
/home/keen/docker/test2

用镜像生成容器
创建并且运行容器,在当前目录新建out
文件夹,并且将之映射成为容器的out
文件夹。
docker run \
-it \
-v ${PWD}/out:/out \
keen-dockerfiletest:1.0.5

感谢
感谢现在的好奇,为了能成为更好的自己。
作者介绍