GitHub - Purecontrol/breizhcamp_bench_python_containers

Abstract

Notre service numérique python de traitement de données temporelles tournait sur un serveur en mêlant multithreading et multiprocessing, il était temps de le conteneuriser. Un coup de Docker et c’est parti… pour une chute de 30% des performances : CPU et RAM qui grimpent, le temps d’exécution aussi et l’ingestion des données prend du retard. Trop.

On s’aperçoit alors que les images Docker Python “officielles” ne sont pas performantes, que l’installation de Python sur un système propose des options de compilation au potentiel intéressant. Un trio se met en place pour élaborer un benchmark pour comparer les performances de différentes façon d’installer Python dans un conteneur Docker : image officielle, Python natif d‘une image Debian, différentes modalités d’installation par pyenv et par uv, l’outil sorti en 2024 qui “dérouille” l’écosystème Python (vous l’avez ?).

Tout benchmark a ses biais, c’est pourquoi nous insisterons sur la démarche élaborée et suivie pour que vous puissiez la reproduire sur vos bases de codes, plutôt que d’insister sur les résultats.

Le trio :

Gaston Gary : spécialiste du métier du service numérique
Sébastien Baguet : spécialiste infrastructure et conteneurisation
Luc Sorel-Giffo : spécialiste Python

Lancer le diaporama

# lancement d'un serveur web permettant de visualiser la présentation dans un navigateur, qui s'auto-rafraichit docker run --rm --init -v $PWD:/home/marp/app -e LANG=$LANG -p 8080:8080 -p 37717:37717 marpteam/marp-cli -s --html . # -> aller à http://localhost:8080/slides/slideshow.md # génération et mise à jour en temps réel du fichier html docker run --rm -v $PWD/:/home/marp/app/ -e LANG=$LANG -e MARP_USER="$(id -u):$(id -g)" marpteam/marp-cli -w slides/slideshow.md # génération du fichier slides/slideshow.html docker run --rm -v $PWD/:/home/marp/app/ -e LANG=$LANG -e MARP_USER="$(id -u):$(id -g)" marpteam/marp-cli slides/slideshow.md

Documentation Marp :

Avec quelles options un binaire Python a-t-il été compilé ?

Avant que nous découvrions la commande python3 -m sysconfig | grep CONFIG_ARGS, nous avons regardé le code source de différents projets pour déterminer les options de compilation d'un binaire Python :

image docker python officielle : 3.12.11. Compilée avec --enable-optimizations et potentiellement avec --with-lto (https://github.com/docker-library/python/blob/14b61451ec7c172cf1d43d8e7859335459fcd344/3.12/slim-bookworm/Dockerfile#L72-L78)
la version python-build-standalone installée avec uv ?
- --enable-optimizations : https://github.com/astral-sh/python-build-standalone/blob/main/cpython-unix/build-cpython.sh#L472
- --with-lto : https://github.com/astral-sh/python-build-standalone/blob/main/cpython-unix/build-cpython.sh#L509
- pas de PYTHON_CFLAGS="-march=native -mtune=native" ?
debian bookworm : https://github.com/docker-library/python/blob/14b61451ec7c172cf1d43d8e7859335459fcd344/3.11/slim-bookworm/Dockerfile#L72-L95
documentation sur les options d'installation de python avec pyenv :
- https://github.com/pyenv/pyenv/blob/master/plugins/python-build/README.md#special-environment-variables : CONFIGURE_OPTS
- https://github.com/pyenv/pyenv/blob/master/plugins/python-build/README.md#building-for-maximum-performance : --enable-optimizations

Monitoring du benchmark

Temps de création des images Docker applicatives

# construction des images et logging des temps bash 1_images_build_time.sh # -> résultats dans le dossier 1_build_times/ (non versionné)

Note : la version de python installée dans les images est 3.12.11, sauf debian bookworm qui embarque la 3.11.2

Performances des images applicatives

# 0. construire les images docker compose -f docker-compose.yml build # 1. lancer le benchmark bash 2_monitor_benchmark.sh &> "2_benchmark_results/$(date '+%Y-%m-%d_%H%M%S')-benchmark_monitoring.txt" # 2. plus tard, lancer prometheus et grafana pour visualiser les consommations CPU et RAM docker compose -f docker-compose.monitoring.yml up grafana # 3. ouvrir les dashboards grafana http://127.0.0.1:9100/dashboards # 4. importer le dashboard 193 (https://grafana.com/grafana/dashboards/193-docker-monitoring/) en sélectionnant la source de données Prometheus # 5. exporter les données CPU et RAM (toutes les séries, sans pré-formatage) en fichier CSV ; les enregistrer dans 2_benchmark_results # notes : # - arrête les conteneurs docker compose -f docker-compose.monitoring.yml stop # - arrête et supprime les conteneurs docker compose -f docker-compose.monitoring.yml down

Notebook d'analyse du benchmark

Nous avons utilisé un notebook marimo (une alternative à jupyter afin d'avoir des notebooks reproductibles), avec plotly et polars. Le code du notebook est dans le fichier notebook.py.

Documentation marimo :

docker compose -f docker-compose.notebook.yml up

Le notebook lit la variable d'environnement BENCHMARK_SOURCES_CONFIG_FILE indiquant le fichier JSON indiquant les chemins de fichier de résultat utilisés par le notebook. Ce fichier a le format suivant :

{ "build_results_dir": "1_build_times", "build_times": "2025-06-23_232911-build_times.txt", "benchmark_results_dir": "2_benchmark_results", "cpu_usage": "CPU_Usage-data-as-joinbyfield-2025-06-24 09_26_36.csv", "ram_usage": "Memory_Usage-data-as-joinbyfield-2025-06-24 09_27_47.csv", "images": { "debian": { // couleur utilisée pour les graphiques de cette image docker "color": "#A80030", // début du fichier, sans le nom de l'image ni l'extension ("2025-06-24T00-49-05" pour "2025-06-24T00-49-05_debian.json") "results_prefix": "2025-06-24T00-49-05" }, "official": { "color": "#FFD43B", "results_prefix": "2025-06-24T01-19-38" }, "pyenvbasic": { "color": "#07B08C", "results_prefix": "2025-06-24T01-50-11" }, "pyenvopt": { "color": "#068F71", "results_prefix": "2025-06-24T02-20-44" }, "pyenvoptmarch": { "color": "#046D57", "results_prefix": "2025-06-24T02-51-18" }, "pyenvoptmarchbolt": { "color": "#034C3C", "results_prefix": "2025-06-24T03-21-51" }, "uv": { "color": "#AB47BC", "results_prefix": "2025-06-24T03-52-24" } } }

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
slides		slides
.dockerignore		.dockerignore
.gitignore		.gitignore
1_images_build_time.sh		1_images_build_time.sh
2_monitor_benchmark.sh		2_monitor_benchmark.sh
Dockerfile.debian		Dockerfile.debian
Dockerfile.marimo		Dockerfile.marimo
Dockerfile.official		Dockerfile.official
Dockerfile.pyenv.basic		Dockerfile.pyenv.basic
Dockerfile.pyenv.opt		Dockerfile.pyenv.opt
Dockerfile.pyenv.optmarch		Dockerfile.pyenv.optmarch
Dockerfile.pyenv.optmarchbolt		Dockerfile.pyenv.optmarchbolt
Dockerfile.uv		Dockerfile.uv
README.md		README.md
benchmark.py		benchmark.py
config.json		config.json
docker-compose.monitoring.yml		docker-compose.monitoring.yml
docker-compose.notebook.yml		docker-compose.notebook.yml
docker-compose.yml		docker-compose.yml
grafana-dashboard-provisioning.yaml		grafana-dashboard-provisioning.yaml
grafana-datasource-config.yaml		grafana-datasource-config.yaml
notebook.py		notebook.py
prometheus-scrape-config.yaml		prometheus-scrape-config.yaml
requirements.marimo.txt		requirements.marimo.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Abstract

Lancer le diaporama

Avec quelles options un binaire Python a-t-il été compilé ?

Monitoring du benchmark

Temps de création des images Docker applicatives

Performances des images applicatives

Notebook d'analyse du benchmark

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Abstract

Lancer le diaporama

Avec quelles options un binaire Python a-t-il été compilé ?

Monitoring du benchmark

Temps de création des images Docker applicatives

Performances des images applicatives

Notebook d'analyse du benchmark

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages