FR EN

Note de Validation Technique v1

Moteur de prédiction de temps de course Wattness · Mars 2026
511 courses réelles · 93 athlètes · 24 parcours · Ironman & 70.3
← Retour au Labo

1. Contexte et objectif

Ce document présente une évaluation rigoureuse du moteur de prédiction de temps de course Wattness, basé sur un modèle physique multi-disciplines (natation, vélo, course à pied) couplé à un système de personnalisation par coefficients individuels.

L'évaluation porte sur 511 résultats réels couvrant 93 athlètes et 24 parcours (Ironman et 70.3), de 2017 à 2025. Le protocole reproduit fidèlement les conditions de production : validation leave-future-out chronologique, où les coefficients personnels ne sont calculés qu'à partir de courses antérieures.

Deux modes de prédiction sont évalués :

2. Méthodologie

2.1 Protocole

Chaque prédiction est générée par le pipeline de production exact : calculateRacePacing() produit le baseline physique, puis fetchPersonalCoefficients() ajuste par discipline si l'historique est suffisant. Aucun paramètre n'est ajusté après coup.

2.2 Validation leave-future-out

Pour chaque course d'un athlète, les coefficients personnels sont calculés uniquement à partir des courses antérieures (exactement comme en production). Les courses futures ne sont jamais visibles, éliminant tout risque de fuite de données.

2.3 Critères d'inclusion

2.4 Métriques

MétriqueDéfinition
MAPEErreur absolue moyenne en pourcentage du temps observé
MAEErreur absolue moyenne (en minutes)
MedAEErreur absolue médiane (robuste aux outliers)
P9090e percentile de l'erreur absolue (borne supérieure pour 90% des prédictions)
BiasErreur signée moyenne. Positif = prédit trop lent ; négatif = prédit trop rapide

2.5 Définition des catégories d'athlètes

Les athlètes sont classés en trois niveaux sur la base d'un algorithme multi-critères combinant les seuils physiologiques (FTP, CSS, CS), le volume d'entraînement, l'historique de compétition et la régularité :

NiveauProfil typen (dataset)
EliteAthlètes avancés (catégories ADV_*) : seuils élevés, volume régulier, historique confirmé196
CompetitiveConfirmés et réguliers (catégories CMP_*, EST_RESILIENT) : bonne base, expérience course260
Age-groupEn développement ou irréguliers (catégories DEV_*, EST_FRAGILE/STANDARD) : profil variable, historique limité55

2.6 Grille d'évaluation

ÉvaluationSeuil MAPEInterprétation
Bon≤ 5 %Précision suffisante pour un usage de planification fiable
Correct5 – 8 %Utilisable avec réserve, écart perceptible sur les temps longs
À améliorer> 8 %Écart significatif, prédiction à prendre comme estimation large
Inconclusifn < 5Échantillon insuffisant pour conclure

3. Résultats du modèle physique (baseline / version gratuite)

Le baseline constitue le socle du moteur : un modèle physique déterministe qui prédit les temps sans historique personnel. C'est la version accessible à tous les utilisateurs, y compris les nouveaux.

3.1 Précision globale par niveau

NiveaunMAPEMAEMedAEP90Bias
Elite1964.6 %21 min14 min46 min-15 min
Competitive2605.5 %24 min17 min1h00≈ 0
Age-group5514.0 %1h0159 min1h42+37 min

3.2 Par format de course

NiveauFormatnMAPEMAEBias
Elite70.31064.1 %12 min-8 min
EliteFull Ironman904.7 %29 min-19 min
Competitive70.31744.8 %15 min-3 min
CompetitiveFull Ironman866.6 %44 min-20 min
Age-groupFull Ironman239.6 %1h04+38 min
Age-group70.33213.4 %45 min+11 min

3.3 Par discipline (baseline)

NiveauSwim MAPEBike MAPERun MAPESwim BiasBike BiasRun Bias
Elite8.9 %4.3 %6.9 %-2 min≈ 0-8 min
Competitive11.1 %8.3 %8.6 %-2 min+11 min-9 min
Age-group8.5 %18.3 %11.3 %-2 min+31 min-1 min

Limites connues du baseline : Le modèle applique les seuils actuels de l'athlète (FTP, CSS) à des courses passées (2017-2025). Si un athlète a progressé ou régressé, cela introduit un biais temporel, particulièrement visible chez les age-group (vélo +31 min). La résolution de ce biais (stockage de seuils historiques) est la priorité d'amélioration n°1.

4. Impact de la personnalisation (coefficients individuels)

4.1 Principe

Les coefficients personnels sont le médian des ratios observé / baseline calculé sur les courses antérieures de l'athlète (minimum 5, filtre outliers). Ils corrigent le baseline par discipline, captant les écarts systématiques propres à chaque individu.

4.2 Résultats (n=177, athlètes avec historique suffisant)

NiveaunMAPE baselineMAPE ajustéGainBias baselineBias ajusté
Elite863.8 %3.3 %-0.5 pts-9 min-4 min
Competitive765.2 %4.9 %-0.3 pts-4 min-14 min
Age-group1515.2 %7.3 %-7.9 pts+46 min+6 min

Observation clé : Le gain le plus spectaculaire est observé chez les age-group (MAPE 15.2 % → 7.3 %, biais +46 min → +6 min). Cela confirme que les coefficients personnels compensent efficacement le biais du baseline pour ce profil, mais l'échantillon reste limité (n=15).

5. Récapitulatif global (baseline + ajusté)

NiveaunModeMAPEMAEMedAEP90Bias
Elite196Baseline4.6 %21 min14 min46 min-15 min
Ajusté4.4 %20 min12 min46 min-13 min
Competitive260Baseline5.5 %24 min17 min1h00≈ 0
Ajusté5.4 %25 min15 min1h00-5 min
Age-group55Baseline14.0 %1h0159 min1h42+37 min
Ajusté11.8 %53 min51 min1h42+22 min

6. Fondements scientifiques du modèle

Le moteur Wattness repose sur des modèles physiques et physiologiques documentés dans la littérature scientifique :

ModuleFondementRéférence
Hydrodynamique natationRelation drag/vitesse en eau libreChatard et al. (1998) [7]
Solveur puissance véloÉquation de Newton-Raphson avec forces résistives (CdA, Crr, gravité, vent)Coggan (2003) [8], Blocken et al. (2018) [6]
Course à pied (dénivelé)Coût énergétique en fonction de la penteMinetti et al. (2002) [3]
Pénalité chaleur (WBGT)Impact de la température sur la performance marathonEly et al. (2007) [2]
Couplage vélo → CAPTransition et effet de fatigue pré-courseHausswirth & Brisswalter (2008) [4], Millet & Vleck (2000) [5]
Décomposition triathlonContribution relative de chaque disciplineRust et al. (2021) [1]

Le modèle n'est pas une boîte noire : chaque prédiction est décomposable segment par segment, avec les pénalités explicitement attribuées (chaleur, dénivelé, couplage, glycogène).

7. Limites et facteurs non modélisés

Modélisé avec pénalité explicite : Chaleur (WBGT), dénivelé, vent de face/dos, couplage vélo-CAP, déplétion glycogénique.

Partiellement modélisé : Drafting (facteur moyen par niveau), position vélo (TT vs route).

Non modélisé : Courant marin, état de route, incidents mécaniques, gestion de course tactique, conditions météo hors température (pluie, humidité extrême).

8. Étude d'ablation (contribution de chaque module)

Pour mesurer la contribution de chaque sous-module, le benchmark est relancé en désactivant successivement un module à la fois. Deux comparateurs naïfs quantifient la valeur ajoutée du modèle physique :

8.1 Résultats globaux

VariantenMAPEMAEBiasMedAEP90% >30min
Modèle complet5116.1 %27 min−1 min17 min1h0529.9 %
Sans chaleur5116.1 %27 min−8 min17 min1h0634.4 %
Sans couplage5116.0 %26 min−5 min17 min1h0431.3 %
Sans glycogène5116.1 %27 min−1 min17 min1h0529.9 %
Naïf individuel3536.0 %27 min+1 min19 min59 min34.8 %
Naïf population5117.9 %34 min−5 min25 min1h1042.1 %

8.2 Par niveau d'athlète

Elite (n=196)

VariantenMAPEMAEBiasMedAEP90% >30min
Modèle complet1964.6 %20 min−15 min14 min45 min23.0 %
Sans chaleur1965.4 %25 min−21 min16 min58 min33.7 %
Sans couplage1964.9 %22 min−17 min15 min47 min27.0 %
Naïf individuel1495.4 %24 min+6 min18 min52 min31.5 %
Naïf population1967.5 %30 min−3 min24 min1h0339.8 %

Competitive (n=260)

VariantenMAPEMAEBiasMedAEP90% >30min
Modèle complet2605.5 %24 min≈ 016 min1h0024.6 %
Sans chaleur2605.3 %24 min−6 min15 min56 min26.2 %
Sans couplage2605.4 %24 min−3 min16 min1h0024.2 %
Naïf individuel1696.3 %29 min≈ 018 min1h0837.3 %
Naïf population2607.9 %34 min−4 min25 min1h1942.7 %

Age-group (n=55)

VariantenMAPEMAEBiasMedAEP90% >30min
Modèle complet5514.0 %1h00+36 min58 min1h4280.0 %
Sans chaleur5512.3 %53 min+26 min52 min1h3176.4 %
Sans couplage5512.8 %55 min+28 min51 min1h3280.0 %
Naïf individuel356.9 %33 min−12 min24 min1h0537.1 %
Naïf population559.5 %44 min−15 min27 min2h0947.3 %

8.3 Par format de course

Full Ironman (n=199)

VariantenMAPEMAEBiasMedAEP90% >30min
Modèle complet1996.2 %39 min−8 min28 min1h3646.2 %
Sans chaleur1996.7 %43 min−20 min34 min1h3058.3 %
Sans couplage1996.2 %39 min−13 min31 min1h2951.8 %
Naïf individuel1636.4 %40 min+6 min30 min1h3050.3 %
Naïf population1997.4 %47 min−6 min39 min1h4258.8 %

70.3 (n=312)

VariantenMAPEMAEBiasMedAEP90% >30min
Modèle complet3126.0 %18 min+2 min13 min42 min19.6 %
Sans chaleur3125.7 %18 min−1 min12 min38 min19.2 %
Sans couplage3125.9 %18 min≈ 013 min42 min18.3 %
Naïf individuel1905.6 %17 min−2 min12 min41 min21.6 %
Naïf population3128.3 %26 min−4 min22 min52 min31.4 %

8.4 Conclusions de l'ablation

Module chaleur : impact le plus significatif pour les Elite (MAPE 4.6 % → 5.4 % sans chaleur, +11 pts de taux d'erreurs >30 min). Effet inverse chez les Competitive (5.5 % → 5.3 % sans chaleur) — la pénalité thermique surcorrige légèrement cette population.

Module couplage : impact modéré sur les elites (MAPE +0.3 pts, +4 pts de taux >30 min). Quasi nul sur competitive et age-group.

Module glycogène : aucun impact mesurable sur aucun niveau. Ce module n'apporte pas de valeur dans sa forme actuelle.

8.5 Modèle physique vs estimateurs naïfs

L'ablation compare deux types de naïfs, ce qui clarifie la valeur du modèle physique selon le contexte :

CritèreModèle physiqueNaïf individuelNaïf population
Historique requisAucunOui (même format)Aucun
DécompositionPar discipline + segmentsTotal uniquementTotal uniquement
Adaptation parcoursProfil, météo, conditionsAucuneAucune
MAPE global6.1 %6.0 % (n=353)7.9 %
MedAE global17 min19 min25 min
% erreurs >30 min29.9 %34.8 %42.1 %

Enseignements clés :

9. Synthèse

Sur 511 résultats réels couvrant 93 athlètes et 24 parcours, le moteur Wattness montre une précision globalement solide, particulièrement chez les profils elite et competitive, avec un gain net lorsque l'historique personnel est suffisant. Ces résultats restent à interpréter avec prudence chez les age-groupers en raison d'un échantillon encore limité.

ProfilGratuit (MAPE)Gratuit (MedAE)Personnalisé (MAPE)Meilleur cas
Elite4.6 %14 min4.4 %3.3 %
Competitive5.5 %17 min5.4 %4.9 %
Age-group14.0 %59 min11.8 %7.3 % (n=15)

La valeur du moteur ne se réduit pas à son MAPE global. L'étude d'ablation confirme que le modèle physique surpasse nettement un estimateur naïf sans historique (MAPE 6.1 % vs 7.9 %, taux d'erreurs >30 min 30 % vs 42 %), et que les modules de chaleur et couplage apportent une valeur réelle pour les elites. Elle tient aussi à sa capacité de décomposition par discipline (permettant un plan de course actionnable), à son adaptation au parcours spécifique (altitude, météo, technicité) et à son fonctionnement sans historique — trois propriétés qu'un simple estimateur statistique ne peut offrir.

Le modèle reste en amélioration continue. Les axes prioritaires sont le stockage des seuils historiques (pour éliminer le biais temporel, principal facteur d'erreur chez les age-group), l'amélioration de la modélisation de la chaleur extrême (surcorrection competitive), et l'élargissement du dataset pour les profils age-group.

Références scientifiques

[1] Rust, C.A. et al. (2021). "What Is the Best Discipline to Predict Overall Triathlon Performance?" Frontiers in Physiology, 12, 654552.

[2] Ely, M.R. et al. (2007). "Impact of Weather on Marathon-Running Performance." Medicine & Science in Sports & Exercise, 39(3), 487-493.

[3] Minetti, A.E. et al. (2002). "Energy cost of walking and running at extreme uphill and downhill slopes." Journal of Applied Physiology, 93(3), 1039-1046.

[4] Hausswirth, C. & Brisswalter, J. (2008). "Strategies for improving performance in long duration events." Sports Medicine, 38(11), 881-891.

[5] Millet, G.P. & Vleck, V.E. (2000). "Physiological and biomechanical adaptations to the cycle to run transition in Olympic triathlon." British Journal of Sports Medicine, 34(5), 384-390.

[6] Blocken, B. et al. (2018). "CFD simulations of the aerodynamic drag of two drafting cyclists." Computers & Fluids, 171, 209-229.

[7] Chatard, J.C. et al. (1998). "Analysis of body composition, swimming performance and estimated energy expenditure." European Journal of Applied Physiology, 78(2), 109-113.

[8] Coggan, A.R. (2003). "Training and racing using a power meter." Training Peaks whitepaper.