Co-Conception Estimation d’État + MPC — Faire Fonctionner la Commande Prédictive sur des Systèmes Réels
Pourquoi C’est Important (Résumé Exécutif)
- La MPC qui « fonctionne en simulation mais pas sur le système réel » échoue presque toujours en raison de problèmes d’estimation — latence, dérive, bruit ou fréquence de mise à jour insuffisante dans l’estimation d’état.
- La co-conception de l’estimateur et du régulateur — avec des budgets de latence explicites, des stratégies de fusion et une logique de repli — est ce qui rend la MPC déployable sur du matériel physique.
- Les implémentations de référence démontrent : NMPC + MHE combinés à 1 ms de calcul total sur des grues à pont, largeur de bande servo augmentée de 147 Hz à 208 Hz via MPC explicite + observateur, et MPC incrémental sans modèle utilisant l’estimation à retard temporel qui évite entièrement l’identification explicite de la plante.
- Ce patron s’applique à tout système où le régulateur a besoin d’états qui ne sont pas directement mesurés : intralogistique, mouvement de précision, robotique et régulation de process.
Le Patron de Conception Expliqué
L’estimation d’état et la MPC ne sont pas des modules indépendants. L’estimateur doit produire des estimations d’état au débit, à la latence et à la précision que le régulateur exige. Lorsque la détection par vision introduit 50 ms de latence, le régulateur doit soit prédire en avant soit extrapoler — et cette prédiction doit être co-conçue avec l’horizon MPC.
Trois approches principales d’estimation apparaissent dans les implémentations de référence :
- Estimation sur Horizon Glissant (MHE) : un estimateur basé sur l’optimisation qui, comme la MPC, résout un problème contraint à chaque pas. La MHE gère naturellement les contraintes sur les états (par ex., « cette température ne peut pas être négative ») et assure la cohérence avec la formulation NMPC.
- Observateurs d’état étendu : augmentent le modèle de la plante avec des états de perturbation, permettant une commande sans offset sans action intégrale dans la fonction de coût MPC. Cela est particulièrement efficace pour les systèmes servo avec des perturbations de charge persistantes.
- Fusion de capteurs (EKF, filtres complémentaires) : combinent des capteurs complémentaires — odométrie visuelle-inertielle avec des capteurs proprioceptifs, ou capteurs de position avec des mesures de courant — pour produire des estimations à faible latence et haute fréquence correspondant au timing du régulateur.
Le principe d’ingénierie clé est que la latence est un paramètre de conception, et non une considération secondaire. Chaque milliseconde de délai d’estimation réduit la bande passante de commande ou doit être explicitement compensée.
MPC linéaire vs. NMPC en co-conception estimation-commande : L’approche d’estimation et le type de régulateur sont étroitement couplés. La MPC linéaire + observateur d’état étendu (application 2, servo à moteur linéaire) est le cas le plus simple : un modèle de plante linéaire permet une MPC explicite (QP hors ligne → table de correspondance), et le DCESO estime les perturbations à partir d’un observateur linéaire. L’ensemble du pipeline est convexe et déterministe, permettant une bande passante de 208 Hz sur du matériel embarqué. La MPC incrémentale sans modèle (application 3, manipulateur robotique) utilise l’estimation à retard temporel pour construire un modèle linéaire incrémental implicite en ligne — l’optimisation reste un QP convexe, évitant entièrement l’identification de système. La MPC non linéaire (NMPC) + Estimation sur Horizon Glissant (MHE) (application 1, grue à pont) couple deux problèmes d’optimisation non linéaires — l’estimateur et le régulateur résolvent tous deux des NLPs à chaque pas. La génération de code automatique (ACADO) maintient le temps de résolution combiné à environ 1 ms, mais cela nécessite une initialisation soigneuse et un démarrage à chaud non nécessaires dans le cas linéaire. Les applications 4-6 (locomotion Solo12, locomotion perceptive ANYmal, lévitation magnétique) utilisent toutes la NMPC avec une estimation d’état non linéaire, reflétant des systèmes où la dynamique est véritablement non convexe : commutation de modes de contact, encodage de la géométrie du terrain comme ensembles de contraintes, ou instabilité en boucle ouverte avec des relations force-jeu non linéaires. Le choix entre la co-conception linéaire et non linéaire est ainsi déterminé par la possibilité de linéariser la dynamique de la plante autour de la plage d’exploitation — si oui, la pile linéaire offre un déploiement plus simple, une optimalité globale garantie et une faisabilité embarquée ; si non, NMPC+MHE fournit l’expressivité nécessaire à un coût de calcul et de mise en service significativement plus élevé.
Applications et Implémentations de Référence
Application 1 : NMPC + MHE Combinés pour Grue à Pont — Intralogistique
La MPC non linéaire a été associée à l’Estimation sur Horizon Glissant Non Linéaire sur un système de grue à pont, utilisant la génération de code automatique pour atteindre un temps d’exécution moyen combiné d’environ 1,02 ms (pic de 1,17 ms) contre une période d’échantillonnage de 10 ms. Le système a validé le mouvement point à point, le rejet de perturbations et le suivi de servo dans des expériences sur matériel. Cela démontre que l’estimation et la commande basées sur l’optimisation peuvent fonctionner ensemble en temps réel sur du matériel de calcul standard, avec une marge confortable en dessous de la période d’échantillonnage. L’approche de génération de code automatique (boîte à outils ACADO) est directement transférable aux applications industrielles de grue et de portique. 1
Application 2 : MPC Explicite + Observateur d’État Étendu pour Servo à Moteur Linéaire — Mouvement de Précision
Une architecture de commande à deux degrés de liberté combinant la MPC Explicite avec un Observateur d’État Étendu à Compensation Différentielle (DCESO) a été appliquée à un servo de positionnement à moteur linéaire. La MPC explicite élimine l’optimisation en ligne en pré-calculant la loi de commande comme une fonction affine par morceaux de l’état. La bande passante de la boucle de position a augmenté de 147 Hz à 208 Hz (une amélioration de 41 %), et le temps de stabilisation de la réponse à l’échelon est passé de 5,38 ms à 3,13 ms (critère à 5 %). L’observateur d’état étendu estime les forces de perturbation en temps réel, permettant un suivi sans offset sans action intégrale dans la formulation MPC. 2
Application 3 : MPC Incrémental avec Estimation à Retard Temporel — Manipulateur Robotique
Une méthode MPC incrémentale a été validée sur un manipulateur robot réel à 3 DDL, utilisant l’estimation à retard temporel pour construire un modèle incrémental qui évite entièrement l’identification explicite de la plante. C’est significatif car la MPC traditionnelle nécessite un modèle dynamique précis, qui peut être coûteux à obtenir et fragile lorsque la dynamique change (changements d’outils, usure, variation de charge utile). Le régulateur fonctionne sur un PC standard et a été démontré avec des moteurs Maxon et des encodeurs incrémentaux. L’approche traite la dynamique non modélisée comme des perturbations estimées à partir de mesures retardées, la rendant robuste aux décalages de modèle sans nécessiter une réidentification du système. 3
Application 4 : Fusion VIO + Odométrie des Jambes pour Locomotion NMPC — Robotique Quadrupède (Solo12)
L’Odométrie Visuelle-Inertielle (VIO) a été fusionnée avec l’odométrie des jambes pour supporter la locomotion basée sur NMPC sur le robot quadrupède Solo12, incluant des expériences en extérieur. Le pipeline d’estimation fait fonctionner un EKF à 200 Hz alimentant une MPC à 20 Hz, avec une commande bas niveau à 1 kHz. Ni la VIO seule (qui souffre de latence et d’interruptions) ni l’odométrie des jambes seule (qui dérive) ne fournissent une qualité d’état suffisante pour une locomotion dynamique. L’approche de fusion traite les modes de défaillance complémentaires : la vision fournit une correction de dérive absolue tandis que la proprioception fournit des estimations de vitesse à haute fréquence et faible latence. 4
Application 5 : NMPC de Locomotion Perceptive avec Estimation du Terrain — ANYmal (ETH Zurich)
Un pipeline perception-planification-commande centré sur la MPC non linéaire à 100 Hz a été validé sur le robot quadrupède ANYmal. Le terrain est encodé comme des contraintes d’appui convexes plus un champ de distance signée pour l’évitement de collision, avec la perception fonctionnant à 20 Hz et la commande de couple corps entier à 400 Hz. La couche d’estimation doit fournir la géométrie du terrain et l’état du robot aux fréquences et latences qui correspondent aux besoins du régulateur — un exemple clair de co-conception où le format de sortie du système de perception (ensembles de contraintes convexes) est choisi spécifiquement pour être consommable par le solveur MPC. 5
Application 6 : NMPC pour Lévitation Magnétique avec Estimation d’État — Démonstration en Laboratoire
La NMPC en temps réel a été démontrée expérimentalement sur une plante de lévitation magnétique rapide non linéaire, comparée à une référence PID. Le système est instable en boucle ouverte, ce qui signifie que le régulateur ne peut pas fonctionner sans une estimation d’état continue. La NMPC a rapporté de meilleures performances de commande que le PID, illustrant que pour les systèmes intrinsèquement instables, la co-conception estimation-commande détermine si le système peut fonctionner du tout, et pas seulement à quel point il fonctionne bien. 6
Ce Que Cela Signifie pour Vos Opérations
- Si votre projet MPC a bloqué pendant la mise en service, la cause profonde est probablement l’estimation. Auditez la latence, la fréquence de mise à jour et les caractéristiques de bruit de vos estimations d’état avant de réajuster le régulateur.
- Les budgets de latence ne sont pas négociables : pour une MPC à 100 Hz, l’estimateur doit livrer les états en moins de 5 ms. Documentez et vérifiez ces budgets pendant la conception.
- La fusion de capteurs n’est pas optionnelle pour les systèmes mobiles ou multi-axes : aucune modalité de capteur unique ne fournit la fréquence, la précision et la robustesse nécessaires pour une commande dynamique.
- La MHE est sous-utilisée dans l’industrie : si votre NMPC résout déjà une optimisation à chaque pas, l’ajout de MHE utilise la même infrastructure de solveur et fournit des estimations d’état cohérentes avec les contraintes.
Comment Nous Livrons Cela (Modèle d’Engagement)
- Phase 0 : NDA + demande de données — caractérisation des capteurs disponibles, des fréquences de mesure, des latences et de l’approche d’estimation actuelle.
- Phase 1 : Découverte à périmètre fixe — conception de l’architecture d’estimation, analyse du budget de latence et faisabilité de la co-conception MPC.
- Phase 2 : Implémentation + validation + mise en service — développement de l’estimateur, intégration MPC, tests Hardware-In-the-Loop et validation sur le terrain.
- Phase 3 : Surveillance + formation + mise à l’échelle — tableaux de bord de santé de l’estimation, logique de repli en mode dégradé et extension vers des axes ou unités supplémentaires.
KPIs Typiques à Suivre
- Qualité de l’estimation : erreur d’estimation d’état (RMS), fréquence de mise à jour de l’estimateur, latence de bout en bout (capteur à entrée du régulateur)
- Performances de commande : erreur de suivi, temps de stabilisation, bande passante, taux de violation de contraintes
- Robustesse : performances sous perte de capteur, comportement en mode dégradé, temps de récupération après réinitialisation de l’estimateur
- Marge de calcul : ratio temps de résolution du solveur / période d’échantillonnage (cible : pic de temps de résolution inférieur à 50 % de la période d’échantillonnage)
Risques et Prérequis
- Caractérisation des capteurs : le bruit, le biais, la latence et les modes de défaillance de chaque capteur doivent être documentés. C’est non négociable pour la co-conception.
- Budget de calcul : l’exécution simultanée de MHE et de NMPC double la charge de travail d’optimisation. Les outils de génération de code (ACADO, acados, CasADi) sont essentiels pour respecter les contraintes temps réel.
- Logique de repli : que se passe-t-il lorsque l’estimateur diverge ou qu’un capteur tombe en panne ? Le fonctionnement en mode dégradé (par ex., repli sur un observateur d’ordre réduit) doit être conçu, et non improvisé.
- Calibration et initialisation : les estimateurs ont besoin de conditions initiales. Les procédures de démarrage et les routines de calibration des capteurs font partie du livrable.
Foire Aux Questions
Q : Quand dois-je utiliser la MHE plutôt qu’un EKF ? Utilisez la MHE lorsque vous avez des contraintes d’état (par ex., limites physiques sur les températures, positions ou concentrations) que l’estimateur doit respecter, ou lorsque le système est fortement non linéaire et que la linéarisation EKF introduit des erreurs inacceptables. La MHE est plus coûteuse en calcul mais fournit des estimations cohérentes avec les contraintes.
Q : Puis-je utiliser une estimation basée sur l’apprentissage automatique avec la MPC ? Oui, mais avec précaution. Les estimateurs basés sur des réseaux de neurones peuvent fournir une inférence rapide, mais ils ne gèrent pas naturellement les contraintes et leurs modes de défaillance sont moins prévisibles. Un patron courant consiste à utiliser le ML pour la perception (cartes de terrain, détection d’objets) et l’estimation basée sur l’optimisation pour les états pertinents pour la commande.
Q : Quelle est l’importance réelle de la latence d’estimation ? Chaque milliseconde de latence raccourcit effectivement votre horizon de prédiction MPC d’un pas. Pour un régulateur à 100 Hz, 10 ms de latence signifie que le régulateur est toujours « un pas en retard » sur la réalité. Pour les systèmes instables (lévitation magnétique, équilibrage), cela peut faire la différence entre un fonctionnement stable et une défaillance.
Q : Que faire si nous ne pouvons pas ajouter plus de capteurs ? Les observateurs d’état et les capteurs logiciels peuvent souvent reconstruire les états non mesurés à partir des mesures disponibles. La question clé est l’observabilité : les états dont vous avez besoin peuvent-ils être inférés de ce que vous mesurez ? Un engagement de découverte à périmètre fixe comprend une analyse d’observabilité pour votre système spécifique.
Réservez un Appel Découverte de 30 Minutes
Prêt à explorer si ce patron correspond à votre système ?
Dr. Rafal Noga — Consultant Indépendant APC/MPC
📧 Contactez-moi · 🌐 noga.es
Découverte à périmètre fixe · NDA d’abord · Disponible sur site en DACH
Références Publiques
Footnotes
-
Debrouwere et al., “Combined NMPC + NMHE for overhead crane control” (KU Leuven / University of Freiburg, 2014). PDF ↩
-
“Explicit MPC + ESO servo algorithm for linear motor positioning” (MDPI Actuators, 2025). Lien ↩
-
Wang et al., “Incremental Model Predictive Control Exploiting Time-Delay Estimation for a Robot Manipulator” (IEEE Transactions on Control Systems Technology, 2022). IEEE Xplore | DLR eLib ↩
-
Dhédin et al., “Visual-Inertial and Leg Odometry Fusion for Dynamic Locomotion” (ICRA 2023, arXiv:2210.02127). PDF ↩
-
“Perceptive Locomotion through Nonlinear Model Predictive Control” (arXiv, 2022). PDF ↩
-
Novotny, “Magnetic levitation: real-time NMPC demonstrated experimentally vs PID baseline” (Springer, 2025). Lien ↩
Related Use Cases
Contact
Envoyer un message
Contact direct
Dr. Rafał Noga
Rendez-vous
Réservez un appel vidéo gratuit de 30 min directement via Calendly.
Réserver sur CalendlyRestez informé
Recevez des informations sur l'IA industrielle, l'APC et l'optimisation des procédés.