Zustandsschätzung + MPC Co-Design — Prädiktive Regelung auf realen Systemen zum Laufen bringen
Warum das relevant ist (Zusammenfassung für Entscheider)
- MPC, das „in der Simulation funktioniert, aber nicht am realen System”, scheitert fast immer an Schätzproblemen — Latenz, Drift, Rauschen oder unzureichende Aktualisierungsrate des Zustandsschätzers.
- Der gemeinsame Entwurf von Schätzer und Regler — mit expliziten Latenzbudgets, Fusionsstrategien und Fallback-Logik — ist das, was MPC auf physischer Hardware einsatzfähig macht.
- Referenzimplementierungen demonstrieren: kombiniertes NMPC + MHE bei 1 ms Gesamtrechenzeit an Brückenkranen, Servo-Bandbreite gesteigert von 147 Hz auf 208 Hz mittels Explicit MPC + Beobachter, sowie modellfreies inkrementelles MPC mit Time-Delay-Estimation, das eine explizite Streckenidentifikation vollständig vermeidet.
- Dieses Muster gilt für jedes System, bei dem der Regler Zustände benötigt, die nicht direkt messbar sind: Intralogistik, Präzisionsbewegung, Robotik und Prozessregelung.
Das Entwurfsmuster erklärt
Zustandsschätzung und MPC sind keine unabhängigen Module. Der Schätzer muss Zustandsschätzungen in der Rate, Latenz und Genauigkeit liefern, die der Regler benötigt. Wenn bildbasierte Sensorik 50 ms Latenz einführt, muss der Regler entweder vorausschätzen oder extrapolieren — und diese Prädiktion muss gemeinsam mit dem MPC-Horizont entworfen werden.
Drei hauptsächliche Schätzansätze treten in den Referenzimplementierungen auf:
- Moving Horizon Estimation (MHE): ein optimierungsbasierter Schätzer, der — wie MPC — bei jedem Schritt ein beschränktes Problem löst. MHE behandelt Zustandsbeschränkungen (z. B. „diese Temperatur kann nicht negativ sein”) auf natürliche Weise und sorgt für Konsistenz mit der NMPC-Formulierung.
- Erweiterte Zustandsbeobachter (Extended State Observer): erweitern das Streckenmodell um Störungszustände und ermöglichen so offset-freie Regelung ohne Integralanteil in der MPC-Kostenfunktion. Dies ist besonders wirksam für Servosysteme mit persistenten Lastdisturbances.
- Sensorfusion (EKF, Komplementärfilter): kombinieren komplementäre Sensoren — visuelle-inertiale Odometrie mit propriozeptiven Sensoren oder Positionssensoren mit Strommessungen — um latenzarme, hochratige Schätzungen zu erzeugen, die auf das Timing des Reglers abgestimmt sind.
Das zentrale Ingenieursprinzip lautet: Latenz ist ein Entwurfsparameter, keine nachträgliche Überlegung. Jede Millisekunde Schätzverzögerung reduziert entweder die Regelbandbreite oder muss explizit kompensiert werden.
Lineares MPC vs. NMPC im Schätzungs-Regelungs-Co-Design: Der Schätzansatz und der Reglertyp sind eng miteinander gekoppelt. Lineares MPC + erweiterter Zustandsbeobachter (Anwendung 2, Linearmotor-Servo) ist der einfachste Fall: Ein lineares Streckenmodell ermöglicht Explicit MPC (Offline-QP → Lookup-Tabelle), und der DCESO schätzt Störungskräfte aus einem linearen Beobachter. Die gesamte Pipeline ist konvex und deterministisch, was 208 Hz Bandbreite auf eingebetteter Hardware ermöglicht. Inkrementelles modellfreies MPC (Anwendung 3, Roboterlenk) verwendet Time-Delay-Estimation, um online ein implizites lineares inkrementelles Modell aufzubauen — die Optimierung bleibt ein konvexes QP, wodurch Systemidentifikation vollständig entfällt. Nichtlineares MPC (NMPC) + Moving Horizon Estimation (MHE) (Anwendung 1, Brückenkran) koppelt zwei nichtlineare Optimierungsprobleme — sowohl Schätzer als auch Regler lösen bei jedem Schritt NLPs. Automatische Code-Generierung (ACADO) hält die kombinierte Lösungszeit bei ca. 1 ms, erfordert jedoch sorgfältige Initialisierung und Warm-Starting, die im linearen Fall nicht nötig sind. Anwendungen 4—6 (Solo12-Lokomotion, ANYmal Perceptive Locomotion, Magnetschwebung) verwenden alle NMPC mit nichtlinearer Zustandsschätzung, da die Dynamik dieser Systeme genuinen nicht-konvexen Charakter hat: Kontaktmodus-Umschaltung, Geländegeometrie als Beschränkungsmengen kodiert oder Open-Loop-Instabilität mit nichtlinearen Kraft-Spalt-Beziehungen. Die Wahl zwischen linearem und nichtlinearem Co-Design wird damit davon bestimmt, ob die Streckendynamik im Betriebsbereich linearisierbar ist — falls ja, bietet der lineare Ansatz einfachere Inbetriebnahme, garantierte globale Optimalität und eingebettete Realisierbarkeit; falls nein, liefert NMPC+MHE die notwendige Ausdrucksstärke zu deutlich höherem Rechen- und Inbetriebnahmeaufwand.
Anwendungen & Referenzimplementierungen
Kombiniertes NMPC + MHE für Brückenkran — Intralogistik
Nonlinear MPC wurde mit Nonlinear Moving Horizon Estimation an einem Brückenkransystem kombiniert und nutzte automatische Code-Generierung, um eine kombinierte mittlere Ausführungszeit von ca. 1,02 ms (Spitze 1,17 ms) bei einer Abtastzeit von 10 ms zu erzielen. Das System wurde in Hardware-Experimenten für Punkt-zu-Punkt-Bewegung, Störungsausregelung und Servo-Nachführung validiert. Dies belegt, dass optimierungsbasierte Schätzung und Regelung gemeinsam in Echtzeit auf Standard-Rechenhardware betrieben werden können, mit komfortablem Abstand unterhalb der Abtastperiode. Der automatische Code-Generierungsansatz (ACADO-Toolkit) ist direkt auf industrielle Kran- und Portalkran-Anwendungen übertragbar.1
Explicit MPC + Erweiterter Zustandsbeobachter für Linearmotor-Servo — Präzisionsbewegung
Eine Zwei-Freiheitsgrade-Regelarchitektur, die Explicit MPC mit einem Differentiell-Kompensierten Erweiterten Zustandsbeobachter (DCESO) kombiniert, wurde auf einen Linearmotor-Positionierservo angewendet. Das Explicit MPC eliminiert die Online-Optimierung durch Vorberechnung des Regelgesetzes als stückweise-affine Funktion des Zustands. Die Positionsschleifen-Bandbreite stieg von 147 Hz auf 208 Hz (eine Verbesserung von 41 %), und die Einschwingzeit der Sprungantwort sank von 5,38 ms auf 3,13 ms (5 %-Kriterium). Der erweiterte Zustandsbeobachter schätzt Störungskräfte in Echtzeit und ermöglicht so offset-freie Nachführung ohne Integralanteil in der MPC-Formulierung.2
Inkrementelles MPC mit Time-Delay-Estimation — Roboterlenk
Eine inkrementelle MPC-Methode wurde an einem realen 3-DoF-Roboterlenk validiert und nutzte Time-Delay-Estimation, um ein inkrementelles Modell aufzubauen, das explizite Streckenidentifikation vollständig vermeidet. Dies ist bedeutsam, weil traditionelles MPC ein genaues dynamisches Modell erfordert, das kostspielig zu beschaffen und bei Dynamikänderungen (Werkzeugwechsel, Verschleiß, Lastwechsel) fragil sein kann. Der Regler läuft auf einem Standard-PC und wurde mit Maxon-Motoren und inkrementellen Encodern demonstriert. Der Ansatz behandelt unmodellierte Dynamik als Störungen, die aus verzögerten Messungen geschätzt werden, und ist dadurch robust gegenüber Modellabweichungen ohne erneute Systemidentifikation.3
VIO + Beinodometrie-Fusion für NMPC-Lokomotion — Vierbeinige Robotik (Solo12)
Visual-Inertial Odometry (VIO) wurde mit Beinodometrie kombiniert, um NMPC-basierte Lokomotion am Vierbeiner Solo12 zu unterstützen, einschließlich Außenversuchen. Die Schätzpipeline betreibt einen EKF mit 200 Hz, der ein MPC mit 20 Hz speist, mit Low-Level-Regelung bei 1 kHz. Weder VIO allein (das unter Latenz und Ausfällen leidet) noch Beinodometrie allein (die driftet) bietet ausreichende Zustandsqualität für dynamische Lokomotion. Der Fusionsansatz adressiert komplementäre Fehlermodi: Vision liefert absolute Driftkorrrektur, während Propriozeption hochratige, latenzarme Geschwindigkeitsschätzungen bereitstellt.4
Perceptive Locomotion NMPC mit Geländeschätzung — ANYmal (ETH Zurich)
Eine Wahrnehmungs-Planungs-Regelungs-Pipeline, die auf nichtlinearem MPC mit 100 Hz basiert, wurde am Vierbeiner ANYmal validiert. Das Gelände wird als konvexe Fußpunktbeschränkungen plus Signed-Distance-Field zur Kollisionsvermeidung kodiert, wobei die Wahrnehmung mit 20 Hz und die Ganzkörper-Drehmomentsregelung mit 400 Hz läuft. Die Schätzschicht muss Geländegeometrie und Roboterzustand in Raten und Latenzen liefern, die den Anforderungen des Reglers entsprechen — ein klares Beispiel für Co-Design, bei dem das Ausgabeformat des Wahrnehmungssystems (konvexe Beschränkungsmengen) gezielt so gewählt wird, dass es vom MPC-Solver verarbeitet werden kann.5
NMPC für Magnetschwebung mit Zustandsschätzung — Labordemonstration
Echtzeit-NMPC wurde experimentell an einer schnellen nichtlinearen Magnetschwebungsanlage demonstriert und mit einem PID-Baseline-Regler verglichen. Das System ist Open-Loop-instabil, d. h. der Regler kann ohne kontinuierliche Zustandsschätzung nicht funktionieren. NMPC zeigte bessere Regelgüte als PID und verdeutlicht, dass für inhärent instabile Systeme das Schätzungs-Regelungs-Co-Design darüber entscheidet, ob das System überhaupt betrieben werden kann — nicht nur, wie gut es arbeitet.6
Was das für Ihren Betrieb bedeutet
- Wenn Ihr MPC-Projekt während der Inbetriebnahme ins Stocken geraten ist, liegt die Ursache wahrscheinlich in der Schätzung. Prüfen Sie Latenz, Aktualisierungsrate und Rauschcharakteristik Ihrer Zustandsschätzungen, bevor Sie den Regler neu abstimmen.
- Latenzbudgets sind nicht verhandelbar: Für ein 100-Hz-MPC muss der Schätzer Zustände in unter 5 ms liefern. Dokumentieren und verifizieren Sie diese Budgets während des Entwurfs.
- Sensorfusion ist für mobile oder mehrachsige Systeme keine Option: Kein einzelnes Sensorprinzip liefert die Rate, Genauigkeit und Robustheit, die für dynamische Regelung benötigt werden.
- MHE wird in der Industrie zu wenig genutzt: Wenn Ihr NMPC bei jedem Schritt bereits eine Optimierung löst, nutzt MHE dieselbe Solver-Infrastruktur und liefert beschränkungskonsistente Zustandsschätzungen.
Wie wir liefern (Engagement-Modell)
- Phase 0: NDA + Datenanfrage — Charakterisierung verfügbarer Sensoren, Messraten, Latenzen und des aktuellen Schätzansatzes.
- Phase 1: Discovery mit festem Umfang — Schätzarchitektur-Entwurf, Latenzbudget-Analyse und Machbarkeit des MPC-Co-Designs.
- Phase 2: Implementierung + Validierung + Inbetriebnahme — Schätzerentwicklung, MPC-Integration, Hardware-in-the-Loop-Tests und Feldvalidierung.
- Phase 3: Monitoring + Schulung + Skalierung — Schätzergesundheits-Dashboards, Degraded-Mode-Fallback-Logik und Erweiterung auf weitere Achsen oder Einheiten.
Typische KPIs zur Verfolgung
- Schätzqualität: Zustandsschätzfehler (RMS), Schätzer-Aktualisierungsrate, End-to-End-Latenz (Sensor bis Regler-Eingang)
- Regelgüte: Nachführfehler, Einschwingzeit, Bandbreite, Beschränkungsverletzungsrate
- Robustheit: Leistung bei Sensorausfall, Degraded-Mode-Verhalten, Zeit zur Wiederherstellung nach Schätzer-Reset
- Rechenmarge: Verhältnis Solver-Zeit zu Abtastperiode (Ziel: Spitzen-Solver-Zeit unter 50 % der Abtastperiode)
Risiken & Voraussetzungen
- Sensorcharakterisierung: Rauschen, Bias, Latenz und Fehlermodi jedes Sensors müssen dokumentiert sein. Dies ist für das Co-Design nicht verhandelbar.
- Rechenbudget: Der gleichzeitige Betrieb von MHE und NMPC verdoppelt den Optimierungsaufwand. Code-Generierungswerkzeuge (ACADO, acados, CasADi) sind unerlässlich, um Echtzeitanforderungen zu erfüllen.
- Fallback-Logik: Was passiert, wenn der Schätzer divergiert oder ein Sensor ausfällt? Degraded-Mode-Betrieb (z. B. Rückfall auf einen Beobachter reduzierter Ordnung) muss entworfen, nicht improvisiert werden.
- Kalibrierung und Initialisierung: Schätzer benötigen Anfangsbedingungen. Hochfahrprozeduren und Sensorkalibrierungsroutinen sind Bestandteil des Liefergegenstands.
FAQ
F: Wann sollte ich MHE statt eines EKF verwenden? Verwenden Sie MHE, wenn Sie Zustandsbeschränkungen haben (z. B. physikalische Grenzen für Temperaturen, Positionen oder Konzentrationen), die der Schätzer einhalten muss, oder wenn das System stark nichtlinear ist und die EKF-Linearisierung unakzeptable Fehler einführt. MHE ist rechenaufwändiger, liefert aber beschränkungskonsistente Schätzungen.
F: Kann ich maschinenlernbasierte Schätzung mit MPC kombinieren? Ja, aber mit Bedacht. Auf neuronalen Netzen basierende Schätzer können schnelle Inferenz liefern, behandeln Beschränkungen jedoch nicht auf natürliche Weise, und ihre Fehlermodi sind weniger vorhersehbar. Ein verbreitetes Muster ist der Einsatz von ML für die Wahrnehmung (Geländekarten, Objekterkennung) und optimierungsbasierter Schätzung für die regelungsrelevanten Zustände.
F: Wie sehr wirkt sich Schätzlatenz tatsächlich aus? Jede Millisekunde Latenz verkürzt den MPC-Prädiktionshorizont effektiv um einen Schritt. Bei einem 100-Hz-Regler bedeuten 10 ms Latenz, dass der Regler der Realität stets „einen Schritt hinterherhinkt”. Bei instabilen Systemen (Magnetschwebung, Balancieren) kann dies den Unterschied zwischen stabilem Betrieb und Ausfall bedeuten.
F: Was, wenn wir keine zusätzlichen Sensoren hinzufügen können? Zustandsbeobachter und Soft-Sensoren können nicht gemessene Zustände häufig aus verfügbaren Messungen rekonstruieren. Die entscheidende Frage ist die Beobachtbarkeit: Können die benötigten Zustände aus den gemessenen Größen abgeleitet werden? Ein Discovery-Engagement mit festem Umfang beinhaltet eine Beobachtbarkeitsanalyse für Ihr spezifisches System.
30-minütigen Discovery-Call buchen
Bereit zu erkunden, ob dieses Muster zu Ihrem System passt?
Dr. Rafal Noga — Unabhängiger APC/MPC-Berater
Fester Projektumfang · NDA zuerst · DACH-Vor-Ort-Einsätze möglich
Öffentliche Referenzen
Footnotes
-
Debrouwere et al., “Combined NMPC + NMHE for overhead crane control” (KU Leuven / University of Freiburg, 2014). PDF ↩
-
“Explicit MPC + ESO servo algorithm for linear motor positioning” (MDPI Actuators, 2025). Link ↩
-
Wang et al., “Incremental Model Predictive Control Exploiting Time-Delay Estimation for a Robot Manipulator” (IEEE Transactions on Control Systems Technology, 2022). IEEE Xplore | DLR eLib ↩
-
Dhédin et al., “Visual-Inertial and Leg Odometry Fusion for Dynamic Locomotion” (ICRA 2023, arXiv:2210.02127). PDF ↩
-
“Perceptive Locomotion through Nonlinear Model Predictive Control” (arXiv, 2022). PDF ↩
-
Novotny, “Magnetic levitation: real-time NMPC demonstrated experimentally vs PID baseline” (Springer, 2025). Link ↩
Related Use Cases
Kontakt
Nachricht senden
Direkter Kontakt
Dr. Rafał Noga
Bleiben Sie informiert
Erhalten Sie Einblicke zu Industrieller KI, APC und Prozessoptimierung direkt in Ihr Postfach.