Mathématiques

Quand les maths se mettent en train

Clémentine LAURENS • Twitter: @ClemLaurens 

©den-belitsky – stock.adobe.com, vectorjuice/Freepik

Guillaume Dalle est un jeune chercheur à l’École Polytechnique Fédérale de Lausanne, en Suisse. En décembre 2022, il a défendu sa thèse de doctorat intitulée Apprentissage statistique et algorithmes d’optimisation combinatoire, avec des applications à la planification ferroviaire. Pour Athena, il revient sur ses travaux et explique comment les mathématiques peuvent aider à faire rouler des trains 

   INTERVIEW DE GUILLAUME DALLE

   Des mathématiques pour la «planification ferroviaire» ? Qu’est-ce que cela signifie exactement ?

Les mathématiques fournissent des outils puissants pour faire face à certains enjeux du secteur ferroviaire. Dans ma thèse, par exemple, je me suis intéressé à la résolution de 3 grands problèmes. D’abord, la prédiction des pannes. Le but est d’anticiper la survenue des avaries graves, celles qui peuvent causer l’immobilisation d’une rame. On souhaite prévoir à quel moment un tel problème risque d’arriver, pour envoyer la rame au centre technique avant qu’elle ne tombe réellement en panne.

Le second problème que j’ai considéré est celui de la propagation des retards – cet effet papillon qui fait qu’un train subissant un retard entre Bruxelles et Ottignies peut in fine perturber la circulation ferroviaire entre Gand et Anvers.

Enfin, j’ai travaillé sur l’allocation des voies. Sur un réseau ferroviaire, on a des trains, des gares et des horaires à respecter. Il faut donc attribuer à chaque train un itinéraire à travers le réseau qui lui permette de relier sa gare de départ et sa gare d’arrivée, ceci en respectant les horaires… Et surtout, sans rentrer dans un autre train !

   Comment vous êtes-vous attaqué à ces 3 sujets ?

Pour la prédiction des pannes, on peut exploiter le fait que les trains d’aujourd’hui ne sont pas juste constitués de roues et d’un moteur. Ils embarquent tout un tas de composants informatiques qui envoient régulièrement des informations sur l’état du train. Elles peuvent être tout à fait banales – comme l’information «Le moteur a été allumé à telle heure» – ou plus alarmantes: par exemple «Tel appareil n’a pas démarré». Avec les bons outils mathématiques, on peut utiliser ces données quotidiennes pour prédire la survenue des problèmes les plus graves.

Concernant la propagation des retards, le constat initial est que, lorsqu’on décide des horaires des trains, il est difficile de choisir exactement les bons intervalles entre les différents départs et arrivées. Avec un délai trop long, on fait circuler moins de trains dans une journée, mais avec un délai trop court, on est très sensible aux perturbations ! C’est ce qui explique cet effet boule de neige dans les retards. Pour améliorer les choses, on peut tâcher de comprendre la mécanique de propagation des retards et créer un modèle statistique qui anticipe leur survenue. Cela permettrait ensuite planifier les horaires des trains de sorte qu’ils puissent naturellement amortir les imprévus.

Le problème de l’allocation des voies, lui, est extrêmement compliqué – en mathématiques, on dit que c’est un problème «NP-difficile». Pourtant, il est facile de trouver un itinéraire entre une gare de départ et une gare d’arrivée pour un seul train ! Mais la complexité explose parce que les trains sont nombreux, et qu’on ne veut pas qu’ils entrent en collision. L’idée, c’est donc d’approcher le problème difficile (celui avec plusieurs trains) de manière intelligente, pour pouvoir le ramener au problème simple (celui avec un seul train).

Prédictions, décisions

   Quels défis pose la résolution de tels problèmes ?

La première des difficultés, c’est de trouver un langage commun pour relier le monde des mathématiques et le secteur ferroviaire. C’est loin d’être évident: on n’a pas les mêmes compétences, on n’est pas habitués aux mêmes outils ni aux mêmes enjeux. La modélisation, c’est toujours un défi: comment passer d’un problème très concret avec plein de paramètres à un problème simplifié, exprimé en langage mathématique et sur lequel on puisse faire des calculs ?

   Quels outils mathématiques utilise-t-on ?

Ma recherche fait intervenir essentiellement 2 disciplines: l’apprentissage automatique (aussi appelé «machine learning») et l’optimisation. L’apprentissage automatique, c’est l’art de décrire un système dans lequel il y a des données de départ et des données de sortie, en donnant une relation entre les entrées et les sorties à l’aide de lois de probabilité. En somme, on veut pouvoir dire: «s’il se passe ceci en entrée du système, en sortie on a telle probabilité qu’il se passe ça et telle probabilité qu’il se passe ça».

Pour modéliser la propagation des retards par exemple, la donnée d’entrée est l’état du réseau ferroviaire à une certaine heure, et la sortie l’état du réseau quelques minutes plus tard. Et pour la prédiction de panne, les données d’entrée sont les informations fournies quotidiennement par le train, et la sortie est la probabilité que le train tombe en panne à un certain moment.

   Et l’optimisation ?

C’est ce qui nous sert à résoudre concrètement les problèmes. Car une fois qu’on a des prédictions, on veut pouvoir prendre des décisions: à quel moment faut-il envoyer un train au centre technique ? Quel itinéraire lui faire prendre ? Le but de l’optimisation, c’est de concilier des contraintes – des horaires à respecter, l’impossibilité pour 2 trains de se retrouver au même endroit au même moment etc. – et des objectifs. Ces objectifs sont souvent exprimés sous la forme de quantités qu’on veut maximiser ou minimiser: on veut un minimum de coûts de maintenance, un minimum de retards…

   Pourquoi faire des mathématiques ferroviaires ?

Dans le contexte écologique actuel, si l’on veut encourager le report modal de la voiture ou de l’avion vers le train, il est important d’avoir un système ferroviaire qui soit fiable, attractif et économiquement performant. Les trains n’ont pas attendu la recherche en mathématiques pour rouler bien sûr, mais notre discipline peut aider à améliorer le système existant pour faciliter la transition écologique.

 

L’APPRENTISSAGE
AUTOMATIQUE OU MACHINE LEARNING

Comme son nom l’indique, le principe de l’apprentissage automatique est de permettre à un ordinateur d’«apprendre par lui-même». Pour cela, on lui fournit un très grand nombre de données, et grâce à des règles statistiques la machine peut inférer les relations, les lois, cachées dans ces données: elle «apprend» comment ces dernières sont structurées. On appelle cette étape la phase d’apprentissage ou d’entraînement. Dans un second temps, l’ordinateur peut réinvestir ce qu’il a appris pour analyser de nouvelles données – c’est la phase de production.

 
Un cas d’usage très classique de machine learning est la reconnaissance automatique d’images – par exemple, pour identifier le type d’animal présent sur une photographie. Pendant la phase d’entraînement, on fournit à un ordinateur un très grand nombre de photos avec leurs descriptions: «chat», «serpent», «baleine»… L’ordinateur va alors trouver une méthode pour relier les photos à leurs descriptions. Par exemple, il peut identifier que lorsque la forme centrale comporte des rayures il s’agit souvent d’un zèbre ou d’un tigre, ou constater que lorsque la couleur bleue est dominante dans l’image, il s’agit souvent d’une baleine… En recoupant toutes ces observations statistiques, l’ordinateur «apprend» des règles lui permettant d’identifier les animaux sur les images. Règles qui lui permettent ensuite d’identifier les animaux sur de nouvelles photographies, cette fois-ci sans avoir préalablement accès à leurs descriptions.

Share This