Transcription
Transcription : Le modèle de subventions et de contributions, par Logement, Infrastructures et Collectivités Canada
[00:00:00 Texte à l'écran : Projets fondés sur l'intelligence artificielle au gouvernement du Canada; Le modèle de subventions et de contributions, par Logement, Infrastructures et Collectivités Canada.]
[00:00:03 Kirsten Gaudreau, Pierre Zwiller-Panicz et une collègue apparaissent dans des fenêtres de clavardage vidéo]
Kirsten Gaudreau : Merci Roxanne et bonjour à tous. Merci d'être là. Pierre et moi sommes là
[00:00:08 Kirsten Gaudreau apparaît en plein écran.]
Kirsten Gaudreau : pour vous présenter notre modèle de prévision par apprentissage automatique pour les subventions et contributions. Prochaine diapo.
[00:00:15 Texte à l'écran : Kirsten Gaudreau, Senior Financial Manager, Finance and Administration, HICC / Gestionnaire principale des services financiers, Finances et administration, LICC]
Kirsten Gaudreau : On va commencer. Moi, je vais être là pour vous donner un peu de contexte sur le modèle, le problème qu'on a soulevé ici à LICC.
[00:00:28 Écran partagé : Kirsten Gaudreau et Pierre Zwiller-Panicz dans des fenêtres de clavardage video, un téléphone cellulaire et le texte suivant : A plan for AI Answers on Canada.ca, December 12, 2025.]
Kirsten Gaudreau : On va parler de la précision du modèle, des impacts, des résultats, de la mise en œuvre et de la gestion du changement pour l'utilisateur.
[00:00:38 Écran partagé : Kirsten Gaudreau et Pierre Zwiller-Panicz Kirsten Gaudreau et Pierre Zwiller-Panicz dans des fenêtres de clavardage video et la diapositive intitulée : ORDRE DU JOUR. Tel que décrit.]
Kirsten Gaudreau : Ensuite, je vais passer la parole à Pierre, qui va vous donner une explication beaucoup plus technique sur le fonctionnement du modèle et comment ça a été développé. Prochaine diapo.
[00:00:48 Écran partagé : Kirsten Gaudreau et Pierre Zwiller-Panicz dans des fenêtres de clavardage video et diapositive intitulée : Le défi : Les surplus budgétaires. Tel que décrit.]
Kirsten Gaudreau : Le projet a vraiment commencé dû au défi à LICC, des surplus budgétaires en subventions et contributions. Pendant quelques années, on a vu des surplus budgétaires de plus de deux milliards de dollars au sein de notre département. Ce qui a mené les agences centrales à faire une demande pour une amélioration des prévisions ou des demandes budgétaires pour les subventions et contributions. Qu'est-ce qui informe les demandes budgétaires? Ce sont nos prévisions en matière de subventions et contributions. Auparavant, on basait ces prévisions-là sur les flux de trésorerie qu'on recevait de la part des récipiendaires.
Mais due à la nature vraiment imprévisible des projets d'infrastructures; donc on pense à des facteurs comme des événements météorologiques ou bien des défis en termes de chaîne d'approvisionnement. Ça fait en sorte que ce n'est pas toujours faisable d'améliorer les flux de trésorerie comme tel.
Donc à l'interne, on a changé de voie, puis on a décidé de se concentrer sur le développement de méthodes de prévision pour chacun de nos programmes de subventions et contributions. Donc c'était vraiment des modèles, au départ, manuels basés sur des données historiques comme des flux de trésorerie et des dépenses réelles. Mais on a rapidement constaté qu'il nous fallait une approche standardisée, qu'on pouvait appliquer à la majorité de nos programmes actuels et qui pourrait aussi être adaptable à de futurs programmes.
Donc c'est à ce moment-là, au sein des finances, dans notre ministère, qu'on a voulu collaborer avec le Bureau des données pour bâtir un modèle d'apprentissage automatique prêt à l'emploi, un modèle qui est évolutif, fondé sur les données historiques des subventions et contributions. Un modèle qui est auto-apprenant et adaptable au programme actuel et futur.
Prochaine diapo.
[00:02:40 Écran partagé : Kirsten Gaudreau et Pierre Zwiller-Panicz dans des fenêtres de clavardage video et Diapositive avec graphique intitulée : Aperçus sur la précision : Performance de l'apprentissage automatique.]
Kirsten Gaudreau : Donc ici, ce qu'on voit à l'écran, c'est le résultat du modèle visualisé dans Power BI. C'est ce que voit l'utilisateur ultime, donc les gestionnaires financiers. Ce qu'on voit ici, ce sont les résultats du modèle, donc la ligne verte, qui se rapproche beaucoup plus étroitement des dépenses réelles dans les années précédentes, comparativement au flux de trésorerie qu'on reçoit des récipiendaires qui sont souvent surestimés. C'est les gestionnaires qui vont se servir de cet outil-là pour mettre à jour nos exercices financiers, aussi vont s'en servir pour informer leur conversation avec les clients. Prochaine diapo.
[00:03:23 Écran partagé : Kirsten Gaudreau et Pierre Zwiller-Panicz dans des fenêtres de clavardage video et diapositive intitulée : Favoriser le changement : Comment l'apprentissage automatique génère un impact concret. Tel que décrit.]
Kirsten Gaudreau : Non seulement le modèle mène à de très bons résultats et nous permet de mieux se rapprocher de nos demandes budgétaires à nos dépenses réelles. On a aussi vu un impact très positif en termes de charges de travail à l'interne. On a pu réduire notre temps de préparation, les mises à jour annuelles des niveaux de référence, de trois mois à un mois à l'aide de l'outil et d'un mois à l'autre pour mettre à jour nos situations financières, on a pu passer de trois à cinq jours, que ça nous prenait auparavant pour compiler nos méthodologies manuelles, à moins de dix minutes à l'aide du modèle en cliquant un bouton pour mettre à jour les données.
Mais le modèle a le potentiel d'avoir un impact sur le gouvernement fédéral en son entier. Donc si on pense au niveau de dépenses pour le gouvernement fédéral, on a vu plus de 150 milliards de dépenses en subventions et contributions pour le gouvernement. Donc, s'il y avait d'autres départements qui adoptaient le modèle, ça pourrait avoir un grand impact sur la prévisibilité du cadre financier du département. Même une petite amélioration des prévisions pourrait avoir un grand impact sur le cadre financier. Prochaine diapo.
[00:04:38 Écran partagé : Kirsten Gaudreau et Pierre Zwiller-Panicz dans des fenêtres de clavardage video et diapositive intitulée : Principaux éléments à considérer. Tel que décrit.]
Kirsten Gaudreau : Maintenant, pour les départements qui pensent peut-être vouloir adopter le modèle dans leur propre contexte, il y a certaines considérations ou des éléments clés à considérer. La première, c'est que le modèle a été bâti pour la majorité des programmes. Si, par exemple, dans votre contexte, vous avez un programme qui est très différent de la majorité, il se pourrait que le modèle performe moins bien pour ce programme-là. La deuxième, c'est que les prévisions reposent sur les données de projets existants. Donc, si dans votre base de données, il manque un projet, il y a des données de programmes qui sont incomplets, alors le modèle ne pourra pas prédire pour ces informations manquantes-là. Le modèle reflète aussi la qualité des données. Meilleures sont les données, meilleurs seront les résultats du modèle.
Finalement, le modèle est mieux adapté aux prévisions agrégées. Ce qu'on veut dire par là, c'est que le total global performe mieux que les résultats au niveau des projets. Alors que les informations existent au niveau des projets, ces prévisions-là vont s'équilibrer à la toute fin et vont mener à des bons résultats, soit au total global ou peut-être même au niveau des programmes. Sur ce, je vais passer la parole à Pierre. Merci.
Pierre Zwiller-Panicz : Merci beaucoup Kirsten.
[00:06:11 Pierre Zwiller-Panicz apparaît en plein écran]
Maintenant, on va passer à la partie un peu plus technique de la présentation puisqu'on entend beaucoup parler d'intelligence artificielle. Mais ici, dans cette partie de la présentation, on va vraiment se concentrer sur ce qu'est vraiment le modèle et ce qui se cache derrière toutes ces prévisions.
[00:06:22 Texte à l'écran : Pierre Zwiller-Panicz, Senior Data Science Analyst (Acting, HICC / Analyste principal de sciences des données (par intérim), LICC.]
Ici, sur cette « slide », ce que vous pouvez voir, c'est un petit peu le pipeline que nous, on utilise chez LICC pour pouvoir avoir le modèle de A à Z. Le modèle est codé en Python. Ces résultats et ces outputs sont mis dans notre plateforme sur Azure DevOps, qui nous permet de garder toutes les traces, justement, des outputs du modèle. Ensuite, on va venir visualiser ça dans Power BI, surtout pour les équipes financières. C'est un outil de visualisation très simple, donc on n'a pas besoin de nécessairement beaucoup de formations pour les agents financiers. C'est vraiment très pratique à utiliser pour eux et surtout partager; plusieurs analystes financiers peuvent se retrouver sur le même Power BI en même temps. On a trouvé que c'était beaucoup plus pratique pour leur travail de tous les jours. Ce que vous pouvez voir encadré en rouge, la surveillance par IA, c'est actuellement un Framework qu'on est en train de développer au sein de LICC.
[00:06:25 Écran partagé : Écran partagé : Kirsten Gaudreau et Pierre Zwiller-Panicz dans des fenêtres de clavardage video et diapositive intitulée : Pipeline du modèle d'apprentissage automatique.]
Puisqu'il faut savoir qu'un modèle, quand on le met en production, ce n'est pas quelque chose qu'on va simplement lancer et ne jamais paramétrer ou réévaluer. Au contraire, nous, on veut qu'une fois qu'il est en production, on veut vraiment garder un œil dessus et faire en sorte que les résultats ne deviennent pas plus mauvais au fur et à mesure du temps pour pouvoir les ajuster et justement garder cette justesse qu'on a actuellement au sein de LICC.
[00:07:44 Écran partagé : Écran partagé : Kirsten Gaudreau et Pierre Zwiller-Panicz dans des fenêtres de clavardage video et diapositive intitulée : Sélection stratégique des variables : Un atout majeur pour l'utilité de l'apprentissage automatique.]
Pierre Zwiller-Panicz : Ici, ce que vous pouvez voir, c'est un petit peu toutes nos interrogations qu'on avait quand on a commencé le projet. On se retrouve avec une base de données qui est extrêmement fournie, avec plus de, je dirais, 1 000 variables qu'on pourrait prendre en compte pour construire le modèle. Ça a été vraiment quelque chose qu'on a dû évaluer, notamment au début du projet avec Kirsten. Cette forêt aléatoire, qui est notre modèle de base, elle est performante grâce à des données qui viennent de notre base de données directement, ce que vous pouvez voir en bleu. Ici, concrètement, ce qu'on a, c'est qu'on a des informations au niveau du programme, au niveau des « agreements » et ensuite au niveau des projets.
C'est vraiment cette strate de données qui va nous permettre d'avoir une vision d'ensemble et qui va permettre au modèle d'avoir une vision d'ensemble, surtout pour nous donner des résultats plus justes.
Basé sur ces données-là, on a créé des variables qui en découlent directement. Ici, le but, c'est d'informer le modèle de plusieurs choses. Une fois que le modèle prend la donnée en compte, il va être informé de ce qui a été dépensé en moyenne, ce qui a été dépensé dans les années précédentes et ce qui reste à dépenser au sein du projet pour les années futures. Cela va vraiment donner une indication et ça va lui permettre surtout de ne pas reproduire les « cash flows » qu'on peut recevoir de la part de nos récipients qui sont la plupart du temps surestimés. Ça va vraiment permettre au modèle de garder les sommes d'argent et les résultats dans un « bracket » qui est relativement convenable. Mais pour comprendre vraiment ce qu'est le modèle, une forêt aléatoire de base, c'est un ensemble d'arbres de décisions. Ici, c'est ce que vous pouvez voir sur l'écran, c'est la représentation, disons, d'un arbre de décisions. La manière dont on aime bien l'illustrer, c'est de donner au niveau des finances et de dire qu'un arbre de décisions équivaut à un analyste financier. Je vais aller le voir au début de la journée et je vais lui dire : Très bien, j'aimerais avoir un « forecast » sur tel projet. L'analyste, avec ses informations et ses connaissances, va analyser et essayer de donner un résultat pour cette prédiction.
[00:09:24 Écran partagé : Écran partagé : Kirsten Gaudreau et Pierre Zwiller-Panicz dans des fenêtres de clavardage video et diapositive avec graphique intitulée : Maîtriser l'apprentissage automatique. Tel que décrit.]
Ici, par exemple, l'analyste va regarder à quelle étape du projet on en est. Est-ce qu'on en est à la première, la deuxième année? Qu'est-ce qui a été dépensé auparavant ou qu'est-ce qui reste? Aussi, par exemple, la durée totale du projet. Tous ces paramètres-là que je viens de vous citer, c'est des paramètres que prend en compte la forêt aléatoire dans sa décision.
L'idée ici, c'est de montrer un petit peu le chemin décisionnel qui peut s'effectuer au sein d'un arbre. Mais ce qui pose problème et pourquoi on ne peut pas simplement avoir un seul arbre, c'est que l'arbre en lui-même, si je lui donne un projet, il va me ressortir un résultat qui sera relativement satisfaisant. Mais le problème, c'est que si je lui donne des nouveaux projets qui arrivent chaque année au fur et à mesure, alors, au fur et à mesure du temps, il va commencer à perdre de la précision dans ses résultats. C'est pour ça qu'on utilise une forêt aléatoire, puisqu'une forêt, c'est un ensemble d'arbres.
[00:10:47 Écran partagé : Écran partagé : Kirsten Gaudreau et Pierre Zwiller-Panicz dans des fenêtres de clavardage video et diapositive avec graphique intitulée : Améliorer les prédictions : Les performances transformatrices des algorithmes de forêts aléatoires. Tel que décrit.]
Pierre Zwiller-Panicz : Donc maintenant, quand j'arrive pour donner un projet à mon analyste, en réalité, je le donne à 200 analystes, qui eux, ont chacun leur propre connaissance du projet, peut-être l'évalueront différemment et peuvent me donner un résultat qui est une forme de résultat d'ensemble plutôt qu'un résultat vraiment très précis. Avec cette manière-là et cette approche-là, on a des résultats qui sont beaucoup plus précis dans le temps, notamment quand on ajoute de nouvelles données dans l'équation et en sachant qu'en finance, on reçoit des nouvelles données tous les jours et que chaque année, on a des « agreements » qui changent ou des projets qui changent. Donc, c'est vraiment important d'avoir quelque chose qui est vraiment fiable sur la durée.
[00:11:32 Écran partagé : Écran partagé : Kirsten Gaudreau et Pierre Zwiller-Panicz dans des fenêtres de clavardage video et diapositive intitulée : Pourquoi les prévisions d'apprentissage automatique de S et C sont-elles importantes? Planifiez de manière proactive; Répartir efficacement les budgets; Prévenir les dépenses insuffisantes ou excessives; Améliorer la transparence et le contrôle; Appuyer la prise de décision stratégique; Harmoniser le financement avec les priorités gouvernementales. Tel que décrit.]
Pierre Zwiller-Panicz : Ces six points reprennent un petit peu ce qu'on a dit plus haut. On essaie de vraiment prédire de manière proactive pour ne pas être en réponse face à tous ces « cash flows » qu'on peut recevoir. Ça nous aide à prédire le budget et d'avoir une approche qui est beaucoup plus axée sur les données et nos connaissances, plutôt que simplement sur les connaissances. Je pense que ça permet aussi aux analystes financiers de se concentrer sur notamment des gros projets qui, eux, nécessitent beaucoup plus de travail. On peut comme ça passer tous les plus petits projets, les projets qui sont plus visibles, des programmes qu'on connaît bien, plus facilement avec ce modèle. Ça leur permet vraiment de concentrer leurs efforts sur des projets d'envergure.
[00:12:17 Écran partagé : Écran partagé : Kirsten Gaudreau et Pierre Zwiller-Panicz dans des fenêtres de clavardage video et diapositive intitulée : Adoptez et mettez en œuvre le modèle de prévision des S et HICC dans votre département. Tel que décrit.]
Pierre Zwiller-Panicz : Ici, c'est vraiment la suite de notre travail. Puisqu'on a mis le modèle en production et qui fonctionne maintenant au sein de LICC, notre rôle maintenant c'est de le promouvoir au sein d'autres départements. Ça a été le cas pour le Public Service Data Challenge qu'on a fait ces derniers mois. Mais ici, justement, toute cette « roadmap » qu'on a construite, c'est vraiment pour montrer à d'autres départements comment ils pourraient adopter le modèle et toutes les étapes qui mènent vers l'adoption.
C'est ce sur quoi se concentre notre travail actuellement. On va présenter au comité des AGM en février. On a vraiment à cœur de pouvoir élargir cette technologie à d'autres départements qui pourraient en avoir besoin et pour qui ça serait efficace. Je vous remercie.
[00:13:02 Pierre Zwiller-Panicz apparaît en plein écran.]
Pierre Zwiller-Panicz : On arrive à la fin de notre présentation. Si vous avez des questions, n'hésitez pas à les poser dans la langue de votre choix.
Merci beaucoup.
[00:13:12 Le logo animé de l'EFPC apparaît à l'écran.]
[00:13:13 Texte à l'écran : canada.ca/school-ecole.]
[00:13:17 Le mot-symbole du gouvernement du Canada s'affiche à l'écran]