Transcription
Transcription : Présentation de la technologie de Formic AI
[00:00:08 Texte à l'écran : Présentation de la technologie de Formic AI.]
[00:00:12 L'écran s'estompe et montre John Medcof.]
John Medcof (enseignant en chef, École de la fonction publique du Canada) : Bonjour et bienvenue à l'École de la fonction publique du Canada. Je m'appelle John Medcof. Je suis l'enseignant en chef de l'École et je suis heureux de vous accueillir pour la séance d'aujourd'hui. Nous sommes ici pour le dernier volet de la série de démonstrations techniques de l'EFPC. Si c'est la première fois que vous la regardez, cette série de vidéos présente des démonstrations pratiques et des technologies innovantes développées par des entreprises canadiennes, soulignant comment les outils émergents tels que les données et l'intelligence artificielle peuvent soutenir de nouvelles approches du travail de la fonction publique et de la prestation de services. Je suis très heureux d'accueillir aujourd'hui Daniel Escott, qui est le président et directeur général de Formic AI.
[00:00:55 Daniel Escott apparaît à l'écran dans une fenêtre de discussion séparée.]
John Medcof : Aujourd'hui, Daniel nous fera la démonstration d'une plateforme d'IA conçue et développée par son entreprise et spécifiquement pour les réalités des professions réglementées. Daniel, bienvenue dans la série des démonstrations techniques. Je vous invite à vous présenter et à nous parler un peu de Formic AI et du produit dont vous allez faire la démonstration aujourd'hui.
Daniel Escott (président et directeur général de Formic AI) : John, merci de me recevoir. Je suis heureux d'être ici. Mon nom est Daniel. Je suis le PDG de Formic AI. Je suis avocat basé en Ontario. J'habite à Toronto, mais je suis originaire de Terre-Neuve. Vous l'entendrez peut-être à mon accent, mais j'essaierai d'être le plus compréhensible possible. Formic a démarré il y a environ quatre ans et demi avec pour mission de rendre l'IA digne de confiance, ce qui semble ambitieux, et l'est en effet. Le fruit des recherches menées au cours des quatre dernières années et demie est une nouvelle architecture d'intelligence artificielle qui dissocie clairement la recherche d'informations de la génération de contenu. Concrètement, ça signifie que nous utilisons les grands modèles de langage pour ce qu'ils font le mieux : la compréhension sémantique, la grammaire et la syntaxe, mais pas la recherche d'informations. Ils n'ont jamais été conçus pour ça. Au lieu d'essayer de les forcer à tout faire, nous nous sommes dit : pourquoi ne pas simplement développer un système qui s'en charge mieux et ajouter le GML là où il excelle?
Il en résulte une capacité à éliminer complètement les fabulations. Nous pouvons fournir des références aux documents sources dans une base de données de n'importe quelle taille, ces références ne peuvent pas être inventées de toute pièce, et nous pouvons garantir que dans nos réponses, le système ne pourra jamais inventer d'informations et ne se contentera pas de vous donner ce qu'il estime être la réponse la plus probable. La façon la plus simple de le décrire est la capacité à prouver une négation. En général, si l'IA ne trouve pas ce qu'elle estime être la réponse la plus précise, elle en inventera une, car elle travaille sur la base des probabilités. Notre système fonctionne sur la base d'une certitude absolue. Si elle ne parvient pas à trouver ce qu'elle estime être la bonne réponse à votre question en se basant sur les informations dont elle dispose dans votre base de données, elle se contentera de dire : « Je ne trouve pas cette information pour vous, je suis désolée ». Ce simple changement modifie complètement la nature de l'intelligence artificielle telle que nous la connaissons, et c'est ce que j'ai hâte de vous montrer aujourd'hui.
John Medcof : Excellent. Je vois vraiment plusieurs manières de l'appliquer à notre contexte de fonction publique. Vous pourriez afficher votre écran et nous présenter la démonstration, pour nous donner une idée du fonctionnement de la plateforme?
Daniel Escott : Absolument. Je vais vous partager mon écran. Vous me direz quand vous le verrez. Voilà.
[00:03:57 Une page Web apparaît à l'écran et Daniel Escott la fait défiler, affichant une liste de documents qui comportent chacun une série d'onglets de catégorie en surbrillance.]
John Medcof : Oui, je peux le voir. Vous pourriez peut-être commencer par m'expliquer ce que je vois ici.
Daniel Escott : Ce que nous examinons actuellement, c'est ce que nous appelons le moteur Formic. Il s'agit, du moins pour l'instant, de notre page d'accueil, et nous y avons mis toute une série de documents de test. C'est notre serveur interne. Des documents de décisions de tribunaux fédéraux, des demandes de brevets, des normes ISO, des documents du Programme du travail, des déclarations d'impôts, un peu de tout, pour vous donner une idée de ce à quoi ressemble un échantillon représentatif d'un ensemble de données diversifié. Ce n'est pas uniquement des données juridiques, ou fiscales ou politiques. C'est un peu de tout, parce que la nature de la fonction publique et ma propre expérience, c'est ce avec quoi nous travaillons tous les jours.
John Medcof : Oui.
Daniel Escott : Ce que je voulais montrer avant tout, c'est comment nous intégrons toutes ces données. Lorsque nous téléversons des documents, la première chose à faire est d'extraire toutes les données. Nous n'importons pas de métadonnées. Nous n'essayons pas de comprendre ce qu'il faut rapprocher entre les informations contenues dans le fichier et celles de la base de données. Nous alimentons toutes nos propres métadonnées à l'aide du système que nous avons développé, et nous résumons également le contenu de chaque fichier lors de son ingestion. Ça nous permet notamment d'éviter ce qui m'agace le plus avec les GML : si l'on soumet le même document à ChatGPT et à Microsoft Copilot en leur posant exactement la même question, on obtient deux réponses complètement différentes. Ça garantit au moins que tous les utilisateurs et toutes les utilisatrices de ce système voient exactement les mêmes informations, que ce soit aujourd'hui ou dans 20 ans.
[00:05:51 Daniel Escott clique sur une flèche à côté du premier document intitulé « 2025fc1144.pdf » dont les onglets surlignés sont les suivants : « Affaire », « fr », « Recours administratifs », « Appel », « Preuves », « Révision judiciaire », « Pratique et procédure », « Administration publique », « Fiscalité », « Afficher plus ». Un résumé se trouve en dessous et se lit comme suit : « Barbara T. Mendiola a reçu la PCU pendant huit périodes entre le 15 mars 2020 et le 26 septembre 2020. L'ARC a déterminé qu'elle n'était pas admissible parce qu'elle avait gagné plus de 1 000 $au cours des périodes applicables. Mme Mendiola a demandé un nouvel examen et, après le règlement de l'examen judiciaire initial, un second examen a été effectué. Le deuxième examen a confirmé qu'elle n'était pas admissible. Mme Mendiola a demandé une nouvelle révision judiciaire, arguant que la décision était déraisonnable et que l'ARC n'avait pas respecté l'équité procédurale. Le tribunal a rejeté la demande, estimant que la décision de l'ARC était raisonnable et que la procédure était équitable, car Mme Mendiola avait gagné plus de 1 000 dollars malgré sa perte d'emploi et avait eu l'occasion de fournir des preuves de son admissibilité. Le tribunal a reconnu les difficultés financières de Mme Mendiola, mais a souligné que l'ARC avait respecté les critères d'admissibilité de la Loi sur la PCU. »]
Daniel Escott : Une fois que toutes les données sont enregistrées dans la base de données, vous pouvez voir que les fichiers individuels s'affichent ici, que le résumé dont je viens de parler apparaît juste ici, et que ces onglets sont mis en évidence. Nous les appelons « balises », mais il s'agit en réalité des métadonnées que nous renseignons. Nous avons mis au point un schéma de métadonnées standard qui peut être adapté à n'importe quel domaine, organisme ou cas d'utilisation.
[00:06:11 Daniel Escott fait défiler la page vers le haut pour afficher les filtres :
« Langue (EN, FR, ZH, HI, ES, AR, PT, RU, IT, DE) »
« Type de document (affaire, législation, mémoire, déclaration, affidavit, preuves, brevet, marque, contrat, mémo, autre, propriété intellectuelle, avis de requête) »
« Domaine du droit (accès à l'information et protection des renseignements personnels, recours administratifs, appel, arbitrage, faillite et insolvabilité, affaires, garde et droit de visite des enfants, protection de l'enfance, citoyenneté et immigration, commerce et industrie, constitution, contrats, créanciers et débiteurs, infractions pénales ou statutaires, dommages et intérêts, défenses, environnement, preuves, famille, tutelle, santé et sécurité, Autochtones, assurance, propriété intellectuelle, international, interprétation, révision judiciaire, travail et emploi, véhicules à moteur, municipalités, négligence, pratique et procédure, professions et occupations, biens et fiducies, administration publique, location à usage d'habitation, droits et libertés, perquisition et saisie, condamnation, pension alimentaire, fiscalité, délits civils, testaments et successions, jeunes contrevenants) ».]
Daniel Escott : Il s'agit d'un schéma de métadonnées que nous avons développé pour un de nos clients, un cabinet d'avocates de l'Ontario. Nous affichons la langue du document avec le type de document en fonction des paramètres que nous avons définis, des domaines juridiques auxquels il pourrait se rapporter, mais il pourrait s'agir de n'importe quoi d'autre. De spécifications techniques, de législation, de politiques ou de documents internes. Tout se fait de manière dynamique.
[00:06:34 Daniel Escott clique sur l'onglet « Afficher plus » sous « 2025fc1144.pdf » et des onglets supplémentaires s'affichent, « révision », « demandeur », « révision judiciaire », « ARC », « tribunal », « PCU », « décision du tribunal », « révision par l'agent de l'ARC », « Loi sur la PCU », « Mendiola », « agent de révision », « perte d'emploi », « perte », « judiciaire », « admissibilité », « agent de l'ARC », « équité procédurale », « emploi », « admissibilité à la PCU ».]
Daniel Escott : Nous ajoutons également, au niveau de chaque dossier, les termes, expressions et concepts clés qui apparaissent régulièrement dans ce document, à la fois pour que nous puissions le retrouver et pour pouvoir trouver d'autres documents semblables qui traitent de la même chose. Maintenant que tout est dans la base de données, il n'y a que deux façons d'interagir avec ces données. La première consiste à effectuer une requête sur l'ensemble des données. L'ensemble des membres de votre organisation aurait accès à une base de données partagée, qu'il s'agisse d'un outil comme GCdocs ou d'un simple dossier de documents sur lequel votre équipe travaille.
[00:07:17 Daniel Escott tape « politique publique sur l'intelligence artificielle » dans la barre de recherche en haut de la page et clique sur « rechercher ».]
Daniel Escott : Mais si je devais lancer une requête ici, comme la politique publique sur l'intelligence artificielle, l'actualité.
[00:07:28 Une nouvelle liste de documents apparaît.]
Daniel Escott : La première chose qui va apparaître très rapidement, ce sont nos résultats de recherche non génératifs.
[00:07:30 Daniel Escott clique sur une flèche à côté du premier document intitulé « AI_RMF_Playbook.pdf » et la première de ses 54 sources se charge en dessous. Il clique sur les neuf premières sources.]
Daniel Escott : Il s'agit de résultats de recherche classés, à l'ancienne, à la manière de Google, où nous identifions toutes les sources pertinentes dans chaque document de la base de données. Son taux de précision est d'environ 80 %. Il ne s'agit pas de vous proposer les résultats les plus susceptibles d'être pertinents, mais bien de vous présenter l'intégralité du contenu de la base de données et de vous indiquer précisément ce qui, dans chacun de ces documents, est pertinent.
[00:07:57 Daniel Escott clique sur une flèche à côté du premier document intitulé « 1761729327847.pdf » et la première de ses 32 sources se charge en dessous. Il clique sur les trois premières sources.]
John Medcof : Chacune des lignes que je vois est un élément de la base de données que je peux explorer davantage. Est-ce là l'idée?
Daniel Escott : C'est exactement ça.
John Medcof : D'accord.
Daniel Escott : L'idée n'est pas de laisser l'IA décider de ce qui est pertinent pour vous. Si vous travaillez avec ce type d'informations dans ce type d'environnement, vous êtes probablement suffisamment digne de confiance pour déterminer vous-même ce qui est le plus pertinent par rapport à ce que vous recherchez. Notre travail consiste simplement à les trouver pour vous et à les présenter d'une manière qui vous évite de passer du temps à parcourir des PDF d'une centaine de pages à la recherche de deux mots-clés différents. Les résultats suivants qui apparaissent dans la recherche sont nos résumés, générés par l'IA.
[00:08:38 Daniel Escott clique sur une flèche à côté du titre « résumé » en haut de la page et un court résumé s'affiche en dessous :
« Les documents fournis traitent de divers aspects de la politique publique liée à l'intelligence artificielle (IA). L'OCDE, le Boston Consulting Group et l'INSEAD Business School ont collaboré à des recherches sur l'adoption de l'IA dans les entreprises, en mettant l'accent sur les implications politiques, les obstacles à l'adoption et les solutions potentielles. Leurs conclusions, basées sur une enquête menée en 2022-2023 auprès d'entreprises ayant adopté l'IA, indiquent que son adoption est relativement faible et concentrée dans les grandes entreprises et dans des secteurs précis. Les obstacles sont notamment le manque de préparation au numérique, les coûts de mise en œuvre élevés et la pénurie d'employées qualifiées. L'étude souligne l'importance du soutien du secteur public, tel que les services d'information et les initiatives de formation, pour faciliter l'adoption de l'IA, et insiste sur la nécessité de cadres réglementaires plus clairs et d'une meilleure évaluation des politiques fichier 1761729327847.pdf. [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14].
Le National Institute of Standards and Technology (NIST) a élaboré le cadre de gestion des risques liés à l'intelligence artificielle (AI RMF 1.0) pour guider les organisations sur le sujet. Ce cadre est volontaire, préserve les droits et n'est pas propre à un secteur, ce qui offre une certaine souplesse à diverses organisations. Il décrit les caractéristiques d'une IA digne de confiance et fournit des fonctions pour traiter les risques liés aux systèmes d'IA, dans le but de favoriser le développement et l'utilisation responsables des systèmes d'IA fichier NIST.AI.100-1.pdf. [15] [16] [17]
Dans le contexte des systèmes juridiques, le rapport d'Alan Diner se penche sur la stratégie numérique de la Cour fédérale d'Australie et les leçons à en tirer pour les tribunaux canadiens. Il examine l'état actuel de la technologie dans les tribunaux canadiens, y compris l'IA, et fournit des recommandations telles que l'élaboration de lignes directrices sur l'IA et la formation à la technologie pour les juges et le personnel fichier alan-diner dine...t public-v3.pdf. De plus, un rapport sur l'IA générative (IAG) suggère que les systèmes judiciaires peuvent améliorer l'efficacité et la précision en intégrant des solutions d'IAG, en soulignant la nécessité d'outils conçus pour les professionnelles du droit, l'intégration avec les technologies existantes, et une formation adéquate du personnel fichier how-genai-impro...s-tr4897289.pdf. [18] [19]
L'adoption de l'IAG dans les entreprises fait également l'objet d'une étude, un rapport indiquant que son utilisation est devenue courante. Ce rapport souligne que la responsabilité est un élément clé, les entreprises mesurant le retour sur investissement et réorientant les budgets vers des programmes dont le rendement a été prouvé. Toutefois, il souligne également une insuffisance dans le renforcement des capacités, avec des défis dans la formation et l'embauche de talents avancés fichier 2025-Wharton-GB...Full-Report.pdf. [20]. »]
Daniel Escott : Nous avons notre résumé court, qui est plutôt une approche rapide et sommaire : donnez-moi un fichier et deux ou trois phrases pour expliquer en quoi il est pertinent, le nom du fichier, ainsi que deux ou trois raisons justifiant sa pertinence.
[00:08:54 Daniel Escott passe le curseur sur la deuxième note de bas de page et un texte supplémentaire apparaît : « 1761729327847.pdf (page 133) L'ADOPTION DE L'INTELLIGENCE ARTIFICIELLE DANS LES ENTREPRISES ©... des mécanismes de soutien actuels et autres. »]
Daniel Escott : Mais comme vous pouvez le voir ici, nous avons beaucoup de notes de bas de page surlignées. C'est une fonctionnalité propre à notre système que nous avons mis trois bonnes années à développer. Ces références sous forme de liens hypertextes renvoient au document, au numéro de page de l'information citée et au texte précis cité. Ces références ne sont pas générées par l'IA, car nous avons réussi à dissocier complètement la recherche d'informations de la génération de la réponse, ce qui signifie qu'elles sont totalement indépendantes de la preuve d'absence de fabulation de la réponse. Elles constituent la source originale de chaque partie de la réponse.
John Medcof : C'est très intéressant. Puis-je vous arrêter un moment?
Daniel Escott : Absolument.
John Medcof : Le résumé lui-même est généré par l'IA, mais les liens vers le document source original m'amèneront au document lui-même et non à une génération de l'IA.
Daniel Escott : C'est tout à fait exact.
John Medcof : D'accord.
Daniel Escott : Nous voulions nous assurer que nous ne nous contentions pas de dire : « Voici toutes les sources où nous avons trouvé ces informations », comme le font ChatGPT ou Copilot, en laissant l'utilisateur ou l'utilisatrice se débrouiller pour trouver le contenu proprement dit. Nous avons donc conçu le système de manière à ce qu'il fonctionne au niveau des paragraphes. Nous pouvons être plus précis, mais nous avons constaté qu'un paragraphe rendait le tout beaucoup plus accessible pour les utilisateurs et utilisatrices. Ces 14 références ont servi à construire ce paragraphe, ces trois références ont servi à construire ce paragraphe, mais pas le premier paragraphe, et ainsi de suite. Nous pouvons donc établir un lien de manière très déterministe : cette partie de la réponse provient de ces 14 sources et uniquement de ces 14 sources.
[00:10:34 Daniel Escott clique sur l'onglet « LONG » à côté de l'en-tête « Résumé » et un autre résumé s'affiche en dessous :
« Rapport de recherche consolidé : Politique publique sur l'intelligence artificielle
La politique publique sur l'intelligence artificielle (IA) est un domaine critique qui évolue rapidement et qui fait l'objet d'une attention particulière de la part de divers organismes internationaux et nationaux, de cadres juridiques et de secteurs d'activité. Les thèmes principaux qui ressortent des rapports fournis concernent la nécessité de cadres réglementaires clairs, d'une gestion des risques solide, d'un soutien du secteur public à l'adoption de l'IA, de considérations éthiques et de l'application de l'IA dans des domaines particuliers tels que les systèmes juridiques et de justice pénale. [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14]
1. Cadres réglementaires et élaboration des politiques :
Nécessité d'une réglementation plus claire : De nombreux documents (fichier 1761729327847.pdf, fichier The Sedona Cana... June 2025 2.pdf, fichier alan-diner dine..t public-v3.pdf) soulignent systématiquement la nécessité de cadres réglementaires plus clairs et d'une meilleure évaluation des politiques pour guider le développement et le déploiement de l'IA. Il s'agit notamment d'aborder l'évolution du paysage juridique entourant l'IA (fichier The Sedona Cana... June 2025 2.pdf). [15] [16] [17] [18] [19]
Approches internationales et gouvernementales :
Le RGPD et la Loi sur l'IA de l'UE sont fréquemment cités comme exemples de réponses réglementaires globales (fichier The Sedona Cana... June 2025 2.pdf, fichier AI RMF Playbook.pdf, fichier ISO 31000 2018.pdf). [19] [20] [21] [22] [23] [24] [25]
La BIPA de l'Illinois est également mentionnée comme cadre réglementaire pertinent (fichier The Sedona Cana... June 2025 2.pdf). [24 [25] [26] [27] [28]. »]
John Medcof : Pourquoi est-ce important? Pourquoi est-ce important du point de vue du client?
Daniel Escott : Ne serait-ce que pour des raisons de traçabilité et d'explicabilité, c'est essentiel. L'un des principaux problèmes que j'ai constatés, non seulement dans le domaine juridique mais dans tous les secteurs où nous avons déployé cette technologie jusqu'à présent, c'est que le principal sujet de critique, mis à part les « fabulations », concerne la capacité à comprendre pourquoi on obtient telle ou telle réponse. Quels sont les éléments pris en compte par l'IA lorsqu'elle vous donne un rapport de 37 pages? D'où proviennent ces informations? S'agit-il de sources réelles ou a-t-elle simplement tout inventé? C'était notre façon de nous prémunir contre ce risque. La capacité non seulement de présenter les informations et les références, mais aussi de pouvoir les recouper en temps réel avec les sources originales, ajoute un niveau de confiance dont l'IA, dans sa forme actuelle, est tout simplement incapable.
John Medcof : C'est super. Merci.
Daniel Escott : Et pour boucler la boucle concernant nos résumés, nous proposons également une version plus longue qui constitue davantage une approche thématique du contenu de ces dossiers. Il s'agit toutefois d'une explication plus exhaustive de tout ce qui figure dans les résultats de recherche et des raisons pour lesquelles ces informations sont pertinentes.
[00:11:48 Daniel Escott fait défiler le résumé long.]
Daniel Escott : Alors que le résumé court se résume à « voici ce que vous cherchez et voici où le trouver », le résumé long est une réponse complète et exhaustive à votre question, quelle qu'elle soit.
John Medcof : Pour passer de l'un à l'autre, il suffit d'appuyer sur les onglets « court » ou « long » qui se trouvent au centre de l'écran.
[00:12:07 Daniel Escott clique sur l'onglet « COURT » puis sur l'onglet « LONG ».]
Daniel Escott : C'est tout à fait exact.
John Medcof : D'accord.
Daniel Escott : La seule autre façon d'interagir avec ces données est de les intégrer dans un projet.
[00:12:15 Daniel Escott clique sur l'onglet « AJOUTER DES FICHIERS DE RÉFÉRENCE À UN NOUVEAU PROJET » en haut de la page et une nouvelle page se charge, affichant un document sélectionné intitulé « Matcher and Complier Patent Application.pdf » sur le côté gauche et le résumé long sur le côté droit.]
Daniel Escott : Nous pouvons y accéder en chargeant un résultat de recherche ou en ouvrant un tout nouveau dossier et en chargeant des fichiers, mais j'ai pris le résumé long et j'ai ouvert un projet avec lui. Nous voyons que la requête et le résultat de la recherche sont les premiers à apparaître, mais tous les documents qui ont été cités avec 158 références dans ce résultat font maintenant partie de ce dossier de projet.
[00:12:38 Daniel Escott clique sur l'onglet « Documents » en haut à droite et une liste de documents apparaît de ce côté.]
John Medcof : D'accord.
[00:12:44 Daniel Escott clique sur l'onglet « Rapports » en haut à droite et une liste de résumés de documents apparaît de ce côté.]
Daniel Escott : Lorsque nous générons notre rapport, ce que nous voyons tout en haut, c'est un résumé général de l'ensemble du contenu de ce dossier. Nous disposons d'un paragraphe qui explique de manière concise les thèmes et les liens entre tous les documents qui ont été chargés, et chacun de ces fichiers est accompagné d'un résumé contextuel que nous avons créé pour ce document lors de son importation initiale. Pour un document académique tel que l'abécédaire de Sedona Canada, il s'agit plutôt d'un résumé académique. Mais si nous passons à un document tel qu'une décision d'une cour fédérale, nous disposons d'une note de recherche juridique complète. Une fois encore, si nous passons à un document tel qu'une demande de brevet, nous extrayons toutes les informations clés relatives au brevet, et tout ça est le fruit de la prise en compte du contexte par notre système. Lorsque nous identifions le type de document, nous déterminons quelles sont les informations les plus importantes qu'il contient et nous les extrayons dès que nous les recevons.
John Medcof : Sur le côté droit de mon écran, j'obtiens un résumé de chacun de ces documents, mais je peux ensuite aller consulter chacun d'entre eux individuellement. C'est ça?
Daniel Escott : C'est tout à fait exact.
John Medcof : D'accord.
Daniel Escott : Et tous ces résumés, ainsi que la conversation à laquelle nous allons passer dans une seconde, sont tous étayés par ces mêmes références.
[00:14:10 Daniel Escott clique sur l'une des références de l'un des résumés et le document affiché sur le côté gauche défile vers le bas jusqu'à un passage surligné. Il clique sur d'autres références et le document défile jusqu'à différents passages surlignés.]
Daniel Escott : Si je souhaite simplement consulter les références du résumé de cette demande de brevet, je peux commencer à faire des allers-retours, et vous verrez, sur le côté gauche de l'écran, que nous sommes actuellement dans le document. Et à mesure que je parcours ces références, nous ne nous contentons pas d'accéder à la page qui est référencée, mais le texte précis auquel l'IA fait référence ici est également mis en évidence.
John Medcof : Intéressant. Wow!
[00:14:34 Daniel Escott clique sur l'onglet « Conversation », ce qui génère à nouveau le résumé long. Il clique sur l'une des références et un nouveau document sélectionné intitulé « 1761729327847.pdf » apparaît sur le côté gauche, avec un passage surligné. Il clique sur d'autres références et de nouveaux documents sélectionnés apparaissent, affichant différents passages surlignés.]
Daniel Escott : Et si nous passions à la conversation et commencions à faire exactement la même chose avec notre résumé long, si je commençais à établir des liens entre ce premier point et la nécessité d'une réglementation plus claire, le système passerait à chaque document cité, m'indiquerait exactement ce qui est cité pour chaque paragraphe, et tout se ferait de manière dynamique et en temps réel. Toutes ces références sont propres à cette réponse en particulier. Et lorsque je poserai une deuxième question dans un instant, nous obtiendrons une autre réponse avec des références complètement différentes.
[00:15:15 Daniel Escott tape « Que dit la Cour fédérale à propos de l'IA? » dans la barre de recherche en bas à droite et clique sur « Envoyer ».]
Daniel Escott : Si je voulais me concentrer sur ce que dit la Cour fédérale à propos de l'IA? Comme nous avons, je crois, deux décisions de la cour fédérale et un rapport d'un juge fédéral ici, le système va passer au peigne fin l'intégralité du contenu de ce dossier. Il reviendra avec quelques paragraphes expliquant ce qui, dans ce dossier, est pertinent, et pourquoi c'est pertinent. Et grâce à ces références, il m'indiquera exactement où je peux le trouver. Pour finir, une fois que nous aurons obtenu cette réponse, j'aimerais tenter de prouver la négation, comme je l'ai mentionné plus tôt. J'aimerais lancer une dernière requête, pour voir à quoi ça ressemblerait dans ce contexte et montrer à tout le monde que nous sommes en fait capables de prouver que quelque chose n'existe pas.
John Medcof : Oui, je suis vraiment curieux de voir cette partie de la démonstration.
[00:16:14 Une réponse détaillée à la requête est générée du côté droit.]
John Medcof : Sur le côté droit, je vois que la recherche est terminée. Le système a identifié les sources de votre requête plus précise?
[00:16:25 Daniel Escott clique sur différentes références et de nouveaux documents sélectionnés apparaissent, affichant différents passages surlignés.]
Daniel Escott : C'est tout à fait ça, et vous verrez que nous avons recommencé à zéro, car toutes les références sont propres à chaque réponse, mais le système m'indique en temps réel : « Voici ce que j'ai trouvé », « Voici en quoi ça correspond à ce que vous recherchez », mais surtout, « Où se trouve-t-il dans vos documents sources? ». Et c'est ce que je trouve le plus important dans les contextes pertinents pour la fonction publique. Parce qu'au final, dans la plupart des cas, il ne suffit pas de trouver ce que vous pensez être la bonne réponse. Il faut être capable de montrer, dans le document de politique, dans la législation ou dans vos documents internes, où vous trouvez cette information, et pourquoi elle est pertinente. Pour l'instant, ça se fait en grande partie grâce aux connaissances institutionnelles et à des personnes qui ont beaucoup d'expérience, en effectuant une recherche sophistiquée par mots-clés ou, dans certains cas, une recherche booléenne, et vous devez passer en revue et vérifier tous ces résultats vous-même.
John Medcof : Je comprends bien que si j'essaie de déterminer d'où je tiens, par exemple, une compétence particulière, disposer d'un résumé de cette compétence est une chose, mais pouvoir accéder directement au paragraphe concerné sans avoir à passer moi-même en revue un long texte législatif, ça me semble tout à fait pertinent.
Daniel Escott : Exactement, parce que vous voyez ici que le rapport sur le congé d'études sur le côté gauche de l'écran fait 149 pages. Si je devais essayer de retrouver moi-même toutes les références contenues dans ce document, ça me prendrait une bonne heure de lecture, et je lis vite. Mais ici, non seulement j'ai accès à toutes ces informations, mais je peux aussi interagir avec elles en temps réel et de manière dynamique.
[00:18:12 Daniel Escott tape « Que pense le pouvoir exécutif des États-Unis de l'IA? » dans la barre de requête et clique sur « Envoyer ».]
Pour conclure, si je posais la question suivante : « Que pense le pouvoir exécutif des États-Unis de l'IA? ».
John Medcof : Et vous supposez qu'il n'y aura pas de réponse à cette question particulière dans l'ensemble des données. C'est ça?
Daniel Escott : Je serais très, très surpris. Je dois admettre que j'ai eu une réunion avec l'équipe de l'Agence du revenu du Canada il y a deux semaines et que le système m'a donné tort (rires).
John Medcof : D'accord (rires).
Daniel Escott : Ce qui est assez amusant, car c'est la nature même de cette activité. Il n'essaie pas de faire le travail à votre place. Il s'agit de rendre votre travail plus rapide et plus facile, car tout le temps passé à rechercher des informations n'est pas du temps consacré à la création de valeur ajoutée ou à l'exécution de tâches réelles. C'est le travail de fond qui doit être fait.
[00:19:08 Une réponse détaillée à la requête est générée du côté droit.]
Daniel Escott : Et bien, j'avais tort. Je reconnais que j'avais tort, mais pour conclure ma réflexion, l'idée générale, c'est que tout ce temps passé à ne pas travailler, à simplement rassembler les éléments nécessaires pour pouvoir réellement faire notre travail, nous n'avons plus besoin de le gaspiller. C'est un travail que personne n'aime faire, qui est généralement très difficile à bien faire, et ça nous permet d'accomplir ce travail en utilisant l'IA de manière éthique et responsable. C'est sécurisé. Le système peut être déployé dans le nuage ou sur site. Mais au final, il ne s'agit pas de remplacer qui que ce soit. Il s'agit de faciliter la vie de tout le monde.
John Medcof : C'est une amélioration des capacités humaines plutôt que d'un remplacement complet, même si je vois bien que ça pourrait nous faire gagner beaucoup de temps. Dans l'exemple que vous venez de donner, il s'avère que c'était le cas.
Daniel Escott : Il s'avère que c'était le cas. Je me suis trompé.
John Medcof : Il a répondu à votre question. Mais si j'ai bien compris ce que vous avez dit dans votre introduction, si vous lui posez une question à laquelle il n'a pas de réponse, plutôt que d'essayer d'en inventer une, il vous répondra de manière transparente qu'il n'a rien trouvé. Est-ce exact?
[00:20:34 Daniel Escott tape « L'intelligence artificielle peut-elle remplacer les travailleurs canadiens? » dans la barre de recherche et clique sur « Envoyer ».]
Daniel Escott : C'est tout à fait exact. J'aimerais rapidement tenter la question suivante : « L'intelligence artificielle peut-elle remplacer les travailleurs canadiens? ». Je suis curieux de voir quelle sera la réponse à cette question parce que, à tout le moins, ça nécessite un niveau d'analyse qui, à mon avis, ne figure pas dans ces documents. Encore une fois, je peux me tromper, mais tout ça pour dire que nous essayons de donner accès à ce type de technologie de manière responsable, qui apporte réellement de la valeur ajoutée sans créer davantage de risques. Je ne pense pas que nous ayons besoin de vanter la valeur de l'IA à grande échelle. Nous devons promouvoir les moyens d'accéder à cette valeur sans compromettre les droits, la vie privée et la sécurité des personnes.
[00:21:40 Une réponse à la requête est générée du côté droit : « Les documents fournis n'indiquent pas directement si l'intelligence artificielle peut remplacer les travailleurs canadiens. Toutefois, le fichier 1761729327847.pdf présente des études sur les effets de l'IA sur la demande de main-d'œuvre, en soulignant que certaines études laissent entrevoir des bouleversements importants à mesure que les tâches cognitives sont remplacées par l'IA. Une étude précoce estimait que 47 % de l'emploi total aux États-Unis pourrait être automatisé d'ici une ou deux décennies. D'autres études, tenant compte de la répartition des tâches automatisables, ont conclu qu'environ 9 % des emplois dans 21 pays de l'OCDE sont automatisables. Des recherches plus récentes suggèrent que près de 40 % de l'emploi mondial est exposé à l'IA, ce chiffre s'élevant à environ 60 % dans les économies avancées en raison de la prévalence des emplois axés sur des tâches cognitives. Le document souligne que ces résultats dépendent d'hypothèses sur le rythme d'adoption de l'IA. [1] [2] [3] [4] [5] [6] »]
Daniel Escott : Et voilà. Les documents fournis n'indiquent pas directement si l'intelligence artificielle peut remplacer les travailleurs canadiens. Cependant, une source est mentionnée ici qui aborde le sujet à un niveau beaucoup plus abstrait. Elle explique ce qu'elle dit, en quoi c'est pertinent et, encore une fois, où je peux la trouver. Nous avons prouvé la négative, et ce que je n'avais pas prévu, c'est que le système m'indique où je pouvais trouver de la documentation connexe.
John Medcof : D'accord, c'est très intéressant. Vous avez mentionné que vous aviez une formation d'avocat et que vous aviez travaillé avec différents types d'organisations. Y a-t-il des secteurs particuliers pour lesquels vous envisagez que ce type d'outil serait particulièrement pertinent ou utile, et pourquoi?
Daniel Escott : John, c'est une excellente question. Le premier domaine par lequel je voulais commencer était évidemment le droit, car les fabulations, l'explicabilité et la sécurité sont toutes des priorités absolues dans le secteur juridique. Mais ce que nous avons constaté, c'est que des domaines comme la comptabilité, les opérations bancaires, la finance, la politique, la sécurité nationale, voire le patrimoine dans une certaine mesure, comportent tous le même élément. Si le système d'IA que nous utilisons invente une réponse, ou si nous ne parvenons pas à déterminer d'où proviennent les informations, les conséquences pourraient être désastreuses. Il ne s'agit pas d'un scénario où, si ChatGPT rédige votre bulletin d'information et qu'il tape mal le nom de quelqu'un, vous corrigez l'erreur et vous passez à autre chose. Il s'agit de domaines où des décisions sont prises chaque jour, où des fonds sont déployés, et qui ont des conséquences dans le monde réel qui affectent des milliers, voire des millions de personnes. Nous ne pouvons pas nous permettre le genre de risque que représente l'IA traditionnelle, ce qui semble étrange à dire seulement cinq ans après son apparition, mais ce sont des domaines où des conséquences néfastes se produisent bel et bien lorsque l'IA commet inévitablement des erreurs. C'est pourquoi nous avons voulu disposer d'une autre solution spécialisée où les paramètres qui affectent ces personnes peuvent être directement pris en compte et atténués. Ce n'est pas une réflexion après coup. Ce n'est pas un simple ajout. C'est au cœur même de l'architecture sur laquelle repose cette technologie, et c'est ce dont, selon moi, notre fonction publique a besoin.
John Medcof : Cette confiance dans la fiabilité des informations et la possibilité d'aller directement à la source, comme vous l'avez dit au début, en tirant parti des atouts de l'IA sans toutefois lui demander d'accomplir des tâches pour lesquelles d'autres formats ou technologies pourraient être mieux adaptés.
Daniel Escott : C'est exactement ça.
John Medcof : J'ai une dernière question pour vous, Daniel. Avec les organisations avec lesquelles vous travaillez actuellement, est-ce que cette plateforme ou cette interface apparaîtra sur le bureau de chaque employée de l'entreprise? S'agit-il d'un système conçu pour que tout le monde puisse accéder aux données qui le concernent? Est-ce plutôt destiné à des personnes occupant des rôles précis au sein de l'organisation? S'agit-il d'une utilisation générale ou d'une utilisation particulière au sein d'une entreprise ou d'une organisation?
Daniel Escott : Nous avons constaté que la valeur de cette technologie augmente de façon exponentielle avec la quantité de données et que le nombre de personnes devant y accéder s'accroît. Selon les bonnes pratiques que nous mettons généralement en œuvre, si nous déployons la solution en nuage, elle serait accessible par un site Web. S'il est déployé sur site ou dans un environnement de réseau local, il sera accessible par l'environnement réseau ou directement par le poste de travail. Mais dans les deux cas, nous essayons d'adopter une approche aussi large que possible et d'inclure autant de données que possible, car le système ne cherche pas à s'adresser à un public particulier ni à privilégier certains cas d'utilisation. J'appelle ça un bibliothécaire numérique. Au niveau le plus simple et le plus abstrait, il s'agit d'une interface vers laquelle vous pouvez vous rendre pour dire : « Je cherche cette information, est-elle disponible ici, et si oui, où puis-je la trouver? ». Le système ira fouiller dans les rayons, passera tout au crible, et reviendra peut-être en disant : « Vous savez quoi? Il n'y a rien ici à ce sujet et je ne peux pas vous fournir cette information ». Mais il pourrait aussi revenir avec une pile de livres et dire : « Voici exactement ce que vous cherchez, voici les pages où vous trouverez tout ça dans chaque document, et si vous avez d'autres questions à ce sujet, faites-le-moi savoir ». Il ne fait pas votre travail à votre place, il ne remplit pas votre déclaration d'impôts, il ne fournit pas de conseils juridiques, mais il se chargera assurément de tout le travail de recherche dans les rayons numériques et mettra tout ça dans un format facile à comprendre pour vous.
John Medcof : C'est un excellent résumé. Je vous remercie. Et avant de conclure, auriez-vous un dernier message à partager concernant la plateforme, son ergonomie ou ses applications? Avez-vous un mot de la fin sur ce qu'il faudrait retenir ici?
Daniel Escott : Certainement. J'ai une remarque à faire sur Formic en particulier et une autre sur l'IA en général. En ce qui concerne Formic, nous faisons partie du groupe d'essai des solutions novatrices. Ainsi, toutes les équipes intéressées par l'essai de cette technologie peuvent passer par ce processus de test et se familiariser avec elle pour commencer à l'utiliser dans différents domaines, que ce soit via le moteur ou une API. Toutes ces fonctionnalités sont modulaires, nous pouvons les adapter d'une manière ou d'une autre. En ce qui concerne l'IA de manière plus générale, je pense que nous devons être conscients de l'évolution de la situation dans ce secteur en particulier. Nous avons aujourd'hui des cas où même des entreprises canadiennes qui développent de l'IA entraînent leurs modèles sur des données qu'elles ont volées à des détenteurs de droits d'auteur américains, ce qui donne lieu à des litiges et soulève des préoccupations en matière de confidentialité, d'éthique et de sécurité, et quant à savoir à qui appartiennent non seulement les données utilisées pour l'entraînement, mais aussi celles fournies à tous ces différents modèles, et ça ne concerne pas uniquement la souveraineté. Je pense qu'il y a une réelle inquiétude quant à la viabilité de ce type d'outils pour des systèmes destinés au grand public canadien.
Quand on sait que des outils comme ChatGPT ou Claude, qui sont principalement entraînés sur des données américaines issues d'Internet, présentent un biais par défaut de 97 % en faveur des informations et des institutions américaines plutôt que des sources et des contenus canadiens. L'ingénierie des invites ou les garde-fous ont leurs limites et ne peuvent pas tout faire sans susciter ce genre de préoccupations. Et quand on parle non seulement de systèmes d'IA intégrés dans des environnements gouvernementaux, mais aussi de systèmes qui interagissent avec des citoyennes ordinaires, les services auxquels ces personnes tentent d'accéder ou les droits qu'elles tentent de protéger, il faut y accorder une importance primordiale, car la réalité est la suivante : que nous soutenions l'innovation canadienne ou simplement l'innovation au Canada, cette technologie peut être extrêmement transformatrice si elle est mise en œuvre correctement, de manière responsable, éthique et sécurisée, mais tout commence par la confiance. Si nous ne pouvons pas lui faire confiance et que le public ne peut pas lui faire confiance, vous pouvez avoir les meilleures mesures de protection au monde, ça ne vous permettra pas d'atteindre votre objectif.
John Medcof : C'est une excellente réflexion pour conclure. Daniel, merci beaucoup d'avoir été avec nous aujourd'hui et d'avoir fait une démonstration de la plateforme, de nous avoir expliqué son fonctionnement et l'intérêt à comprendre les sources de nos informations et les outils que nous pouvons utiliser pour y accéder. J'apprécie vraiment que vous ayez pris le temps. Merci beaucoup.
Daniel Escott : Merci beaucoup, John. Ça me fait plaisir.
[00:29:49 Le logo animé de l'EFPC s'affiche à l'écran.]
[00:29:55 Le logo du gouvernement du Canada s'affiche à l'écran.]