Semaine de démos d'outils de données de l'EFPC : Trouver de l'information et la gérer grâce à l'automatisation (DDN3-V06)

Description

Cet enregistrement d'événement présente une discussion sur la façon dont les logiciels qui font usage de l'intelligence artificielle et de l'apprentissage automatique permettent de créer des tableaux informatifs et d'effectuer des recherches très précises dans plusieurs systèmes de stockage de contenu et de données.

(Consultez la transcription pour le contenu en français.)

Durée : 00:58:13
Publié : 21 juin 2022
Type : Vidéo

Événement : Semaine de démos d'outils de données de l'EFPC : Trouver de l'information et la gérer grâce à l'automatisation

Lecture en cours

Semaine de démos d'outils de données de l'EFPC : Trouver de l'information et la gérer grâce à l'automatisation

Transcription | Visionner sur YouTube

Transcription

Transcription : Semaine de démos d'outils de données de l'EFPC : Trouver de l'information et la gérer grâce à l'automatisation

[Le logo de l'EFPC apparaît à l'écran.]

[John Medcof apparaît dans une fenêtre de clavardage vidéo.]

John Medcof, École de la fonction publique du Canada (EFPC) : Bonjour et bienvenue à l'École de la fonction publique du Canada. Je m'appelle John Medcof et je suis enseignant en chef ici à l'EFPC. Je suis heureux d'être avec vous pour l'événement d'aujourd'hui dans le cadre de la Semaine de démos d'outils de données.

Avant de commencer, j'aimerais souligner que les terres où je me trouve actuellement font partie du territoire non cédé du peuple algonquin anichinabé. Je sais que beaucoup d'entre vous se joignent probablement à nous aujourd'hui d'autres régions du pays et je vous encourage à prendre un moment pour reconnaître le territoire autochtone traditionnel à partir duquel vous participez à l'événement. Je vous remercie.

Voici quelques éléments relatifs à la logistique. L'événement d'aujourd'hui se déroulera en anglais, mais une interprétation simultanée sera offerte. Nous serons également heureux de répondre aux questions des participants dans le cadre de la démonstration. Ainsi, si vous souhaitez poser une question à nos experts, vous pouvez utiliser la fonction « lever la main » sur le côté de votre écran. Enfin, nous vous recommandons de déconnecter votre appareil d'un réseau privé virtuel afin de profiter pleinement de l'événement. Si vous rencontrez des problèmes techniques, nous vous recommandons de cliquer de nouveau sur le lien de la webdiffusion que nous vous avons envoyé. Sur ce, passons à l'événement d'aujourd'hui.

Je commencerais peut-être par dire que les technologies de pointe s'appuient sur la puissance des données et que l'intelligence artificielle et l'apprentissage automatique peuvent aider la fonction publique à innover pour offrir les meilleurs services, le meilleur soutien et le meilleur encadrement possible aux Canadiens. Comme ces technologies traitent des chiffres, résument des données et gèrent des transactions numériques, je pense qu'elles peuvent nous offrir, en tant que fonctionnaires, de nouvelles possibilités et de nouveaux moyens de nous concentrer sur les éléments stratégiques et créatifs de notre travail d'une nouvelle façon qui pourrait être utile. Ainsi, tout au long de la Semaine de démos d'outils de données, nous étudions la façon dont les organismes du gouvernement du Canada exploitent la puissance des données, de l'intelligence artificielle et de l'apprentissage automatique pour aider la fonction publique à innover et à tirer parti de ces technologies à l'avenir. Je dois également souligner que cette série d'apprentissage est présentée en collaboration avec Innovation, Sciences et Développement économique Canada, ainsi qu'avec nos collègues de la Communauté des données du GC. Nous les remercions beaucoup.

[Trois experts se joignent au clavardage vidéo.]

Sur ce, j'ai le plaisir d'accueillir nos trois invités d'aujourd'hui. Notre première invitée est Sonya Read, qui est secrétaire adjointe par intérim de Politiques et services numériques au Bureau du dirigeant principal de l'information du Secrétariat du Conseil du Trésor du Canada. Sonya occupait auparavant le poste de directrice exécutive de la Politique sur le numérique, dans lequel elle a dirigé des initiatives stratégiques pour soutenir la transformation numérique du gouvernement. Bienvenue, Sonya. Je suis heureux de vous voir.

Je suis également heureux de présenter Jason Cassidy, qui est le fondateur et le directeur général de Shinydocs Corporation. Jason résout les défis relatifs à la technologie d'entreprise depuis plus de vingt ans en tant que développeur de nouveaux produits et entrepreneur. Ses solutions informatiques primées contribuent à transformer le paysage numérique, des solutions traditionnelles de gestion du contenu d'entreprise aux services modernes liés au contenu.

Il est accompagné de Norm Friend, consultant en matière de solutions informatiques pour Shinydocs. Norm travaille dans le domaine de la gestion de l'information d'entreprise depuis plus de vingt ans et il se spécialise dans la mise en œuvre de solutions de gestion des documents et de l'information dans les organisations de nombreux secteurs. Merci infiniment, Jason et Norm, d'être parmi nous aujourd'hui. Bienvenue à vous deux.

Jason Cassidy : Oui. Je suis heureux d'être parmi vous. Merci beaucoup, John.

Norm Friend : Merci, John.

John Medcof : Excellent. En ce qui concerne le déroulement de l'événement, je vais d'abord inviter Sonya à présenter un mot d'ouverture et quelques réflexions sur la situation de la gestion de l'information au gouvernement du Canada, du point de vue du Bureau du dirigeant principal de l'information, soit le BDPI. Jason et Norm nous présenteront ensuite une vue d'ensemble et une démonstration de l'application Shinydocs, qui est un exemple des travaux de pointe réalisés dans le domaine de l'automatisation de la recherche et de la gestion des données. Je suis très enthousiaste à ce sujet. Ensuite, il y aura une période de questions au cours de laquelle nous aurons l'occasion de discuter de la démonstration avec eux. Sur ce, Sonya, la parole est à vous.

Sonya Read, Secrétariat du Conseil du Trésor du Canada : Merci infiniment, John et tout le monde, d'être parmi nous aujourd'hui. Je suis très heureuse d'être ici aujourd'hui pour participer à cette discussion, dans le cadre de la Semaine de démos d'outils de données de l'École de la fonction publique du Canada. Je suis très contente d'être ici aujourd'hui, de discuter de l'importance de la gestion, des données et de l'information. Comme je me joins à vous de chez moi, j'espère désespérément que personne ne sonnera à la porte et que mon chien ne commencera pas à paniquer. Nous verrons bien dans les prochaines minutes.

Au cours des dernières années, en tant que sous-ministre adjointe responsable de la politique sur la gestion de l'information et de la politique sur l'accès à l'information dans le secteur du Conseil du Trésor qui est également chargée de diriger la transformation numérique, je me suis vivement intéressée à l'utilisation d'outils et de systèmes automatisés pour soutenir une bonne gestion de l'information. Je suis parfaitement consciente de l'importance de ces outils. L'information et données au sein du gouvernement du Canada sont un atout stratégique dont nous devons tirer le meilleur parti. Nous les utilisons pour élaborer nos politiques en matière de décisions opérationnelles. Nous en avons besoin pour comprendre le fonctionnement de nos politiques et de nos programmes. Nous en avons besoin pour offrir de meilleurs services et pour faire mieux en général.

Si nous ne gérons pas correctement nos renseignements et nos données, il peut être très difficile de faire ces choses efficacement. On ne peut pas utiliser ce qu'on ne trouve pas. On ne peut pas plus utiliser un élément que l'on a trouvé, mais qui n'est pas adapté. On ne peut pas, du moins, l'utiliser très facilement. La politique sur les services et le numérique, qui est entrée en vigueur l'année dernière, définit les objectifs et les exigences pour que les renseignements et les données soient gérés comme un actif stratégique tout au long de leur cycle de vie, de sorte qu'ils soient de plus en plus interopérables afin d'en permettre l'utilisation continue et de soutenir nos priorités de transparence au gouvernement du Canada. Ainsi, la confidentialité et la sécurité des données sont pleinement intégrées dans la manière dont nous gérons nos renseignements et nos données.

Cela englobe une série de responsabilités pour les hauts fonctionnaires comme le dirigeant principal de l'information. Nous devons déterminer les renseignements et les données qui ont une valeur opérationnelle dans notre organisme. Nous devons aussi trouver et connaître la période pendant laquelle nous devons les conserver avant de les éliminer. Cela comprend également des obligations pour les gestionnaires et les employés, donc pour tous ceux qui participent au présent appel. Nous devons comprendre nos obligations concernant nos responsabilités en matière de gestion de l'information, afin de présenter des faits à l'appui de nos décisions et de nous assurer que cette information est placée dans les référentiels et les endroits où nous pouvons la trouver ou d'autres peuvent la trouver plus tard. La quantité de l'information et les données augmente de façon exponentielle chaque journée.

Notre capacité à gérer ces actifs manuellement n'est pas efficace, d'autant plus que nous sommes en télétravail depuis très longtemps. Parallèlement, les renseignements et données sont plus importants que jamais et constituent un actif organisationnel stratégique. Pas seulement pour votre organisme, mais pour le gouvernement du Canada dans son ensemble.

Ils sont essentiels pour réaliser la transformation numérique, améliorer les services et favoriser la transparence par l'accès à l'information et d'autres initiatives du gouvernement ouvert. Le développement de technologies de rupture telles que l'intelligence artificielle, l'apprentissage automatique et l'infonuagique remet encore plus en question les anciens paradigmes et les façons dont nous faisons les choses depuis de nombreuses années. Les dirigeants principaux de l'information ou DPI sont chargés de veiller à ce que les systèmes numériques constituent le moyen privilégié de créer, d'enregistrer et de gérer les renseignements sur les entreprises. Mais la gestion de l'information doit continuer à s'adapter aux besoins de l'air numérique.

Nous devons de plus en plus exploiter les outils et technologies numériques pour automatiser et numériser autant que possible les processus manuels de la gestion de l'information, ou GI, afin de mieux comprendre nos données et d'en retirer une valeur cohérente. Nous devons utiliser ces outils pour que l'employé moyen ne doive pas être un spécialiste en gestion de l'information.

Ainsi, la personne moyenne qui crée un document ne devrait pas avoir à prendre des décisions spécialisées sur les métadonnées qu'elle doit appliquer à cette information et sur la manière dont cette information sera éliminée à la fin de son cycle de vie. Nous devons trouver un moyen pour que la bonne chose à faire soit la chose facile à faire pour nos employés. Nous devons en éliminer les incertitudes, tout en facilitant le travail des spécialistes de la GI et des autres spécialistes en matière d'information et de données, qu'il s'agisse de gérer ou d'utiliser les renseignements et données dont nous disposons. L'information carve l'un de nos actifs les plus précieux, doivent être entretenues et gérées afin qu'ils puissent être trucs et utilisent par ceux qui en ont besoin.

C'est là que réside le véritable potentiel de la gestion de l'information. Elle transforme cet actif en un facilitateur d'affaires, car les demandes d'information et les possibilités de réutilisation de celle-ci sont infinies au gouvernement du Canada. En exploitant la puissance de l'automatisation et de l'intelligence artificielle et en éliminant la dépendance en matière de GI à l'égard des utilisateurs finaux, la GI peut présenter des valeurs opérationnelles incroyables pour les organisations et le gouvernement du Canada.

Il s'agit donc d'un potentiel que nous devons vraiment, vraiment exploiter, non seulement pour pouvoir trouver des données lorsque nous répondons à une demande d'accès à l'information, mais aussi pour pouvoir les trouver lorsque quelqu'un nous demande de produire une note qui a peut-être déjà été produite quatre ou cinq fois au cours du cycle de vie d'un ministère. Les outils et les technologies numériques modernes nous aideront à y parvenir.

Au Secrétariat du Conseil du Trésor, ou SCT, nous révisons, actualisons et simplifions à cette fin nos propres instruments de politique sur la GI. Nous voulons nous assurer que nous disposons de bonnes règles pour gérer les renseignements et les données à l'ère numérique et que nous mettons en place les bons outils pour y parvenir, à savoir des outils et des systèmes qui aideront les employés à trouver rapidement et facilement les renseignements et données dont ils ont besoin au bon moment.

Je tiens donc à remercier l'EFPC d'avoir organisé cette semaine les événements de démonstration d'outils de données. Tout au long de la semaine, nous avons assisté à des démonstrations de différents outils destinés à soutenir la gestion des données et des renseignements. J'espère que les démonstrations de cette semaine contribueront à motiver les praticiens de l'ensemble du gouvernement du Canada en ce qui a trait à l'art du possible, afin que nous puissions continuer à tirer le meilleur parti de nos importants fonds de renseignements et de données. Merci beaucoup.

John Medcof : Merci infiniment, Sonya. Je pense que cela présente bien la démonstration d'aujourd'hui et que vous avez en quelque sorte énoncé les défis et les possibilités du domaine de la gestion de l'information. Merci beaucoup pour votre présence avec nous aujourd'hui. Sur ce, je vais laisser la parole à Jason et à Norm, qui vont nous présenter la démonstration.

[Un écran est partagé et on peut lire sur une diapositive : « Shinydocs. Utilisation de l'automatisation pour rechercher et gérer des informations. »]

Jason Cassidy : Fantastique. Merci beaucoup, John. Je remercie aussi tout particulièrement Sonya. Sonya, j'aurais aimé que vous présentiez chacune de nos présentations, car vous avez donné le ton quant à l'importance de la gouvernance de l'information. J'aime bien que vous ayez mentionné brièvement que nos technologies actuelles devraient permettre d'éviter que les fonctionnaires soient responsables du problème de la gestion efficace de l'information. Nous disposons effectivement d'outils et nous sommes ravis de vous en montrer quelques-uns, ainsi que leur utilisation.

[Pendant que Jason parle, des diapositives résument ses propos.]

Je veux donc rendre ce sujet vraiment pertinent pour les fonctionnaires afin que vous compreniez les raisons pour lesquelles vous devriez vous en soucier et la façon dont cela devrait vous toucher. L'information importante, comme le disait Sonya, devra être rappelée dans l'avenir, probablement par d'autres personnes que vous, pour prendre des décisions, respecter des lois ou assurer la sécurité. Il existe toutes sortes d'excellentes raisons pour lesquelles nous devons avoir une gestion et une gouvernance de l'information.

Le problème, surtout actuellement avec l'augmentation du travail à domicile et des modes de travail hybrides, est que l'information se présente sous de nombreuses formes différentes. Je vais donc la définir aujourd'hui. Nous n'allons pas nous préoccuper des éléments qui se trouvent dans des bases de données structurées et dans des données déjà organisées. Je veux réfléchir davantage aux communications ad hoc que vous avez, aux textes, aux courriels, aux documents formels et informels, aux éléments que vous pourriez réunir ou que vous pourriez utiliser à partir d'un modèle, ou aux médias riches comme cette présentation qui aura des transcriptions. La valeur créée ici pourrait avoir besoin d'être rappelée dans l'avenir et ces données tabulaires pourraient être intégrées directement dans un document. Nous utilisons des données du gouvernement ouvert pour un grand nombre de nos sources de données et, bien souvent, directement dans ce document PDF ou Excel. Il existe toutes sortes de données tabulaires importantes, qui racontent davantage une histoire qu'elles ne servent de base de données.

Nous avons donc besoin de cette information. Nous devons être en mesure de la récupérer. Nous devons être en mesure de l'utiliser dans le cadre de notre processus décisionnel ultérieur plutôt que de l'utiliser comme un tuyau d'échappement qui sort de l'arrière-plan d'un processus d'affaires. La complexité liée au fait de simplement dire à quelqu'un « mettez les données dans un système différent pour que nous puissions effectuer de la gestion de l'information » ne fonctionne vraiment que si cela n'entrave pas l'écosystème dans lequel se trouvent déjà ces données.

Ainsi, des dessinateurs partout au Canada travaillent avec des systèmes de conception assistée par ordinateur (CAO) et avec ce type d'outils compliqués. On ne peut pas simplement leur dire de passer à Microsoft OneDrive. Ils ont besoin de leurs outils pour effectuer leur travail important. Des gens ont créé des liaisons entre des feuilles de calcul Excel ou des éléments similaires qui peuvent se briser. Je sais que lorsqu'ils parlent à l'ARC, soit l'Agence du revenu du Canada, ils peuvent avoir jusqu'à 10 000 documents de ce type qui contiennent des macros dépendantes des circonstances existantes.

Nous ne voulons pas briser cet écosystème seulement pour avoir la possibilité de rappeler des données ou de réaliser une gouvernance de l'information dans l'avenir. Nous devons apporter un complément à cet écosystème, tout en respectant les lois et les exigences qui nous sont imposées. Ce sont donc les objectifs plus généraux dont nous allons parler aujourd'hui en abordant les technologies.

Nous vous montrerons de quelle façon de grandes organisations le font déjà. Je vous donne l'exemple de la société Bruce Power, avec laquelle nous en sommes à la troisième année d'utilisation de ce type de technologie. Lorsque nous avons parlé pour la première fois à ses intervenants, ils voulaient être dans une situation où leur seule limite serait le nombre de personnes qu'ils embauchaient. Toutefois, ce n'était pas la seule limite qu'ils avaient. Leur limite était la suivante : chaque fois que cette installation nucléaire très sûre, qui est l'une des plus grandes de la planète avec ses 4 000 employés, ses 6 000 entrepreneurs et 10 000 personnes dans son réseau de chaîne d'approvisionnement, devait faire quelque chose, des recherches devaient être réalisées avant de pouvoir appuyer sur le bouton du bon de travail.

[Une nouvelle diapositive indique : « Au cours de la démonstration d'aujourd'hui, Shinydocs vous montrera comment des organisations massives envisagent leurs données et ce que les fonctionnaires peuvent prévoir à l'avenir avec les données qu'ils créent chaque jour. »]

De 40 à 60 heures de recherche par des personnes très importantes sont souvent nécessaires pour réunir les bons renseignements. Nous avons donc demandé à la société Bruce Power de calculer tout cela au préalable afin que nous puissions lui fournir les bons renseignements en quelques secondes. Nous avons dit : « On peut dire que vous voulez vous assurer d'éliminer, pour tout bon de travail, tout document d'approvisionnement ou tout dessin, de la bonne information de contrôle afin que les gens utilisent l'information la plus récente et que vos employés soient en sécurité. »

Le gouvernement du Canada doit également faire ces choses. On ne veut pas avoir à rechercher des données pendant 40 heures pour ensuite se dire : « J'espère que j'ai la bonne information. » Ne serait-il pas intéressant d'utiliser la technologie pour calculer cette information au préalable et en trouver une grande partie en vivant une expérience de recherche se rapprochant de celle de Google ou de l'expérience de magasinage de Best Buy pour toutes vos données, plutôt que de devoir savoir où elles se trouvent, puis de devoir les rechercher en amont? Ou, pire encore, plutôt que d'être obligé d'effectuer ce travail de métadonnées d'avance pour que quelqu'un, plus tard, puisse le faire? Rendons tout cela concret. Comment cette automatisation est-elle mise en œuvre?

[Une nouvelle diapositive indique : « Comment cette automatisation est-elle mise en œuvre? Acte 1 : Découvrir votre cas potentiel. Acte 2 : Enrichissez et connectez-vous à votre entreprise. Acte 3 : Agir en toute confiance. »]

Comment quelqu'un peut-il être dans le brouillard et peut-être dans l'ignorance quant à l'emplacement et à la nature de ses données, puis devenir confiant et certain de pouvoir agir comme la société Bruce Power ou d'autres clients?

Eh bien, ça commence par ce que nous appelons le « périple du héros ». Il y a un acte un, un acte deux, puis un acte trois. Norm Friend, un consultant en matière de solutions informatiques qui a une expérience hallucinante concernant, entre autres, cette technologie vous en fera une démonstration. Pensez-y : tout comme dans le périple du héros, vous devez découvrir qui vous êtes et ce dont vous êtes capable avant de pouvoir agir avec confiance.

Dans l'acte un, nous vous montrerons la manière de découvrir le cas potentiel, de déverrouiller les choses qui sont facilement déverrouillées dans les données. Dans l'acte deux, nous vous montrerons la façon de l'enrichir et de le relier à votre entreprise de manière automatisée, car, à vrai dire, vous avez des milliards et des milliards de documents. Aucun humain ne réussira jamais à passer à travers ces documents pour ensuite les harmoniser avec votre entreprise. Il faut des machines pour y arriver. Nous vous montrerons de quelle façon ces machines le font.

L'acte trois est entièrement axé sur vous. C'est à ce moment que vous agirez avec confiance. Vous voulez déplacer toutes vos données dans les services OneDrive de Microsoft 365 ou les dossiers dans GCdocs, mais ce n'est pas l'idée que la migration en soi est difficile qui vous empêche d'y arriver. C'est que vous ne pouvez même pas commencer parce que vous ne connaissez ni l'endroit où doivent aller les données ni la façon de créer les métadonnées. Ou peut-être pensez-vous que ces charges de travail doivent rester sur des disques partagés ou dans le courrier électronique. Vous ne pouvez pas prendre ces décisions sans passer par les actes un et deux en bonne et due forme. Or, vous n'avez jamais commencé ni l'un ni l'autre parce que vous n'avez jamais su de quelle façon le faire et vous n'avez jamais eu les technologies nécessaires. Nous changerons cela aujourd'hui.

Examinons maintenant le périple du héros, dont le premier volet est l'acte un. Dans l'acte un que Norm va vous montrer sous peu, nous trouverons des données redondantes, périmées et inutiles. Nous trouverons les premiers renseignements personnels et les arrimerons avec certains éléments évidents du fonds de commerce. Nous parlerons ensuite de ce qui est possible. Je veux m'assurer que vous réalisiez que cela comprend deux parties. D'un côté, il y a l'aspect agréable, mais compliqué, derrière les coulisses, dans lequel on retrouve toutes vos données et des visualisations. Ne vous préoccupez pas de cela en tant que fonctionnaire, mais sachez seulement qu'il y a un tour de magie qui utilise l'intelligence artificielle, ou IA, ainsi que d'autres choses que Norm vous montrera.

De l'autre côté, il y a une interface agréable. Norm vous montrera une méthode très semblable à celle de Google, qui consiste à parcourir les données et à trouver la bonne information au bon moment en quelques secondes au lieu d'y passer plusieurs heures. Sur ce, je vais arrêter de partager mon écran pour laisser la parole à Norm.

[Le partage d'écran de Jason se termine. Norm partage son écran, qui montre trois utilitaires de recherche de fichier. Deux d'entre eux se trouvent dans des onglets Internet et l'un provient de l'ordinateur.]

Norm Friend : Merci, Jason. Commençons par l'outil Discovery pour la découverte de données. Voici un client typique avec lequel nous travaillons et qui dispose d'un certain nombre de référentiels. En haut, vous pouvez voir des partages de fichiers. Sur la droite, vous voyez que GCdocs est ouvert. En bas, nous pourrions avoir l'outil SharePoint Online. Ils constituent tous des référentiels différents qui stockent des données. Microsoft Exchange en est un autre. Il en existe beaucoup.

Ce que nous voulons faire, comme nous l'avons dit, c'est en dresser l'inventaire et envisager la création d'une plateforme qui permettrait de commencer la découverte de données. Alors, la première étape consiste à corréler tout cela au même endroit.

[Il montre des graphiques en secteurs complexes, en corrélation avec des graphiques à barres.]

En procédant de la sorte, nous obtenons une visualisation comme celle-ci. Je peux maintenant voir en un seul endroit tout le contenu provenant de tous ces différents référentiels. Je peux commencer à obtenir des données de base sur cet ensemble particulier de données ou sur mon référentiel.

Je peux appliquer des filtres. Je peux choisir d'examiner ce qui se trouve seulement dans SharePoint Online. J'ai maintenant une bonne idée de la provenance des données et de leur nature. Maintenant, dans le cadre de cette première étape de découverte des données, je veux aussi faire un peu de nettoyage. C'est ce que nous appelons les données redondantes, périmées et inutiles (RPI). Encore une fois, nous appliquons un certain nombre de règles et de processus sur notre contenu.

Nous pouvons ensuite commencer à examiner l'information dont nous disposons pour déterminer celle qui est redondante. Voici tous mes doublons d'information. Ils contiennent peut-être des copies de courriels, des fichiers qui n'ont pas été utilisés depuis sept ans ou des fichiers inutiles comme des fichiers de zéro octet ou sans extension. Il y a beaucoup de bruit de ce type dans nos organisations. Vous seriez surpris de voir la quantité d'information qui provient de ces données RPI. Dans bon nombre de nos organisations, il peut y avoir entre 40 % et 50 % de ce contenu redondant, périmé et inutile dans ces référentiels de données.

L'étape suivante, qui fait toujours partie de cette découverte de données, consiste à examiner certains renseignements généraux que nous voudrions appliquer dans l'ensemble de l'entreprise et à désagréger ces données pour déterminer à qui elles appartiennent. Est-ce qu'elles appartiennent aux ventes ou à l'ingénierie? Est-ce qu'elles appartiennent à un autre groupe?

Je veux aussi extraire les entités générales. Et si je pouvais extraire chaque date d'un document, chaque pièce de monnaie? Dans ce cas, le nom de tout le monde se trouve dans un document. En faisant cela dans tous ces référentiels, nous avons maintenant un très bon aperçu de ce qui s'y trouve.

Après avoir construit ces index, nous pouvons commencer à examiner certains des résultats obtenus. Je vais donc m'appuyer sur ces résultats au cours de l'enrichissement et de l'action, soit les différents actes. Dans ce cas, si je regarde ici, je sais que je dispose de beaucoup de données sur une personne nommée Josie. D'accord? Je veux donc chercher le nom de Josie.

[Dans un onglet de Shinydocs, Norm tape le mot « Josie » dans une barre de recherche. La page de résultats présente une liste de fichiers, montre un aperçu de ceux-ci et offre des options de filtre dans une barre latérale.]

Je peux donc me dire : « Très bien, je veux trouver tout ce qui contient son nom. » Encore une fois, je peux choisir. Je veux peut-être consulter uniquement le contenu de GCdocs ou trouver un élément précis dans l'ensemble de mon entreprise.

J'ai maintenant une expérience de recherche très, très facile, comme avec Google. Nous allons bientôt parler, entre autres, de certains éléments que vous pouvez utiliser. Maintenant que j'ai enrichi les données, je peux voir clairement les documents qui contiennent cet élément d'information particulier. Encore une fois, l'endroit où se trouve cette information importe peu. L'outil fournira les données de tous les référentiels.

Cela situe le contexte de l'acte un, qui consiste à obtenir ce paysage, cette découverte et cet inventaire de données, et à les préparer pour l'acte suivant, à savoir la compréhension.

[Le partage d'écran bascule vers le diaporama de Jason. Celui-ci résume ses principaux points.]

Jason Cassidy : Merci, Norm. Pour récapituler, vous avez vu les premières étapes de l'enrichissement. Vous avez vu la façon dont nous comprenons les données et dont nous trouvons les doublons, les noms des personnes, les dates, les sommes d'argent et toutes ces choses évidentes qui sont faciles à trouver dans une organisation. C'est la première étape.

La deuxième étape consiste à véritablement relier ces éléments à votre entreprise. Cela nécessite une certaine intendance de données ou des personnes qui connaissent très bien votre entreprise, sauf que c'est automatisé. Cela représente 10 000 documents à la fois ou des centaines de milliers de documents à la fois. Norm vous montrera la façon d'utiliser l'intelligence artificielle qui est déjà intégrée dans votre organisation afin d'enrichir les données. La dernière chose que vous avez vue était cette interface de recherche agréable et facile.

Comment rendons-nous l'enrichissement facile? Vous le reliez aux données et vous faites en sorte que tout ce à quoi vous devez penser soit calculé au préalable afin que vous puissiez utiliser des cases à cocher ou des cases de défilement plutôt que de devoir réfléchir à l'endroit où se trouve le contenu pour aller le chercher. Je vais maintenant arrêter de partager mon écran. Passons à l'enrichissement, Norm.

[Norm partage son écran pour montrer un formulaire et une feuille de calcul remplie de métadonnées.]

Norm Friend : Bien sûr. Merci. Le premier point est très important. Nous utilisons comme cadre ce que nous appelons un « modèle d'information unifié » lorsque des données se trouvent dans toutes ces applications que nous avons. Ces données sont liées à un certain nombre de documents que nous avons vus dans ces référentiels. Dans le présent scénario, je veux sélectionner un bon de commande.

À droite, je vois un document, soit le document PDF d'un bon de commande fourni, dans ce cas, par Adams Crooks et Lowe. Sur le côté se trouve mon progiciel de gestion intégré, ou PGI, qui contient une foule de renseignements sur les entreprises comme leur nom, leur nom abrégé, leur ville, leur province, bref tous ces renseignements structurés. Comme on peut s'y attendre, il contient des renseignements comme le numéro de bon de commande et le numéro de fournisseur.

Ces renseignements ne sont pas différents de ceux que nous voyons dans le document lui-même. Ainsi, une partie de ce modèle d'information unifié commence à rassembler ces concepts et cette entité de données en un seul endroit. Voici l'ensemble des résultats qui en résulte.

[Norm montre plus de graphiques en secteurs et de graphiques à barres.]

Ainsi, en poursuivant l'enrichissement, je peux maintenant examiner les documents que j'ai étiquetés, dans ce cas, avec mes données du bon de commande, afin de savoir lesquels sont petits, moyens ou importants, lesquels contiennent des taxes et lesquels n'en contiennent pas. Je peux voir ma croissance d'une année à l'autre en fonction de tous ces différents bons de commande.

Je peux même voir les bons de commande existants. Je peux voir ici [inaudible] chez Crooks. Je peux forer vers le bas pour chacun d'entre eux. Ici encore, ce que nous avons fait dans tous ces différents référentiels, c'est de commencer à faire de l'enrichissement. Cela sert, entre autres, à prendre toutes ces applications sectorielles et à les amener dans notre index pour permettre une analyse et une découverte de données plus approfondies. Maintenant que c'est fait, revenons à la recherche au moyen de l'outil Discovery.

[Norm navigue vers la page de recherche Shinydocs Discovery et utilise la barre de recherche.]

Alors, maintenant, disons que je travaille au service des finances et que je cherche... Qui est-ce que je veux rechercher? Auer et Walter. Alors, je cherche maintenant un bon de commande de ce groupe. Ici encore, je veux peut-être rechercher la phrase exacte. Je pourrais choisir un endroit particulier, mais je veux seulement chercher tout ce qui contient Auer et Walter.

L'ensemble des résultats revient, mais maintenant que j'ai un enrichissement supplémentaire, je peux commencer à faire des choses comme... Eh bien, je sais qu'il s'agit d'un bon de commande. Ainsi, je ne m'intéresse pas à certaines propositions de vente existantes avec lesquelles nous avons travaillé. Je veux uniquement les bons de commande qui y sont liés.

[Il filtre les résultats.]

En fait, je cherche le prix total d'un bon de commande. Je veux maintenant trouver un bon de commande qui s'élève, disons, entre 300 000 $ et 500 000 $, ou plutôt 600 000 $. Étant donné que j'ai procédé à cet enrichissement, il est maintenant possible grâce à des choses comme notre recherche d'en tirer parti comme sur n'importe quel autre site Web où l'on filtre très rapidement les résultats pour trouver les documents précis dont on a besoin.

Ensuite, on pourra enrichir encore plus. Et si je pouvais faire des choses comme ce qui suit? Comme cela a été fait pour une société de crédit-bail présentée sur le côté ici, je veux maintenant examiner tous mes contrats de location en fonction de leur emplacement géographique.

[Norm montre des cartes sur lesquelles sont présentés des points jaunes et des points rouges.]

Et si je veux examiner l'ensemble de mon index et trouver à quel endroit ce document est géographiquement lié? Encore une fois, nous parlons de tous ces référentiels. Nous pouvons y arriver en prenant simplement le début de l'enrichissement de l'acte un, puis en y ajoutant tous ces enrichissements différents, en fonction des domaines des données que nous cherchons à enrichir.

Jason Cassidy : C'est formidable, Norm. Ce que nous constatons avec nos clients, c'est qu'il n'y a pas un acte trois qui les gouverne tous. L'idée est que vous pouvez maintenant rechercher de l'information avec la facilité d'une expérience de recherche se rapprochant de celle de Google et que vous avez maintenant fait à l'intérieur de votre organisation et de votre écosystème tout le travail difficile qui a été fait sur le Web public. Ce système est meilleur que la simple recherche par mots-clés, comme vous l'avez vu, car il connaît les données de géolocalisation. Il connaît les données temporelles, soit les données liées au temps, l'ancienneté d'un élément et sa dépréciation du point de vue de l'intérêt.

Qui plus est, il sait comment s'harmoniser avec votre fonds de commerce. Si vous avez les numéros de dossier, les numéros de bon de commande comme Norm l'a montré, les numéros de fournisseur, les noms des personnes ou les noms des employés, il calcule au préalable toutes ces données. Elles deviennent des filtres ou des éléments pour ce que vous voulez faire. Cela vous permet de vraiment comprendre toutes vos données non structurées et de prendre des décisions.

Par exemple, l'une des choses dont nous parlons beaucoup avec le gouvernement du Canada est la façon de moderniser des choses simples comme le stockage des données et de commencer à utiliser les outils qu'il a déjà achetés comme GCdocs, Microsoft 365 et tous les éléments géniaux qui les accompagnent. La plus grande limite est notre troisième point ici. Comment pouvez-vous réellement passer à quelque chose d'autre si vous ne savez pas ce que vous avez déjà?

Ainsi, dans certains cas, vous passez d'une ignorance totale à une confiance totale. Cela vous permet d'éviter l'embarras d'une fuite de données, d'un piratage ou de ce genre de chose, alors que vous ne savez même pas ce qui a été perdu parce que vous ne saviez même pas que des gens le cherchaient. On en arrive à un point où l'on connaît la nature exacte de chaque document dans le système de fichiers, dans le courrier électronique, dans GCdocs, dans SharePoint, peu importe où il se trouve. Nous pouvons sécuriser ces documents comme il se doit, les déplacer exactement à l'endroit où ils doivent se trouver.

Qui plus est, notre certitude fera en sorte que nous ne perturberons pas le flux de travaux de quiconque. Si nous revenons à nos amis les dessinateurs qui travaillent en CAO, nous savons que nous ne déplacerons aucun contenu leur appartenant avant qu'il ne soit prêt à l'être. Nous savons que nous ne briserons pas les liaisons de feuilles de calcul Excel, car nous ne les déplacerons pas tant que nous n'aurons pas trouvé de solution. Dans l'ancien monde dans lequel je travaillais, nous déplacions vers des éléments sur le Web comme GCdocs des personnes qui travaillaient dans des fichiers Excel contenant des liens. Ensuite, nous devions corriger les liens dans 10 000 documents. C'est comme si on vous cassait les jambes pour ensuite vous vendre des béquilles. C'est ridicule. Ne brisez rien. Agissez avec confiance. Cela vous facilitera la vie en tant que fonctionnaire et vous permettra d'être le mieux informé possible pour prendre ces décisions.

Malgré le fait que nous ne montrons à personne, par exemple, la façon d'« enregistrer sous » un document dans Microsoft Word, PowerPoint, Excel ou dans un système de CAO, l'un des secrets intéressants et sous-jacents de ces trois actes est qu'ils apportent un complément à votre façon de travailler actuelle. Nous voulons y apporter un complément. Alors, Norm, pourquoi ne pas passer en revue quelques autres cas d'utilisation? Étant donné que nous ne pouvons pas englober tous les aspects des trois actes intéressants et des choses que vous pouvez faire maintenant que vous êtes le héros, nous pouvons peut-être passer en revue d'autres exemples de ce que nous pouvons faire.

Norm Friend : Tout à fait. Comme nous l'avons mentionné, la partie « action » de... Lorsque nous comprenons que la partie « action » sera différente pour chaque cas d'utilisation dans ces référentiels, nous comprenons que nous avons maintenant la capacité d'agir sur ces choses. Dans le présent exemple, j'effectue de l'élimination. Il pourrait s'agir de migrations de données. Comme nous sommes dans la Semaine des données, disons que j'ai maintenant besoin de créer un catalogue de données pour poursuivre l'analyse dans d'autres systèmes d'analyse que je veux utiliser, car nous avons créé une structure à l'intérieur de nos données non structurées.

Pour ce qui est de la confiance, encore une fois, je reviens à la recherche. Nous avons fait cet enrichissement, mais qu'arriverait-il si je savais exactement quel bon de commande trouver?

[Norm utilise la fonction de recherche avancée de la barre de recherche Shinydocs Discovery. Cela ne donne qu'un seul résultat.]

Quelles sont les probabilités que lorsque je sais exactement quel bon de commande trouver, ce document, quel que soit le référentiel... Dans ce cas, il se trouve dans GCdocs. Peu importe où il se trouve. Nous avons fait l'enrichissement et nous avons maintenant la possibilité de prendre des mesures comme trouver très rapidement le contenu dont nous avons besoin.

Jason Cassidy : C'est génial. Merci, Norm. Nous passerons en revue quelques autres éléments de contexte, comme ce qui nous a amenés ici, le type d'utilisation de cette technologie et les choses auxquelles il faut penser en tant que fonctionnaire. Nous rejoindrons ensuite John pour répondre à quelques questions à mesure que les questions parviendront à notre système ici.

Alors, voici un aperçu d'où tout cela provient. Une chose vraiment intéressante s'est passée entre 2007 et 2009. Tout le monde participant au présent appel a compris la façon de créer du contenu numérique, mais personne n'était prêt. Je ne parle pas ici en mal de GCdocs, de SharePoint, des partages de fichiers ou autre. C'est seulement que cela nous est arrivé.

[Dans son diaporama, Jason montre un graphique indiquant des quantités de données dans le temps. Vers 2007, les données commencent à suivre une tendance exponentielle. Deux points sont mis en évidence : l'un se situe vers 2005, où il est indiqué « Plus grandes instances de SharePoint » et l'autre point se situe vers 2007, où il est indiqué « Colonial Pipeline ».]

Voici un exemple. Ce sont les données de l'un de nos clients. Je ne vous dirai pas lequel. Dans cet exemple, les partages de fichiers représentent à eux seuls 760 téraoctets de données. Cela représente 1 200 partages de fichiers. Quand on pense aux choses qui se passent dans ces organisations... En passant, ce ne sont pas les données de Colonial Pipeline, nous utilisons cette société seulement à titre d'exemple. Cette petite zone bleue ici représente cent gigaoctets de données. Il s'agit d'une très petite quantité de données, soit le soixante-dixième ou moins du contenu global. C'est cette quantité qui a été piratée chez Colonial Pipeline, ce qui a réduit le débit carburant vers la côte est des États-Unis.

Pensez à ceci : cette entreprise ici possède maintenant un nombre de données des centaines de fois plus élevé. Nous soulignons le fait qu'il ne s'agit pas précisément de la plus grande instance de SharePoint. Ce qui est en vert représente les plus grandes instances de SharePoint de la planète, qui tendent à représenter environ 100 à 200 téraoctets de données.

Pour que ces organisations puissent tout placer dans Microsoft 365 ou GCdocs, il faudrait qu'elles possèdent sept ou huit de ces plus grandes instances sur la planète. Cela ne rime à rien. Cela ne se fera pas. Comme vous pouvez le voir, leurs données augmentent. La seule façon de régler ce problème est donc l'automatisation de la compréhension des données, puis l'automatisation de l'activité consistant à mettre les bonnes choses au bon endroit. Bien sûr, nous voulons des outils comme GCdocs pour la gestion des documents. Nous en avons besoin. Bien sûr, nous voulons des outils comme Microsoft 365 pour la collaboration et une centaine d'autres utilisations. Bien sûr. Je ne dis pas de ne pas les utiliser. Ce que je veux dire, c'est qu'il y a une étape zéro. Il y a une étape préalable, qui consiste à comprendre la nature de vos données et la façon dont les gens les utilisent, à automatiser cela, puis à automatiser l'activité consistant à amener les données au bon endroit lorsque les utilisateurs sont prêts.

J'espère que cette visualisation renforce vraiment le fait que même si quelqu'un dit que notre stratégie est de déplacer les données quelque part, ce n'est pas vraiment la stratégie. La stratégie doit être la suivante : comprendre ce qui se passe, puis déterminer le bon endroit où les déplacer en fonction de cette compréhension. Ceci ne fait que renforcer ce fait.

Encore une fois, ce n'est pas un discours contre les plateformes. Je ne voudrais pas que quelqu'un le prenne de cette façon, car même avant le présent appel, l'un de nos collègues travaillait justement dans GCdocs et il disait qu'il entretenait une relation amour-haine avec cet outil. Il en saisit la valeur, mais il comprend en quoi cet outil peut limiter l'écosystème dans lequel il travaille. À mon avis, cela réside dans le fait qu'il n'y a pas eu de bonnes stratégies, orientations et technologies pour aider les gens à y parvenir, par opposition à l'utilisation réelle des systèmes eux-mêmes.

J'ai écrit en majuscules que j'aimerais que tout le monde demande que cela apporte un complément à sa façon de travailler et dise : « Je vous en prie, ne me demandez pas d'appliquer des changements tant que nous ne comprendrons pas l'incidence qu'ils auront sur nous. » Ensuite, vous pourrez tirer parti de systèmes comme celui que Shinydocs présente ici afin d'amener les gens vers ces changements. J'espère que nous pourrons compter sur les gens pour se faire entendre à ce sujet. Ainsi, nous trouverons les données où qu'elles se trouvent.

Je sais que Facebook n'est pas le meilleur exemple de conscience sociale ces derniers temps, mais c'est un merveilleux exemple de la façon de rassembler d'énormes quantités de données et de trouver la bonne donnée. Évidemment, Facebook fait cela à vous, pas pour vous, mais Shinydocs le fait pour vous. Nous nous connectons à chaque partage de fichiers, à chaque SharePoint, à chaque GCdocs, à chaque courriel. Nous connaissons l'emplacement des données, leur nature et la façon de les déplacer. Cependant, nous ne sommes pas en train de vous dire de les placer dans Shinydocs. Ce n'est pas ce que nous faisons. Il s'agit seulement d'une compréhension et d'un réseau dans lequel vous pouvez poser des questions. C'est la solution moderne.

[Une diapositive présente une longue liste d'avantages liés à l'adoption d'une plateforme de données enrichies, comme « La solution moderne ne nécessite aucune migration ou effectue une migration de manière si fluide que les utilisateurs ne la remarqueront jamais ».]

Vous pouvez peut-être faire une capture d'écran de cette diapositive, qui présente toutes sortes d'aspects positifs dont je ne vais pas examiner la valeur point par point. Toutefois, la dernière chose que je dirai, c'est que certaines personnes nous demandent : « D'accord, mais pourquoi maintenant? Qu'est-ce qui est différent maintenant? » C'est une excellente question. Pour la première fois dans l'histoire de l'humanité, nous disposons réellement de la capacité de calcul et de la capacité de réseau nécessaires pour réaliser tout cela à l'échelle de calcul. Nous pouvons collecter vos données assez rapidement. Nous pouvons enrichir vos données assez rapidement. Il y a vingt ans, il aurait fallu dix ans pour réaliser ces activités, tandis qu'il faut maintenant dix mois ou dix semaines. Nous pouvons donc être très reconnaissants que l'ensemble de l'industrie ait progressé à pas de géant pour que nous puissions aujourd'hui appliquer ces technologies au problème particulier de la gestion des données.

Si cela vous intéresse vraiment en tant que décideur, nous avons une offre à commandes pour tout ce que vous avez vu ici aujourd'hui. Gardez à l'esprit qu'il s'agit d'une stratégie tout autant qu'un logiciel. Or, notre entreprise est bien entendu un fabricant de logiciels. Nous serons donc heureux de vous parler de stratégie et de logiciels au fur et à mesure. Revenons à John. Merci infiniment de nous avoir donné l'occasion de parler.

John Medcof : Oui. Merci beaucoup, Jason. Merci beaucoup, Norm, pour cette visite guidée de Shinydocs, qui représente un exemple du potentiel et des changements très intéressants qui se produisent en ce moment. Comme vous l'avez dit, dans le domaine de la gestion de l'information, la série consiste à montrer la puissance de ces technologies et à faire réfléchir à la valeur que présente la capacité de trouver la bonne information au bon moment. Vous nous en avez donné un bon aperçu. C'était très, très captivant.

J'ai eu l'impression, quand Norm a partagé son écran dans l'acte un, que c'était mon bureau ce matin. Bon nombre des défis que vous avez soulignés concernant les types de données que nous n'exploitons pas m'ont semblé vrais. Quelques questions du public ont commencé à arriver et je peux vous en présenter quelques-unes. Tout d'abord, l'une des questions est : comment l'outil de Shinydocs détermine-t-il les filtres à appliquer sur les données non structurées? Trouve-t-il des modèles par lui-même grâce à l'apprentissage automatique ou s'agit-il d'un processus manuel?

[Le partage d'écran se termine.]

Jason Cassidy : Oui. C'est un bon début, John. Comme nous l'avons dit plus tôt, ce n'est absolument pas un processus manuel. Nos clients possèdent des milliards de documents. La société Bruce Power disposait à elle seule d'un millier de milliards de points de données, qui remontaient jusqu'à 1968. Il est impossible de faire quoi que ce soit manuellement. Ce qui est très intéressant, c'est que bien souvent, les organisations en savent déjà beaucoup sur vos données. Comme Norm l'a montré, lorsqu'il a montré une feuille de calcul Excel qui provenait d'un PGI,

très souvent, nous savons déjà des choses grâce à des feuilles de calcul contenant des données structurées. Quels sont les numéros des bons de commande? Quels sont les dossiers sur lesquels les gens travaillent? Ce genre de choses. La première chose à faire est de calculer au préalable l'emplacement de ces renseignements dans l'ensemble des données. Vous pouvez alors tirer des conclusions assez simples et évidentes. Vous pouvez utiliser l'apprentissage automatique et la classification pour déterminer, entre autres, ce qu'est un bon de travail ou ce qu'est un certain type de rapport, quel que soit le ministère dans lequel vous travaillez.

On peut utiliser ce genre de choses. On peut ensuite trianguler ces renseignements avec d'autres données. Par exemple, un document qui contient toujours tel type de titre et tel type de contenu et de renseignements est généralement tel type de document. On peut en tirer des conclusions. Cela ne fonctionne que si vous pouvez effectuer une recherche de grande envergure dans l'ensemble des données avec l'outil Discovery. De plus, cela ne fonctionne que si vous disposez de données qui permettent d'élaborer ces concepts d'affaires.

Ainsi, nous constatons qu'environ 70 % ou 80 % des données donnent cette première conclusion. On en a déjà une idée assez précise grâce aux données structurées rendues accessibles. À partir de ce moment, il faudra réaliser un travail de longue haleine. Les 20 % restants correspondent parfois à des travaux par le propriétaire, qui ne sont jamais manuels, car nous n'allons pas jusqu'aux processus manuels. Ce travail fait autrefois n'a jamais fonctionné.

[John parle « en silence ».]

Oh. On dirait qu'on a perdu le son de votre micro, John. Je suis en train de regarder le clavardage de Zoom en ce moment, alors vous pouvez faire un copier-coller de la question dans le clavardage de Zoom si vous le souhaitez.

John Medcof : Jason, j'ai dû rebrancher mon casque d'écoute.

Jason Cassidy : Oh, voilà.

John Medcof : Absolument. Bien sûr. M'entendez-vous maintenant?

Jason Cassidy : Vous pouvez poursuivre, John, nous vous entendons bien.

John Medcof : D'accord. Voici la deuxième question. [00:42:34 inaudible] vol lors d'une atteinte à la sécurité des données, comment cela fonctionnerait-il?

Jason Cassidy : Oui. En cas d'atteinte à la sécurité des données, on connaît généralement la zone d'intérêt qui a été attaquée. Il s'agira de tels partages de fichiers, de telle application Web, de tel endroit à l'intérieur de SharePoint ou de quelque chose de ce genre. Le problème que rencontrent nos clients est qu'ils se demandent : « Comment pouvons-nous en être sûrs? » Il existe parfois des données d'analyse, comme des pistes de vérification, qui peuvent être intégrées dans notre moteur d'analyse pour vérifier plus particulièrement ces éléments.

Le plus souvent, les gens ne sont pas aussi prévoyants. Il faut donc être en mesure d'utiliser un outil comme le nôtre pour se demander : « Quels sont les concepts qui se trouvent dans les dix millions de documents qui peuvent avoir été compromis? » Vous ne passerez pas en revue dix millions de documents un à un pour déterminer les renseignements personnels qui pourraient avoir été exploités ou ce genre de choses. Vous ne pouvez connaître que les concepts.

Eh bien, nous fournissons les concepts instantanément. Donc, les concepts sont fournis très vite et cela nous permet d'affirmer avec certitude : « Voici le type de renseignements personnels ou le type d'information confidentielle qui ont été compromis ou non. » Il s'agit d'éléments pour lesquels les gens peuvent avoir un peu de certitude. C'est encore mieux si nous pouvons intégrer les pistes de vérification dans les analyses.

John Medcof : C'est fantastique. Merci beaucoup. Les questions continuent d'affluer. Je vais donc passer aux questions des participants. L'un d'entre eux demande : « Pourriez-vous nous en dire davantage sur la façon dont se fait l'enrichissement et sur le temps nécessaire pour le mettre en place dès le départ? »

Jason Cassidy : Oui. Il y a deux types d'enrichissement et c'est pourquoi nous le divisons en actes un et deux. L'acte un se déroule très rapidement. C'est aussi rapide que les machines peuvent le prendre, mais c'est en quelque sorte plus général. Les noms des personnes sont les noms des personnes. Le langage naturel comprend cela. Bien entendu, le Canada est un endroit merveilleux à cet égard, car il a une pluralité de cultures. Il n'y a pas de base de données de noms de personnes.

Mais la façon dont le contenu est utilisé en anglais, en français et dans d'autres langues montre clairement quand des noms sont utilisés. C'est ce que Norm a montré, soit la façon de trouver ce premier enrichissement. Dans cet acte un, des téraoctets de données, des centaines de téraoctets de données peuvent être créés en quelques semaines ou moins, en fonction du volume de données dont vous disposez.

Dans l'acte deux, en ce qui concerne une grande organisation comme la société Bruce Power qui possède des centaines de téraoctets de données, bon nombre de ces données sont très confidentielles et propres à son niveau de gestion des actifs, à sa quantité de renseignements nucléaires contrôlés et à ses travaux réalisés avec le Centre de la sécurité des télécommunications, l'Association mondiale des exploitants de centrales nucléaires (WANO) et autres. Aucun outil d'intelligence artificielle sur la planète ne peut trier sur le volet ces données.

Il faut donc intégrer tous ces concepts d'affaires et les automatiser, ce qui peut prendre quelques mois, voire une année. L'intérêt réside dans le fait qu'une fois le travail terminé, vous disposerez de ces modèles pour toujours. Chaque nouveau document qui apparaîtra à partir de maintenant jusqu'à la fin des temps sera automatiquement traité de la bonne façon aux fins de gouvernance de l'information. Chaque changement que vous devrez effectuer sera désormais petit et progressif. L'homme ne devra pas tout apprendre sur ce document pour s'assurer qu'il arrive au bon endroit.

Les avantages sont donc énormes pour des efforts comparables, à vrai dire, à ceux que déploierait une personne pour effectuer manuellement un glisser-déposer de milliers de documents. Si vous déployez les mêmes efforts et que vous automatisez le tout, vous aurez des résultats pour toujours.

John Medcof : D'accord. Merci. C'est vraiment utile. L'une des choses qui m'ont vraiment frappé pendant que vous parliez et pendant que Norm faisait la démonstration est la mesure dans laquelle l'accent est désormais mis sur l'utilisateur final, notamment sur la façon dont il utilise ces outils tous les jours. Je pense que Sonya a mentionné le fonctionnaire moyen au début de son allocution. Je me sens vraiment comme ce fonctionnaire moyen. Pourriez-vous nous parler un peu de cette évolution et de l'importance accrue désormais accordée à des outils comme ceux-ci en vue de penser à l'utilisateur final et à l'utilisateur moyen dans une organisation, plutôt que seulement aux personnes qui les activent en coulisse?

Jason Cassidy : Oui. Certainement, John. Auparavant, la technologie n'était que de la technologie. Vous embauchiez des employés en technologie de l'information et ils s'occupaient de tout ce qui était lié à la technologie. Ce service obtenait tous les investissements s'il fonctionnait bien. Si jamais il avait déjà visé juste pour vous rendre la vie plus facile, alors tous les fonds y allaient encore. Le problème est que cette façon de faire a toujours fonctionné en principe, mais qu'elle n'a jamais fonctionné pour vous.

C'est la raison pour laquelle on assiste actuellement à un changement. Les organisations, les gouvernements, les organismes privés et bien d'autres réalisent qu'ils ne mettront leur argent, qu'ils ne miseront que sur des choses dont les résultats s'avèrent positifs.

Quand vous procédez à une transformation numérique, ce qui constitue un terme très chargé puisque cela peut comprendre bien des choses, de la robotique au type de travail que nous faisons ici, je vous suggère de la faire cadrer avec l'un des quatre éléments suivants : le produit que vous fournissez à vos clients, le service que vous leur offrez, l'expérience client du personnel ou de vos clients, ou vos principaux processus d'affaires. Par exemple, la société Bruce Power et d'autres ont simplement rendu leurs processus d'affaires beaucoup plus puissants.

Dès que vous faites cela, il ne s'agit plus d'un projet de technologie de l'information. Cela devient une question de résultat et d'expérience pour les autres. Je pense que vous conviendrez que, d'ici 2040, les processus papier n'existeront plus. Nous n'allons plus nous rendre au bureau local « canada.ca » pour faire quoi que ce soit avec du papier.

Comment en sommes-nous arrivés là? Nous en sommes arrivés là en examinant notre expérience client et celle de notre personnel et en veillant à ce que ces éléments soient numérisés et automatisés afin que nous puissions nous concentrer sur le travail intellectuel de la plus grande valeur plutôt que de nous préoccuper des détails relatifs à la sauvegarde d'un document au bon endroit.

John Medcof : D'accord. C'est fantastique. Je me sens vraiment concerné en tant qu'utilisateur. Merci. Un autre participant a posé une question. Il est curieux d'en savoir plus sur les fonctions liées à la tenue des dossiers. Où se fait l'élimination des documents? Est-ce qu'elle continue à se faire à l'échelle des référentiels ou est-ce que Shinydocs peut la centraliser? Cela facilite-t-il le transfert des documents dans les archives?

Jason Cassidy : Tout à fait. En fait, il s'agit d'où nous venons. Notre entreprise a été nommée, pendant trois de ses quatre premières années d'existence, partenaire technologique de l'année dans ce domaine par la société OpenText puisqu'elle apportait un complément à ce processus. Nous nous en sommes éloignés simplement parce que le volume était trop petit. Nous avons constaté que seulement un demi ou un pour cent du contenu se trouvait à des endroits comme GCdocs. Nous nous sommes dit que non, nous voulons frapper plus fort. Nous voulons atteindre tout le monde.

Ce qui nous amène à nous poser précisément ces questions, c'est que les dossiers sont partout. Comment trouver ces dossiers s'ils sont partout? On a besoin d'une analyse comme celle-ci. Je vais donner un exemple très précis. Disons que vous avez un document de contrôle qui précise que tout le monde doit utiliser cette dernière version et qu'il s'agit d'un dossier important qui se trouve dans GCdocs.

Comment peut-on s'assurer que Norm n'utilise pas la version qu'il conserve dans sa boîte aux lettres électronique? Comment peut-on s'assurer que quelqu'un n'utilise pas le partage de fichiers? Notre outil d'analyse, par des mesures simples comme la duplication, passe en revue les documents pour trouver toutes les copies de ce document partout dans l'ensemble de votre réseau. Ainsi, quand une personne effectue une recherche, des avertissements peuvent être appliqués à toutes les versions déconseillées pour qu'elle n'utilise que ce nouveau dossier.

Il importe peu que le dossier se trouve dans GCdocs. Nous pouvons vous aider à aller le chercher. Nous avons notamment des outils de migration. Cela comprend en quelque sorte deux parties. Il faut s'assurer que les gens prennent les bonnes décisions concernant leurs dossiers. Ensuite, comme Norm l'a montré brièvement dans un tableau de bord, il faut déterminer les éléments qui peuvent faire l'objet d'une élimination en fonction de leur information temporelle et de leur classification. Voilà. C'est bien.

Les outils comme GCdocs ont parfois une tenue de dossiers intégrée. Elle fera parfaitement l'affaire. Nous ne sommes pas inquiets à ce sujet. Dans SharePoint, vous pouvez ajouter des solutions additives à cette fin. Nous ne sommes pas inquiets à ce sujet. Ce qui nous préoccupe, c'est de nous assurer que notre système traite correctement le document une fois qu'il est versé dans un partage de fichiers ou un courrier électronique. Nous avons beaucoup travaillé là-dessus et nous sommes heureux de discuter avec les fonctionnaires de la manière dont nous pouvons les aider avec les 90 % de données restantes.

John Medcof : Oui. Merci. L'exemple de Norm, encore une fois, m'a vraiment frappé. J'ai l'impression qu'il y a probablement une certaine redondance dans les documents qui se trouvent dans certains de mes endroits de travail et que je ne saurais probablement même pas quel document utiliser. Je suis donc reconnaissant de cet exemple. D'autres questions sont arrivées. Le temps file, mais quelques-unes d'entre elles sont de très bonnes questions.

Il y a une question pour Jason. Vous avez mentionné à la deuxième étape qu'une gouvernance des données est nécessaire, qu'il s'agit de l'un des premiers problèmes auxquels sont confrontés les gestionnaires de documents et les autres spécialistes de la gestion de l'information, quel que soit l'outil utilisé, et que tout outil est voué à l'échec en l'absence d'une gouvernance convenue. Comment l'outil Shinydocs et l'équipe de Shinydocs peuvent-ils nous aider à automatiser la gouvernance?

Jason Cassidy : La gouvernance elle-même a, si je commence par... Je fais moi-même partie du groupe de travail du Conseil canadien des normes. Je m'y connais en gestion de documents. J'y participe avec le Conseil canadien des normes. Je fais également partie du groupe de travail sur l'intelligence artificielle du Conseil canadien des normes. Je comprends donc qu'il existe une manière rigoureuse d'avoir des activités de tenue des dossiers. Cela atteint ensuite une plus grande catégorie de la gouvernance de l'information.

Je pense que vous, pas vous en particulier, John, mais les personnes qui posent les questions, je pense que vous êtes des spécialistes, en tant que professionnels des documents. Si vous commencez par exemple par la norme ISO 15489, soit la spécification de base sur la gestion des documents, et si vous progressez à partir de celle-ci, vous aurez tout ce qu'il faut, des métadonnées automatisées à tous les autres éléments.

Nous sommes certains, après avoir mené une expérience il y a trois ans qui est maintenant terminée, que l'élément manquant est de connaître la façon d'intégrer un pétaoctet de données à ce groupe. Comment peut-on intégrer dix pétaoctets de données à ce groupe? Il n'existe aucune normalisation à cet égard.

C'est là que Shinydocs intervient en vous disant qu'une fois que vous connaissez la nature d'un document, que ce soit grâce à notre moteur de classification ou aux analyses automatisées que Norm a montrées, et que vous connaissez sa classification, vous pouvez prendre le relais à titre d'intendant de données ou de gestionnaire de documents. Vous avez compris et nous ne voulons pas nous mettre en travers de votre chemin.

Le problème que vous avez, à notre connaissance, est le fait que vous avez du mal à trouver ces renseignements dans tous ces systèmes. Ce que vous faites, c'est que vous dites : « John, arrêtez de faire ce que vous faites. Vous devez mettre les données à l'endroit où je veux pour que je puisse obtenir ce dont j'ai besoin. » Désolé, John ne fera pas ça pour vous. Nous devons donc intégrer ces données au groupe. C'est ce dont nous nous occupons.

J'en conviens, notre outil nécessite tout autant de gouvernance de l'information. Je suppose que vous devrez me croire sur parole, alors qu'il ne reste que sept minutes, quand je vous dis que nous avons intégré beaucoup de choses à cette fin et que nous sommes heureux d'expliquer individuellement aux gens la façon dont cela fonctionne.

John Medcof : D'accord, très bien. Merci, Jason. Il ne nous reste que...

Jason Cassidy : Désolé de vous avoir livré en pâture.

John Medcof : Non... Ce n'était pas tout à fait faux. Je suis heureux d'être la personne mentionnée dans cet exemple. Écoutez, il ne nous reste que quelques minutes et je voudrais que nous jetions un regard vers l'avenir. Pour ma part, en tant que possible fonctionnaire moyen dont Sonya a parlé, il me semble que l'évolution des outils de gestion du contenu d'entreprise a été exponentielle au cours des dernières années.

Des applications semblables à ce que vous nous avez montré aujourd'hui apportent une puissance de traitement de l'information étonnante, ainsi qu'une facilité d'utilisation que j'ai mentionnée plus tôt. Beaucoup d'entre nous ne pouvaient même pas imaginer une telle chose il y a, disons, cinq ans. C'est du moins mon cas. Si l'on se tourne vers l'avenir, quel est, selon vous, le prochain débouché pour les services modernes de gestion du contenu d'entreprise?

Jason Cassidy : Oui. J'aime que vous ayez formulé la question ainsi, car, à mon avis, il n'est pas question que d'une technologie. Notre technologie va s'améliorer. Comme celles de tout le monde. À mon avis, il a toujours manqué une stratégie commune sur la manière d'assurer la réussite des fonctionnaires. Comment allez-vous obtenir la bonne information au bon moment afin de ne pas attendre soixante heures pour répondre à une demande?

C'est comme si l'on posait la question suivante : qui est bon en transport régional et international? Est-ce que ce sont les gouvernements? La société Boeing? Un constructeur de véhicules automobiles? C'est tout le monde. Toutes sortes de choses doivent être réunies pour disposer d'un moyen sûr d'acheminer des marchandises du point A au point B. Il en va de même pour l'information. C'est notre logiciel, mais il ne commence pas là. Il commence par une stratégie consistant à se demander de quoi nous avons besoin avec ces choses. Comment pouvons-nous faire en sorte que cela soit sûr pour tout le monde? Comment les technologies distinctes interviennent-elles?

Je crois que si nous avons beaucoup de succès dans dix ans, les gens ne diront plus des phrases comme « J'ai une stratégie sur SharePoint » ou « J'ai une stratégie sur Shinydocs ». Les gens diront : « J'ai une stratégie en matière d'information qui me permet de savoir ce dont les gens ont besoin pour faire leur travail. Je trouverai ensuite la technologie qui soutiendra cette stratégie. » Lorsque nous parviendrons à ce stade, lorsque les gens abandonneront l'idée de la « technologie en premier » pour passer à celle de la « stratégie en premier », nous aurons gagné. Je dirais que l'épée de Damoclès que représente l'idée de la « technologie en premier » est encore suspendue au-dessus de nos têtes actuellement.

John Medcof : Waouh! Quel excellent point pour terminer! Je vous remercie sincèrement, Norm et Jason. Je suis reconnaissant de votre présence parmi nous aujourd'hui. J'ai trouvé la discussion très intéressante. J'ai eu un petit problème de son à un moment et je m'en excuse. Le potentiel qu'offrent ces applications et ces technologies pour le gouvernement du Canada est vraiment enthousiasmant. Je pense que votre démonstration nous a vraiment donné une idée de leur puissance et des possibilités qu'elles offrent.

Je remercie également nos participants de partout au pays, qui se sont joints à nous pour l'événement virtuel d'aujourd'hui. J'espère que la démonstration de la manière dont les technologies de pointe peuvent optimiser nos pratiques de gestion de l'information a constitué pour chacun d'entre vous une occasion d'apprentissage utile et stimulante. Pour terminer, j'invite toute personne intéressée à en savoir plus sur ces sujets à se joindre à la communauté de gestion des données ou à se tenir à l'affût de ses prochains événements de démonstration d'outils de données. Merci, Norm. Merci, Jason. Encore une fois, je suis très reconnaissant de votre présence parmi nous aujourd'hui. Bonne journée!

Jason Cassidy : Merci infiniment, John.

Norm Friend : Prenez soin de vous, tout le monde.

[Le clavardage vidéo s'estompe et le logo de l'EFPC apparaît.]

Liens connexes

Parcourez toutes les vidéos

Contactez-nous Abonnez-vous au bulletin GCApprentissage

En vedette

Événement : Conférence sur les données du GC 2024 : Conversation avec Shoshana Zuboff et Jim Balsillie (rediffusion)

(10 mai 2024)

Événement : Conférence Manion 2024 : Une discussion avec le Dr Alika Lafontaine au sujet de la polycrise dans le domaine des soins de santé au Canada

(28 mai 2024)

Événement : La Série sur la confiance : La confiance et la mésinformation dans les écosystèmes de l'information numérique (rediffusion)

(29 mai 2024)

Suivez :

Date de modification :: 2024-01-10

Sélection de la langue

Recherche