Adopter un usage éthique de la donnée au sein de son entreprise, c’est aligner les valeurs de l’entreprise à l’usage des données, en déclinant ces principes de manière opérationnelle à tous les niveaux. Anne-Eole, Senior Consultant en Data Management, propose dans cet article des exemples concrets d’outils et de process mobilisés pour incarner ces valeurs dans l’usage quotidien des données par les collaborateurs.
1. Au départ, une entreprise dotée d’un cadre éthique d’usage des données
Un cadre éthique d’usage de la donnée au sein de l’entreprise doit comprendre les valeurs et principes que l’entreprise souhaite respecter et promouvoir ainsi qu’une déclinaison opérationnelle permettant à chaque acteur de s’impliquer dans le respect de ces valeurs.
Pour déployer un cadre d’usage éthique des données en entreprise, nous vous recommandons de vous baser sur la gouvernance que vous avez mise en place autour des données.
Dans la vie réelle de l’entreprise, un facteur sera déterminant pour que les valeurs s’incarnent dans les usages quotidiens : une communauté Data Governance impliquée et active. Cela sous-entend des collaborateurs engagés dans leurs rôles, des process clairs et disponibles et une animation de la communauté par du partage et de la collaboration (avec des use cases réguliers par exemple.)
Nous avons pris en exemple Allan et Eva. Ils travaillent dans une entreprise ayant défini un cadre d’usage éthique des données, des valeurs jusqu’aux process. Voici leurs expériences.
2. Allan, Data Scientist pour un moteur de recommandations
Allan a rejoint sa nouvelle entreprise en tant que Data Scientist Junior. Il a été embauché pour améliorer le moteur de recommandation utilisé sur le site e-commerce de l’entreprise.
Des valeurs partagées dès l’onboarding des collaborateurs
Dans l’entreprise depuis une semaine, Allan a pu participer à un parcours d’intégration des nouveaux employés où il a notamment pu découvrir :
- Les valeurs de l’entreprise ;
- L’existence d’un cadre d’usage éthique des données au sein de l’entreprise ;
- La macro-organisation mise en place autour de la gouvernance des données.
Étant Data Scientist, il a pu accéder à un parcours spécifique lui présentant de manière détaillée l’organisation autour des données. Il a ensuite eu accès aux politiques de gestion des données et au catalogue des données (avec la documentation et les personnes ressources.
La grille d’analyse de risque éthique
Allan travaille à l’amélioration d’un algorithme permettant d’optimiser les recommandations faites aux clients sur le site e-commerce, en fonction des articles regardés et achetés. Suite aux analyses qu’il a réalisées, il comprend qu’intégrer le genre déclaré par le client permet d’améliorer fortement les recommandations du moteur. Cependant, les personnes n’ayant pas déclaré de genre ou ayant répondu “non binaire” se voient recommander principalement des articles du rayon Enfant.
Parmi les outils dont dispose Allan se trouve la grille d’analyse de risque éthique, spécifique aux usages de type Machine Learning sous la forme d’un questionnaire. Cette grille lui permet d’évaluer le risque éthique lié aux usages qu’il fait des données. Il doit obligatoirement la remplir s’il utilise des données sensibles (ici, le genre déclaré par le client). A l’issue de ce questionnaire, l’usage est affecté à une zone de risque éthique :
- Zone de risque faible : pas d’action ultérieure à prévoir ;
- Zone de risque moyen : La décision de Go / No Go est prise avec des parties prenantes de niveau intermédiaire (Lead Data Scientist, Data Owner) ;
- Zone de risque élevé : Une instance spécifique est réunie autour du projet pour déterminer la décision à prendre. Selon l’enjeu, les parties prenantes associées sont adaptées. Un représentant du Comité d’éthique est consulté.
Dans cet exemple, Allan a déterminé un niveau de risque moyen pour son algorithme. Conformément au process, il en a discuté avec le Lead Data Scientist qui a validé l’analyse de risque faite. Tous deux l’ont ensuite partagée au Data Owner du jeu de données utilisé ainsi qu’à l’équipe Marketing (client du moteur de recommandation).
Gestion du risque éthique : s’appuyer sur l’intelligence collective et le retour d’expérience
Une décision collective est prise et documentée : le moteur de recommandation utilisera pendant trois mois une version de l’algorithme intégrant le genre déclaré. En effet, le biais induit pour les clients n’ayant pas déclaré de genre (se voir recommander “trop” d’articles issus du rayon Enfant) n’est pas considéré comme discriminant et n’est pas contraire aux valeurs de l’entreprise.
Il est également acté que les données recueillies pendant ces trois mois seront ensuite utilisées pour améliorer l’algorithme, avec comme objectif d’améliorer les recommandations faites à l’ensemble des clients, notamment ceux n’ayant pas déclaré de genre.
3. Eva, Data Owner sur un jeu de données CRM
Eva est Data Owner sur un jeu de données issu du CRM de l’entreprise. Son jeu de données est constitué d’agrégats : nombre de clients par lieux de résidence et par segment de clientèle. Ce jeu est principalement utilisé pour déterminer les aires d’influence des boutiques physiques.
Des collaborateurs soutenus sur la prise de décision
Un partenaire avec qui l’entreprise est en relation depuis de nombreuses années demande à avoir accès à ce jeu de données. Il se trouve que l’entreprise partage déjà d’autres jeux de données similaires avec lui.
Cependant, ce partenaire a récemment fait l’objet d’articles de presse peu flatteurs sur l’usage qu’il faisait des données personnelles. Même si le jeu de données ne comprend pas directement des données personnelles, Eva hésite sur la suite à donner.
Elle décide d’utiliser le process de signalement de nouveaux usages de la donnée, afin de disposer d’un avis éclairé. Pour cela, elle décrit son jeu de données, le nouvel usage (ici, un partage avec un partenaire) et met en avant l’argument de l’actualité récente du partenaire pour justifier de la nouveauté de l’usage. Elle décrit le risque éthique comme moyen. Le partenaire est déjà en relation avec l’entreprise et a, à ce titre, signé une convention bipartite sur les conditions de partage des données, des conditions qui doivent garantir le respect des valeurs de l’entreprise.
Des process au service de l’humain
Comme tout nouvel usage, cette demande fait ensuite l’objet d’une analyse spécifique. Quelques jours plus tard, Eva est associée à une réunion : elle y expose la demande et l’instance décide de valider le partage des données. En effet, ce partage rentre parfaitement dans le cadre de la convention partenariale. De plus, aucune donnée personnelle n’est échangée. Eva est rassurée et l’instance la remercie de sa vigilance.
Le workflow pour l’ouverture d’un nouveau jeu de données à un partenaire signataire d’une convention est mis à jour : il n’est pas utile de déclarer un nouvel usage si la convention a été signée depuis moins d’un an (date de mise à jour des conventions suite aux travaux sur l’éthique) et si les données concernées ne sont ni confidentielles ni à caractère personnel.
Une valorisation des collaborateurs et un partage des bonnes pratiques
Eva est particulièrement impliquée dans son rôle de Data Owner et a une appétence particulière pour le sujet de l’éthique et de la data. Identifiée comme ambassadrice par le Chief Ethics Officer auprès des Data Owner, sa mission est multiple :
- elle participe aux formations des nouveaux Data Owner en leur présentant les enjeux éthiques et les process existants ;
- elle coordonne les retours d’expériences proposés par les Data Owners ;
- elle est le point de contact des Data Owners sur les sujets éthiques et fait remonter les questions auprès du Chief Ethics Officer si besoin.
4. Pérenniser les process éthiques : un enjeu d’avenir
A travers ces deux exemples, nous avons souhaité montrer que l’éthique des données en entreprise trouve un sens quand les collaborateurs qui utilisent ces données au quotidien peuvent mettre en pratique cette éthique.
Comme pour les sujets de gouvernance de données, de nombreuses questions continueront de se poser : comment généraliser de bonnes pratiques ? Comment s’adapter à différents contextes ? Comment rétroagir sur l’existant pour plus de cohérence et d’efficacité ? Comment s’assurer de la motivation de l’ensemble des collaborateurs à faire vivre cet usage éthique des données ?
Les outils de Data Management et de Data Gouvernance peuvent accompagner cette industrialisation et pérennisation des process avec une forte dimension opérationnelle. A titre d’exemple, une banque française utilise aujourd’hui Collibra pour aider l’équipe chargée de la RSE à gérer la politique de rétention des documents à l’échelle du groupe. C’est la preuve qu’un sujet de haut niveau et fortement transverse (dans notre exemple la RSE, pourquoi pas l’éthique demain) peut aujourd’hui bénéficier des outils de Data Management.
En résumé :
FAQ :
Une communauté Data Governance impliquée et active qui va veiller à incarner les valeurs de l’entreprise dans les usages quotidiens. Autrement dit, il faut fonder une équipe de collaborateurs engagés dans leurs rôles et leur donner accès à des process clairs et disponibles.
2- Qu’est-ce qu’une grille d’analyse de risque éthique ?
Sous forme de questionnaire, la grille d’analyse permet d’évaluer le risque éthique lié aux usages des données. En cas d’utilisation de données sensibles, elle doit obligatoirement être remplie. À la suite de cela, le Data scientist pourra déterminer la zone de risque éthique (faible, moyen, élevé.)