Principes de confidentialité : recherche, apprentissage et intelligence artificielle
Cette traduction n’est fournie qu’à titre informatif. Dans l’éventualité où des incohérences apparaîtraient entre celle-ci et la version anglaise, c’est la version anglaise qui prévaudrait.
Principes de confidentialité : recherche, apprentissage et intelligence artificielle
Notre mission est de proposer un produit qui rend la vie professionnelle plus simple, plus agréable et plus productive. La confidentialité et la sécurité des données de nos clients sont essentielles, comme nous l’expliquons dans notre Politique de confidentialité, notre documentation à propos de la sécurité, ainsi que la documentation SPARC de Salesforce et les conditions d’utilisation de Slack.
L’apprentissage automatique (AA) et l’intelligence artificielle (IA) sont des outils puissants que nous utilisons de façon limitée pour optimiser notre approche. Nous ne développons pas de grands modèles de langage (LLM) ou d’autres modèles génératifs à l’aide des données des clients. Pour développer des modèles d’IA/AA pour des fonctionnalités telles que les recommandations d’émoji et de canal, nos systèmes analysent les données des clients (par exemple, les messages, le contenu et les fichiers) soumises à Slack ainsi que d’autres informations (y compris les informations d’utilisation), dans le cadre défini dans notre Politique de confidentialité et dans votre contrat client. Pour garantir la confidentialité et la sécurité des données des clients dans ce contexte spécifique, nous avons mis en place des lignes directrices :
- Les données ne pourront pas passer d’un espace de travail à un autre. Pour tout modèle qui sera utilisé par l’ensemble de nos clients dans le monde, nous ne concevons ni n’entraînons pas ces modèles de manière à ce qu’ils puissent apprendre, mémoriser ou reproduire une partie des données des clients.
- Nous avons mis en place des contrôles techniques pour bloquer certains accès. Lors du développement de modèles d’AI/AA ou de l’analyse des données clients, Slack ne peut pas accéder au contenu sous-jacent. Nous avons mis en place de multiples mesures techniques pour éviter que cela ne se produise. Veuillez lire notre Livre blanc sur la sécurité pour plus d’informations sur ces contrôles qui protègent la confidentialité et la sécurité des données des clients.
- Nous offrons aux clients la possibilité des choix quant à ces pratiques. Si vous le souhaitez, vous pouvez exclure vos données client de la formation des modèles globaux de Slack. Si vous choisissez de ne pas participer, les données clients de votre espace de travail seront utilisées uniquement pour améliorer l’expérience sur votre propre espace de travail, et vous continuerez à bénéficier de tous les avantages de nos modèles d’IA/AA formés à l’échelle mondiale sans contribuer aux modèles sous-jacents.
Contactez-nous pour exclure le partage de vos données. Si vous le souhaitez, vous pouvez exclure vos données client des modèles globaux de Slack. Pour ce faire, demandez à un propriétaire de l’organisation ou de l’espace de travail, ou un propriétaire principal, de contacter l’équipe de l’expérience client à l’adresse feedback@slack.com, en indiquant l’URL de votre espace de travail ou organisation, et « Slack Global model opt-out request » en objet de l’e-mail. Nous vous enverrons une confirmation lorsque votre demande aura été traitée.
Données client et autres informations
Comment Slack peut utiliser les données client (comme les messages, les contenus et les fichiers) ainsi que d’autres informations pour mettre à jour nos services
En partant des principes ci-dessus, voici quelques exemples d’améliorations et de méthodes de protection de la confidentialité que notre produit et les équipes chargées des analyses des données peuvent utiliser pour développer, mettre à jour et améliorer Slack :
- Recommandations de canaux : Nous pouvons utiliser ces informations pour recommander à un utilisateur de rejoindre un nouveau canal public dans son entreprise. Ces suggestions sont basées sur la souscription à un canal, l’activité et les correspondances de sujets. Notre modèle apprend des suggestions précédentes et de la souscription ou non d’un utilisateur au canal que nous recommandons. La confidentialité est garantie en séparant notre modèle des données des clients. Nous utilisons des modèles externes (non formés sur les messages Slack) pour évaluer la similarité des sujets, en générant des scores numériques. Notre modèle global ne propose des recommandations que sur la base de ces scores numériques et de données non liées au client. Pour obtenir des détails techniques, veuillez consulter notre blog d’ingénierie pour en savoir plus.
- Résultats de recherche : Nos modèles d’apprentissage automatique de la recherche aident les utilisateurs à trouver ce qu’ils recherchent en identifiant les bons résultats pour une requête particulière. Pour ce faire, nous nous basons sur l’historique des résultats de recherche et sur les engagements précédents, sans que le texte de la requête, le résultat ou l’indicateur de la recherche ne contribuent à son apprentissage. En d’autres termes, notre modèle ne peut pas reconstituer la requête ou le résultat de la recherche. Il apprend à partir d’informations contextuelles propres à l’équipe, comme le nombre de clics sur un message lors d’une recherche ou une correspondance entre le nombre de mots dans la requête et le message recommandé.
- Saisie semi-automatique : Slack pourrait proposer des suggestions pour compléter des requêtes de recherche ou d’autres textes, par exemple en complétant automatiquement la phrase « assistance client » après qu’un utilisateur a saisi les premières lettres de cette expression. Ces suggestions sont locales et proviennent de messages publics courants dans l’espace de travail de l’utilisateur. Notre algorithme, qui sélectionne les suggestions potentielles, est entraîné de manière globale sur les compléments précédemment suggérés et acceptés. Nous protégeons la confidentialité des données en utilisant des règles pour évaluer la similitude entre le texte saisi et la suggestion de différentes manières, notamment en utilisant uniquement les scores numériques et le nombre d’interactions passées dans l’algorithme.
- Suggestion d’émoji : Slack peut suggérer des réactions émoji aux messages en utilisant le contenu et le ton du message, l’utilisation antérieure et la fréquence d’utilisation des émojis au sein de l’équipe dans différents contextes. Par exemple, si 🎉 est une réaction courante aux messages de félicitations dans un canal particulier, nous suggérerons aux utilisateurs de réagir aux nouveaux messages positifs similaires avec 🎉. Pour ce faire, tout en protégeant les données des clients, nous pourrions utiliser un modèle entièrement externe (non formé sur les messages Slack) pour classer le ton du message. Notre modèle suggérerait alors un émoji en tenant compte uniquement de la fréquence à laquelle un émoji particulier a été associé à des messages de ce ton dans cet espace de travail.
Ces personnalisations et ces améliorations ne sont possibles que si nous étudions et comprenons comment nos utilisateurs interagissent avec Slack.
Slack prend la confidentialité très au sérieux. Nos obligations de confidentialité décrites dans nos accords client et dans notre politique de confidentialité s’appliquent dans chacun de ces trois scénarios. Les données client appartiennent aux clients auxquelles elles se réfèrent. Slack agrège et dissocie les données client de façon à ce que l’utilisation que Slack fait de ces données pour améliorer ses services ne permette jamais à une partie tierce d’identifier un client comme étant la source de ces améliorations (à l’exception des sociétés affiliées de Slack et de ses sous-traitants).
IA générative
L’IA générative représente une catégorie plus récente de systèmes d’IA capables de générer du contenu tel que du texte en réponse à des invites saisies par un utilisateur. Les grands modèles de langage (LLM) font partie de cette catégorie d’IA. Slack utilise l’IA générative dans son offre de produits Slack AI et tire parti de LLM tiers.
Les clients achètent Slack AI en tant que module complémentaire et la fonctionnalité d’IA générative n’est pas incluse dans l’offre Slack standard. Les données des clients ne sont pas utilisées pour entraîner des modèles de LLM tiers. Slack n’entraîne pas de LLM ou d’autres modèles génératifs à partir des données des clients et ne partage aucune donnée des clients avec des fournisseurs de LLM. Pour en savoir plus, consultez l’article How We Built Slack AI To Be Secure and Private (Comment nous avons créé Slack AI de manière à ce que les données restent sécurisées et privées).
Slack AI utilise des LLM prêts à l’emploi qui ne mettent pas à jour les modèles et ne conservent en aucune manière les données des clients lorsqu’une demande leur est adressée. De plus, du fait que Slack AI héberge ces modèles dans sa propre infrastructure AWS, les données des clients ne quittent jamais l’espace de confiance de Slack et les fournisseurs de LLM n’ont jamais accès à ces données.
Recherche de réponses générative de Slack AI
La fonction de recherche de Slack AI exploite les sources suivantes : les fonctionnalités de Slack (canevas, appels d’équipe, notes, transcriptions de clips et extraits de texte) ; les fichiers téléchargés sur Slack (PDF, e-mails, docx, pptx et Keynote) ; les documents liés depuis Google Drive (Docs, Slides) ; Sharepoint/OnDrive (Word, Powerpoint) et les applications partenaires de stockage de fichiers comme Box (lorsqu’elles sont installées). L’utilisateur doit être authentifié via l’intégration avec Slack pour accéder à ces fichiers. Des paramètres d’administrateur permettent de désactiver tous les résultats de fichiers ou de désactiver la récupération d’informations provenant de fichiers hébergés de manière externe. En savoir plus dans le Centre d’assistance ou le guide de l’administrateur.