Slack from Salesforce ロゴ
ニュース

機械学習と AI の使用における Slack の顧客データ保護方法

Slack チーム一同作成2024年5月17日

最近、Slack Community のメンバーから、Slack が公開している「プライバシーに対する基本理念」の明確性が十分でなく、Slack が顧客のデータをどのように使用しているかについて誤解を招くおそれがあるとの指摘がありました。この貴重な意見を受けて、改めてウェブサイト上の文章を見直したところ、指摘のとおりであることがわかりました。特に、従来から使われている機械学習(ML)モデルと生成 AI でのデータの使用方法の違いについて、Slack のアプローチをより明確に説明すべきでした。

そこで、機械学習と生成 AI の機能を提供するにあたって、Slack がどのように顧客データを保護しているのかをより明確に説明するために、基本理念を更新しました。その要点は以下のとおりです。

  • Slack は、チャンネルや絵文字のおすすめ、検索結果などに対して、プライバシー保護を適用した業界標準の機械学習手法を用いています。これらのモデルを構築またはトレーニングする際に、何らかの種類の顧客データを学習、記憶、再現する方法がとられることはありません。このようなモデルにより、ユーザーのデータが共有されるリスクを伴うことなく、プロダクトの利用体験を向上させることができます。お客さまによるオプトアウトも可能です。従来から用いられている Slack の機械学習モデルは、匿名化された集約データを使用し、DM、プライベートチャンネル、パブリックチャンネル内のメッセージの内容にアクセスすることはありません
  • アドオンの生成 AI プロダクトである Slack AI は、サードパーティの大規模言語モデル(LLM)を用いていますが、この LLM のトレーニングに顧客データが使用されることはありません。また、Slack が顧客データを用いて LLM やその他の生成モデルを開発することもありません。

私たちは信頼性を最も重視しています。それにはまず、透明性が確保されていなければなりません。Slack を最良のかたちで利用していただくために、ユーザーの皆さまに対して、Slack がどのような方法で顧客データを使用している / 使用していないかについて、明確に説明する必要があると考えています。

この記事でも、皆さまにお役立ていただけるよう、できるだけ詳しく明確な説明を目指します。また、皆さまからのご意見もお待ちしています。

従来の機械学習モデルにおける顧客データの保護

Slack の使命は人々のビジネスライフをよりシンプルに、より快適に、より有意義にすることです。そしてユーザーの皆さまが最高の仕事をするために、Slack 内にある膨大な情報を効率的に把握し、必要な内容をすばやく見つけられるようにしたいと考えています。そのため Slack は 2017 年以来、適切な情報を適切なユーザーに適切なタイミングで提示できるよう、プライバシー保護を適用した業界標準の機械学習手法を用いています。これは例えば、検索で入力を開始した時に提案されるチャンネル名のオートコンプリートや、ワークスペース内で参加する新しいチャンネルのおすすめなどに使用されています。

Slack のプライバシーに対する基本理念には、Slack における機械学習システムの使用方法についての指針が示されています。私たちは、透明性と説明責任のために、この基本理念を外部に公開しています。この基本理念は、顧客およびユーザーのプライバシーに関する Slack の長期的なコミットメントと一致しています。具体的には、以下のことを保証しています。

  • ワークスペース間でデータが漏洩することはありません。顧客データを学習、記憶、または再現するような方法で、機械学習モデルの構築やトレーニングを行うことはありません。
  • 機械学習モデルがメッセージやファイルの内容に直接アクセスすることはありません。そうではなく、以下のように、慎重に導き出された数値的な特徴を利用します。
    • チャンネルで最後に送信されたメッセージのタイムスタンプをもとに、チャンネルのアーカイブをおすすめすることがあります。これは、ユーザーが最近使っていないチャンネルをアーカイブして、サイドバーを整理するのに役立ちます。
    • 2 人のユーザー間でのやり取りの回数をもとに、新しい会話を始める際に、その相手となる可能性の高い同僚の候補をリスト表示します。
    • あるチャンネルの名前と、ユーザーが参加しているほかのチャンネルの名前との間で重複している単語の数をもとに、そのユーザーに関連性を知らせることができます。
  • 技術的対策により、不正アクセスを防ぎます。AI や機械学習モデルを開発する際、またはその他の方法で顧客データを分析する際に、Slack はその基礎となるコンテンツにアクセスすることはありません。そのようなアクセスが行われないよう、さまざまな技術的手段を講じています。顧客データの機密性とセキュリティを保護する方法について、詳しくは Slack のセキュリティに関するホワイトペーパーをご覧ください。
  • これらの手法の利用について、お客さまに選択肢を提供しています。Slack の機械学習モデルのトレーニングに顧客データが用いられないようにしたい場合は、オプトアウトが可能です(こちらを参照)。これらの機械学習モデルを安全にトレーニングするための強力な保護を有している Slack では、可能なかぎり優れた利用体験を提供できるよう、初期設定ではワークスペースはオプトアウトされていません。

以下は、Slack で非生成型の機械学習モデルがどのように使用されているかを示す具体例です。

検索ランキング

ユーザーがメンバーやメッセージ、ファイルを検索した際に、結果に優先順位をつけ、パーソナライズされたリストを作成します。

仕組み :
検索用の機械学習モデルが、そのクエリに対する適切な結果を特定することで、ユーザーが探している情報を見つけられるよう支援します。これは過去の検索結果と過去のエンゲージメントに基づいて行われ、検索クエリ、結果、プロキシの基礎となるテキストからは学習しません。つまり、Slack のモデルは実際の検索クエリを用いてトレーニングされるのではなく、クエリ中の単語の数など、検索に関連する情報から学習します。

おすすめ
プロダクト内のさまざまな場所で、関連するユーザー、チャンネル、絵文字、その他のコンテンツをおすすめします。例えば、参加すべきチャンネルの提案などを行います。

仕組み :
ユーザーに Slack を最大限に活用してもらえるよう、Slack は例えば、ワークスペース内の新しいパブリックチャンネルへの参加をおすすめすることがあります。こうした提案は、チャンネルのメンバーシップ、アクティビティ、トピックの重複度などに基づいて行われます。Slack のデータを一切使用することなく開発されたオープンソースの機械学習モデルを用いて、プライバシーが保護された方法で、トピックの類似性を評価し、数値スコアを出力します。Slack のモデルは、この数値スコアと非顧客データのみに基づいて推奨を行っています。

オートコンプリート
Slack の検索クライアントを使用して、ユーザーがメンバーやチャンネル、ファイル名をメッセージに追加するのを支援します。

仕組み :
例えば、ユーザーがメッセージ内で特定のチャンネルに言及したい場合に、# を先頭につけてその名前の入力を開始すると、自身が参加しているチャンネルや、最近または頻繁にやり取りがあるチャンネルなどの入力数に基づいて、Slack のモデルが最も関連性が高いと考えられるチャンネルを提案します。

つまり、 Slack で従来から使われている機械学習モデルは、匿名化された集約データを用いており、こうした提案を行うために、DM、プライベートチャンネル、パブリックチャンネルのメッセージの内容自体にアクセスすることはありません。集約されたデータをもとに、より良い検索や、より適切なおすすめを提供しています。

お客さまによるオプトアウトとユーザーエクスペリエンス

Slack にメールでご連絡いただくことで、お客さまは非生成型の機械学習モデルのトレーニングをオプトアウトできます。オプトアウトすると、お客さまのワークスペースに関連付けられているすべてのデータは、お客さまのワークスペースのエクスペリエンス向上のために使用されるようになります。基盤となるモデルにデータが利用されることなく、お客さまはグローバルにトレーニングされた機械学習モデルのメリットのすべてを引き続き得ることができます。これまでユーザーがフィードバックを提供できた、プロダクトの特定の部分が削除される場合がありますが、プロダクトの機能が無効になることはありません。ただ、固有の使用パターンに対しての最適化がなされなくなるため、お客さまのチームにおいてグローバルモデルのパフォーマンスがわずかに低下する場合があります。

つまり、ある 1 つの組織がオプトアウトしても影響はわずかですが、オプトアウトする組織の数が多くなれば、このタイプのモデルの全体的なパフォーマンスが低下する傾向があります。

生成 AI の導入

生成 AI では、ユーザーエクスペリエンスを向上させる新しいモデルのクラスが導入されています。それが大規模言語モデル(LLM)です。Slack のアドオンとして別途購入可能な Slack AI において、LLM が使用されています。Slack AI は以下に示すように、セキュリティと信頼性を最も重視して構築されています。

  • お客さまのデータが Slack 外に出ることはありません。
  • Slack はお客さまのデータで LLM をトレーニングすることはありません。
  • Slack AI は、ユーザーがすでに閲覧できるデータに対してのみ動作します。
  • Slack AI においても、Slack のエンタープライズレベルのセキュリティとコンプライアンス要件のすべてが維持されます。

Slack は、お客さまのデータで LLM やその他の生成モデルをトレーニングすることはなく、お客さまのデータを LLM プロバイダーと共有することもありません。

Slack がどのようにセキュリティとプライバシー保護を考慮して Slack AI を構築しているかについて、詳しくはこちらをご覧ください。

この記事はお役に立ちましたか?

0/600

助かります!

ご意見ありがとうございました!

了解です!

ご意見ありがとうございました!

うーん、システムがなにか不具合を起こしてるみたいです。後でもう一度お試しください。

読み進める

コラボレーション

DX とは?デジタル化・IT 化との違いや成功させるためのポイントを解説

DX は、デジタル化や IT 化とどう違うのでしょうか。DX の定義や取り組むべき理由、成功させるためのポイントのほか、DX の実現に向けて取り入れたい技術などを解説します。

生産性

ノマドワーカーとは?必要なものやメリット・デメリットを解説

ノマドワーカーとは働き方のスタイルのことをいいます。ノマドワーカーのメリットやデメリット、ノマドワーカーとして働く上で必要なものなどについて解説します。

生産性

タスク管理が上手い人とは?その特徴や方法を解説

日々の業務効率を上げるために不可欠なスキルのひとつがタスク管理です。タスク管理が上手い人の特徴や上手く実践するためのポイントのほか、有用なツールについて解説します。

生産性

リスクヘッジとは?企業が行うリスクヘッジの種類や対策などを紹介

リスクヘッジという金融用語は、一般的なビジネスでも利用されるようになりました。企業が行っているリスクヘッジや、リスクヘッジを行う際のポイントなどを解説します。