機械学習と AI の使用における Slack の顧客データ保護方法

6 分で読むことができます

最近、Slack Community のメンバーから、Slack が公開している「プライバシーに対する基本理念」の明確性が十分でなく、Slack が顧客のデータをどのように使用しているかについて誤解を招くおそれがあるとの指摘がありました。この貴重な意見を受けて、改めてウェブサイト上の文章を見直したところ、指摘のとおりであることがわかりました。特に、従来から使われている機械学習（ML）モデルと生成 AI でのデータの使用方法の違いについて、Slack のアプローチをより明確に説明すべきでした。

そこで、機械学習と生成 AI の機能を提供するにあたって、Slack がどのように顧客データを保護しているのかをより明確に説明するために、基本理念を更新しました。その要点は以下のとおりです。

Slack は、チャンネルや絵文字のおすすめ、検索結果などに対して、プライバシー保護を適用した業界標準の機械学習手法を用いています。これらのモデルを構築またはトレーニングする際に、何らかの種類の顧客データを学習、記憶、再現する方法がとられることはありません。このようなモデルにより、ユーザーのデータが共有されるリスクを伴うことなく、プロダクトの利用体験を向上させることができます。お客さまによるオプトアウトも可能です。従来から用いられている Slack の機械学習モデルは、匿名化された集約データを使用し、DM、プライベートチャンネル、パブリックチャンネル内のメッセージの内容にアクセスすることはありません。
アドオンの生成 AI プロダクトである Slack AI は、サードパーティの大規模言語モデル（LLM）を用いていますが、この LLM のトレーニングに顧客データが使用されることはありません。また、Slack が顧客データを用いて LLM やその他の生成モデルを開発することもありません。

私たちは信頼性を最も重視しています。それにはまず、透明性が確保されていなければなりません。Slack を最良のかたちで利用していただくために、ユーザーの皆さまに対して、Slack がどのような方法で顧客データを使用している / 使用していないかについて、明確に説明する必要があると考えています。

この記事でも、皆さまにお役立ていただけるよう、できるだけ詳しく明確な説明を目指します。また、皆さまからのご意見もお待ちしています。

従来の機械学習モデルにおける顧客データの保護

Slack の使命は人々のビジネスライフをよりシンプルに、より快適に、より有意義にすることです。そしてユーザーの皆さまが最高の仕事をするために、Slack 内にある膨大な情報を効率的に把握し、必要な内容をすばやく見つけられるようにしたいと考えています。そのため Slack は 2017 年以来、適切な情報を適切なユーザーに適切なタイミングで提示できるよう、プライバシー保護を適用した業界標準の機械学習手法を用いています。これは例えば、検索で入力を開始した時に提案されるチャンネル名のオートコンプリートや、ワークスペース内で参加する新しいチャンネルのおすすめなどに使用されています。

Slack のプライバシーに対する基本理念には、Slack における機械学習システムの使用方法についての指針が示されています。私たちは、透明性と説明責任のために、この基本理念を外部に公開しています。この基本理念は、顧客およびユーザーのプライバシーに関する Slack の長期的なコミットメントと一致しています。具体的には、以下のことを保証しています。

ワークスペース間でデータが漏洩することはありません。顧客データを学習、記憶、または再現するような方法で、機械学習モデルの構築やトレーニングを行うことはありません。
機械学習モデルがメッセージやファイルの内容に直接アクセスすることはありません。そうではなく、以下のように、慎重に導き出された数値的な特徴を利用します。
- チャンネルで最後に送信されたメッセージのタイムスタンプをもとに、チャンネルのアーカイブをおすすめすることがあります。これは、ユーザーが最近使っていないチャンネルをアーカイブして、サイドバーを整理するのに役立ちます。
- 2 人のユーザー間でのやり取りの回数をもとに、新しい会話を始める際に、その相手となる可能性の高い同僚の候補をリスト表示します。
- あるチャンネルの名前と、ユーザーが参加しているほかのチャンネルの名前との間で重複している単語の数をもとに、そのユーザーに関連性を知らせることができます。
技術的対策により、不正アクセスを防ぎます。AI や機械学習モデルを開発する際、またはその他の方法で顧客データを分析する際に、Slack はその基礎となるコンテンツにアクセスすることはありません。そのようなアクセスが行われないよう、さまざまな技術的手段を講じています。顧客データの機密性とセキュリティを保護する方法について、詳しくは Slack のセキュリティに関するホワイトペーパーをご覧ください。
これらの手法の利用について、お客さまに選択肢を提供しています。Slack の機械学習モデルのトレーニングに顧客データが用いられないようにしたい場合は、オプトアウトが可能です（こちらを参照）。これらの機械学習モデルを安全にトレーニングするための強力な保護を有している Slack では、可能なかぎり優れた利用体験を提供できるよう、初期設定ではワークスペースはオプトアウトされていません。

以下は、Slack で非生成型の機械学習モデルがどのように使用されているかを示す具体例です。

検索ランキング

ユーザーがメンバーやメッセージ、ファイルを検索した際に、結果に優先順位をつけ、パーソナライズされたリストを作成します。

仕組み :
検索用の機械学習モデルが、そのクエリに対する適切な結果を特定することで、ユーザーが探している情報を見つけられるよう支援します。これは過去の検索結果と過去のエンゲージメントに基づいて行われ、検索クエリ、結果、プロキシの基礎となるテキストからは学習しません。つまり、Slack のモデルは実際の検索クエリを用いてトレーニングされるのではなく、クエリ中の単語の数など、検索に関連する情報から学習します。

おすすめ
プロダクト内のさまざまな場所で、関連するユーザー、チャンネル、絵文字、その他のコンテンツをおすすめします。例えば、参加すべきチャンネルの提案などを行います。

仕組み :
ユーザーに Slack を最大限に活用してもらえるよう、Slack は例えば、ワークスペース内の新しいパブリックチャンネルへの参加をおすすめすることがあります。こうした提案は、チャンネルのメンバーシップ、アクティビティ、トピックの重複度などに基づいて行われます。Slack のデータを一切使用することなく開発されたオープンソースの機械学習モデルを用いて、プライバシーが保護された方法で、トピックの類似性を評価し、数値スコアを出力します。Slack のモデルは、この数値スコアと非顧客データのみに基づいて推奨を行っています。

オートコンプリート
Slack の検索クライアントを使用して、ユーザーがメンバーやチャンネル、ファイル名をメッセージに追加するのを支援します。

仕組み :
例えば、ユーザーがメッセージ内で特定のチャンネルに言及したい場合に、# を先頭につけてその名前の入力を開始すると、自身が参加しているチャンネルや、最近または頻繁にやり取りがあるチャンネルなどの入力数に基づいて、Slack のモデルが最も関連性が高いと考えられるチャンネルを提案します。

つまり、 Slack で従来から使われている機械学習モデルは、匿名化された集約データを用いており、こうした提案を行うために、DM、プライベートチャンネル、パブリックチャンネルのメッセージの内容自体にアクセスすることはありません。集約されたデータをもとに、より良い検索や、より適切なおすすめを提供しています。

お客さまによるオプトアウトとユーザーエクスペリエンス

Slack にメールでご連絡いただくことで、お客さまは非生成型の機械学習モデルのトレーニングをオプトアウトできます。オプトアウトすると、お客さまのワークスペースに関連付けられているすべてのデータは、お客さまのワークスペースのエクスペリエンス向上のために使用されるようになります。基盤となるモデルにデータが利用されることなく、お客さまはグローバルにトレーニングされた機械学習モデルのメリットのすべてを引き続き得ることができます。これまでユーザーがフィードバックを提供できた、プロダクトの特定の部分が削除される場合がありますが、プロダクトの機能が無効になることはありません。ただ、固有の使用パターンに対しての最適化がなされなくなるため、お客さまのチームにおいてグローバルモデルのパフォーマンスがわずかに低下する場合があります。

つまり、ある 1 つの組織がオプトアウトしても影響はわずかですが、オプトアウトする組織の数が多くなれば、このタイプのモデルの全体的なパフォーマンスが低下する傾向があります。

生成 AI の導入

生成 AI では、ユーザーエクスペリエンスを向上させる新しいモデルのクラスが導入されています。それが大規模言語モデル（LLM）です。Slack のアドオンとして別途購入可能な Slack AI において、LLM が使用されています。Slack AI は以下に示すように、セキュリティと信頼性を最も重視して構築されています。

お客さまのデータが Slack 外に出ることはありません。
Slack はお客さまのデータで LLM をトレーニングすることはありません。
Slack AI は、ユーザーがすでに閲覧できるデータに対してのみ動作します。
Slack AI においても、Slack のエンタープライズレベルのセキュリティとコンプライアンス要件のすべてが維持されます。

Slack は、お客さまのデータで LLM やその他の生成モデルをトレーニングすることはなく、お客さまのデータを LLM プロバイダーと共有することもありません。

Slack がどのようにセキュリティとプライバシー保護を考慮して Slack AI を構築しているかについて、詳しくはこちらをご覧ください。

セキュリティ

機械学習と AI の使用における Slack の顧客データ保護方法

従来の機械学習モデルにおける顧客データの保護

検索ランキング

お客さまによるオプトアウトとユーザーエクスペリエンス

生成 AI の導入

この記事はお役に立ちましたか？

助かります！

了解です！

読み進める

グローバルのデータレジデンシーが拡大 : スイス、UAE、ブラジルが新たに追加

Slack 上のデータを保護するベストプラクティス、高度な脅威検出機能、アラートコントロールをご紹介

金融業界で不正なコミュニケーションを回避するには

Slack Enterprise Grid に Enterprise Key Management が登場

従来の機械学習モデルにおける顧客データの保護

検索ランキング

お客さまによるオプトアウトとユーザーエクスペリエンス

生成 AI の導入

この記事はお役に立ちましたか？

助かります！

了解です！

読み進める

グローバルのデータレジデンシーが拡大 : スイス、UAE、ブラジルが新たに追加

Slack 上のデータを保護するベストプラクティス、高度な脅威検出機能、アラートコントロールをご紹介

金融業界で不正なコミュニケーションを回避するには

Slack Enterprise Grid に Enterprise Key Management が登場

まずは無料でお試し。Slack をチームで使ってみましょう