アイデンティティ(ID)とプライバシーは同時に検討すべきだ
by ExchangeWire.com / Supported by CARTA HOLDINGS on 2021年1月05日 in ニュース
パーミュティブ(Permutive)でプロダクトマネージャーを務めるデビッド・ライシャー(David Reischer)氏が、ExchangeWireのTraderTalk TVに出演した後、アドテク業界はポストcookieの世界でアイデンティティとプライバシーに関連する課題をいかにして克服できるかをまとめてくれた。
この1年、アイデンティティを巡って多くの議論が巻き起こった。しかし、このような議論をするときは、そもそもなぜ議論しているかを心に留めておくことも重要だ。こうした業界の変化を推進しているのは規制当局とブラウザメーカーであり、その動機ははっきりしている。ユーザーのプライバシーを保護することだ。そのため、ポストcookieの世界におけるアイデンティティについて話し合うときは、それだけを単独で話し合うことはできない。必ずアイデンティティとプライバシーを1つの議題として扱うべきだ。アドテク業界が規制当局、ブラウザメーカーに正面からぶつかって勝てる見込みはないため、現在のプライバシー標準に準拠した持続可能なソリューションを議論する必要がある。
クロスドメイン識別子とは?
この業界で識別子(ID)といえば、通常はクロスドメイン識別子を意味する。1つのソリューションで複数のドメイン、環境にまたがってユーザーを識別できるようにするIDのことだ。例えば、私がA、B、Cというドメインを訪問した場合、アドテクベンダーはIDによってすべて同一人物だと認識できる。以下に挙げるプログラマティック広告の中核機能はこのIDに支えられている:
・測定とアトリビューション
・フリークエンシーキャップ
・データターゲティング
アドテクベンダーはこれらすべてのユースケースで、ユーザーがどのドメインにいても同一人物であることを判別できる機能を利用している。
どのようなクロスドメイン識別子が存在するのか?
サードパーティcookieは長年、オープンウェブにおける主要なIDだった。しかし、SafariとFirefoxでサードパーティcookieが消滅し、Chromeもサードパーティcookieの終焉を予告したため、業界は代わりになるものを探し始めている。
最近はさまざまなIDソリューションを聞くようになったが、ほとんどのソリューションは3つのカテゴリーのいずれかに分類できる。そして、どのIDソリューションも3つのいずれかに入ると覚えておくことが極めて重要だろう。魔法のようなIDソリューションは存在しない。何が技術的に可能かは、ブラウザによって明確に決まっている。
・Cookie
Cookieは馴染み深いはずなので、詳しい説明は不要だろう。手短に言えば、ウェブサーバーがブラウザに保存できるドメインごとの小さなテキストファイルだ。これによってad-tech.comがブラウザにランダムなIDを保存することができれば、ドメインからad-tech.comにリクエストが来るたびに、ユーザーを再識別できる。
Cookieがファーストパーティかサードパーティかは状況によって異なる。ファーストパーティcookieは、ユーザーが訪問したドメイン内でのみ有効なものだ。クロスドメイントラッキングに使われることはなく、消滅の心配はない。
・決定論的ID
決定論的IDはハッシュ化されたメールアドレスのような確実性の高いIDを使用する。多くの場合、ハッシュ化されたメールアドレスはさらに独自のプロトコルで暗号化されるが、結局のところ、IDはハッシュ化されたメールアドレスだ。
ここで知っておくべきことは、決定論的IDはユーザーがログインした場所でしか機能しないことだ。ドメインAとBにログインしたら、そこでターゲティングされるが、ログインしていないドメインCやDでターゲティングされることはない。
・確率論的ID/フィンガープリンティング
最後に、確率論的IDというカテゴリーがある。それ自体にあまり意味のないシグナルをいくつも使うというアプローチだ。例えば、IPアドレス、ユーザーエージェント、画面の解像度やインストールされているフォントといったデバイス情報がこれにあたる。これらのシグナルは単体ではあまり意味を持たないが、いくつも組み合わせることで、1つの「フィンガープリンティング(指紋)」となり、通常かなり高い確率でユーザーを識別できる。
W3Cが定義した2種類のフィンガープリンティングを紹介しよう:
- 能動的フィンガープリンティング:インストールされているフォントや画面の解像度を読み取るためのコードをページに埋め込む必要がある。
- 受動的フィンガープリンティング:IPアドレス、Cookie、ユーザーエージェントなど、HTTPリクエストにデフォルトで含まれるデータポイントを使用する。
それぞれのクロスドメイン識別子はプライバシーにどのような影響を及ぼすのか?
これらのIDについて語るときは、プライバシーの観点から見ることも重要だ:
・Cookie
Cookieは、プライバシー保護にはつながらない使われ方をしてきたが、エンドユーザー側で比較的うまくコントロールできる。具体的には、ユーザー自身がCookieを削除し、IDをリセットできる。つまり、たとえソリューションが新しいCookieを作成しても、それは新しいIDであって、過去に収集した同一人物のデータには二度とアクセスできないということだ。
・決定論的ID
決定論的IDもエンドユーザー側でいくらかコントロール可能だ。手間がかかり、知識も必要だが、ユーザーが特定サイトからログアウトし、Cookieを削除すれば、識別される心配はなくなる。
ただし、問題がある。エンドユーザーが自身のIDをリセットする方法が存在しないことだ。ユーザーがサイトに再びログインすれば、入札ストリーム内で収集されていた同じIDのデータに再びアクセスできる。Cookieは通常、ランダムな文字列から成るが、決定論的IDはユーザーのメールアドレスをベースにしている。そしてメールアドレスは変更される可能性が低い。
・確率論的ID/フィンガープリンティング
フィンガープリンティングは間違いなく、エンドユーザーにとって最悪のアプローチだ。ほかの手法と異なり、エンドユーザーがIDをリセットする余地は全くない。ユーザーはIPアドレスやユーザーエージェント、画面の解像度を変更できないためだ。たとえプライバシーモードで閲覧しても、IPアドレスとユーザーエージェントは変わらない。本当に厄介な問題だ。
新しいオープンウェブの到来に向けて、今、プライバシーについて何を知っておくべきか?
・フィンガープリンティングは決して素晴らしいアイデアではない
ブラウザベンダーはフィンガープリンティングを阻止するため、必要なことは何でもすると表明している。Chromeはすでに、ユーザーエージェント文字列に含まれる情報量を大幅に減らすと発表している。さらに、「Privacy Budget」も発表された。サイトが確率論的IDを計算できるほど大量のプロパティを読み込んでいたらユーザーに警告する仕組みだ。
Safari WebKitはすでにいくつかのウェブAPIへのアクセスを制限しており、トラッキング防止策の回避は、セキュリティ脆弱性の悪用と同等の重大課題として扱うと明言している。
・オープンウェブは二分化が進行する
現在
現在の世界では、オープンウェブの約55%がCookieによって識別されている。そのうち、認証済みユーザーは5%未満。具体的には、パブリッシャーのサイトにログインしているユーザーのことだ。残りの約40%は匿名ユーザー。パブリッシャーには識別できるが、バイサイドでは識別できないユーザーを意味する。
未来
私たちの予想では、今からおよそ14カ月でアドテク業界は様変わりする。まず、識別可能なユーザーはほぼいなくなる。認証済みユーザーは増えるかもしれないが、近いうちに10%を超える可能性は低い。その結果、オープンウェブのデフォルト状態は匿名になる──ユーザーの85%か95%くらいだろうか。
その95%の匿名トラフィックを巡って、パブリッシャーはウォールドガーデンにますます近づくだろう。パブリッシャーは彼らのユーザーを100%識別できるため、データは各パブリッシャーの環境内に存在し続ける。そして、パブリッシャーはユーザーの行動や関心をすべて把握できる。ただし、これらの環境すべてをつなぐクロスドメイン識別子という結合組織は消えてなくなる。
もしIDソリューションだけに注力すれば、私たちは95%のユーザーを無視することになるだろう。これはパブリッシャーと広告主のどちらにとっても不利益だ。しかし、匿名ウェブのためのソリューション構築は、プライバシーを犠牲にしては成り立たない。
・プライバシーバイデザイン → データの抑制
新しいソリューションを開発する際は、プライバシーバイデザインの原則に従う必要がある。具体的なユースケースを調べ、どうすればデータの露出を最小限に抑えられるかを理解しなければならない。規制当局が注目しているのは、入札ストリームに露出するデータの量だ。
ユーザーを1対1でターゲティングするユースケースの場合、現在、ユーザーIDは多くのデータポイントにおいて入札ストリームに露出している。そして、アドテクベンダーは豊富なコンテクスチュアルデータを活用し、ユーザーIDやユーザーが訪問したサイト、消費したコンテンツ、何かの行動をした日時や場所から成る巨大なデータベースを構築している。
私たちは入札ストリーム内のデータ量を必要最小限に抑えられるかどうかを問うべきだ。この例では、必要最小限のデータはユーザーIDのみになる。コンテクスチュアルデータがなければ、このようなデータベースの構築は不可能だ。ユーザーIDがメールアドレスをベースにしている場合、データの抑制はさらに重要になるだろう。
同時に、もしユーザーIDが存在しなければ、私たちはコンテクスチュアルデータやオーディエンスシグナルを入札ストリームに露出できる。これらのデータポイントをユーザーIDに集約できないため、プライバシーという点でははるかに安全だ。最終的には、データの露出を抑制することはエコシステム全体、そのなかでもパブリッシャーの責任だ。パブリッシャーが目指すべき目標は次の2つである:
- ユーザーのプライバシーを守る ― オーディエンスを(コンテクスチュアルデータとともに)販売する場合、それらをIDとひも付けないこと。
- ファーストパーティ資産を守る ― ユーザーにIDを割り当てる場合、それらをコンテクスチュアルデータとひも付けないこと、だ。
ABOUT ExchangeWire.com / Supported by CCI
本記事は、ExchangeWire.comに掲載された記事の中から日本の読者向けにCARTA HOLDINGSが翻訳・編集し、ご提供しています。
株式会社CARTA HOLDINGS
2019年にCCIとVOYAGE GROUPの経営統合により設立。インターネット広告領域において自社プラットフォームを中心に幅広く事業を展開。電通グループとの協業によりテレビCMのデジタル化など新しい領域にも積極的に事業領域を拡大している。