「Logicad」が実践する、人工知能が広げるデータの有効活用とターゲティング広告配信の多様化 [インタビュー]
2015年12月に東証マザーズに上場したソネット・メディア・ネットワークス。同社の主力サービスであるDSP「Logicad」に実装されている人工知能「VALIS-Engine」による潜在顧客ターゲティングについて、同社代表取締役社長 地引 剛史氏と、事業開発部長 山本 則行氏に、サービスの概要や特徴について詳細に聞いた。
(聞き手:ExchangeWire Japan 野下 智之)
広告配信において人工知能が必要とされる理由と役割
―「Logicad」のこれまでのビジネスの経緯やターゲティング手法の発展の歴史についてお聞かせください。
山本氏:「Logicad」が本格的にサービスを開始したのは、2012年の春です。この時点では、リターゲティングを手法として取り入れておりました。リターゲティング自体もその後もちろん進化していますが、その次に取り入れたのは、セグメントを作って配信するオーディエンスターゲティングです。その後これを拡張してほしいという要望をうけ、2013年頃から類似拡張(オーディエンス拡張)の手法を導入しました。そして、2015年に取り組んでいるのが、この類似拡張をよりブランディング向けの用途に発展させるということ、すなわち潜在顧客ターゲティングです。
―人工知能は、潜在顧客ターゲティングで初めて使われたのですか?あるいは以前から使われていたのですか?
山本氏:人工知能の本格的な活用は今回が初めてです。
―山本さんのご経歴、貴社での役割について、ぜひお聞かせください。
山本氏:1991年に入社後、1999年にソニー社内募集にて部署を異動して以降、パーソナライゼーションに関する研究を続けてきました。個人的ともいえる活動として始めたのですが、恐らくソニーの中では最初期だったと思います。この頃Googleも立ち上がってきましたが、インターネットは、それ以前から普及しつつあり、とにかく情報があふれていたのです。ソニーはAVコンテンツを大量に抱えており、これらをユーザーに正しくお伝えするために、色々なユーザーインターフェースの開発に取り組んでいました。ですが、ユーザーインターフェースの工夫だけでは追いつかなくなるところまで、インターネットで情報が一気に増えてしまいました。
これらをどのように出していくかというところに、絶対に技術が必要になると、着眼したのです。
そこで、パーソナライゼーションの中でもリコメンデーションというテーマの研究に着手しました。
この研究は、2000年頃のユーザーのメールからの嗜好抽出に基づく情報提示アプリ開発に始まり、2003年に開発・提供したテレビでの番組推薦機能のほか、2011年から順次世界19カ国で展開されたサブスクリプション型音楽サービス『Music Unlimited』の楽曲推薦機能まで様々な推薦アルゴリズム・UXに活かされました。
その後、社内新規事業創出チャレンジの2年間を経て、2014年10月に、当社に参画し、現在は、事業開発部の責任者として、人工知能の開発とそれをコアにした事業開発をしています。
―そもそものご質問ですが、人工知能を「Logicad」と結びつけられた理由、広告配信における人工知能とは何かというところからお聞きしたいのですが。
山本氏:人工知能というのは、情報システムに学習能力を持たせるものです。より正確に言うと、人工知能には、ロボットが意識や感情をもって自身で判断しながら動きまわる、というような、強い人工知能と、弱い人工知能と呼ばれるものの大きく二通りがあります。
私たちが取り組んでいる、あるいは世の中で最近よくいわれる人工知能は、弱い人工知能にカテゴライズされます。この弱い人工知能は、とにかく、特定用途向けに学習・推論・予測機能を持たせたもので、人の面倒な作業の置き換えや、人では到底できないような高速処理をさせるために適用されます。事象を忠実に観察しながら、そこからエッセンスを抜き出して、モデル化します。そのモデルができると、予測が可能になるのです。この予測機能が広告配信システムになぜ必要なのか。それは、RTB広告取引の領域では、膨大なデータが超高速に流れている中での精度が求められるからです。このような領域は、実はめったにないほどで、1秒に5万回から10万回の応答をするようなシステムの中では、とても人では扱いきれないということになるわけです。ですから、瞬間瞬間の判断を、ある意味、機械に任せるということですね。しかし判断をルールで記述するには事象が複雑すぎて手に負えない。そこで、自動的に事象を学習し最適解に近づけるために機械学習の登場となるわけです。これが人工知能と広告配信とが非常に親和性が高い所以です。
配信精度の高さだけではない、マーケッターがDSPに求めるのは、広告配信により得られた効果の説明能力
―最近はDSP各社が「独自のアルゴリズム」と言われています。どうもこのあたりの言葉の関係性を混同してしまいがちなのですが、アルゴリズムと人工知能の関係性についても、分かりやすく教えていただけないでしょうか。
山本氏:人工知能の学習する機能が機械学習といわれる技術。そして機械学習を実現するための手続き、これがアルゴリズムです。アルゴリズムとは、数学の世界の定式化、プログラムはその具現化といえます。因みに一介の述語論理で形式化された体系の上に成り立つ現在のコンピューターでは、例えばパラドクスを自身で味わうことは不可能で、量子脳のような理論を具現化できない限り、強い人工知能は実現不可能なのでは、と私は考えていますが、これは議論あるところでしょう。
―なるほど。各社がいっている「独自のアルゴリズム」というのは、ある意味当然のことだと思うのですが。独自でないアルゴリズムが逆にあるのでしょうか?
山本氏:独自のアルゴリズム・・・。アルゴリズムをプログラムと同一視するなら当然かなあと思います(笑)。機械学習部が外製であろうが、内製しているものであろうが、新たにプログラムを書いて動作させたものは「独自のアルゴリズム」には違いないでしょう。
―なるほど、では「独自のアルゴリズム」という言葉を使わずに貴社の特徴を把握するにはどのようにしたらよろしいでしょうか?
山本氏:世の中にはいま、機械学習と呼ばれているモジュールは転がるほど存在します。また、手法として成熟したものがいくつもあります。そのAPIをたたくだけで、入力と出力さえ定義すれば完成し、あとはパラメータをチューニングするだけで人工知能は動くことができるのです。通常言われている人工知能の活用というのは、恐らくはこのようなものでしょう。
ですが、私たちソニーグループでは、このようないわばコモディティー化した人工知能を製品に使うのではなく、目的に応じたアルゴリズムを独自に作るという取り組みをしてまいりました。その目的というのは、例えば、AIBOの知能を実現するときには、安全に人を楽しませるような人工知能、情報推薦のためならば、ただ妥当な提示だけでないセレンディピティを演出するような人工知能、というようなものです。解くべき課題が、ユーザーエクスペリエンスに絡む場合や、システム的制約が厳しい場合、既製品では、「間尺に合わない」ということがよくあったわけです。
テレビ番組と音楽のレコメンデーションではまったく異なるアルゴリズムを作ってまいりました。
今回私たちが考えたアルゴリズムは、ターゲティング精度の高さと、説明能力があること。これらが大きな特徴です。
精度の高さを実現するために、私たちは広告配信実績のデータから数万にも及ぶ特徴量を抽出して用いています。
特徴量とは機械が人の行動の特徴を捉えるために用いる属性のことです。
広告配信における特徴量の特徴は異質な値が大量にあることです。例えば平日の広告クリック率や閲覧頻度をはじめとした取りうる値が連続値のもの、あるいは、性別やデバイス、見ているページ、該当/非該当(0/1)であらわされるものなど、多種多様なヘテロデータの集まりです。
われわれが広告配信におけるセグメントを作るために、ターゲットユーザーをモデル化する際の特徴量の扱い方は数学的なモデルにのっとっています。この点において、当社の独自のアルゴリズムをもとに高い精度の広告配信を実現しています。また、配信した結果を説明することが出来ます。
地引氏:説明能力についてですが、一般論としてマーケッターの方は、効果が出たときに、その理由がわからないことを、嫌います。「これは何でそうなったのかが全然分からない。」というようなことです。よく「複雑系」などという打ち出しをして、「結果出るときもあるし、出ないときもあります」と。「なぜでしょうか。」と聞かれると、「これは機械がやっていることなので説明できません。」と。こうなると、マーケッターの方から、「これではマーケティングには使えないよね。」とご指摘を受けることになります。
山本氏:開発者は、どうしても一方向に精度を追い求めてしまうのです。精度0.0何%上げるということに必死になってしまうのです。結果的にその追い求めた高い精度の必要性がなかったり、説明しきれずに、ブラックボックス化してしまったりします。ですが、「ブラックボックスでは、どんなにスーパー高精度でも使われないよ。」と、何回も言われました。(笑)
どのようなデータかではなく、データをいかに有効活用するか~精度の高い広告配信に求められること~
―人工知能を活用した潜在顧客ターゲティングをする際、インプットデータにはどのようなデータを使っているのでしょうか?
地引氏:潜在顧客ターゲティングでは、ファーストパーティデータと、1年間の入札データ、レスポンスデータ、クライアントの広告配信データが活用されています。
ファーストパーティデータは、クライアントから頂くデータ。入札データとは、SSPから入札リクエストがくる度に蓄積されるデータのことです。これが1年分貯まっています。その量は月間で千数百億、年間に直すと1兆の規模です。またそれに対してどういうレスポンスを返したかというデータセット、あとは、オークションで勝った際の広告配信のデータセット。大きくはこの四つのデータです。
山本氏:ファーストパーティデータは、すごく中身の濃いデータです。で、男性女性などグラフィック属性も正確についていますし、購買履歴も残っています。オフラインでの購買履歴が残っている場合もあります。当社の配信データと紐付けることで、一層精度が高まります。
地引氏:ファーストパーティデータの典型的な使い方としては、例えば、優良顧客というセグメントを作り、優良顧客セグメントをさらに4分割にするというようなことをします。20代独身女性、よく買ってくれるファンというように。このようなペルソナをいくつか作りますよね。こういうペルソナになりそうな人というのを、われわれの膨大なデータの中からWeb上での行動の傾向を見て、この人だったらこのペルソナになりそうだ、あるいは、こういう優良顧客になりそうだ、というユーザーを探してきます。
そのデータを基に広告の配信ターゲットを拡張していくのです。
山本氏:先ほど人工知能とは学習・予測能力を持つものだと申し上げました。学習能力というのは、学ぶべきもの、いわゆる教師データが必要なわけです。何を学ぶべきかが分からないと、どうしようもありません。その学ぶべき対象というのが、優良顧客なのです。優良顧客に行動パターンとして近い人を連れてこよう、というターゲティング方法ですね。人工知能は一生懸命その特徴を学ぼうとします。人工知能システムに、優良顧客のタイプを指定したら、人工知能はそれをモデル化し、モデルに合う人を見つけにいきます。その対象は、3億という膨大なユニークブラウザです。これだけ膨大な母数があるので、潜在顧客へのターゲティングがワークするのです。
―これまでお聞きしたお話では、貴社の場合は、「たくさんの種類のデータを持っている。だから効果が高い。」という差別化のロジックではないですよね。一方で、「いろいろな種類のデータを私たちは持っています。で、これを解析して、効果を最適化します。」というロジックの事業者もいると思いますが、この違いについてはどのようにお考えですか?
地引氏:もちろん、データはデータであったほうがいいという側面はあります。ですが、たくさんの種類のデータを保有していたからと言っても、それが効果につながるとは限りません。
例えば、販売経験のない社員に色々なデータを持たせても、急激に売り上げが伸びる訳ではないことと同じです。やはりそこには、現場経験での蓄積など、違う能力が必要だと思います。
洋服を実店舗で販売する場合、店員の方は、お客さんが来店していることで、顕在顧客として認識し、お客さんの着ている洋服をはじめ、会話から販売したい商品を薦めていきます。
一方で、私たちが開発している潜在顧客の発掘は、店舗に来ていないユーザーに対して「この人は今ならネット通販で洋服を買いそうだ。」ということを推測する必要があり、コンシェルジュみたいなものです。コンシェルジュになるには、ある程度の学習を重ねる必要があります。この点は人工知能の学習に基づくノウハウの部分です。人工知能の有無により、広告配信の精度は随分違うと感じていただけると思います。
―潜在顧客ターゲティングは、ダイレクトレスポンス系の広告主よりも、ブランド広告主のほうが、浸透しやすいとお考えですか?
地引氏:はい、そう思います。ですが、例えばダイレクトレスポンス系の広告主様であっても、例えば総合通販企業などのように、むしろすごくROASを厳しくみておられる広告主様には向いていると思います。なぜなら、新規顧客と、既存顧客とでは異なるKPIを持っており、新規顧客の獲得単価水準が既存顧客のそれと違うこともよく理解されていて、そのような施策にも慣れていらっしゃるからです。
―今後のお取り組みについて、お聞かせください。
山本氏:これまでは、広告を配信する人を選ぶという点に注力し、商品化を進めてまいりました。
今後は、選んだ人に、どのような商材を「いつ」、「どのように」見せるかというリコメンド型配信に取り組んでまいります。潜在顧客ターゲティングやダイナミック・クリエイティブなど、当社の他商品と組み合わせることもできると考えています。その際、シンプルなリコメンドではなく、コンテクストも加味して、そこに若干ユーザーごとの振れ幅を持たせてリコメンドの幅を広げていくことも考えております。音楽配信サービスでアルゴリズム開発時に経験したのが、ユーザーの好きな曲のみリスト化すると、ユーザーはそれに飽きてしまうということでした。これはジレンマですが、リコメンドシステムの精度が高ければ高いほど、その人にぴったりと合ってしまい、飽きられてしまうという現象が起こるのです。私はこれを「推薦の墓場」と名づけました。かといって一律変化させればよいわけでなく、ユーザーには個々に許容できる振れ幅というのがあるのです。その振れ幅も検出して、その範囲でリコメンドをするのです。
例えば、靴のページを見たユーザーに、同じ色や形の靴をリコメンドするのではなく、かばんをリコメンドするとか。もしかしたら、見た靴がおしゃれな靴であれば、デートの場所をリコメンドするというようなリコメンドの仕方もあるかもしれません。
地引氏:広告の文脈で言いますと、「ライトユーザーに、ライトタイミングでライトメッセージを出す。」ということになります。今後ターゲティング配信において、この洗練さの追及は、マーケッターから益々求められるようになると思います。
今までは、問題もそれほど大きくなりませんでしたが、ここまでリターゲティング広告が普及すると、その状況も変わってくるでしょう。インターネット広告の半分が、ユーザーを追いかけまわし過ぎる広告になってしまえば、産業自体がまずくなるのでないかと思っています。私たちはそういう危機感は持っています。
みんなが同じ情報を見て、同じように行動してしまうような傾向を作るも作らないも、マーケティングの責任であると思います。個人が本来生活すべき場所とか、能力を拡張すべき範囲とかというところにうまく適切な情報をぶつけられるようになると、広告の可能性はもっと広がると思います。私たちは人工知能を使い、そのような新たな領域に挑戦していきたいと考えております。
ABOUT 野下 智之
ExchangeWire Japan 編集長
慶応義塾大学経済学部卒。
外資系消費財メーカーを経て、2006年に調査・コンサルティング会社シード・プランニングに入社。
国内外のインターネット広告業界をはじめとするデジタル領域の市場・サービスの調査研究を担当し、関連する調査レポートを多数企画・発刊。
2016年4月にデジタル領域を対象とする市場・サービス評価をおこなう調査会社 株式会社デジタルインファクトを設立。
2021年1月に、行政DXをテーマにしたWeb情報媒体「デジタル行政」の立ち上げをリード。