Display Advertising with Real-Time Bidding (RTB) and Behavioural Targetingを読む (1. Introduction)

ディスプレイ広告に関連することがほとんど全て書かれている本、”Display Advertising with Real-Time Bidding (RTB) and Behavioural Targeting”がarXivで公開されているため、読んでいる。

[1610.03013] Display Advertising with Real-Time Bidding (RTB) and Behavioural Targeting

内容をまとめていく。

1. Introduction

広告とは、潜在的な顧客が商品を購入したりサービスに加入したりすることを促すマーケティングメッセージである。

広告を掲載する主なチャネルとして、テレビ、ラジオ、新聞、雑誌などが存在するが、多くのビジネス・サービスがオンライン空間上に移行しているので、インターネットは潜在的な顧客を獲得する自然な選択である。

ディスプレイ広告やモバイル広告における近年の最重要な進歩は、リアルタイムオークションを可能にするReal-Time Bidding (RTB)の進歩である。

科学的には、RTBの自動化・統合・最適化のさらなる需要により、情報検索(IR)、データマイニング(DM)、機械学習(ML)、経済学などの分野で新たな研究分野が生じる。

例えば、情報検索の研究者は、広告キャンペーンの目標が与えられたとき、潜在的なオーディエンスとの関連性を定義するという課題に直面しており、その結果、リアルタイムの入札リクエストデータを基に潜在的なオーディエンスを見つけてフィルタリングする技術を開発している。

データマイニングの研究者の基本的なタスクは、入札リクエスト、落札単価、広告インプレッションの大規模なデータに対する繰り返しパターンを特定することである。

機械学習の研究者にとって、新たな問題は、コストを最小限に抑えながらコンバージョンを最大化するために、広告主のために上手に入札することを学習するなど、データを基に機械に学習させることである。

さらに興味深いことに、インプレッション単位の最適化によって広告主と代理店は、自身やサードパーティの複数のデータソースから得られるユーザーデータに基づいた有効性を最大化することができる。

広告主は、クリック数やコンバージョンなどの特定のKPIを最大化するために複数のサイト運営者からインプレッションを購入し、サイト運営者は収益を最適化するためにインプレッションを複数の広告主へ販売する。

これにより、オンライン広告市場は、市場の統合が強く推進されている金融市場に近づいている。

ウェブページ、広告主、ユーザー間でクリックやコンバージョンを最適化するなどの共通の目的は、機械学習データマイニング、情報検索、行動ターゲティングを、ゲーム理論、経済学、最適化と組み合わせた多分野にわたる多大な研究を必要とする。

急速な成長と巨大な可能性にもかかわらず、RTBの多くの側面はさまざまな理由で研究コミュニティに対して未知のままである。

この本では、実世界システムに関する知見を提供し、産学間のギャップを埋めるとともに、オンライン広告の最先端のインフラ、アルゴリズム、技術的課題および研究課題の概要を提供する。

1.1 A short history of online advertising

最初のオンライン広告はウェブ上には約3,000万人にしかいなかった、1994年に現れた。

HotWiredの1994年10月27日号のWeb版は、AT&Tのバナー広告を初めて表示した。

1.1.1 The birth of sponsored search and contextual advertising

スポンサードサーチの枠組みは1998年にIdealabのBill Grossによって作成された。

IdealabはGoto.comに設立されたが、Goto.comは、Yahoo!によって2003年に買収され現在のYahoo! Search Marketingとなっている。

一方、Googleは2002年2月にGSP(Generalized Second Price Auction)を使用して独自のサービスAdWordsを開始し、2002年5月に品質基準の入札を追加した。

2007年、Yahoo! Search Marketingも続いて、品質基準の入札を追加した。

スポンサードサーチにおける検索結果と広告を一致させる技術に関する特許紛争を解決するため、Googleが270万株をYahoo!に支払ったことに言及する価値はある。

スポンサードサーチでは、広告主はビジネスを促進するために特定のキーワードを購入することができ、ユーザーはそのような検索エンジンを使用することで、継続的に無料サービスに貢献することができる。

一方、1998年に、ディスプレイ広告がコンテキスト広告として開始された。

Gilad ElbazとAdam Weissmanが始めたOingoは、単語の意味に基づいた独自の検索アルゴリズムを開発し、WordNetと呼ばれる根本的な辞書を作成した。

Googleは2003年4月にOingoを買収し、そのシステムの名前をAdSenseとした。

その後、Yahoo! Publish Network、Microsoft adCenter、およびAdvertising.comなどの多くが、同様のサービスを提供するために作成された。

コンテキスト広告プラットフォームは、ビデオ、オーディオ、地理情報を含むモバイルネットワークなど、より豊かなメディア環境に適応して進化た。

これらのプラットフォームにより、サイト運営者はウェブページ、ビデオクリップ、アプリケーション上のスペースの一部を使ってお金を稼ぐことができた。

通常、このようなサービスは、広告ネットワークまたはディスプレイネットワークと呼ばれ、膨大な数のサイト運営者や広告主から構成されるため、必ずしも検索エンジンを必要としない。

スポンサードサーチ広告は、単純なコンテキスト・クエリキーワードと一致するコンテキスト広告の一種と考えることもできるが、初期の発達、市場の大規模化、研究の注目を受けて重点を置かれてきた。

1.1.2 The arrival of ad exchange and real-time bidding

2005年頃にインプレッションを売買することに基づくreal-time bidding (RTB)に焦点を当てた新しいプラットフォームが作成された。

例としては、ADSDAQ、AdECN、DoubleClick Advertising Exchange、adBrite、Right Media Exchangeなどがある。

これらはad exchangesとして知られている。

従来の広告ネットワークとは異なり、これらの広告交換は複数の広告ネットワークをまとめて集め、市場での需要と供給のバランスをとっており、ユーザの訪問によって生成された広告のインプレッションをリアルタイムで販売する。

サイト運営者や広告ネットワークは、そのようなビジネスに参加することで利益を得ることができる。

サイト運営者は、関連するユーザープロファイルとコンテキストに興味のある広告主にインプレッションを販売するが、広告主はより多くのサイト運営者に接触してより良いマッチングのインプレッションをリアルタイムで購入することができる。

同時に、異なる機能を持つ他の同様のプラットフォームが出現した。

(i) demand side platform (DSP)

広告主がキャンペーンを管理し、各入札リクエストに対するリアルタイムの入札レスポンスをアルゴリズムによってad exchangesに応答する。

(ii) supply side platform (SSP)

サイト運営者がウェブサイトの広告在庫を管理する。

しかし、real-time bidding (RTB)や複数の広告ネットワークの集約は、そのような市場(インプレッションの売買が行われる場所)の性質を変えることはなく、オークションの仕組みを介してリアルタイムで取引を行う。

簡単のために、取引が行われるより広いプラットフォームを表現するために、この本で"ad exchanges"という用語を使用する場合がある。

1.2 The major technical challenges and issues

リアルタイム広告は、時間の経過とともに大量のデータを生成する。

グローバルなDSPのFikisuは、毎日320億件、ピーク時間に毎秒250万件のインプレッションを処理していると主張している。

規模をより想像するための例として、ニューヨーク証券取引所は毎日約120億株を取引している。

ディスプレイ広告の取引量はすでに金融市場を上回っている。

さらに重要なのは、ディスプレイ広告産業は、コンピュータサイエンスの研究者や経済学者に、インターネットのトラフィック、ユーザーの行動や動機、オンライン取引を研究して理解するユニークな機会を提供する。

この業界だけが、広告取引におけるウェブサイトやユーザー全体にわたるほぼすべてのウェブトラフィックを集計している。

RTBエコシステムは、Cookieベースのユーザー追跡と同期によるリアルタイムのインプレッション購入により、ユーザーの行動ターゲティングとパーソナライゼーションの力を完全に引き出す機会とインフラを提供する。

これは、機械駆動アルゴリズムが、広告とユーザとの間の関連性の一致を自動化および最適化することを可能にする。

RTB広告は、ユーザーの反応(クリックスルー率、CTR)推定、行動ターゲティング、知識抽出、関連性フィードバック、不正検知、経済学、推薦システムやパーソナライゼーションなど、多くの研究課題におけるデータサイエンス研究の重要な戦場になっている。

1.2.1 Towards information general retrieval (IGR)

オンライン広告の基本的な技術目標は、広告主とサイト運営者が合意した適切な価格で適切なユーザーに適切な広告を適切なタイミングで自動的に配信することである。

そのため、RTBベースのオンライン広告は、情報検索(IR)の分野と強く相関している。

これは、伝統的に情報のニーズと文書の関連性を構築することに重点を置いている。

情報検索の研究は、典型的にはテキストデータを扱うが、画像、ビデオ、およびオーディオ信号を含むマルチメディアデータに拡張されている。

また情報検索の研究は、Collaborative FilteringとRecommender Systemsを含む、カテゴリデータと順位データもカバーしている。

これらのすべてのケースにおいて、情報検索の重要な研究課題は、検索とフィルタリングの2つの特有のタスク、すなわちクエリとドキュメントの関連性を研究し、モデル化することである。

検索タスクは、情報のニーズ(クエリ)がアドホックであり、ドキュメントの集合は比較的静的である。

対照的に、情報フィルタリングタスクは、情報のニーズ(クエリ)が静的であるときに定義され、ドキュメントはシステムに入り続ける。

情報検索は、Web検索やエンタープライズ検索の応用を超えて、他の多くの応用に由来する一般的な検索の問題について考えることで、研究範囲を広げることができる。

基本的に、2つの情報オブジェクト間の対応を構築することに興味がある限り、様々な目的と基準の下で、一般的な検索問題とみなすことができる。

オンライン広告はこの応用分野の1つであり、この本では新しい情報の一般的な検索問題(IGR)を明らかにしたい。

例えば、リアルタイムに広告に提示する技術は、情報検索とデータマイニング機械学習および他の関連分野の豊富な文献に基づいて構築され、広告とユーザとの間の関連性マッチングに関連する様々な問いに答えることができる。

しかし、典型的な情報検索問題と比較した差異と難点は、様々な経済的制約を考慮していることにある。

制約の一部は、オークションの仕組みから継承された動機に関連するものもあれば、参加者(広告主およびサイト運営者)の異なるの目的に関連するものもある。

さらに、RTBは、2つの一致した情報オブジェクトの間で双方向で統一された、関連性マッチングの有用なケースを提供する。

RTBでは、広告、ユーザー、サイト運営者の間に内部的なつながりがある。

広告主は、潜在的なユーザーと広告のマッチングによって最終的にコンバージョンにつながることを望んでいる。

一方サイト運営者は、広告とウェブページのマッチングによって高い報酬を得ることを望んでいる。

関連性が計算されるとき、両方の目的は達成されることを必要とする。

1.3 The organisation of this monograph

この本の対象読者は、この分野の学術研究者および業界実務家である。

その目的は、読者がドメイン知識を取得し、一般的なRTBとオンライン広告で研究活動を促進することである。

本の内容は主に4つである。

まず第2章と第3章では、RTB広告とその仕組みの概要を説明する。

具体的には、第2章では、業界で普及している主流のユーザー追跡と同期技術と同様に、RTBがどのように動作するかについても説明する。

第3章では、オークション市場におけるRTBオークションの仕組みと、その結果として得られる予測手法について紹介する。

次に、広告主の視点から問題を説明する。

第4章では、過去に提案されたさまざまなユーザー応答モデルを説明して、ユーザーをターゲットにし、潜在的なユーザーのパターンに合わせて広告を作成する。

第5章では、さまざまな市場設定での広告主の視点から最適な入札を提示する。

第6章では、サイト運営者に焦点を当てて、最低入札価格の動的設定、プログラムによる直接販売、新しいタイプの広告契約について説明する。

この本は、RTBの2つの重要な主題である、第7章のアトリビューションモデルと第8章の広告不正検知で終わる。

読者の技術的背景や興味に応じていくつかの読書経路がある。

学術研究者のために、第2章と第3章は、現在産業に展開されているリアルタイムのオンライン広告システムを理解するのに役立つ。

後の章では、産業界の実務者がこの分野の研究課題、最先端のアルゴリズムおよび潜在的な将来のシステムを把握するのに役立つ。

これらの後の章は特殊なトピックに関するものなので、より深いレベルで個別に読むことができる。