90
Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Embed Size (px)

Citation preview

Page 1: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Search Engines and Web Advertising

Antonio PanciaticiISTI-CNR

Page 2: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

The Advertising market

Internet 2006: first half 2006 vs. first half 2005 (+18.9%)

Page 3: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

The Advertising market

Page 4: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Tecniche di Advertising

Flash Richiedono Flash Player

Immagini GIFs animate, JPEGs

Sponsored links Text Based Ads (Search-Based

Advertising or Content-Targeted Advertising)

Page 5: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Our Focus

Search-Based Advertising: ogni volta che l’utente immette una query, il motore di ricerca mostra gli Ads più rilevanti nella pagina dei risultati Le keywords contenute nella query vengono confrontate

con quelle selezionate dall’advertiser

Content-Targeted Advertising: ogni volta che l’utente visita una pagina di contenuto (trigger page), il motore di ricerca mostra gli Ads più rilevanti nella pagina stessa Il contenuto della pagina visitata viene confrontato con

keywords selezionate dall’advertiser

Page 6: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Search-Based Advertising

AdvertisementKeyword

Advertisementspiù rilevanti

Page 7: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Content-Targeted Advertising

Ad

Page 8: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Key Points

Punto di vista dell’advertiser Quali keyword comprare (problema del

matching) ? Quanto pagare (problema del pricing) ?

Punto di vista del motore di ricerca Come suggerire buone keyword (problema del

matching) ? Come far pagare le keyword (problema del

pricing) ? Come mostrare gli advertisers più rilevanti

(problema del ranking) ?

Page 9: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Key Points

Se l’advertisement è rilevante il motore di ricerca guadagna, sia da un punto di vista economico sia dal punto di vista della credibilità

Se l’advertisement è rilevante aumenta la probabilità che anche l’advertiser guadagni

Page 10: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Il problema del matching

Il problema del matching varia in base al tipo di advertising che si adotta Search-based Advertising Content-targeted Advertising

Page 11: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Search-Based Advertising

Advertisement = (Keywords, titolo, descrizione, URL)

Query = (Search keywords, contesto)

Il processo di matching è keyword-driven

Page 12: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Search-Based Advertising

AdvertisementKeyword

Advertisementspiù rilevanti

Titolo

Descrizione

URL

Page 13: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Content-Targeted Advertising

Advertisement = (Keywords, titolo, descrizione, URL)

Query = (Triggering page, contesto)

Il processo di matching riguarda il contenuto di una pagina (molte keywords)

Page 14: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Search-Based Advertising

Problema principale: poche informazioni (sostanzialmente solo le kewords)

Ranking dipende anche da quanto hanno offerto gli advertisers

Page 15: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Content-Targeted Advertising

Problema principale: gap semantico Linguaggi differenti (esempio bottiglia,

bottle, contesti diversi) Sinonimi Matching approssimato ?

Page 16: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Algoritmi per il matching (Content-Targeted Advertising)

Impedance Coupling in Content-tergeted Advertising(Berthier Ribero-Neto, Paulo B. Golpher, Marco Cristo, Edleno Silva de Moura)

Page 17: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Due diversi insiemi di algoritmi matching diretto tra il contenuto della pagina

(trigger page) il testo dell’advertisement e le keywords associate

matching tra il contenuto della pagina arricchita con nuove keywords. Approccio giustificato dal fatto che spesso I vocabolari della pagina e dell’advertisement sono diversi (Vocabulary impedance)

Page 18: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Advertisement composto da un titolo, una descrizione e un URL

p trigger page A insieme di advertisements ai si vuole effettuare il ranking degli

advertisements ai rispetto a p

Page 19: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Vector Space Model Vettori dei pesi della query e del documento q = (w1q,…,wiq,…,wnq)

dj = (w1j,…,wij,…,wnj)

wiq = peso associato al termine ti nella query q

wij = peso associato al termine ti nel documento dj I pesi sono calcolati utilizzando tf-idf (prodotto

term frequency, inverse document frequency) (tf = importanza del termine nel documento, idf =

rarity del termine nel documento)

Page 20: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Il ranking della query q rispetto al documento dj è il seguente (cosine similarity formula)

Impedance Coupling in Content-targeted Advertising

Page 21: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Primo algoritmo (AD) Matching contenuto dell’ advertisement (titolo +

descrizione) e il contenuto della trigger page

AD(p, ai) = sim(p, ai)

Page 22: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Secondo algoritmo (KW) Matching keyword (può essere composta

da più termini) associate all’advertisement e il contenuto della pagina p

KW(p, ai) = sim(p, ki)

Page 23: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Terzo algoritmo (AD_KW) Molte volte le keyword scelte

dall’advertiser sono presenti anche nell’advertisement. Si può usare questa informazione per migliorare AD.

Matching dell’advertisement e le sue keyword con il contenuto della pagina p

AD_KW(p, ai) = sim(p, ai ki)

Page 24: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising Quarto algoritmo (ANDKW)

Molte volte le keyword scelte dall’advertiser non sono presenti nella pagina p anche se l’advertisement può avere un rank alto. Si può pensare che la presenza delle keyword nella pagina p fornisca un indicatore della rilevanza dell’advertisement (le keyword danno una sintesi dell’advertisement)

Matching dell’advertisement forzando la presenza delle keyword nella pagina p

sim(p, ai) se ki pANDKW(p, ai) =

0 altrimenti

Page 25: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising Quinto algoritmo (AD_ANDKW)

Matching dell’advertisement e delle sue keyword forzando la loro presenza nella pagina p

sim(p, ai ki ) se ki p

AD_ANDKW(p, ai) =

0 altrimenti

Algoritmo migliore tra tutti quelli visti fino ad ora

Page 26: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Problemi La trigger page appartiene ad un

contesto più ampio di quello relativo all’advertisement

La correlazione tra l’advertisement e la trigger page può essere legato a topic che non compaiono esplicitamente nel contenuto della pagina

Page 27: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Il primo problema è dovuto al fatto che il contenuto delle pagine può riguardare qualsiasi argomento. L’advertisement è molto coinciso e mirato per sua natura

Il secondo problema è dovuto al fatto che molte volte gli advertiser scelgono keyword generiche che non coincidono con i termini specifici contenuti nella pagina (vino, chianti)

Page 28: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Algoritmi Impedance Coupling per ridurre i problemi esposti sopra Idea di base: aggiungere nuove parole

(termini) più generali alla trigger page Per farlo analizza i vocabolari di

documenti simili alla ricerca di termini generali che possano caratterizzare meglio il contenuto della pagina p

Page 29: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Bayesian Network Model per determinare la probabilità che un termine ti sia un buon candidato a rappresentare il contenuto della pagina p

Page 30: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising P(Ti | R) probalità che il termine ti sia un buon candidato

a rappresentare il contenuto della pagina p R nodo nella Bayesian Network rappresentante la

nuova pagina r (pagina p con nuovi termini) 0 ≤ ≤ 1 ( = 0 R = p) constante di normalizzazione wij peso associato al termine ti nel documento dj (dj

documento simile a p) d0 = p

Page 31: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Si effettua il ranking dei termini ti in base alla loro bontà ttop quello per cui vale maxt P(Ti | R)

(quello con il rank più alto) Aggiunge alla pagina p (trasformandola nella

pagina r) tutti i termini per cui P(Ti | R) / P(Ttop | R) ≥ (in questo caso = 0.05)

Page 32: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Sesto algoritmo (AAK_T) Matching dell’advertisement e keywords

solo rispetto al set e dei nuovi termini

AAK_T(p, ai) = AD_ANDKW (e, ai)

Page 33: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Settimo algoritmo (AAK_EXP) Matching dell’advertisement e keywords

rispetto alla pagina estesa r (termini in p + termini in e)

AAK_EXP(p, ai) = AD_ANDKW (p e, ai)

Page 34: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Ottavo algoritmo (H) Matching della landing page

dell’advertisement rispetto alla pagina p. Giustificato dal fatto che landing page (hyperlink della landing page hi) dell’advertiser descrive il target reale dell’advertisement

H(p, ai) = sim (p, hi)

Page 35: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Nono algoritmo (AAK_H) Combinazione di AD_ANDKW con H Matching dell’advertisement, delle keyword,

della landing page rispetto alla pagina p forzando la presenza delle keyword nella pagina p

sim(p, ai hi ki) se ki p

AAK_H(p, ai) =

0 altrimenti

Page 36: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

Decimo algoritmo (AAK_EXP_H) Combinazione di AD_EXP con H Matching dell’advertisement, delle keyword, della

landing page rispetto alla pagina p forzando la presenza delle keyword nella pagina p e

sim(p e, ai hi ki) se ki p e

AAK_H(p, ai) =

0 altrimenti

Page 37: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Impedance Coupling in Content-targeted Advertising

AAK_EXP_H ottiene i risultati migliori (tra tutti gli algoritmi), abbastanza naturale dato che utilizza tutte le possibili fonti di informazioni

Page 38: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Performance

Nel content-targeted advertising gli advertisements sono associati alle pagine quando le pagine vengono pubblicate

Tutte le informazioni (landing pages, triggering page, etc..) sono ottenute tramite page crawling, link crawling, sono ottenibili off-line

Gli advertisement che arrivano a run-time possono essere assegnati alle pagine già pubblicate in modo off-line

Se ne deduce che il problema della performance non è critico

Page 39: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Algoritmi per Search-Based Advertising

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

(Paat Rusmevichientong, David P. Williamson)

Page 40: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Il problema: dato un budget giornaliero e una probabilità di click-through non conosciuta, fornire un algoritmo in grado di selezionare le keyword da acquistare in modo da massimizzare il guadagno medio

Punto di vista dell’advertiser

Page 41: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Supponendo di avere N keywords rappresentate dai numeri {1, 2, 3,…, N}

Per ogni A {1, 2, 3,…, N} , sia ZA la variabile aleatoria (v.a) che indica il profitto che si ottiene se si seleziona l’insieme di keyword da A

Sia = (A1, A2,…) una politica, cioè una sequenza di v.a. At indica l’insieme di keyword che l’advertiser seleziona nel periodo t. At può dipendere dalle osservazioni al tempo t-1

Per tutti i T ≥ 1 quello che si vuole trovare è una politica = (A1, A2,…) tale che sia massimo:

Page 42: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Alcune osservazioni Il costo totale dipende dal numero di click Massimizzare il guadagno, dato un certo budget,

richiede la conoscenza della probabilità di click-through dell’advertisement associato ad una data keyword.

La probabilità di click-through non è conosciuta (si può determinare osservando il comportamento delle keyword per un dato periodo, però può avere un costo notevole)

La maggior parte degli algoritmi assume la conoscenza di una stima della probabilità di click-through

Page 43: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

L’approccio seguito dagli autori è quello di trovare un trade-off tra le keyword selezionate basandosi sulle performance passate, e le keyword selezionate tra quelle mai usate

Page 44: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

L’algoritmo parte dal caso in cui si conosce la probabilità di click-through e poi fornisce anche una tecnica che elimina questa restrizione

Noi vedremo solo il caso in cui si conosce la probabilità di click-through, il modello che definiremo in realtà vale per entrambi i casi

Page 45: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Modello: Spazio di probabilità (, F, P) N keyword {1, 2, 3,…, N}

Per ogni t ≥ 1 sia St una v.a rappresentante il numero totale di search query arrivate nel periodo t

S1 , S2, … sono indipendenti ed identicamente distribuite con media 1 < < ∞

Supponiamo di conoscere St

Page 46: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Modello (continua): In ogni periodo, le query arrivano in modo

sequenziale ed ogni query può essere una delle N keyword {1, 2, 3,…, N}

Per ogni t ≥ 1 e r ≥ 1 sia Qtr una v.a

rappresentante la keyword associata alla query r arrivata nel periodo t

Qtr sono indipendenti ed identicamente distribuite

e P{ Qtr = i } = i con i {1, 2, 3,…, N} e i =1

Supponiamo di conoscere i

Page 47: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Modello (continua): Il budget in ogni periodo è 1€ (non si perde di

generalità) pi probabilità di click-through per keyword i {1,

2, 3,…, N}, con 0 pi 1

ci (CPC) cost per click

Supponiamo di conoscere ci rimane costante

i guadagno per click con la keyword i

Supponiamo di conoscere i rimane costante

Page 48: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Modello (continua): At indica l’insieme di keyword che l’advertiser

seleziona nel periodo t Br

At budget rimanente al periodo t quando la query r viene immessa e l’advertiser ha scelto di selezionare le keywords in At

Xtri variabile aleatoria di Bernulli con parametro pi

(probabilità di click-through) P{Xtri = 1} = pi

Per ogni i con t ≥ 1 e r ≥ 1 vale che Xtri sono

indipendenti ugualmente distribuite Xt

ri indipendenti dall’arrivo delle query

Page 49: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Dato il modello visto si ha che

1(.) funzione indicatrice i At (l’advertiser effettua un offerta sulla keyword i all’inizio

del periodo t) Qt

r = i (la query r-esima corrisponde alla keyword i)

BrAt ≥ ci (c’è abbstanza budget per pagare il costo della

keyword i se l’utente va sull’advertisement) Xt

ri = 1 (l’utente effettivamente va sull’advertisement)

Page 50: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Supponendo di conoscere pi il problema diventa(static binding problem)

Non è più dipendente dal tempo ! S numero di query Br

A budget rimasto quando la query r-esima viene immessa e l’advertiser ha scelto di selezionare le keywords in A

Xri variabile di Bernulli (indica se l’utente va sull’advertisement relativo alla keyword i durante l’arrivo della query r-esima)

Page 51: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Così formulato, il problema è NP-completo (stochastic knapsack problem) se pi = 1 per ogni i il problema dello zaino standard

Gli autori forniscono un algoritmo approssimato (trova soluzione near-optimal) sotto alcune ipotesi

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Page 52: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Ipotesi Le keyword sono ordinate in modo discendente

secondo il rapporto profitto/costo 1/c1≥ 2/c2 ≥… ≥ N/cN

icipii > 1 (i probabilità query che r-esima contenga la keyword i) si possono aggiungere keyword fittizie con = 0 in modo da ottenere questa disequazione

Esistono k ≥1 e 0 ≤ < 1 tali che ci ≤ 1/k e i ≤ k per tutti gli i (i = numero medio di query contenenti la keyword i)

Page 53: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Le ipotesi sopra sono derivate da esperimenti su dati reali Teorema: siano k e definiti secondo le ipotesi, supponendo di

conoscere pi e supponendo anche che 1/k + 1/k1- + 1/k(1-)/3 ≤ 1

si definisce

Intuitivamente significa cercare il valore l tale che il costo delle prime {1,...,l} keyword ordinate secondo le ipotesi non ecceda il budget

Page 54: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services

Se = E[min {S,}] / (misura quanto la distribuzione del numero delle query è vicina alla propria media)

Se P = {1,2,…,Iu} e Z* il profitto ottimo abbiamo

Page 55: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Il problema del Pricing(Search-based Advertising)

Ogni keyword è un mercato nel quale gli advertisers competono per avere la posizione migliore

Il mercato varia in base alle keywords Per ogni keyword competono molti

advertisers, quali di questi devono essere visualizzati ?

Il motore di ricerca utilizza uno schema di pagamento PPC (Pay per Click). Quanto devono pagare per ogni click ?

Page 56: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Il problema del Pricing(Search-based Advertising)

Scenario Una keyword (un mercato) Un insieme di compratori (Advertisers) Un venditore (motore di ricerca) Ogni compratore ha una sua funzione di pay-off

Come organizzare il pricing in modo che tutti siano soddisfatti ?

Page 57: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Game Theory

“Game Theory is a bag of analytical tools designed to help us understand the phenomena that observe when decision-makers interact”. (Martin J. Osborne, Ariel Rubistain, A Course in Game Theory)

Page 58: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Game Theory

Alcuni concetti importanti Gioco strategico Equilibrio di Nash

Giochi legati al Web Advertising Aste generalizzate di secondo prezzo

(GSP)

Page 59: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Game Theory

Ipotesi I giocatori hanno un comportamento razionale e sfruttano

le loro conoscenze su strategie e comportamenti (conosciuti) degli altri giocatori

Non c’è cooperazione tra giocatori (Giochi non cooperativi)

Strategic Game: Ogni giocatore sceglie la sua strategia una volta per tutte, tutti i giocatori prendeno le loro decisioni simultaneamente (dal punto di vista del gioco). Quando un giocatore adotta una strategia non è informato della strategia adottata dagli avversari

Page 60: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Strategic Game (due giocatori)

Due giocatori Il giocatore i-esimo adotta un insieme di

strategie Ai non vuoto, con ai Ai strategia pura Il giocatore i-esimo è rappresentato da una

funzione di pay-off ui : A -> R dove A = A1 x A2

Nota: ui dipende anche da ciò che fanno gli altri giocatori

Page 61: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Game Theory

Chiameremo profilo il vettore a = (a1 , a2) con a1 A1 e a2 A2

Diremo che una strategia aj è weakly-dominant per il giocatore i-esimo se

ui(aj,*) ≥ ui(ak,*) per ogni ak Ai indipendentemente da quale sia la strategia degli altri giocatori

Diremo che una strategia aj è strongly- dominant per il giocatore i-esimo se

ui(aj,*) > ui(ak,*) per ogni ak Ai indipendentemente da quale sia la strategia degli altri giocatori

Page 62: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Equilibrio di Nash

Un equilibrio di Nash in un gioco strategico<N=(1,2), (A1 , A2), (u1 , u2)> con due giocatori, è un profilo a* = (a*

1 , a*2) tale che

u1 (a*1 , a*

2 ) ≥ u1(ai , a*2 ) for all ai A1

u2 (a*1 , a*

2 ) ≥ u2(a*1 , aj ) for all aj A2

Intuitivamanente: fissate le strategie degli altri giocatori, nessun giocatore è incentivato a cambiare la propria

Page 63: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Game Theory

Esempi di giochi strategici con strategie pure Due giocatori

Dilemma del Prigioniero, Back o Stravinsky, etc..

Aste Aste di secondo prezzo (Vickrey Auction) Generalized Second Price Auction (GSP) Vickrey

(Aste legate al Web Advertising)

Page 64: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Il Dilemma del Prigioniero

Due sospetti sono messi in due celle diverse Se confessano entrambi vengono

condannati entrambi a tre anni Se uno solo di essi confessa, questo viene

liberato e la sua testimonanzia viene utilizzata per condannare a quattro anni l’altro

Se nessuno dei due confessa vengono entrambi condannati ad un anno

Page 65: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Il Dilemma del Prigioniero

3 4

0 1

3 0

4 1

Confessa

Non confessaConfessa

Non confessa

Confessa Non confessa

Confessa

Non confessa

Esiste un solo equilibrio di Nash (Confessa, Confessa), non è l’ottimo Confessare è una strategia strongly-dominant L’ottimo è (Non confessa, Non confessa) ma non è un equilibrio !

Page 66: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Nash Equilibrium

Un equilibrio di Nash in un gioco strategico <N, (Ai), (≥i)> è un profilo a* in A di azioni con la proprietà che per ogni giocatore i N vale

(a*-i , a*

i ) ≥i (a*-i , ai) for all ai Ai

Dove Per ogni giocatore i N esiste una relazione di

preferenza ≥i definita su A = Xj NAj

a-i = (aj) j N/i

Page 67: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Nash Equilibrium

Per giochi strategici con un numero qualsiasi di partecipanti (N ≥ 2) può esistere un equilibrio di Nash, più di uno, o anche nessuno

Equilibrio di Nash (generale) Se per ogni giocatore i l’insieme Ai è compatto e convesso, e ≥I è

continua e quasi concava allora il gioco strategico <N, (Ai), (≥i)> ha un equilibrio di Nash

Ogni gioco strategico finito (se ogni Ai finito) con strategie miste ha un equilibrio di Nash

Page 68: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Asta di primo prezzo

Asta di primo prezzo Lo scopo è assegnare un oggetto ad uno tra N possibili compratori Ogni giocatore i ha una sua stima (privata) vi del valore

dell’oggetto vi > 0 per ogni i Simultaneamente, ogni giocatore i fa un offerta bi

privata (offerta strategia) L’oggetto viene assegnato al giocatore che offre di più

(se ce ne è più di uno, in modo random) Per avere l’oggetto, il vincitore paga la sua offerta

Dire la verità non è una strategia dominante !

Page 69: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Asta di secondo prezzo

Asta di secondo prezzo (Asta di Vickrey) Lo scopo è assegnare un oggetto ad uno tra N possibili

compratori Ogni giocatore i ha una sua stima (privata) vi del valore

dell’oggetto vi > 0 per ogni i Simultaneamente, ogni giocatore i fa un offerta bi

privata (offerta strategia) L’oggetto viene assegnato al giocatore che offre di più

(se ce ne è più di uno, in modo random) Per avere l’oggetto, il vincitore paga la seconda offerta

più alta

Page 70: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Per ogni giocatore i, offrire il massimo possibile (bi = vi) è una strategia weakly-dominant. Infatti, posto ri = max(bj) per ogni j ≠ i si ha

0 se bi ≤ ri

ui = vi - ri se bi > ri

Supponiamo bi > vi allora

Se ri ≥ bi ui = 0 lo stesso guadagno ottenibile offrendo vi

Se ri ≤ vi ui = vi - ri lo stesso guadagno ottenibile offrendo vi

Se vi < ri < bi ui = vi - ri < 0 offrendo vi ui = 0

Asta di secondo prezzo

Page 71: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Per ogni giocatore i, offrire il massimo possibile (bi = vi) è una strategia weakly-dominant. Infatti, posto ri = max(bj) per ogni j ≠ i si ha

0 se bi ≤ ri

ui = vi - ri se bi > ri

Supponiamo bi < vi allora

Se ri ≥ vi ui = 0 lo stesso guadagno ottenibile offrendo vi

Se ri ≤ bi ui = vi - ri lo stesso guadagno ottenibile offrendo vi

Se bi < ri < vi ui = 0 se il giocatore avesse offerto vi ui = vi - ri

Asta di secondo prezzo

Page 72: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Asta di secondo prezzo

Esiste un equilibrio di Nash in cui tutti i giocatori offrono la loro stima del valore dell’oggetto

Page 73: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Asta generalizzata di secondo prezzo (GSP)

Asta generalizzata di secondo prezzo (Vickrey) Lo scopo è assegnare simultaneamente 0 < M < N di

oggetti tutti uguali ad un sottoinsieme degli N possibili compratori

Ogni giocatore desidera un oggetto Ogni giocatore i ha una sua stima (privata) vi del

valore dell’oggetto vi > 0 per ogni i Per il giocatore i, ogni oggetto ha lo stesso valore vi Simultaneamente, ogni giocatore i fa un offerta bi

privata Gli M giocatori che hanno offerto di più si aggiudicano

gli oggetti Il giocatore che ha offerto di più paga la seconda

offerta più alta, il secondo la terza, e così via

Page 74: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Per ogni giocatore i, offrire il massimo possibile (bi = vi) non è una strategia weakly-dominant. Infatti, date (r1 > r2 >….> rM) le M offerte più alte

0 se bi rM

ui = vi - rh se bi = rh-1 con h = {2,…,M}

Supponiamo rM < bi = rM -1< r1 < vi allora ui = vi – rM

Se il giocatore i-esimo avesse offerto bi allora ui = vi – r1 < vi – rM offrire il massimo possibile (bi = vi) non è una strategia dominante

Asta generalizzata di secondo prezzo

Page 75: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

GSP e Web Advertising

Modello GSP applicato al Web Advertising Google, Yahoo utilizzano GSP Google adotta alcune modifiche che rendono

l’asta ancora più complicata (CTRi = expected click-through rate dell’advertiser i-esimo)

Yahoo (CTR non dipende dall’advertisement)

Page 76: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

How to price keywords

Advertisers preferiscono questo slot

Click through rate 200 per ora

Click through rate 150 per ora

Page 77: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

GSP e Web Advertising (Yahoo)

N slots nella pagina di ricerca K advertisers interessati ad una keyword ci numero medio di click per periodo per un

advertiser nello slot i Ogni advertiser desidera un solo slot vk valore del click per l’advertiser k uk = ci vk – pij guadagno advertiser k in

posizione i (strategia del giocatore) Advertisers sono risk neutral (tendono a

massimizzare uk)

Page 78: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

GSP e Web Advertising

Alcune considerazioni ci non dipende dall’advertiser, ma solo

dalla posizione vk non dipedende dallo slot

pij dipende dagli altri advertisers

Page 79: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

GSP e Web Advertising

Pay-off del giocatore i-esimo nella posizione j-esima ui = cj (vi – bj+1)

Il giocatore che ha acquistato lo slot N-esimo in teoria non paga (in realtà i motori di ricerca impongono un prezzo minimo)

Page 80: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

GSP e Web Advertising

Anche in questo caso dire il vero non è una strategia dominante Tre giocatori, con v rispettivamente uguale a 17€, 12€, 3€

per click Due slots Click-through rates per la prima posizione 250, per la

seconda 248 (quasi gli stessi) Se tutti I giocatori dicono il vero e offrono la loro stima del

valore, il pay-off del giocatore che vince la prima posizione è:

(17 - 12) * 250 = 1250€ Se solo il giocatore che ha vinto avesse offerto 11€

(mentendo) avrebbe avuto un pay-off maggiore: (17 - 3) * 240 = 3360€ > 1250€

Page 81: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

GSP e Web Advertising

Nel caso reale di Google o Yahoo, l’asta è ripetuta continuamente: le assunzioni sulla riservatezza di alcune

informazioni (v, b) possono non essere più vere. I giocatori imparano (v, b) giocando

Cambiano gli equilibri Minimo prezzo di entrata,…

Page 82: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

GSP e Web Advertising

Equilibri simmetrici: un dato advertiser non è interessato ad uno slot più in alto se deve pagare di più

Equilibri asimmetrici: un dato advertiser può essere interessato ad uno slot più in alto anche se deve pagare di più

Ci possono essere diversi equilibri di Nash (simmetrici, non simmetrici)

Page 83: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Il problema del ranking (Search-based Advertising)

In che ordine visualizzare gli advertisments ? Yahoo ordina solo rispetto al prezzo

pagato Google ordina rispetto al prezzo pagato

ed ad un fattore legato alla rilevanza dell’advertisement (CTRi)

Pagamento è sempre secondo il modello GSP

Page 84: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Il problema del ranking

Yahoo (solo prezzo) apprezzato dagli advertisers per la

trasparenza presenta qualche problema legato alla

rilevanza dei risultati Chi ha pagato di più non è detto che sia

quello più rilevante !

Page 85: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Il problema del ranking

Google (prezzo e rilevanza) Forse meno apprezzato dagli advertisers

(meno trasparenza) Aumenta la rilevanza dei risultati

È in testa chi ha il miglior trade-off tra l’offerta e la rilevanza !

Page 86: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Il problema del ranking

(Google) Ri = bi x CTRi dove CTRi = expected click-through rate

dell’advertiser i-esimo (misura rilevanza dell’advertisement i-esimo)

bi = pagamento dell’advertiser i-esimo

Gli advertisements sono ordinati secondo il loro Ri

Page 87: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Alcuni problemi aperti

Granularità del mercato Ferrari e Red Ferrari devono essere due

mercati diversi ? Utilizzo di robots per effettuare il bidding

Attualmente I motori di ricerca lo permettono

Quali nuovi meccanismi (incentivi) introdurre ?

Page 88: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Alcuni problemi aperti

Che modello di costo adottare se il numero di slot è variabile Cosa succede se il numero di slot a

disposizione cambia ?

Page 89: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Bach o Stravinsky ?

Due persone desiderano andare insieme ad un concerto di musica classica. Una preferisce Bach, l’altra Stravinsky

Page 90: Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

Bach o Stravinsky ?

1 0

0 2

2 0

0 1

Bach

StravinskyBach

Stravinsky

Bach Stravinsky

Bach

Stravinsky

Ci sono due equilibri di Nash (Bach, Bach), (Stravinsky, Stravinsky)

Non ci sono strategie dominanti