Il nostro team ha trascorso innumerevoli ore a elaborare dati e rivedere numeri: non solo da una prospettiva ingegneristica ma soprattutto da acquirente, per una gestione che supporti esigenze e fornisca risposte su come e dove ogni dollaro venga speso.
Un breve recap di quello che avviene ogni giorno sulle 40 miliardi di impression che riceviamo:
- Ad stacking – con la generazione multipla di impression per un singolo o addirittura inesistente spazio pubblicitario
- Malware traffic – con la generazione di traffico di impression o click senza reale visualizzazione o interazione umana
- Quality Spoofing – con la catalogazione del proprio traffico con domini o app che in realtà non sono propri e simulano brand famosi
- False Impression enrichment – con l’arricchimento della impression con dati come localizzazione o anagrafica del cliente che in realtà sono completamente inventati od obsoleti
La lista si allunga ogni giorno e, con la crescita del mondo mobile su desktop, i sistemi di frode si sono adattati e duplicati in complessità e caratteristiche.
La frode nell’advertising rientra nella sfida quotidiana della nostra azienda, parte di un ecosistema in cui la società è intermediaria tra publishers e advertisers.
Abbiamo dunque individuato alcuni punti chiave che nel corso del tempo abbiamo fatto nostri, cambiando la nostra organizzazione e i nostri sistemi per prevenirla:
- Non fidarsi di nessuno
- Reagire velocemente
- Ogni dimensione ha importanza
- La frode è una professione
Non fidarsi di nessuno
Come DSP interagiamo con i publishers, gli advertisers e i fornitori di dati ogni giorno e utilizziamo protocolli standard per scambiare miliardi di dati. La maggior parte dei dati che otteniamo è basata su IP, user agent, coordinate geografiche, ID del dispositivo, ecc. Tutte informazioni che provengono direttamente dal publisher, dalla SSP, dagli Exchange, dagli ad server.
Ma, ed è questo il punto cui poniamo attenzione, tutto può essere falsato e non ci si dovrebbe fidare di alcuna informazione. Tutto ciò che si usa per prendere una decisione, nel nostro caso per continuare ad acquistare o meno quell’impression, deve essere verificato in ogni fase del flusso dell’utente.
Gli IP possono essere falsati usando le VPN e oggi le estensioni del browser forniscono l’accesso agli IP dei consumatori residenziali, a basso costo. Gli user agent possono essere modificati da chiunque sappia programmare.
Queste informazioni vengono trasmesse da un SDK o da un publisher o da un SSP e se analizzate abbiamo scoperto che non sono attendibili. Se l’impression non sta comunicando direttamente con il nostro sistema, ma passa attraverso un intermediario, le informazioni possono essere alterate. Se c’è un’opportunità, qualcuno lo farà.
In Bucksense abbiamo reagito a questo problema con un paio di progetti. Ogni volta che un utente tocca il nostro sistema possiamo raccogliere dati: quando facciamo una programmatic bid, quando serviamo l‘impression, quando tracciamo il click, quando seguiamo l’utente nel percorso di conversione. Raccogliere tutti i dati dell’utente in ogni momento e collegare tutti i punti dell’azione in un unico funnel è la base di questo processo di verifica.
Questi dati vengono spesso utilizzati per tenere traccia delle conversioni e fare la giusta attribution ma raramente vengono utilizzati per verificare se il traffico è legittimo. L’incrocio di tutti questi punti mostra spesso una buona presenza di attività di frode.
Alcuni esempi sono:
- siti o app che non dispongono di traffico statunitense ma sono presenti negli Stati Uniti perché i CPM sono più alti
- siti o app che simulano gli utenti mobile al posto degli utenti desktop perché sono più pregiati
- app con nomi falsi o neppure presenti negli app store
- siti o app che vendono video perché oggi più profittevoli, ma non hanno un placement video e altro ancora
Reagire velocemente
Il secondo aspetto da prendere in considerazione è la velocità. Chiunque sia coinvolto nelle truffe sa che la maggior parte dei sistemi di frode richiedono comunque l’intervento umano e questo significa che si alternano tempi operativi e di stand-by. In genere i picchi di frode durante i fine settimana, le notti, i venerdì pomeriggio quali momenti preferiti per agire.
Le frodi sono continue, vengono e vanno e si nascondono dietro una facciata perfettamente insospettabile. Identificare i siti o le applicazioni che fanno frode al 100% è facile: quelli più grandi e più sfidanti sono quelli che gonfiano i propri numeri o cambiano automaticamente i propri comportamenti, più volte al giorno.
I software di frode sono sofisticati e attivi 24 ore su 24 e non si possono combattere con il solo lavoro umano: infatti si devono automatizzare completamente l’analisi delle impression e la verifica per fornire un valido servizio. La qualità e la coerenza dei posizionamenti nel funnel del cliente vengono costantemente verificati dal nostro sistema che prende autonomamente la decisione di bloccare un posizionamento se qualcosa risulta sbagliato.
Un ritardo di una giornata nell’agire su qualcosa di analogo potrebbe costare una campagna di migliaia di dollari. Ecco perché guardiamo con sospetto alle soluzioni antifrode adv offerte sul mercato con aggiornamenti di database ogni x giorni. Lo stesso vale per il servizio di analisi post-impression che mostrerebbe solo un’immagine dei danni causati una volta che un operatore abbia avuto il tempo di controllare.
Ogni dimensione ha importanza
Quando abbiamo iniziato ad analizzare i dati dei processi sopra descritti abbiamo anche scoperto la granularità di questi eventi. Oggi chiunque si siede in qualsiasi luogo del mondo potrebbe preparare frodi su un server cloud poco costoso e generare un paio di centinaia di dollari al giorno di profitto illecito. In molti paesi queste sono cifre più alte delle paghe standard e questo incoraggia un gran numero di persone a diventare imprenditori di frode.
Quindi ci sono grandi organizzazioni che creano frodi, ma ci sono anche centinaia di attori irrintracciabili e anonimi di piccole dimensioni che tutti insieme possono rappresentare per un advertiser un danno enorme di denaro, al livello delle grandi organizzazioni aziendali di frode.
Oggi i servizi cloud come AWS, Google Cloud o Microsoft Cloud offrono IT anonimo a chiunque. La capacità di accendere un server con un click da casa offre un’arma perfetta per avviare una frode e, una volta scoperta, riavviarla 5 minuti dopo da altro luogo.
Un sistema che cerca di controllare questo comportamento non può eseguire la scansione delle frodi lavorando sulle percentuali della spesa totale. Ogni dollaro frodato su un singolo posizionamento può essere un indizio che deve essere valutato e automaticamente fermato.
In Bucksense abbiamo progettato il nostro sistema per verificare tutte le impression che transitano sui nostri sistemi. La long tail dei publishers rappresenta il traffico ad alto rendimento per campagne molto specifiche o di nicchia. Nelle stesse long tail si nascondono queste frodi.
Un sistema che non è in grado di eseguire un’analisi completa di ogni posizionamento e si concentra solo sul top del 60-70% dei principali publishers, lascerà il 30% scoperto che è quello su cui i truffatori contano.
La frode è una professione
Le frodi hanno grandi profitti e margini. E consentono di assumere eccellenti professionisti tecnici con quei soldi. Spesso questi individui sono spinti e guidati dalla sfida di “battere” il sistema.
Sono organizzati, tecnologici e collaborano tra loro per scambiarsi trucchi e scorciatoie.
L’industria AdTech che vuole combattere questo sistema, deve avere qualcuno dedicato e organizzato allo stesso modo. Combattere le frodi non può essere solo un lavoro di squadra che affronta il problema ogni volta che lo incontra. Sarebbe una guerra combattuta con armi impari.
Molte aziende danno in outsourcing la loro protezione contro le frodi a professionisti esterni. Noi stessi abbiamo collaborazioni con molte società antifrode che ci aiutano su più fronti anche se, a nostro avviso, restano strumenti utili ma non realmente risolutivi. La strategia generale di questi tool esterni può solo eseguire la ricerca o lo scan di frodi ogni x minuti e valutare esclusivamente la qualità con audit esterni.
Il solo modo di impegnarsi nella prevenzione è quello di applicare il controllo a ogni singola impression ricevuta e servita. Il campionamento esterno aiuta ma non è la soluzione.
Basta guardare i numeri che vediamo ogni giorno:
- il 5% – 8% del traffico è generato da IP né residenziali né aziendali. Principalmente servizi cloud, quindi questo significa che non si tratta di essere umani reali.
- il 5% del resto viene generato da dispositivi reali e IP ma senza vista o interazione da parte di un utente. Generati principalmente da applicazioni che funzionano in background e utilizzano connessioni utente e hardware efficaci per gonfiare i loro numeri.
- il 10% di questi sono generati da siti o applicazioni di cattiva qualità con esche a click, banner sovrapposti o video scadenti o che ricompensano gli utenti per guardare gli annunci durante la notte.
Tutto questo insieme, senza la dovuta attenzione, può bruciare ¼ del budget.
Conclusioni
Abbiamo preso il sistema antifrode molto seriamente e abbiamo investito ore di sviluppo e centinaia di migliaia di linee di codice. Non pretendiamo di aver trovato la formula perfetta, ma crediamo che siamo sulla strada giusta per mantenere le frodi al minimo.
Questa è una lotta costante e continua. I tipi di frode cambiano ogni giorno e quindi deve esserci un sistema di prevenzione.
Chi froda, lo sta facendo meglio di noi anche solo attraverso la collaborazione. C’è molto da condividere tra loro e molto poco tra gli attori del mondo AdTech.