Sapere quante persone visitano il vostro sito è utile. Sapere chi sono quelle persone è trasformativo. La differenza tra vedere “5.000 visitatori questo mese” e capire che “il 60% sono donne tra 25-44 anni appassionate di design d’interni e attivamente in cerca di servizi di arredamento” è la differenza tra marketing generico e marketing mirato che converte davvero. Google Analytics 4, attraverso la funzionalità Google Signals e un sofisticato sistema di identificazione degli utenti, offre proprio questa capacità: trasformare numeri anonimi in comprensione profonda del vostro pubblico.
Ma dietro questa magia c’è un sistema complesso che lavora su più livelli per identificare gli utenti, rispettare la loro privacy, e fornirvi comunque dati utilizzabili anche quando una parte significativa del traffico rifiuta il tracciamento. Comprendere come funziona questo sistema non è un esercizio tecnico fine a se stesso: è la chiave per interpretare correttamente i dati che vedete in GA4 e per sfruttare appieno il potenziale di Google Signals per le vostre strategie di marketing.
User ID vs Client ID: capire come GA4 identifica gli utenti

Prima di parlare di Google Signals (qui il tutorial Google su come attivarlo), dobbiamo capire come GA4 identifica gli utenti attraverso due identificatori principali.
Client ID: l’identificatore base
Il Client ID è l’identificatore predefinito di GA4. Quando un visitatore arriva sul vostro sito, GA4 genera automaticamente un numero casuale e lo salva nel cookie _ga del browser. Questo diventa il Client ID di quella persona.
Il Client ID funziona come un “badge temporaneo” per ogni combinazione browser-dispositivo. Se tornate domani dallo stesso Chrome su desktop, GA4 riconosce il Client ID e sa che siete la stessa persona. Ma funziona solo all’interno dello stesso browser sullo stesso dispositivo.
La stessa persona che visita da smartphone riceve un Client ID diverso. Se usa Firefox invece di Chrome, altro Client ID. Se cancella i cookie, perde il Client ID e ne riceve uno nuovo. Per GA4, sembrano persone diverse anche se è sempre la stessa. Conseguenza: lo stesso utente su tre dispositivi viene contato come tre utenti separati, gonfiando i numeri totali.
Su Safari e browser iOS, i cookie durano solo 7 giorni. Se un utente Safari non torna entro una settimana, il Client ID viene cancellato. Al suo ritorno, GA4 lo conta come nuovo visitatore, gonfiando artificialmente la metrica “nuovi utenti”.
User ID: il tracciamento cross-device proprietario
Il User ID risolve il problema del Client ID, ma richiede un sistema di autenticazione. È un identificatore che create e gestite nel vostro database, associato all’account utente.
Quando un utente fa login, inviate il suo User ID a GA4. Da quel momento, GA4 associa tutte le azioni al suo User ID, indipendentemente da dispositivo o browser. Se fa login da smartphone e poi da desktop, GA4 capisce che è la stessa persona perché vede lo stesso User ID.
Questo è il vero tracciamento cross-device individuale. Vedete il percorso completo: scoperta prodotto su mobile, ricerca su tablet, acquisto su desktop. Senza User ID, sarebbero tre utenti separati con percorsi frammentati.
Il limite: funziona solo per utenti autenticati. Perfetto per e-commerce, SaaS, piattaforme membership. Ma se avete un sito di contenuti dove la maggioranza legge senza fare login, il User ID copre solo una frazione dei visitatori.
Regole importanti: il User ID non può contenere informazioni personali identificabili (no email, no nomi). Deve essere un identificatore anonimo (tipicamente un UUID casuale). E dovete dichiararlo nella privacy policy.
Google Signals: il ponte tra anonimato e comprensione
Qui entra in gioco Google Signals, probabilmente la funzionalità più potente e meno compresa di GA4. Google Signals non è un identificatore come User ID o Client ID. È piuttosto un sistema che sfrutta i dati che Google ha già raccolto attraverso il suo ecosistema per arricchire i vostri dati di GA4 con informazioni demografiche e di interesse.
Come funziona Google Signals nel concreto
Quando attivate Google Signals nella vostra proprietà GA4, state autorizzando Google a fare un’associazione: prendere i dati anonimi di sessione che GA4 raccoglie sul vostro sito e collegarli ai profili che Google mantiene per gli utenti che sono contemporaneamente loggati al loro account Google e hanno attivato la personalizzazione degli annunci nelle impostazioni del loro account.
Non sta tracciando individui specifici per voi. Non vi sta dicendo “Mario Rossi ha visitato il tuo sito”. Vi sta dicendo in forma aggregata: “Una porzione dei tuoi visitatori appartiene a questi segmenti demografici e di interesse che Google ha identificato attraverso le loro attività nell’ecosistema Google”.
Pensatela così: Google sa tantissimo sui suoi utenti perché li vede cercare su Search, guardare video su YouTube, leggere email su Gmail, navigare con Chrome, usare Maps. Da questi comportamenti, algoritmi di machine learning inferiscono profili demografici (età, genere) e profili di interesse (categorie di affinità come “appassionati di fitness”, segmenti in-market come “in cerca di servizi di web design”).
Quando quell’utente visita il vostro sito mentre è loggato a Google, Signals permette a GA4 di “attingere” a quella conoscenza che Google ha già costruito. Non sta tracciando l’utente per voi in tempo reale, sta semplicemente applicando etichette demografiche e di interesse alle sessioni anonime che già stavate raccogliendo.
I tre tipi di dati che Google Signals fornisce

Google Signals arricchisce i vostri report GA4 con tre categorie di informazioni straordinariamente preziose per il marketing.
1. Dati demografici: età e genere
I report demografici mostrano la distribuzione del vostro pubblico per fasce d’età (18-24, 25-34, 35-44, 45-54, 55-64, 65+) e per genere (maschio, femmina). Questi dati vengono inferiti da Google basandosi su pattern comportamentali attraverso tutto l’ecosistema Google, non da dichiarazioni esplicite degli utenti.
Se scoprite che il 65% dei vostri visitatori più ingaggiati sono donne tra 35-54 anni, mentre pensavate di targettizzare principalmente uomini giovani, avete appena scoperto un’opportunità enorme di riallineare tutta la vostra comunicazione, le immagini che usate, i benefit che enfatizzate, persino i prodotti che promuovete.
2. Categorie di affinità: le passioni durature
Le categorie di affinità rappresentano gli interessi stabili e le passioni degli utenti. Google classifica le persone in categorie gerarchiche come “Appassionati di sport/Running e fitness”, “Viaggiatori/Viaggiatori d’avventura”, “Tecnologia/Appassionati di gadget elettronici”, “Casa e giardino/Appassionati di arredamento”.
Questi profili si costruiscono nel tempo osservando cosa cercano, quali video guardano, quali siti visitano ripetutamente. Non sono curiosità momentanee ma tratti caratteriali del loro profilo di consumatore. Se scoprite che una porzione significativa del vostro pubblico sono “Appassionati di green living” o “Foodie e gourmet”, potete costruire tutta la vostra narrativa di brand attorno a valori e temi che risuonano con quelle passioni.
La struttura gerarchica è importante: non siete limitati a macro-categorie. Potete scendere a livelli di dettaglio come “Media e intrattenimento/Amanti dei film/Appassionati di cinema d’autore” oppure “Business e industria/Imprenditori e professionisti/Consulenti e freelance”. Questa granularità permette targeting pubblicitario estremamente preciso quando create campagne su Google Ads o altri canali.
3. Segmenti in-market: le intenzioni d’acquisto attive
I segmenti in-market sono forse i dati più immediatamente spendibili perché rappresentano intenzioni d’acquisto attive nel presente. Google identifica utenti che stanno attivamente ricercando, confrontando prezzi, visitando siti di e-commerce, leggendo recensioni per specifiche categorie di prodotti o servizi.
La differenza tra affinità e in-market è cruciale. Un utente può essere “appassionato di fotografia” (affinità) perché guarda tutorial su YouTube e legge blog di fotografia. Ma quando diventa “in-market per fotocamere reflex digitali”, significa che sta confrontando Canon vs Nikon, leggendo recensioni su Amazon, visitando siti di negozi fotografici. È in modalità acquisto attiva, non solo curiosità passiva.
Se vedete che una porzione significativa dei visitatori del vostro sito di consulenza sono in-market per “software di gestione progetti” o “servizi di marketing digitale”, avete un’intelligenza strategica d’oro. Potete costruire landing page specifiche che parlano esattamente a quelle intenzioni, offrire contenuti che rispondono alle domande che stanno ponendosi in questa fase di ricerca, creare campagne di remarketing con messaggi del tipo “Stai valutando soluzioni di X? Ecco perché la nostra è diversa”.
I limiti e le realtà di Google Signals
Google Signals sembra magico, ma ha limiti importanti che dovete capire per interpretare correttamente i dati.
Primo limite: copertura parziale del traffico. Google Signals fornisce dati solo per utenti che soddisfano tre condizioni simultanee: devono essere loggati al loro account Google mentre visitano il vostro sito, devono aver attivato la personalizzazione degli annunci nelle impostazioni del loro account, e devono aver accettato i vostri cookie di tracciamento tramite il banner di consenso.
Nella pratica, questo significa che vedrete dati demografici e di interesse tipicamente per il 30-70% del vostro traffico totale, con variazioni enormi a seconda del tipo di sito e dell’audience geografica. Siti italiani ed europei tendono ad avere percentuali più basse perché gli utenti europei sono più attenti alla privacy e meno propensi ad accettare tracking. Utenti che navigano in incognito, che usano ad blocker aggressivi, o che semplicemente hanno disattivato la personalizzazione annunci non contribuiranno mai ai dati demografici.
Secondo limite: soglie di privacy. Google applica automaticamente soglie rigorose per proteggere l’anonimato. Se una particolare combinazione di dimensioni (ad esempio “donne 25-34 interessate a design d’interni che hanno visitato la pagina X”) ha meno di circa 50 utenti, Google nasconde completamente quei dati nei report. Questo previene che qualcuno possa dedurre informazioni su individui specifici incrociando dati demografici con altri parametri.
Per siti con poco traffico (sotto i 500 utenti al giorno in media), queste soglie possono rendere i dati demografici praticamente inutilizzabili perché troppe combinazioni finiscono sotto la soglia e vengono nascoste. Vedrete messaggi come “dati nascosti per proteggere la privacy dell’utente” o semplicemente celle vuote nei report. Questo è un problema noto di GA4 con Google Signals attivo, e non c’è modo di aggirarlo se non aumentando il volume di traffico o allargando i periodi di analisi per accumulare più dati.
Terzo limite: non è tracciamento cross-device individuale. Questa è probabilmente la confusione più comune. Google Signals non fa quello che fa il User ID. Non vi mostra che lo stesso individuo ha visitato da tre dispositivi diversi. Non ricostruisce percorsi cross-device per singoli utenti identificabili nei vostri report.
Quello che fa è più sottile: fornisce intelligence aggregata sul tipo di persone che visitano il vostro sito. Vi dice “hai un segmento significativo di uomini 45-54 appassionati di tecnologia”, ma non vi traccia il percorso del signor Mario Rossi attraverso i suoi dispositivi (a meno che Mario non faccia login sul vostro sito, nel qual caso state usando User ID, non Signals).
Come GA4 costruisce i report: la gerarchia delle identità
Ora che abbiamo capito i singoli identificatori, vediamo come GA4 li usa insieme per costruire i report che vedete nell’interfaccia. Questo sistema si chiama Reporting Identity ed è configurabile nelle impostazioni della proprietà GA4.
Le tre opzioni di Reporting Identity
GA4 offre tre modalità per decidere quali identificatori usare quando aggrega i dati nei report. La scelta che fate impatta direttamente il numero di utenti che vedete nei report e quali funzionalità di intelligence sono disponibili.
1. Blended (Modalità Mista) – Default
Questa è l’opzione predefinita quando create una nuova proprietà GA4. Usa tutti gli identificatori disponibili in ordine di priorità decrescente: User ID > Google Signals > Device ID > Modeling.
Ecco come funziona nella pratica: per ogni evento che arriva a GA4, l’algoritmo controlla prima se c’è un User ID. Se sì, usa quello per associare l’evento a un utente. Se non c’è User ID, controlla se Google Signals può fornire informazioni (utente loggato a Google con personalizzazione annunci attiva). Se nemmeno Signals è disponibile, usa il Device ID (Client ID sul web, App Instance ID su app). Se anche il Device ID manca (utente ha rifiutato tutti i cookie), ricorre al modeling basato su machine learning per stimare il comportamento.
Il vantaggio di Blended è che massimizza la copertura dati: state usando tutte le frecce al vostro arco per identificare gli utenti e riempire i gap quando alcuni identificatori non sono disponibili. Ottenete accesso completo ai dati demografici e di interesse da Google Signals, e il modeling vi permette di mantenere dati rappresentativi anche quando una porzione del traffico blocca il tracciamento.
Lo svantaggio è che se avete implementato User ID e Google Signals è attivo, potreste incorrere in un fenomeno chiamato data thresholding. Quando GA4 rileva che un report potrebbe rivelare informazioni su gruppi di utenti troppo piccoli (meno di 40-50), nasconde automaticamente quei dati per proteggere la privacy. Questo può rendere alcuni report parzialmente vuoti o inaffidabili, specialmente per siti con traffico moderato.
2. Observed (Modalità Osservata)
Funziona come Blended ma esclude il modeling: User ID > Google Signals > Device ID, e basta. Se nessuno di questi identificatori è disponibile per un utente, semplicemente non compare nei vostri report.
“Observed” significa che state contando solo comportamenti direttamente osservati, non stimati statisticamente. Il vantaggio è che tutti i dati nei report sono “reali” nel senso che corrispondono a eventi effettivamente tracciati, non proiezioni statistiche. Per chi non si fida del modeling o vuole report più “puliti”, Observed è l’opzione preferita.
Lo svantaggio è che perdete una porzione di traffico nei report. Tutti gli utenti che hanno rifiutato i cookie e per i quali il modeling avrebbe stimato il comportamento semplicemente scompaiono dai vostri conteggi. I numeri di utenti in Observed saranno sistematicamente più bassi rispetto a Blended. E il problema del data thresholding con Google Signals attivo rimane identico.
3. Device-based (Basata su Dispositivo)
Usa esclusivamente il Device ID, ignorando completamente User ID, Google Signals, e Modeling. Ogni dispositivo-browser è contato come utente separato, esattamente come funzionava Universal Analytics.
Il vantaggio principale è che elimina completamente il problema del data thresholding. Se Google Signals è la causa principale delle soglie privacy che vi stanno nascondendo dati, passare a Device-based risolve immediatamente il problema. Vedrete tutti i vostri dati senza censure.
Gli svantaggi sono significativi: perdete completamente i dati demografici e di interesse (questi esistono solo tramite Google Signals). Perdete qualsiasi capacità di unificare utenti cross-device anche se hanno fatto login (User ID viene ignorato). E il vostro conteggio utenti sarà sistematicamente gonfiato perché la stessa persona su tre dispositivi conta come tre utenti.
Device-based è consigliato principalmente in due scenari: siti con basso traffico dove il thresholding di Signals rende i report inutilizzabili, oppure siti che non hanno implementato né User ID né Signals e quindi non starebbero beneficiando comunque di quelle funzionalità.
Il ruolo del Modeling nel colmare i gap

Il modeling merita un approfondimento perché è una delle innovazioni più significative di GA4 rispetto a Universal Analytics. Con normative privacy sempre più stringenti e percentuali crescenti di utenti che rifiutano cookie, il tracciamento tradizionale copre sempre meno del traffico totale. GA4 affronta questo problema usando machine learning per stimare il comportamento degli utenti non tracciabili.
Ecco come funziona: GA4 analizza i pattern comportamentali di utenti simili che hanno acconsentito al tracciamento (stessi paese, device, browser, sorgente di traffico, pagine visitate) e proietta quei comportamenti per stimare cosa stanno facendo gli utenti che hanno rifiutato. Non è precisione al 100%, ma mantiene i vostri dati statisticamente rappresentativi anche quando il 30-40% del traffico opta-out.
Il modeling è particolarmente importante per le metriche di conversione. Senza modeling, tutte le conversioni da utenti che hanno rifiutato cookie sarebbero semplicemente perse, creando un buco nero nei vostri dati di attribuzione. Con modeling attivo (disponibile solo in modalità Blended), GA4 stima quante conversioni provengono da questi utenti, permettendovi di avere dati di ROI più accurati per le campagne Google Ads.
Il modeling non è perfetto e ha limiti. Non può stimare comportamenti altamente specifici o inusuali: funziona meglio per azioni comuni come visualizzazioni di pagina, aggiunte al carrello, acquisti standard. E ovviamente introduce un margine di errore statistico. Ma in un mondo dove l’alternativa è perdere completamente il 30-40% dei vostri dati, il modeling è un compromesso ragionevole che mantiene utilizzabili le vostre analisi.
Implicazioni pratiche: quale configurazione scegliere?
La scelta della Reporting Identity non è puramente tecnica ma strategica e dipende dal vostro tipo di business, volumi di traffico, e priorità analitiche.
Se avete implementato User ID e volete sfruttarlo appieno: Iniziate con Blended o Observed per accedere ai dati cross-device. Monitorate se il data thresholding diventa un problema. Se troppi report mostrano celle vuote o messaggi di dati nascosti, valutate di disabilitare Google Signals nelle impostazioni (possibile da ottobre 2023) pur mantenendo Blended/Observed per beneficiare di User ID e Modeling senza le soglie privacy di Signals.
Se volete dati demografici e di interesse: Attivate Google Signals e usate Blended o Observed. Accettate che il thresholding potrebbe nascondere alcuni dati, specialmente se avete traffico moderato. Allargate i periodi di analisi (settimane invece di giorni) per accumulare numeri più alti che superino le soglie.
Se avete basso traffico e i report sono quasi vuoti per thresholding: Passate a Device-based per eliminare le soglie, anche se perderete dati demografici. È meglio avere dati completi anche se meno sofisticati che dati demografici parzialmente censurati e inutilizzabili.
Se non avete né User ID né Google Signals attivi: Device-based è probabilmente la scelta giusta perché non state beneficiando comunque delle funzionalità avanzate di Blended/Observed.
Ricordate che potete cambiare la Reporting Identity in qualsiasi momento senza impatto permanente sui dati raccolti. È semplicemente un filtro su come quei dati vengono aggregati nei report. Sperimentate con le opzioni diverse e vedete quale offre i report più utili per le vostre esigenze specifiche.
Vuoi sfruttare appieno Google Signals e i dati demografici per le tue strategie di marketing?
Noi di Prima Marketing ti aiutiamo a configurare correttamente Google Analytics 4 con Google Signals, interpretare i dati demografici e di interesse per il tuo pubblico specifico, e costruire campagne Google Ads performanti basate su questi insights. Non lasciare che la complessità tecnica ti impedisca di accedere a intelligence di mercato che può trasformare i tuoi risultati. Contattaci per una consulenza personalizzata e scopri chi sono veramente le persone che visitano il tuo sito e come raggiungerle efficacemente.
