AI VoiceEsperienza positivaOnline

Soluzione Credito — l'agente vocale AI che qualifica i lead al posto dell'operatore

Per Soluzione Credito abbiamo costruito un motore di chiamate outbound in cui un agente vocale AI conduce conversazioni reali, qualifica il lead e consegna all'operatore umano solo i contatti che valgono davvero il tempo.

AI Voice29 maggio 20266 min di lettura
Apri l'esperienza

In una struttura che vende servizi finanziari per telefono, il collo di bottiglia non è il prodotto. Non è il pricing. Non è la qualità degli operatori. È un numero: quanti lead un operatore umano riesce a contattare in un giorno. Tra liste sporche, numeri che non rispondono, persone che riattaccano dopo dieci secondi e contatti che non sono mai stati interessati al servizio, le ore produttive vengono diluite in attività che non producono nulla.

Per Soluzione Credito abbiamo costruito un motore che cambia la struttura del problema. Le chiamate outbound non le fa più un umano: le fa un agente vocale AI, che parla, ascolta, capisce, qualifica, e consegna all'operatore umano solo i lead che hanno superato un filtro vero. L'operatore prende in mano il telefono solo quando dall'altra parte c'è qualcuno che vale.

Il problema vero di chi vende per telefono

Vendere servizi al telefono — credito, energia, telecomunicazioni, assicurazioni — vive di tre verità scomode.

La prima: la maggior parte dei numeri di una lista non risponde mai. Numeri vecchi, persone al lavoro, blacklisting, fasce orarie sbagliate.

La seconda: della minoranza che risponde, una grossa parte non è interessata al servizio. Non per cattiva qualità della lista, ma perché la qualificazione vera passa solo da una conversazione: situazione attuale, esigenza reale, tempistiche, profilo.

La terza: tutto questo lavoro — chiamare, aspettare, sentire "no", richiamare — viene fatto da operatori umani che costano. È un'attività che brucia energia, motivazione, attenzione, su persone che dovrebbero invece concentrarsi sulla parte alta dell'imbuto: la trattativa con chi è davvero interessato.

Il risultato strutturale di questa configurazione è che un team di dieci operatori passa la maggior parte della giornata a fare il lavoro che dovrebbe essere fatto da un sistema, e una minoranza della giornata a fare il lavoro che giustifica il costo del loro stipendio.

La tesi: l'AI vocale non sostituisce l'operatore, gli libera il tempo

C'è una narrativa comune sull'AI vocale che la presenta come sostitutiva. "L'agente AI parla con il cliente al posto dell'umano." Non è la tesi che abbiamo difeso costruendo Soluzione Credito.

La tesi è opposta: l'agente AI fa la parte di chiamata che l'umano non vorrebbe fare. Le prime quattro frasi. La verifica che dall'altra parte ci sia qualcuno. La qualificazione iniziale: "ha già un finanziamento in corso, sta cercando di consolidare, sta valutando, è solo curioso". Quando — e solo quando — questa fase è superata, il sistema passa il contatto a un operatore umano, già caldo, già qualificato, con un brief generato dall'AI.

L'umano prende il telefono e parla con qualcuno che vuole parlare, su un tema che ha già espresso interesse a discutere. È un'attività che torna a essere ad alto valore aggiunto. È il motivo per cui un operatore esperto è ancora insostituibile: quando il cliente è qualificato, la conversione passa dalla qualità umana della trattativa.

Come funziona, vista dall'operatore di campagna

L'operatore di campagna — la persona che gestisce le liste e definisce gli obiettivi — entra nella piattaforma e vede una vista pulita: lead disponibili, campagne in corso, esiti.

Crea una campagna nuova in due passaggi. Sceglie i lead dalla lista (con il numero di telefono giusto per ognuno, dove sono presenti più contatti per persona), dà un nome alla campagna, conferma. La campagna nasce in stato "in attesa": è pronta, ma non ha ancora iniziato a chiamare.

Quando l'operatore preme "Avvia ora", parte il motore. Il Campaign Runner — un loop server-side che gira in continuo — comincia a pescare i lead della campagna e a dispatchare le chiamate, rispettando il numero massimo di chiamate parallele configurato (la concorrenza, una soglia che protegge l'infrastruttura telefonica e la qualità del servizio).

Da quel momento in poi, la campagna prosegue da sola. L'operatore può chiudere il browser, andare a pranzo, tornare il giorno dopo: il sistema continua. Quando una chiamata si conclude, viene scritto un CallSummary con l'esito strutturato: connessa o non connessa, qualificata o non qualificata, dettagli della conversazione, prossima azione consigliata.

La parte difficile: il tempo reale della voce

Costruire un agente che chatta in modo competente è già un problema serio. Costruire un agente che parla in modo competente è un problema di un ordine di grandezza superiore. Il motivo è uno solo: la voce non perdona la latenza.

In una chat, due secondi di attesa prima della risposta sono accettabili. Al telefono, due secondi di silenzio sono un difetto di prodotto. La persona dall'altra parte pensa che la linea sia caduta, dice "pronto?", riattacca.

Per questo, l'intera architettura del motore vocale è disegnata attorno a un vincolo: la latenza percepita tra la fine della frase del cliente e l'inizio della risposta dell'agente deve restare sotto una soglia che varia tra il sub-secondo e il secondo, a seconda del contesto della conversazione. È un requisito di prodotto, non un nice-to-have.

Per rispettarlo abbiamo costruito una pipeline che fa convivere il riconoscimento vocale in streaming, l'orchestrazione LLM via grafi di stato (LangGraph), la sintesi vocale a bassa latenza (con voci naturali realistiche), il rilevamento del turno di parola (voice activity detection on-device), e il routing telefonico via Asterisk ARI per la connessione ai centralini reali. Ogni millisecondo che si poteva togliere è stato tolto.

L'isolamento del cliente-specifico, lo sguardo al prodotto

Una scelta architetturale di fondo: il motore è oggi costruito per Soluzione Credito, ma è progettato per diventare un prodotto.

Vuol dire che ogni decisione tecnica passa per una doppia lente. Sul piano del comportamento, l'agente deve funzionare perfettamente per il caso d'uso di Soluzione Credito — qualificazione di lead per servizi di credito al consumo. Sul piano della struttura, il codice non deve incorporare quel caso d'uso a livello irrecuperabile. Stringhe magiche specifiche del cliente, prompt hardcoded, regole di business legate a un tenant: tutto vive dietro un confine pulito.

L'effetto pratico di questa disciplina è che quando il prodotto verrà generalizzato, non sarà una riscrittura. Sarà un'estrazione, modulo per modulo, di quello che è già lì.

Cosa abbiamo imparato dai primi mesi

La prima lezione: la qualità del tempo dell'operatore umano cambia in modo non lineare quando viene tolto il rumore di fondo. Un operatore che parla solo con lead qualificati non è solo "più produttivo": è anche meno stanco, meno demoralizzato, più capace di gestire bene le obiezioni reali quando arrivano.

La seconda: la varianza degli esiti delle chiamate AI è molto bassa, e in quel "molto bassa" c'è un valore strategico. L'umano ha giornate buone e giornate storte. L'agente AI esegue lo stesso copione, con la stessa qualità, alle quattro del pomeriggio come alle nove del mattino.

La terza: i CallSummary strutturati diventano, nel tempo, una fonte di intelligence preziosissima sul mercato. Sapere — su volumi grandi — quale percentuale di persone risponde "sto valutando", "ho già un finanziamento", "non sono interessato adesso ma magari tra sei mesi" è un'informazione che modifica le scelte di marketing e di prodotto a monte.

Per chi vende servizi al telefono

Se gestisci una struttura di vendita telefonica — credito, assicurazioni, energia, telco, servizi B2B — e ti riconosci nel problema strutturale di un team di operatori che spende troppo tempo nella parte bassa dell'imbuto, parliamone. Possiamo capire insieme dove l'AI vocale può togliere rumore senza togliere qualità umana dove invece serve.