Hoe wij bij Freeday klanttevredenheid op schaal meten

Bij Freeday verwerken onze digitale medewerkers dagelijks grote aantallen klantgesprekken via chat, e-mail en spraak. Ze helpen klanten mechaniekerafspraken in te plannen, vragen te beantwoorden, vakantiebestemmingen aan te bevelen, supporttickets te maken en meer.
Ze zijn snel, onvermoeibaar en consistent. Maar net als elk lid van je supportteam dragen ze je merk in elke interactie. Wat roept de essentiële vraag op:
Hoe weten we dat ze hun werk goed doen?
De blinde vlek van enquêtes
CSAT-enquêtes (klanttevredenheid) zijn een van de meest gebruikte manieren om de kwaliteit van support te meten. Na een gesprek wordt klanten gevraagd hun ervaring te beoordelen, doorgaans op een schaal van 1 (zeer ontevreden) tot 5 (zeer tevreden), met een optionele opmerking of duim omhoog/omlaag.
Het probleem is niet dat CSAT slecht is. Met 10-15% responspercentages is het zelfs beter dan veel andere enquêtegebaseerde statistieken. Het probleem is dat de meerderheid van de klanten, 85-90%, helemaal niet reageert.
Wat zit er in al die stille gesprekken? We hebben geen directe feedback, geen score en vaak geen idee of de klant tevreden, neutraal of gefrustreerd is vertrokken.
En zelfs wanneer klanten wel reageren, is er nog een uitdaging:
- Scores bevinden zich vaak aan de extremen: de zeer blije of de zeer ongelukkige.
- Het is moeilijk te weten waarom iemand een bepaalde score heeft gegeven, vooral als ze geen opmerking hebben achtergelaten.
Het resultaat? We eindigen met een onvolledig, vertekend beeld van de werkelijke klantervaring. Een beeld dat het risico loopt de luidste stemmen oververtegenwoordigd te hebben en het "stille midden" te negeren, waar de meeste interacties plaatsvinden.
Voor een high-volume supportoperatie, of die nu digitaal of menselijk is, is dat een serieus risico:
- Subtiele problemen die de gemiddelde klant treffen gaan onopgemerkt.
- Consequent "net oké" ervaringen worden nooit gemarkeerd voor verbetering.
- Teams kunnen eindigen met optimaliseren voor randgevallen in plaats van de algehele ervaring.
Met andere woorden, je neemt beslissingen met slechts een deel van het verhaal.
We hadden een manier nodig om die lacunes op te vullen — om betrouwbare CSAT-inzichten te krijgen voor 100% van de gesprekken, niet alleen de 10-15% waar iemand op een knop heeft geklikt.
Dus bouwden we er een.
Van gevoel naar data
In plaats van alleen op enquêterespons te vertrouwen, gebruiken we AI om te simuleren hoe een klant zijn eigen ervaring zou beoordelen, zelfs als ze nooit een enquête hebben ingevuld.
De AI bekijkt het hele gesprek, van begin tot eind, en voorspelt een score van 1 tot 5. Naast de score geeft het ook een korte toelichting, net als een klant zou doen als je vraagt: "Waarom gaf je die beoordeling?"
Om deze voorspellingen nauwkeuriger te maken, houdt de AI rekening met vijf kernfactoren:
- Oplossing: Is het probleem daadwerkelijk opgelost?
- Sentimenttraject: Is de stemming van de gebruiker in de loop van de tijd verbeterd of verslechterd?
- Toon & duidelijkheid: Was de interactie beleeft, helder en gemakkelijk te volgen?
- Efficiëntie: Verliep het gesprek soepel, of waren er vertragingen?
- Nauwkeurigheid: Was de informatie nuttig?
Het model legt ook uit waarom het die score heeft gegeven, zoals een klant dat zou doen als je het zou vragen.
Waar mogelijk voeden we de AI ook extra context. Dat omvat zaken als duim omhoog/omlaag, geschreven opmerkingen en tijdstempels. Deze signalen helpen het beter toon, tempo en het eindresultaat te begrijpen.
Hoe dicht zit AI bij de echte zaak?
Dit is de cruciale vraag. Om die te beantwoorden, moeten we eerst begrijpen wat CSAT-scores ons eigenlijk vertellen.
Hoewel CSAT vaak wordt gepresenteerd als een vijfpuntsschaal, functioneert het in de praktijk meer als een tweecatégoriesysteem: blij of onblij.
- Positieve ervaring: Scores van 4 of 5
- Negatieve ervaring: Scores van 1, 2, of 3
Wat dit betekent:
- Een verschil van één punt binnen dezelfde categorie (zoals
1vs.2,2vs.3, of4vs.5) wijst nog steeds op hetzelfde resultaat. Zowel de AI als de gebruiker waren het eens over de vraag of de ervaring positief of negatief was. - Een verschil van één punt over de grens (zoals
3vs.4) is significanter, omdat het de uitkomst omkeert van ontevreden naar tevreden (of omgekeerd).
En net zoals mensen zijn exacte scores subjectief. De 4 van de ene persoon kan de 5 van de andere zijn. Daarom beschouwen we een voorspelde 4 op een 5-interactie als een succes: de AI heeft nog steeds een positieve ervaring geïdentificeerd.
Kortom: 74% van de tijd heeft de AI het resultaat correct, wat ons een betrouwbaar, consistent beeld geeft van elke klantinteractie — niet alleen degenen die op een enquête klikken.
De voor de hand liggende volgende vraag is:
Kan AI ooit precies de score van elke klant evenaren?
Waarschijnlijk niet, en dat is prima. Hier is waarom:
1. Het menselijke element
Twee mensen kunnen bijna identieke gesprekken hebben en toch totaal verschillende scores geven. De ene heeft gewoon een goede dag en geeft een 5. De andere heeft een slechte ervaring gehad met een chatbot in het verleden (waarschijnlijk niet een Freeday-bot 🙂) en geeft een 2. Deze emotionele lagen zijn onmogelijk volledig te modelleren, zelfs met de beste AI.
2. Minder context = meer giswerk
Sommige supportchats bestaan uit slechts een paar berichten. Dat laat weinig ruimte voor het model om toon of resultaat te interpreteren. Hoe korter de chat, hoe meer giswerk vereist is.
3. De sarcasmebarrière
Zelfs beleefde sarcasme of subtiel humor kan een uitdaging zijn voor AI om perfect te interpreteren. Zo kan "Bedankt… dat was nuttig" oprecht of lichtelijk gefrustreerd zijn — context telt.
Het kernpunt: de AI hoeft niet perfect te zijn om waarde te bieden. De voorspellingen geven een betrouwbaar, consistent beeld van of een klant tevreden of ontevreden is vertrokken, wat betekenisvolle verbeteringen aandrijft.
Wat dit oplevert voor Freeday en onze klanten
Met AI-gegenereerde CSAT hebben we nu zicht op 100% van de gesprekken van onze digitale medewerkers. Dat opent geheel nieuwe mogelijkheden:
✅ We kunnen onderpresterende flows of patronen vroeg signaleren, ook als geen gebruiker klaagt.
✅ We kunnen de data segmenteren — per kanaal, team, gesprekstype of andere dimensie — om verborgen inzichten bloot te leggen.
✅ We krijgen consistente benchmarks over kanalen, teams en use cases.
✅ We kunnen prestaties continu verbeteren op basis van deze statistiek, niet alleen wanneer er toevallig feedback binnenkomt.
Voor onze klanten betekent dit dat we op schaal een hoger niveau van kwaliteitscontrole kunnen leveren.
En omdat dit systeem niet afhankelijk is van gebruikers die op een enquête klikken, werkt het stil op de achtergrond, altijd aan, altijd verbeterend.
Wat volgt
We blijven het model verfijnen, verkennen zaken als scorekalibratie over talen heen, slimmere weging van verschillende gesprekstypen en verbeteringen in randgevallen zoals sarcasmedetectie.
Maar zelfs in zijn huidige vorm geeft dit systeem ons iets dat we eerder niet hadden:
Een schaalbare, consistente, intelligente manier om de kwaliteit van elke klantinteractie te meten, niet alleen de luidruchtige.
Dit is geen leuke extra. Het is een stap naar een nieuwe standaard in klantondersteuning.
Bij Freeday passen we ons niet alleen aan aan die toekomst — we helpen die te vormgeven. En we blijven delen wat we onderweg leren.
Explore more workforce insights
Read how enterprises across industries deploy digital employees to transform operations.
FAQ
Common questions about AI agents, automation, and enterprise deployment answered.
AI agents handle repetitive workflows continuously without fatigue or error, eliminating the need for proportional headcount increases. Enterprises using Freeday reduce contact center costs by up to 92% while maintaining industry-leading CSAT scores. The agents process one million monthly calls with consistency that human teams cannot match, handling customer service inquiries, KYC verification, accounts payable processing, and healthcare intake simultaneously across voice, chat, and email channels.
Any workflow that follows consistent rules and doesn't require complex human judgment can be automated. This includes customer service inquiries, KYC verification, accounts payable processing, patient intake, appointment scheduling, booking modifications, returns management, and insurance verification. The platform connects to over 100 business applications including Salesforce, SAP, and Epic, enabling agents to access the systems your organization already uses.
Freeday maintains ISO 27001 certification with full GDPR and CCPA compliance built into the platform foundation. Security and governance requirements are not afterthoughts but core architectural principles. Your customer data and business processes receive protection that matches the sensitivity of the information involved, with enterprise-grade controls for organization-wide AI deployment.
Performance Intelligence tracks conversation metrics and auto-scores CSAT in real time, detecting issues before escalation becomes necessary. The system provides visibility into what agents are doing, why they're making decisions, and whether they're complying with regulations. This eliminates manual reporting that consumes time and introduces errors.
Freeday's architecture supports any AI model, protecting your investment as technology evolves. You're not locked into a single vendor's approach and can experiment with different models to choose what works best for your specific workflows. This flexibility ensures your platform remains current as the AI landscape changes.
Ready to learn more?
Reach out to our team to discuss your specific needs.




