E-mail: mensen zijn buitengewoon voorspelbaar

Mensen zijn buitengewoon voorspelbaar wat hun e-mailgedrag betreft. Dat blijkt uit de eerste grote studie naar het gebruik van e-mail. Het gedrag is zo voorspelbaar dat een algoritme - een wiskundig systeem - kan berekenen hoe lang een antwoord op een e-mail zal zijn en wanneer een e-mailuitwisseling gaat eindigen. Die informatie kan worden gebruikt in de volgende generatie van e-mailsystemen.
(Foto: Jason Rogers via Flickr)

Elektronische post of e-mail speelt een zeer belangrijke rol in het leven van een groot deel van de wereldbevolking, en men zou verwachten dat antropologen al lang grote gegevensbanken met e-mails geanalyseerd hebben om de impact van deze tamelijke nieuwe vorm van communicatie op het dagelijkse leven te bepalen.

Dat is echter niet het geval en er is vreemd genoeg niet veel geweten over hoe mensen e-mail gebruiken. De weinige studies die er geweest zijn, bekeken slechts kleine steekproeven en ze leverden weinig schokkende bevindingen op, zoals dat sommige mensen e-mails beantwoorden in de volgorde waarin ze toekomen, en dat anderen de belangrijkste mails er uit halen en die eerst beantwoorden.

Geen spam

Om iets te doen aan dat gat in onze kennis, heeft een team van de Yahoo Labs in Barcelona en Californië en van de University of Southern California de gedragspatronen bestudeerd in een gegevensbank van 16 miljard e-mails, die uitgewisseld werden tussen twee miljoen mensen gedurende verschillende maanden. "We denken dat onze studie de eerste grootschalige analyse is van e-mailconversaties", zo zei teamleider Farshad Kooti. 

Aangezien veel e-mail die mensen krijgen, spam is of automatisch verstuurd wordt, koos het team er voor om enkel die e-mails te bestuderen die tussen twee individuen werden uitgewisseld, in een conversatie die minstens uit vijf uitwisselingen bestond.

De 16 miljard e-mails kwamen van de e-mailaccounts van twee miljoen unieke gebruikers die toestemming gegeven hadden voor het gebruik van hun gegevens, en alleen de e-mails van commerciële domeinen en van andere Yahoo-gebruikers die mee wilden doen, werden bekeken. Van de 16 miljard mails, waren er 187 miljoen die uitgewisseld werden tussen twee gebruikers. Het zijn vooral die e-mails die onderzocht werden.

De onderzoekers konden aan de hand van informatie zoals het e-mailaders van de afzender en de ontvanger, de tijd van verzending, het onderwerp van de e-mail, de tekst van de e-mail en het aantal bijvoegsels, de statistische eigenschappen bestuderen van de communicaties tussen twee mensen.

Om de privacy van de gebruikers te garanderen, werden de afzenders en de ontvangers anoniem gemaakt, en geen enkele mens analyseerde de inhoud van teksten van de e-mails. In de plaats daarvan gebruikten de onderzoekers algoritmes om statistische gegevens te verzamelen over de tekst van de e-mails, zoals de lengte, het aantal e-mailadressen in een uitwisseling, en dergelijke.

© Sergey Nivens - www.belgaimage.be

Sneller en korter

Het team bracht de e-mails tussen individuen samen als ze hetzelfde onderwerp hadden, en rangschikte ze chronologisch. Vervolgens bestudeerde het team een aantal kenmerken van deze e-mailuitwisselingen, zoals de tijd die er voorbij ging voor er op een e-mail geantwoord werd, de lengte van het antwoord, en ook hoe deze factoren variëren naar gelang van de leeftijd en het geslacht van de afzender en dergelijke.  

De resultaten van de studie zijn interessante lectuur. Het blijkt dat jongere mensen sneller reageren, met kortere antwoorden, en dat mannen iets snellere en kortere antwoorden sturen dan vrouwen.

Ook van belang bleek de tijd wanneer een e-mail verstuurd werd. "We ontdekten dat gebruikers sneller antwoorden op e-mails die ze op weekdagen en tijdens de werkuren ontvangen, en dat de antwoorden de neiging hebben korter te worden later op de dag en in de weekends", zo zei Kooti.

Mobiele toestellen hebben ook hun impact: "Antwoorden van mobiele toestellen kwamen sneller, en ze waren korter dan antwoorden van op een desktop, en e-mails zonder bijvoegsels kregen over het algemeen sneller een antwoord."

AP2014

Overbelasting

Een fenomeen dat steeds belangrijker wordt, is een overbelasting aan e-mails. Kooti en zijn team ontdekten dat naarmate mensen meer e-mails krijgen, ze de snelheid waarmee ze die beantwoorden verhogen, maar niet genoeg om het hogere aanbod weg te kunnen werken.

Met andere woorden, naarmate mensen meer overbelast raken, antwoorden ze op een kleiner deel van de binnenkomende e-mails met kortere antwoorden. "Ze blijven echter wel antwoorden en mogelijk zelfs sneller."

Algoritme

Het team bekeek ook de verschillen tussen een e-mail en het antwoord erop, zoals het aantal woorden dat gebruikt werd en de tijd tussen verschillende antwoorden. Interessant is dat in de eerste helft van een e-mailconversatie de antwoorden meer en meer op elkaar gaan gelijken, zowel in lengte als in tijd tussen de antwoorden. Eens de conversatie over de helft is, verandert dat en wordt het antwoordgedrag in toenemende mate verschillend. 

Die patronen lieten het team toe van een "machine learning algorithm" - een stelsel wiskundige vergelijkingen die zonder tussenkomst kunnen leren van gegevens - te ontwerpen dat de verschillende stadia in de e-mailconversaties kon herkennen, en dat kon voorspellen wanneer de conversaties zouden eindigen. Het team trainde vervolgens het algoritme om het tijdstip en de lengte van de antwoorden te voorspellen, en te voorspellen of een e-mail de laatste zou zijn in een conversatie.

En hoewel de voorspellingen niet perfect zijn, zijn ze goed genoeg om een impact te hebben op de manier waarop e-mailsystemen in de toekomst ontworpen zullen worden. "Als men in staat is om nauwkeurig te voorspellen op welke boodschappen een gebruiker zal antwoorden, kan men dat gebruiken om de e-mails in de inbox van de gebruikers te rangschikken volgens welke er eerst beantwoord moeten worden. Dat kan helpen om de last van het overaanbod aan informatie te verminderen", zegt het team.

De studie kan de manier helpen vastleggen waarop algoritmes in de toekomst onze e-mails zullen behandelen. Alles wat de last van het overaanbod aan e-mails kan verminderen, kan een belangrijk onderdeel worden van de "verborgen bureaucratie van de communicatie".

Yahoo heeft een duidelijk belang in dit soort van werk, en dat maakt het verrassend dat dit soort van studie nu pas voor het eerst gedaan is. Met een beetje geluk zal het niet even lang duren voor de bevindingen van de studie verwerkt worden in toekomstige e-mailsystemen.

© stuartmiles - www.belgaimage.be