Monthly Archives: August 2006

AOL Releases Search Logs from 500,000 Users

dans un élan de générosité naïve, aol a rendu publique une énorme base de données qui révèle les recherches effectuées sur le web par plus de 500.000 de leurs utilisateurs, de mars à mai 2006, voir ici: http://www.ugcs.caltech.edu/~dangelo/aol-search-query-logs/

les entrées sont anonymisées, c’est à dire que le screen name de l’utilisateur est remplacé par un numéro identifiant. sachant que les gens pratiquent l’egosurfing, cherchent des adresses, il est probablement possible d’en identifier certains, ce qui a poussé aol à supprimer rapidement cette base de données. on peut bien entendu la trouver sur différents miroirs. le rêve éveillé de marketeux du web mal intentionnés? nul doute que dans les jours à venir, des interfaces de visualisation de ces données vont fleurir sur le web. pour l’instant on trouve quelques histoires ad-hoc comme celle du numéro 927, qui s’intéresse aux jambes cassées et à la vie sexuelle des personnages de dessin animés…

ces données sont passionnantes, fascinantes, effrayantes. elles sont biaisées par le fait qu’elles proviennent d’aol: des utilisateurs pas forcément très versés dans l’informatique. elles confirment quelques impressions bien connues: les gens utilisent les moteurs de recherche pour retrouver des url qu’ils ont la flemme de retenir (le mot clé le plus recherché, est ironiquement: google), mais aussi énormément à des fins plus ou moins avouables.

voici, au hasard, quelques extraits que j’en ai tiré, accrochez-vous bien.

Hello, my number is 3399:
playboy background for myspace
pic of a black rose
playboy cursors for myspace
listen to sexy lady by mc magic
need to lose weight in my stomach how can i do that
i’m looking for a song called sexy lady
poems for someone u miss
stupid videos
sad poems about breaking up with your love
make a slideshow for myspce
pocket bikes in austin and round rock texas
cd fulkes lizards online
how do you french kiss

Hello, my number is 2282:
wwwkingkong
hezekia come out the closet
www.find my dad.com
www.findafriend.com
wwwmissing.com
wwwyahoo.com
wwwmissingloveone.com
out of the closet
wwwmissingpersons.com
chat
wwwdaedbeatdad.com

Hello, my number is 2708:
google
wetcircle.com
makehimpay.net
jizzhut
sexy tops
free gay information
revenge tactics
thong dancewear
free email addresses
encyclopedia of revenge
how to stop loving someone
verizon.net
free stuff
weird free thingsto send someone

Hello, my number is 2761:
tomora tonioli
wholesale lobster tails
norco real estate
corona real estate
amore cheesecakes
angels
who’s who
tonioli
cheesecakes
box of lobster tails
box of frozen large lobster tails
wholesale xl twin mattresses
wholesale and discount lobster tails
who’s who in real estate

Hello, my number is 3745:
match.com
yahoo
matchcom
match.
match
google.com
help aol.com
pepper
helpaol.com

Hello, my number is 479:
wto history
citation machine
kant theory of knowledge
south suburban college
allegory of the cave
nip tuck season 3 dvd
dictionary
proofs for the existence of god
bose car decal
cranial nerves
cals
german translation
existence precedes essence
sartre man surrounded by absurdity

j’arrête là, j’ai l’impression d’être un voyeur. je réalise, en lisant cette analyse menée par John Battelle il y a 3 ans que nous tenons là une partie de la database of intentions. je n’aurais pas mieux dit:

The Database of Intentions is simply this: The aggregate results of every search ever entered, every result list ever tendered, and every path taken as a result. It lives in many places, but three or four places in particular hold a massive amount of this data (ie MSN, Google, and Yahoo). This information represents, in aggregate form, a place holder for the intentions of humankind – a massive database of desires, needs, wants, and likes that can be discovered, supoenaed, archived, tracked, and exploited to all sorts of ends. Such a beast has never before existed in the history of culture, but is almost guaranteed to grow exponentially from this day forward. This artifact can tell us extraordinary things about who we are and what we want as a culture. And it has the potential to be abused in equally extraordinary fashion.