Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

jeudi, mars 12, 2009

Twitter: TwitCloud

Twitter devient ces temps-ci le canal sur lequel se fait le buzz. Vous avez peut-être entendu parler du camion de bouffe coréenne, et autres histoires du même genre. Overdose ou pas, Twitter est devenu le vecteur des gros buzz, avec une réactivité jamais atteinte. Les blogs font figure de dinosaures poussifs à côté.

Alors, je me devais d'inventer le TwitCloud. Voici en temps réel ce qui s'est passé sur les 1000 derniers messages du canal Twitter #hadopi, aujourd'hui autour de 18h :



Ca le fait, non ? Créé en 5 minutes chrono.

Je ne devrais pas écrire ce post. Je vais me faire piquer l'idée...

PS: Si investisseur intéressé, laisser message ;-)

16 Commentaires:

Anonymous Anonyme a écrit...

Allez : Martine débat sur l'Hadopi à la séance de ce soir et rejette la loi - tout en liant cet article dans mon Twittou-tou ;) En attendant la Revue de ce soir ... Quel fatigue de buzzer :)

12 mars, 2009 18:51  
Blogger Loran a écrit...

comme quoi Brard est plus cité que Bloche... Etonnant... C'est peut-être un effet de la veste jaune... :o)

12 mars, 2009 19:24  
Blogger Jean Véronis a écrit...

La veste en politique, c'est tout un art : se la retourner, en prendre une. Alors au moins qu'elle soit belle !

12 mars, 2009 19:26  
Anonymous Anonyme a écrit...

Ha ha ! 5 mn, très fort ;-)

Du coup, j'ai une question : est-il possible de récupérer « facilement » à la fois le tri sémantique et à la fois les données (géographiques) des comptes d'où proviennent les mots ?
Je pense notamment à ce qu'on fait les gens du New York Times pendant le Superbowl :

http://www.nytimes.com/interactive/2009/02/02/sports/20090202_superbowl_twitter.html

Est-ce beaucoup plus compliqué ?
Chapeau pour la perf en tout cas ;-)

13 mars, 2009 00:28  
Blogger Jean Véronis a écrit...

Cheristophe> Bah, quand on a tous les outils qu'il faut, il n'y a plus qu'à assembler dans un "pipe"...

La géographie serait un poil compliquée, il faudrait écrire un peu de code, mais c'est tout à fait faisable. Le truc du NYT était superbe. Comme toujours le plus long serait la partie graphique. Pour que ça ait de la gueule, il y a tout une animation à faire en flash...

13 mars, 2009 06:22  
Anonymous Anonyme a écrit...

À Jean :

Merci pour ces précisions. Il faudrait creuser ça mais il y a surement plein de choses à faire entre Twitter et géographie ;-)

« Comme toujours le plus long serait la partie graphique. »

Oui, c'est sûr, si tu arrives à coder des choses comme ça en 5 minutes, le graphisme sera forcément plus long, je peux le confirmer ;-)

13 mars, 2009 09:06  
Anonymous Anonyme a écrit...

il y a un filtre sur les mots de 2, 3 & 4 lettres ?
parce que j'ai l'impression que c'est "rien compris" et non "compris" qui devrait figurer dans ce nuage :-)

13 mars, 2009 13:06  
Anonymous Anonyme a écrit...

Bonjour Jean,

Je vous suggère d'aller visiter notre site www.twitscoop.com qui existe depuis quasiment un an ;-)

Cordialement,

Pierre
co-fondateur de lollicode (société éditrice de twitscoop.com)

13 mars, 2009 13:51  
Blogger Jean Véronis a écrit...

Bonjour Pierre, oui je connais twitscoop. Mais sauf erreur de ma part, ça ne fait pas la même chose. Je n'ai pas vu (mais j'ai pu louper) comment avoir un nuage sur une search ou un canal précis ? De plus, le nuage de home a l'air quasi totalement anglophone (sans doute par la masse des twits, qui le sont). On peu en parler plus si vous le souhaitez : jean at veronis.fr

13 mars, 2009 16:05  
Anonymous Anonyme a écrit...

Jean > effectivement vous avez raison! (et d'ailleurs pour répondre à votre 2ème point nous ne gardons que les tweets anglophone pour avoir un corpus statistiquement significatif vu que notre nuage se construit sur l'ensemble des "tweets")

Il existe cependant qques solutions et plugins qui devraient vous intéresser dans le registre que vous avez mentionné - le plus intéressant à mon sens est Search Cloudlet (qui fait même l'exercice sur google): http://www.getcloudlet.com/
Vous pouvez également regarder du côté de tweetag.

Enfin, si vous souhaitez échanger par email >> mon prénom at lollicode point com

13 mars, 2009 17:36  
Blogger Jean Véronis a écrit...

Pierre> Oui, je comprends bien la question de l'anglais. Il faudrait insérer un détecteur de langue pour pouvoir faire un nuage général par langue. Cela me paraît tout à fait possible (bien que cela pose des problème nombreux dans le cas des twits).

13 mars, 2009 18:13  
Anonymous Anonyme a écrit...

5 min top chrono tu fais fort ;)
Si tu es près à codé la même chose avec la reconnaissance de positions géographique et quelques autres options bonus, je te fais le design / interface graphique qui tue, et on partage le pactole :p

15 mars, 2009 12:06  
Blogger Jean Véronis a écrit...

Natacha> Quand on a tous les outils, il n'y a plus qu'à les mettre en pipeline : transformation du RSS de l'API twitter en texte, calcul du lexique, génération du tag cloud... Rien de spécial !

Le plus compliqué c'est effectivement d'habiller le truc (mais je ne suis pas sûr qu'il y a ait un pactole à ramasser sur ce genre d'outils, le modèle économique doit être assez faible !)

16 mars, 2009 16:11  
Anonymous Anonyme a écrit...

Au même moment (ou presque) de l'autre côté de l'atlantique, une recherche sur le même sujet (ou presque). Les grands esprits se rencontrent sur internet.

17 mars, 2009 09:55  
Blogger Jean Véronis a écrit...

Anonyme> Ah oui. Merci du lien : je n'étais pas au courant. Il y a une telle effervescence sur le sujet que c'est sur de tenir ça veille à jour !

17 mars, 2009 10:16  
Anonymous Anonyme a écrit...

Toujours sur le sujet, et toujours de l'autre côté de l'Atlantique, deux petites choses qui vont vous amuser :

http://infosthetics.com/archives/2009/03/social_weather_mapping.html

http://infosthetics.com/archives/2009/03/social_collider_revealing_cross-connections_between_twitter_conversations.html

19 mars, 2009 14:57  

Enregistrer un commentaire