Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

mercredi, décembre 07, 2005

Outil: Le Chronologue

[Avis de décès: le Chronologue ne fonctionne hélas plus, le moteur Dir.com sur lequel il s'appuyait étant moribond. Désolé...]

Le Chronologue est un outil qui permet de visualiser de façon graphique l'évolution de termes sur le Web francophone au cours du temps (il ne s'agit pas du nombre de requêtes comme pour Google Zeitgeist, mais du nombre d'apparition du terme dans les pages elles-mêmes -- voir explications ici).


dir.com
Chronologuez :



relatif absolu



dir.com Astuce Utilisez des guillemets pour chercher une expression exacte

Bonne Chronologie! -- mais attention, ce n'est qu'un petit proto sans prétention: il y a encore du bruit, des problèmes divers (par exemple, la période allant du 1er septembre à la mi-octobre n'est pas très fiable pour l'instant).


Post-scriptum

Bilan de la première journée d'utilisation
  • Il y a eu près de 4800 requêtes sur le Chronologue en 24 heures. Je ne pensais pas qu'il rencontre un tel succès!
  • Vos commentaires ont été très nombreux et très pertinents (aussi bien ici que sur cet autre billet). J'ai essayé de répondre aux questions au fur et à mesure, mais il faudra décidément que j'essaie de faire une "FAQ".
  • Il faut prendre cet outil pour ce qu'il est: un petit démonstrateur sans prétention. Je ne suis qu'un "agitateur d'idées" pas un développeur industriel. J'essaie de modestement de montrer ce qu'on pourrait faire dans le domaine, d'ouvrir quelques pistes...

89 Commentaires:

Blogger Gabrouze a écrit...

Bravo !!!
l'idée est très bonne. Et les résultats trés intéressants.

07 décembre, 2005 08:13  
Anonymous Anonyme a écrit...

Bonjour,

Le moteur ne serait-il pas biaisé vers des dates récentes? Je m'explique : en faisant une recherche sur Cécilia Sarkozy, ou Nathalie Marquay, il me semble que l'on devrait avoir des pics vers Aout Septembre, puisque ca a fait la "une" en été. Or le graphique reste plat en ces périodes. Peut-être pourriez vous expliquer cela?

Amicalement,

Marc

07 décembre, 2005 09:55  
Blogger Jean Véronis a écrit...

Marc> Il me semble qu'on en a surtout parlé fin août (mais je ne suis plus très sûr), or nos graphiques commencent en septmbre. Quoi qu'il en soit, vous avez sans doute raison: le système est sans doute moins "sensible" sur le mois de septembre. Philippe a fait ensuite des correctifs importants sur le moteur qui améliorent fortement les choses.

07 décembre, 2005 10:10  
Anonymous Anonyme a écrit...

On ne peut pas être surpris de la corrélation entre racaille et sarkozy. Par contre, j'ai ajouté choucroute et depuis, je doute de la pertinence de cet outil.
Mouiii, il faut faire quelques réglages ?

Julien.

07 décembre, 2005 10:47  
Blogger Jean Véronis a écrit...

Julien> C'est sûr qu'il faut faire des réglages. Ceci étant, ça n'est pas la faute de Sarkozy si octobre-novembre c'est la saison de la choucroute et qu'on en parle un peu partout! Il faut se méfier des corrélations, qui n'indiquent pas nécessairement rapport de cause à effet. Autre exemple: le pic "vendanges" et le pic "Sarkozy" correspondent assez bien...

07 décembre, 2005 11:14  
Anonymous Anonyme a écrit...

Super ! Vous avez essayé avec Aixtal et Veronis par exemple ?

07 décembre, 2005 11:19  
Anonymous Anonyme a écrit...

Excellent outils, merci beaucoups.

Serait-il envisageable de ne faire des recherche que dans des pages d'un pays donné (les pages en .be ou en .fr )?

07 décembre, 2005 11:28  
Blogger Jean Véronis a écrit...

Nico> Vous avez essayé avec Aixtal et Veronis. Bien sûr (ego quand tu nous tiens!). C'est amusant parce qu'il y a un pic très fort sur "Véronis" début novembre: ce sont mes billets sur Racaille et sur les AdWords de l'UMP qui ont été beaucoup repris. Par contre il y a un deuxième pic, sur Aixtal, celui-là, à la mi-novembre, et là ce sont mes histoires de "nuages" qui ont bien plu. Comme quoi, le "grand public" me cite plutôt comme Véronis, et les geeks comme Aixtal!

07 décembre, 2005 11:42  
Blogger Jean Véronis a écrit...

Vincent> Serait-il envisageable de ne faire des recherche que dans des pages d'un pays donné (les pages en .be ou en .fr ) Techniquement, ça ne paraît pas impossible, mais aurons-nous le temps et l'énergie? En tous cas la suggestion est très bonne, merci!

07 décembre, 2005 11:48  
Blogger Loran a écrit...

Tres fort.
Bravo.

07 décembre, 2005 12:12  
Anonymous Anonyme a écrit...

Effectivement, c'est a la fois une super idee et une super realisation. Cela dit, un outil pour faire des correlations de maniere automatique, ca fait froid dans le dos. Par exemple, le cas suivant : http://www.up.univ-mrs.fr/cgi-veronis/chronologue?mot1=racisme&mot2=sarkozy&mot3=demagogie&mot4=dictature&mot5=policier&mot6=genocide&Soumettre=Soumettre

07 décembre, 2005 12:23  
Blogger Jean Véronis a écrit...

Marc> J'ai fait une modif qui semble améliorer les choses sur septembre octobre, bien que je ne sois pas encore 100% satisfait...

07 décembre, 2005 13:25  
Anonymous Anonyme a écrit...

Idée extrêmement intéressante mais quelle unité de mesure est représentée sur l'axe des ordonnées ?

07 décembre, 2005 15:39  
Anonymous Anonyme a écrit...

Epatant.

07 décembre, 2005 16:44  
Blogger J2J2 a écrit...

Jean, Google serait-il black listé, ou considéré comme un stop word?
Il n'y a aucune courbe pour Google.

07 décembre, 2005 17:02  
Blogger TOMHTML a écrit...

Oups, j'avais pas vu qu'il y avait un autre post sur votre nouveauté

et comme Jérôme, je m'interroge sur la non-présence de Google (cf commentaire sur autre post)...

07 décembre, 2005 20:11  
Anonymous Anonyme a écrit...

On peut très bien voir ici: http://www.up.univ-mrs.fr/cgi-veronis/chronologue?mot1=oui&mot2=non

Que le oui est majoritaire en novembre.

07 décembre, 2005 21:04  
Blogger Jean Véronis a écrit...

Jérôme, Tomhtml> Google: oui, et je vois avec étonnement que Yahoo et MSN sont absents aussi. Bizarre, parce que quand on entre ces requêtes à la main dans l'interface web de dir.com on a des résultats. A voir.

07 décembre, 2005 21:29  
Blogger Jean Véronis a écrit...

Aiz> L'unité sur l'axe des ordonnées est le nombre de fois par rapport à la moyenne (qui est la ligne horizontale à la position 1). Donc, par exemple un pic à 2 veut dire 2 fois plus important que la moyenne pour ce mot.

07 décembre, 2005 21:31  
Blogger TOMHTML a écrit...

Oui en fait l'axe des ordonnées est trompeur : Villepin est "au dessus" de Sarkozy, mais c'est sans compter que Sarkozy est contenu dans 552000 pages, tandis que Villepin est contenu dans 421000 pages "seulement".

Jean, on se colle de près ! ^^

07 décembre, 2005 21:58  
Blogger Tom Roud a écrit...

Bonjour,
l'outil est très intéressant. Cependant, il me semble qu'il y a un biais, que vous pouvez peut-être corriger : si on rentre des noms hors "actualités" récentes, des noms communs ou des noms mal orthographiés, on voit clairement une corrélation, avec des pics au 3/4 de Septembre et au premier quart d'Octobre. Regardez par exemple :

http://www.up.univ-mrs.fr/cgi-veronis/chronologue?mot1=Raffarin&mot2=Sarkozi&mot3=peu-etre&mot4=charrette&mot5=&mot6=&Soumettre=Soumettre

En tous cas, merci pour ce blog toujours très instructif !

07 décembre, 2005 23:38  
Blogger J2J2 a écrit...

Oui, très étrange que Google, Yahoo et MSN soient absents. Et surtout très dommage, ça aurait permis de comparer avec les graphes des résultats "manuels" publiés par Olivier hier dans son billet Quand les moteurs de recherche occupent l'espace média...

08 décembre, 2005 10:30  
Blogger Vicnent a écrit...

Halalala !!!
De plus en plus fort !!!
Je propose la loi de "Moore II" : tous les 6 mois, le Blog de Jean est 2x plus intéressant qu'avant. Et "Dieu" sait qu'il l'est déjà...
Pour ce dernier outil, je n'ai qu'un mot : "Enorme" (au sens de Fabrice Luchini)
Comme d'hab', moi je dis Encore !!!!!

08 décembre, 2005 11:41  
Anonymous Anonyme a écrit...

je constate fréquemment un "pic" aux alentours de septembre, auquel je ne trouve pas d'explication, quel que soit le mot : femme, colle, enfant, sexe, etc.
pourquoi ?

08 décembre, 2005 12:28  
Blogger Jean Véronis a écrit...

Anonyme> Quelques problèmes chez dir.com... J'ai ré-étalonné etpour l'instant c'est bon, mais les résultats sont instables. Je serai peut-être obligé de fermer l'outil temporairement en attendant que ça se tasse. A suivre.

08 décembre, 2005 14:38  
Blogger TOMHTML a écrit...

Vincent, je te soutiens pleinement à propos de la loi de Moore II !


Pour Google, voici une petite comparaison sur les services Google. On remarque de sacrés pics ! Pour y voir un peu plus clair, enlevez le graphe de "Google Analytics" ;)

08 décembre, 2005 15:55  
Anonymous Anonyme a écrit...

Bonjour,

Quoique que je demande au chronologue (camion, cacahuete, egyptologue ...), la courbe est descendante sur les 15 derniers jours. Qqu'un a-t-il réussi a avoir des courbes croissantes sur cette période ?

08 décembre, 2005 17:15  
Blogger Jean Véronis a écrit...

Anonymous> courbes croissantes -- oui: "miss france 2006", "alexandra rosenfeld" (avec les guillemets)...

08 décembre, 2005 17:55  
Anonymous Anonyme a écrit...

Mais c'est absolument genial! Ceci dit, il faut faire tres attention a ne pas confondre correlation et causalite. Il se peut qu'il y ait des correlations fortuites, mais cela ne veut pas dire forcement un lien de causalite. L'interpretation des courbes necessitent dont toujours un modele.

Je suis astrophysicien, et je travaille sur un sujet qui n'est pas considere comme "chaud" (les etoiles Wolf-Rayet), mais qui est relie fortement a un sujet relativement chaud: les sursauts de rayons gammas. Je voulais comparer les deux. Mais aussi les comparer aux deux sujets les plus chauds de l'astrophysique contemporaine: la matiere noire et l'energie sombre d'un cote, et les planetes extra-solaires de l'autre. Le resultat est le suivant:

http://www.up.univ-mrs.fr/cgi-veronis/chronologue?mot1=Wolf-Rayet&mot2=%22Gamma-ray+burst%22&mot3=%22dark+matter%22&mot4=%22dark+energy%22&mot5=exoplanet&mot6=ESO&Soumettre=Soumettre

Le resultat est tres interessant! On peut voir les choses suivantes.

1. La courbe rouge des sursauts de rayons gamma est relativement periodique. Est-ce que cela est lie a la simple apparition relativement reguliere de sursaut dans l'Univers? Le taux d'apparition de ces sursauts est mal connu, mais l'apparition d'articles sur le sujet est assez reguliere.

2. Il existe des correlation temporaires entre les Wolf-Rayet et les sursauts de gamma. Ce qui est normal dans certains cas, puisque les WR sont les progeniteurs des GRBs (en tous cas les long-soft). Debut novembre la courbe des WR augmente significativement. Cela correspond assez bien au moment ou j'ai soumis 3 papiers sur les WR sur arxiv.org... Correlation? Causalite?...

3. Dark matter et Dark energy sont bien correlees. Je continue a penser que ce sont les deux plus grosses farces de l'astrophysique moderne, mais les publications sur le sujet sont enormes. A ce propos, il est plutot etonnant de voir des courbes assez peu constantes. Le nombre de papiers sur le sujet est constant et volumineux. Pourquoi la courbe change autant? Est-elle sensible a l'apparition des termes dans la presse non-specialisee, qui elle n'est pas constante?...

4. On ne peut pas comparer les courbes des planetes d'un cote, de la dark energy et dark matter d'un autre, et les WR et GRBs de l'autre, puisque l;echelle est relative. Si l'on pouvait choisir de faire figurer les courbes mais avec une echelle absolue (connaissant la valeur moyenne), on pourrait peut-etre mesurer l'importance relative entre les sujets.

Je crois que je vais continuer a lire assidument le blog de Jean Veronis, avec beaucoup beaucoup de plaisir. Merci!
Cédric

08 décembre, 2005 18:33  
Anonymous Anonyme a écrit...

C'est gé-nial !
Les perspectives sont énormes... merci de mettre cet outil à disposition !

Encore bravo

08 décembre, 2005 18:45  
Anonymous Anonyme a écrit...

interessant comme outil de veille concurrentiel !!

je viens d'en parler sur mon blog

08 décembre, 2005 18:54  
Anonymous Anonyme a écrit...

J'ai lu et relu les commentaires, mais c'était hier et j'ai une mémoire très courte... donc je ne sais pas si ça a été dit, déjà :
n'aura-t-on pas pour n'importe quel terme une augmentation dans les dates les plus récentes ? En effet, les anciennes pages peuvent disparaître, par exemple... et ne plus être indexées.

Je dis sans doute une idiotie...

08 décembre, 2005 23:32  
Blogger Jean Véronis a écrit...

Misdre> Oui, tout à fait: les anciennes pages disparaissent progressivement, ou sont mises à jour (et changent donc de date). Mais je pars de l'hypothèse que cette tendance affecte tout le web et par des statistiques appropriés, je "soustrais" cet effet global.

09 décembre, 2005 07:00  
Anonymous Anonyme a écrit...

Jean, cet outil est génial ! Faites qu'il soit disponible à nouveau rapidement ! Je poste mes remarques et desiderata d'utilisateur sur mon blog :

http://vanb.typepad.com/versac/2005/12/suivre_les_conv.html

versac

09 décembre, 2005 10:50  
Anonymous Anonyme a écrit...

L'outil est super, mais que penser des médias ? Cela laisse perplexe sur les informations qu'on nous donne et à quel moment !

09 décembre, 2005 18:26  
Anonymous Anonyme a écrit...

Super idée

J'irai meme jusqu'à dire que le moteur devrait l'integrer définitivement car c'est tres utile d'avoir une vision historique quand on effectue une recherche
incroyable que google n'ai pas mieux paufiné ce point sur son moteur avant

vivement que ça fonctionne a nouveau !

10 décembre, 2005 09:28  
Anonymous Anonyme a écrit...

Pourquoi la recherche du mot Google a une fréquence de 0 ?

30 décembre, 2005 10:28  
Anonymous Anonyme a écrit...

Superbe outil !
j'en ai fait un article sur mon site d'actu en faisant bien entendu un lien vers votre superbe site que j'ai découvert par hasard mais qui est très instructif !
Euh l'article ne paraitra que l'année prochaine !
Weetabix

31 décembre, 2005 16:51  
Anonymous Anonyme a écrit...

Très bon outil!

Sympa pour analyser les tendances politiques...

=)

03 janvier, 2006 14:36  
Anonymous Anonyme a écrit...

Ou encore les décisions Politique :

Légalisation du Peer to Peer mi-décembre par la loi Davdsi.


Il serait interressant de créer un espace de diffusion des différentes analyses des internautes...

moi je suis partant ;)

03 janvier, 2006 16:24  
Blogger Stephane MOT a écrit...

Précieux : face à une multitude d'outils autrement plus sexys et riches (ie text mining), le votre a le merite de l'instantanéité, de la simplicité (usage, compréhension, pédagogie...), de la neutralité et, ce qui ne gache rien, de la gratuité !

09 janvier, 2006 10:52  
Anonymous Anonyme a écrit...

Concernant le chronologue, les comparaisons entre différentes personnes sont elles réellements possibles ? Je veux dire, d'un point de vue graphique, les moyennes n'étant pas les mêmes, on ne peut pas comparer les "popularités" des mots. On sait juste si on en parle plus. Ai-je bien compris ?

13 janvier, 2006 12:05  
Anonymous Anonyme a écrit...

Bravo, cet outil est très intéressant, tout comme votre site tout entier. Félicitations et bonne continuation!

15 janvier, 2006 09:38  
Anonymous Anonyme a écrit...

Bonjour
ca fait un moment que je devore votre blog, et j'adore ses outils le chronologue, et le nebuloscope.
Dans l'un de vos exemples vous cherchez sarkozy, banlieues, émeutes, effectivement on peut correler.
Mais parfois on cherche un terme par exemple "ben laden" on trouve un pic aux alentours du 10 octobre, on se demande pourquoi.. Y'a-t-il quelque chose en rapport avec l'actualité? Je ne sais pas vraiment comment faire mais peut être existe-t-il un moteur de recherche dans l'actualité. Par exemple dans une période donnée, disons quelques jours avant le pic, on recherche le mot clef.. Ca donnerait peut-être une idée de la raison du pic...
Qu'en pensez vous ?
Bonne continuation.

15 janvier, 2006 15:04  
Blogger Jean Véronis a écrit...

Nicolas> toujours difficile à dire: pourquoi tel ou tel pic... Peut-être la sortie d'un livre, un événement particulier? Je ne connais hélas pas de moteur efficace pour la recherche d'actualités. J'utilise les moteurs du NY Times, ou de Libé mais il sont assez rustiques (pas de graphiques, etc.). Des journaux comme lLibé disent qu'ils traversent une crise, le passage du papier au net en gros. Ne faudrait-il pas qu'ils proposent des outils sophistiqués qui attireraient et fidèliseraient le lecteur électronique?

15 janvier, 2006 15:58  
Anonymous Anonyme a écrit...

Sans le savoir, je tombe en plein dans la conversation: Ma question était "Pourquoi ce pic?" mais je me demandais s'il était possible de superposer les courbes des n plus gros scores de la période immédiatement suivante. Cela pourrait aider, de savoir ce qui a remplacé le mot-clé dans le buzz. (Peut-on l'employer ainsi, le buzz?).
En tout cas, bravo et merci pout tout.

19 janvier, 2006 16:16  
Blogger Jean Véronis a écrit...

Francois> Afficher les n plus gros scores -- Si je comprends bien ce que vous suggérez, il faudrait savoir quels sont les mots qui appaissent en remplacement d'un mot qui s'éteint. Pas facile comme problème!

22 janvier, 2006 20:24  
Blogger Jean Véronis a écrit...

Gilda> Merci, c'est gentil. Sablier est une bien bonne lecture. Un petit moment de poésie quotidien...

22 janvier, 2006 20:28  
Anonymous Anonyme a écrit...

Il serait vraiment intéressant, d'un point de vue de l'étude de la néologie, de pouvoir remonter de quelques années. J'ai bien tenté le coup avec 48 mois mais l'outil ne semble pas le supporter. Est-ce que ce serait bien difficile à faire pour vos collègues du côté de moteur de recherche?

Merci pour cet outil fantastique!

23 janvier, 2006 20:05  
Blogger Jean Véronis a écrit...

Lui> Ah oui, ce serait merveilleux! malheureusement, c'est impossible, pour des raisons techniques...

23 janvier, 2006 20:44  
Anonymous Anonyme a écrit...

Tout simplement merci pour ces petits outils simples et magiques que sont le nebuloscope et le chronologue... en espérant pérennité et amélioration constante ;-)
A2B
www.miticblog.com

26 janvier, 2006 16:06  
Anonymous Anonyme a écrit...

Merci infiniment de nous laisser jouer avec ce merveilleux gadget.
Personnellement, je suis émerveillée par les "nuages" de mot. A part la beauté du geste, ça sert à quoi? C'est pour concurrencer google? ça me fait un peu penser aussi à kartoo.com et ses jolies planètes.

27 janvier, 2006 20:55  
Blogger Jean Véronis a écrit...

Briconcella> concurrencer Google -- n'allons pas jusque là... J'essaie juste d'illustrer quelques petites idées comme ça. Oui, ça ressemble un peu à Kartoo. L'idée de Kartoo est bonne; avec quelques améliorations ça pourrait être un bel outil.

27 janvier, 2006 21:22  
Blogger neofutur a écrit...

bonjour, j'utilise votre outil depuis quelques semaines, et je tenai a vous signaler un
pic
comme je n'en avai encore jamais vu.


A signaler : les petits pics précédents comme 'spip-contrib' sont deja de gros pics.

comment expliquer cela ? a ce point ?

dans l'espoir d'aider, pour le cas ou cela pourrait vous aider pour le tuning de ce fabuleux outil . . .

30 janvier, 2006 04:12  
Blogger Jean Véronis a écrit...

Neofutur> C'est une illusion d'optique... Ce que j'affiche ce sont des fréquences relatives, c'est à dire rapportées à la moyenne du mot sur la période (la ligne horizontale grise à 1). Lorsqu'un mot a une fréquence moynne très faible, comme PHPMYPIXELPAGE, et qu'il se met à apparaître d'un coup, cela fait évidemment un énorme pic, sa fréquence est multipliée par 10 ou 50... Pour des mots qui apparaissent un million de fois comme SPIP, les variations ne peuvent pas être aussi grandes et aussi brusques.

J'ai déjà repéré ce problème, et j'ai réfléchi à un autre mode de visualisation... Dès que j'ai deux minutes, je m'y mets!

30 janvier, 2006 08:49  
Anonymous Anonyme a écrit...

Intéressant. Serait-il possible d'avoir un historique plus conséquent (5 mois c'est un peu léger)? Peut servir à notre site dédié à l'étude du pic de pétrole (www.oleocene.org).
Cordialement.

30 janvier, 2006 22:09  
Anonymous Anonyme a écrit...

je suis beat d'admiration pour ce que vous avais produit je me demande quel en est la fiabilitée
mais peu importe si sa peu servir de moteur de recherche

31 janvier, 2006 01:50  
Anonymous Anonyme a écrit...

Faisons la synthèse de quelques posts... Le mode de visualisation actuel, en quantités relatives, est très intéressant et il ne faut pas le supprimer. Il serait par contre judicieux de pouvoir choisir entre cet affichage relatif et un affichage "absolu", où une expression apparaissant mille fois écraserait en effet une autre expression n'apparaissant que vingt fois.
D'autre part, un historique de taille paramétrable serait très intéressant, surtout si il permet de remonter avant septembre 2005.
N'empêche, cet outil reste passionnant, surtout pour les pauvres ingénieurs comme moi qui préfèrent le quantitatif au qualitatif. Merci encore.

31 janvier, 2006 02:05  
Blogger Jean Véronis a écrit...

Anonymous> Serait-il possible d'avoir un historique plus conséquent?> -- cette question m'est souvent posée, mais hélas, la date butoir restera le 1/9/2005. Le moteur n'était pas paramétré d'une façon qui permette d'avoir les dates de façon adéquate auparavant...

31 janvier, 2006 09:58  
Blogger Jean Véronis a écrit...

Phyvette> merci... la fiabilité est très bonne sur les pics très prononcés, par exemple une expression qui apparaît tout d'un coup, comme blog proviseur ou qui se met à être beaucoup plus employée comme "segolene royal". Elle n'est pas très bonne sur des mots ou expressions assez généraux, et dont les fluctuations semblent assez aléatoires...

31 janvier, 2006 10:00  
Blogger Jean Véronis a écrit...

Anonymmous>pouvoir choisir entre cet affichage relatif et un affichage "absolu" -- oui, c'est exactement ce que j'envisage. Le temps me manque un peu, mais ça va venir... Par contre pour l'historique j'ai déjà répondu: on ne pourra pas, techniquement parlant, remonter au de-là de sept. 2005.

31 janvier, 2006 10:02  
Blogger Dado a écrit...

Avant toutes choses, je tiens à vous présenter mes félicitations pour le Nébuloscope et le Chronologue. Comme je postais un commentaire dans le but d'émettre une remarque - que j'espère constructive - je ne voudrais que vous croyiez que je n'apprécie pas énormément ces deux outils !

Je viens de me rendre compte qu'il y a un petit phénomène qui semble parasiter les résultats. J'ai fait des recherches sur la grippe aviaire et les différents noms d'oiseaux : cygnes, canards, poules, moineaux. Mis à part "cygnes", qui connaît un pic remarquable peu de temps avant la dernière montée de "grippe aviaire" - et non simultanément ! les autres oiseaux sont moins touchés. C'est là que je me suis rendu compte que canards, poules et moineaux avaient des pics similaires, qui pouvaient laisser croire à une forte correlation entre eux. J'ai donc testé avec d'autres mots sans rapport comme lapins et lunettes :

Correlations bizarres

On observe les mêmes correlations. Il semble donc que ce soit un bruit extérieur. Savez-vous à quoi il est du ? A des fluctuations sur le nombre de pages visitées ? Si c'est le cas, ne serait-il pas alors possible de présenter, plutôt que le nombre brut d'occurences, le rapport occurences/pages visitées ?

21 mars, 2006 02:56  
Blogger Dado a écrit...

Oups! Je n'avais pas remarqué le billet publié dans l'article "La grippe aviaire a disparu" et où vous expliquez les raisons de ce bruit.

>> "En effet, le simple compte de pages pour chaque jour sur une requête donnée est assez "bruité". Des tas de paramètres entrent en jeu, comme les variations hebdomadaires (moins de pages créées ou modifiées les week-ends!) ou à plus long terme (moins de pages pendant les vacances), ou bien liées au moteur lui-même (changement de stratégie ou de fréquence de crawling, etc.). Mais ces paramètres affectent (grosso modo) tous les mots de la même manière..."

Qui plus est, je viens de réaliser que la "solution" que j'avais suggérée ne marche pas du tout, mais alors pas du tout !

Désolé donc pour ces commentaires inutiles ! :(

27 mars, 2006 15:52  
Blogger Jean Véronis a écrit...

Dado> Je m'aperçois que je n'avais pas répondu au précédent message. Toutes mes excuses: le système Blogger est très archaïque et les commentaires sur les billets anciens sont difficiles à repérer. En plus du "bruit" plus ou moins aléatoire, il faut faire attention aux corrélations: qui dit corrélation ne dit pas causalité. Si "printemps" et "CPE" montent ensemble ces jours-ci, ce n'est pas parce que c'est l'un qui a provoqué l'autre... Un exemple que je cite souvent est celui des cigognes: s'il y a plus de naissances dans les communces où il y a beaucoup de cigognes, ce n'est pas forcément parce qu'elles y ont apporté des bébés (mais peut-être simplement parce qu'elles font leurs nids loin des centre-villes, et que les jeunes couples y résident souvent, parce que c'est moins cher...). Donc, méfiance!

27 mars, 2006 19:42  
Anonymous Anonyme a écrit...

D'abord, félicitations pour cet outil très instructif quand on arrive à interpréter les résultats.

D'autre part, j'aurai voulu savoir si avec le plugin de recherche Firefox, il y avait une méthode (séparation par des virgules, des points virgules ?) pour faire une recherche sur plusieurs mots en parallèle comme sur la page de recherche . En effet, les requêtes que j'effectue le plus souvent sont des comparaisons et je ne peux donc me servir du plugin.

Merci d'avance pour la réponse.

28 mars, 2006 16:49  
Blogger Jean Véronis a écrit...

Stéphane> Oui, séparez les termes par une virgule (idem dans le Nébuloscope).

28 mars, 2006 17:02  
Anonymous Anonyme a écrit...

excellent! J'ai testé grippe aviaire et cpe et les résultats vont bien le même sens que ce que vous aviez précedemment observé entre les émeutes en banlieue et la même grippe aviaire.
Merci pour la mise à disposition d'un tel outil.

07 avril, 2006 07:53  
Anonymous Anonyme a écrit...

J'ai essayé "CPE" et "Grippe avaiaire" dans le Chronologue. On constate bien que Villepin a réussi à vacciner le web contre la grippe aviaire!

07 avril, 2006 22:14  
Blogger P. P. Lemoqeur a écrit...

Je cherchais Chronologue. J'ai trouvé et maintenant je suis accro, addicté, T.O.Cisé...

Merci.

La statistique jubilatoire, c'était pas évident...

A bientôt...

08 avril, 2006 22:01  
Blogger P. P. Lemoqeur a écrit...

Ah! J'oubliais ...

Monsieur Véronis, aviez-vous, avant que la technique permette votre travail actuel, une idée de ce que votre projet pouvait dans son application, devenir (un poil...) subversif ?

08 avril, 2006 22:21  
Anonymous Anonyme a écrit...

Magnifique outil ! Quel dommage que vous ne puissiez le faire agir rétroactivement afin que sur des termes et sujets un peu brûlants comme chômage, travail, exclusion on puisse se faire une idée de leur fortune variable, disons sur les 20 dernières années, et jeter les bases d'une "science" de l'euphémisme, de l'antiphrase et de la litote. Bravo tout de même.

12 avril, 2006 11:34  
Anonymous Anonyme a écrit...

Je me permets de mettre un lien vers un jeu que je viens de découvrir récemment et qui rejoint un peu le chronologue : les mots de l'infos. En fait, le principe est simple : il s'agit d'une bourse aux mots. On achète des mots quand on pense qu'ils vont faire parler d'eux dans l'actualité. Le cour d'un mot est calculé en fonction de sa fréquence dans un certains nombre de site web. Je trouvais le recoupement avec le chronologue intéressant... je ne sais pas si cela pourra vous intéresser par contre...
http://www.lesmotsdelinfo.com

26 avril, 2006 16:43  
Blogger moncoach-enligne a écrit...

Je clique sur le "Nouveau Plugin pour Firefox au bas de la page et Patatra !

Not Found
The requested URL /cgi-veronis/mycroft.mozdev.org/download.html was not found on this server.

Dommaaaage !

Au fait j'en profite pour poser une petite question. Olivier Ertzscheid annonce dans son blog affordance.info (http://affordance.typepad.com/mon_weblog/) "l'embauche de Jean Véronis et la reprise de son Chronologue qui devient Google Trends."
C'est vrai ?

Merci encore pour cet outil fantastique qui donne un peu de sens à cette surabondance d'information.
Pierre.

11 mai, 2006 10:23  
Anonymous Anonyme a écrit...

Bonjour,

Pourriez vous indiquer une définition plus précise du travail effectué par le Chronologue après une requête ?
Qu'entendez-vous exactement par "pages crawlées" (c'est du québécois ???).
Les pages "crawlées" correspondent-elles à celles "crawlées" par le Chornologue ou bien à ces celles "crawlées" par les internautes ?
Petite question (curiosité) : comment le Chronologue peut-il techiquement ne travailler que sur les pages "francophones" ?
Merci

Laurent

29 mai, 2006 09:35  
Blogger Jean Véronis a écrit...

Pages crawlées: ce sont les pages aspirées par le moteur quotidiennenment (avec une normalisation pour éliminer les fluctutations générales: variations saisonnieres, etc.). Contrairement à Google Trends, je ne m'occupe pas des requêtes des utilisateurs.

Pas francophones: c'est Dir.com qui fait ça, comme tous les moteurs, avec un module de reconnaissanceautomatique de la langue. Vous pouvez en faire autant sur Google ou Yahoo en réglant Langue->Français.

29 mai, 2006 09:41  
Anonymous Anonyme a écrit...

Bonjour,

Il ne fonctionne pas en ce moment, est ce normal?

21 juillet, 2006 16:42  
Blogger Jean Véronis a écrit...

>Il ne fonctionne pas en ce moment, est ce normal?

Non ;-)

Mais Dir.com est en panne ces jours-ci...

22 juillet, 2006 15:25  
Anonymous Anonyme a écrit...

Excellent petit outil qui rendra de grands services. Merci.
Je mets un lien sur mes blogs.

14 septembre, 2006 16:30  
Blogger Philippe a écrit...

Oups, il a l'air malade le Chronologue, depuis fin octobre apparemment... Je lui souhaite un prompt rétablissement ;) !

06 novembre, 2006 22:07  
Anonymous Anonyme a écrit...

@freecorp

Il a même l'air mort depuis début janvier : sarkozy = 0 selon le chronologue.

Ou alors, on ne doit pas fréquenter le même internet !

06 février, 2007 10:20  
Blogger XoF a écrit...

C'est beau et bien utile quand on s'intéresse à la langue...
J'ai un petit problème : quand on entre deux mots identiques, la courbe rouge et la courbe bleue ne sont pas exactement superposées, voire divergent carrément... snif...

15 février, 2007 19:01  
Anonymous Anonyme a écrit...

J'aimerais signaler que le serveur dir.com est de nouveau opérationnel. J'attends avec impatience le retour du chronologue.

20 avril, 2007 17:04  
Blogger Jean Véronis a écrit...

Oui, mais le crawler l'est-il ? le moteru fonctionne, mais il n'est plus alimenté en pages nouvelles (enfin, je vais quand même vérifier).

20 avril, 2007 17:10  
Blogger micami a écrit...

Coucou !!
Je ne sais pas si je ne suis pas douée (j'ai pas tellement l'âme de l'informaticien) ou si c'est mon ordi qui est vieux, mais je n'arrive pas à effectuer ma recherche, j'aimerai savoir l'occurence du mot Bordeaux au de mars 2008 à 2009, mais je n'y arrive pas.
De plus j'aimerai filtrer cette recherche dans un journal précis genre Le Monde, est-ce possible ?

Merci de me répondre,

a toute !!

22 avril, 2009 14:50  
Anonymous Health Blog a écrit...

Monsieur Véronis, aviez-vous, avant que la technique permette votre travail actuel, une idée de ce que votre projet pouvait dans son application, devenir (un poil...) subversif ?

24 janvier, 2011 13:27  
Anonymous Iam a écrit...

De plus j'aimerai filtrer cette recherche dans un journal précis genre Le Monde, est-ce possible ?

24 janvier, 2011 13:28  
Anonymous wczasy w polsce a écrit...

Oups, il a l'air malade le Chronologue, depuis fin octobre apparemment... Je lui souhaite un prompt rétablissement ;) !

15 mars, 2011 02:08  
Blogger Jean Véronis a écrit...

Le Chronologue ne fonctionne hélas plus...

15 mars, 2011 08:19  
Anonymous stephane a écrit...

Je viens de repenser à ce fabuleux outil qu'était le chronologue en lisant cette news de Clubic sur le départ de Pierre Bellanger de Skyrock

"Nombreuses discussions également sur Twitter, où les termes « Skyrock », « Pierre Bellanger » et « Difool » figuraient mardi matin parmi les sujets en vogue en France (appelés trending topics) mardi matin."

Ralala, Twitter pourrait nous mettre à disposition un chronologue !
A moins que cela n'existe déjà ?

15 avril, 2011 00:15  

Enregistrer un commentaire