Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

mardi, octobre 14, 2008

Blogs: Page Rank et Wikio Rank

Après avoir lu ma description de l'algorithme du classement Wikio, certains d'entre vous m'ont demandé : "Mais puisque le classement Wikio se base sur le nombre de rétroliens, n'est-il pas finalement plus ou moins équivalent au Page Rank de Google" ?

Bonne question en effet. La réponse est non : les deux indices mesurent des choses très différentes. En voici la démonstration.

J'ai pris le top 1000 du classement français de Wikio, et j'ai calculé le PR de Google pour chacun de ces sites. Voici le résultat sous forme de graphique. En abscisse (c'est-à-dire horizontalement), le "Wikio Rank" ; en ordonnée (verticalement) le Page Rank. Chaque point représente un blog du top 1000.


Vous voyez que les points se répartissent sous forme de nuage assez informe. Les statisticiens parmi vous savent que ce type de graphique apparaît quand il n'y a pas de corrélation entre les deux variables, ou une corrélation très faible. Il existe même un indice qui permet de calculer très précisément la "force" du lien entre les deux variables, le "coefficient de détermination". Je ne veux pas décourager les lecteurs allergiques aux maths, mais ce coefficient indique quelle est la part de la variation ("variance") d'une variable qui est complètement expliquée par l'autre. Si ce coefficient est de 1 les deux variables sont strictement équivalentes ; s'il est de 0, elle n'ont strictement rien à voir. Plus les variables sont liées, plus le nuage ressemble à une ligne droite (je simplifie ;-).

Ici, le coefficient de détermination est de 0,09. Il est donc très faible : le PR de Google permet de prédire moins de 10% de la variation du Wikio Rank.

Observons par exemple le top 20 :

WikioGoogleBlog
16http://www.presse-citron.net
27http://fr.techcrunch.com
33http://www.journaldugeek.com
44http://www.accessoweb.com/
55http://www.nowhereelse.fr
64http://fr.mashable.com
75http://www.guim.fr/blog
84http://pisani.blog.lemonde.fr
95http://jegpol.blogspot.com
105http://www.fubiz.net/blog/
117http://www.gizmodo.fr/
125http://maitre-eolas.fr
136http://www.kelblog.com/
145http://www.intox2007.info
155http://standblog.org/blog
165http://marc.vasseur.over-blog.com
176http://www.dotclear.net/log
185http://www.iphon.fr
205http://www.tapahont.info

On voit que dans le top 20, seulement deux blogs ont un PR de 7 (ce qui est très élevé : seuls des sites comme Le Monde, Le Figaro ou l'ANPE ont un PR de 8 en France). Mais si l'on regarde la chose plus en détail, on s'aperçoit que ce sont Techcrunch et Gizmodo, qui récupèrent du PR de leur équivalent en .com (qui est, lui PR8). Donc, un peu artificiel... De même, sans doute, le blog Dotclear, PR 6 (son domaine dotclear.net est PR 7).

Les autres PR 7 du top 1000 sont les suivants :

WikioGoogleBlog
27http://fr.techcrunch.com
117http://www.gizmodo.fr/
367http://passouline.blog.lemonde.fr
2527http://blog.netvibes.com/fr
7787http://featured.typepad.com/france
8577http://everything.typepad.com/france

On notera qu'à part le blog de Pierre Assouline, République des livres, les autres PR 7 sont aussi un peu artificiels, puisqu'ils héritent de leur "maison mère" (Netvibes, Typepad). Du point de vue Google, on peut donc dire que République des livres est le blog français qui se distingue de tout le reste.

A part ce cas exceptionnel, on peut donc dire qu'un blog très bien côté chez Google se voit attribuer un PR 6. Voici par exemple les dix premiers PR 6 du classement Wikio :

WikioGoogleBlog
16http://www.presse-citron.net
136http://www.kelblog.com/
176http://www.dotclear.net/blog
216http://www.vincentabry.com
246http://www.descary.com
256http://www.webdeux.info
316http://www.zorgloob.com
416http://aixtal.blogspot.com
446http://bruxelles.blogs.liberation.fr/coulisses
456http://framablog.org

Ce sont des blogs établis depuis longtemps (je pense au mien ou à Zorgloob), ou bien qui ont fait l'objet d'un gros buzz (Presse-Citron avec l'affaire Martinez) ou encore qui viennent juste d'obtenir leur PR 6 après une montée très spectaculaire (Vincent Abry). Mais ce qui est frappant, c'est que dans le top 20, on trouve des blogs très connus qui ont un PR faible : le Blog du Geek (3e) n'a qu'un PR 3 (il vient juste de faire un bon spectaculaire chez Wikio), Pisani ou Mashable n'ont qu'un PR 4...

A part quelques biais (la distribution du PR sur des sous-sites comme pour Typepad etc.), on peut dire que le Page Rank et le Wikio Rank mesurent des choses différentes.

Le PR de Google a tendance à mesurer la "visibilité" (je n'ose plus dire "influence", c'est un trop mauvais terme) d'un blog à long terme. Il cumule tous les liens présents sur le Web, alors que le classement Wikio donne une préférence à la période très récente (voir explications ici). Cela explique par exemple que ce blog ait gardé son PR 6 au cours des derniers mois alors que, comme vous l'avez remarqué, j'ai beaucoup moins publié au printemps et cet été : j'avais, comme il se doit, dégringolé dans le classement Wikio. Je remonte maintenant fortement, puisque j'écris à nouveau et que vous avez la gentillesse de me "linker". L'indice Wikio est donc beaucoup plus réactif.

De plus, le PR prend tous les liens, y compris de sites Web classiques, alors que le classement Wikio ne prend que les liens venant de flux RSS. Le PR reflète donc plus la visibilité globale (si ce n'est dans le "monde réel", mais du moins sur le Web dans son ensemble), alors que le Wikio Rank mesure la visibilité au sein de la blogosphère. Cela explique sans doute en partie la très belle performance de Pierre Assouline, dont le blog est beaucoup cité en dehors de la blogosphère (c'est le cas d'Aixtal aussi).

Il semble donc que Page Rank et Wikio Rank donnent des images différentes mais très complémentaires. Cela me laisse aussi penser que dans l'évolution future sur laquelle nous avons commencé à réfléchir collectivement, il ne faut sans doute pas trop croiser le Wikio Rank avec des critères qui se rapprochent de ceux du Page Rank (visibilité à long terme, liens hors de la blogosphère), sinon la richesse que constitue cette double mesure viendrait à s'estomper. Mais je vous laisse la parole, comme toujours...

Libellés : ,


22 Commentaires:

Anonymous Anonyme a écrit...

Attention tout de même : il m'apparaît important de préciser que le PR de la Googlebar n'est pas le PR réel des sites. En effet pour certains sites ayant tendance à vendre du lien (dont des blogs bien placés dans le classement Wikio), Google tend à baisser leur PR visible sans que le PR réel soit affecté, afin justement de décourager la vente et l'achat de lien. Toute étude sur la relation entre le PR et autre chose ne peut être fiable, sauf pour discerner quelques tendances.

D'autre part, le PR visible compris entre 0 et 10 n'est qu'une représentation du PR réel compris entre 0 et 1, selon une echelle logarithmique. Deux PR5 n'ont en fait selon toute probabilité pas la même popularité même si elle semble identique.

14 octobre, 2008 10:09  
Blogger Jean Véronis a écrit...

Sébastien> Oui, bien entendu. Nous parlons ici du seul 'PR' qui soit accessible au public, celui que Google veut bien afficher... On a vu au printemps le coup de batte de base-ball que Libération a pris sur la tête, en se trouvant soudain rétrogradé à un PR 5 ! Comme tu le dis, il peut y avoir divergence avec le 'vrai' PR utilisé en interne, mais cela va même plus loin : Google utilise désormais bien d'autres critères dans le "ranking" de résultats de recherche que le PR théorique...

14 octobre, 2008 10:14  
Anonymous Anonyme a écrit...

et quels sont les 2 blogs crédités d'un PR1, par curiosité... ?

14 octobre, 2008 10:32  
Blogger Jean Véronis a écrit...

Denis> Ah oui, tiens je n'avais pas regardé :

http://winsa.free.fr/wordpress
http://www.pasunclou.com

Connais pas...

14 octobre, 2008 10:40  
Anonymous Anonyme a écrit...

Le blog de Pierre Assouline ne profite t il pas du PR de www.lemonde.fr ?

14 octobre, 2008 10:54  
Blogger Jean Véronis a écrit...

Je ne crois pas, non. Je n'ai pas regardé la structure du site du Monde très à fond, mais il n'y a pas de lien direct depuis la Home (qui porte le PR 8), contrairement à Techcrunch.com etc. Et il y a une quantité de blgos du Monde, seul Assouline est PR7. En regardant son nombre impressionnant de liens sur Yahoo Explorer j'ai plutôt l'impression que c'est l'effet de liens externes.

14 octobre, 2008 10:59  
Anonymous Anonyme a écrit...

Merci pour les éclaircissements

14 octobre, 2008 12:11  
Anonymous Anonyme a écrit...

Si si, Assouline a un lien depuis la Home de LeMonde.fr, dans la colonne de droite sous "Les blogs invités"...

14 octobre, 2008 14:10  
Blogger Jean Véronis a écrit...

An oui, vous avez l'oeil plus aiguisé que moi ! Ce sont apparemment des liens tournants vers les derniers billets (et non vers la homme d'Assouline), qui renvoient un peu de PR, effectivement, mais de façon sans doute plus diffuse.

14 octobre, 2008 14:20  
Blogger Vicnent a écrit...

juste deux remarques de matheux.

- Tout d'abord, il est vrai qu'entre PR et ClassementWikio, il y a un monde : l'échelle de temps (120 jours contre 'pas d'échelle de temps') et le modèle de calcul (L'un des log, l'autre une pondération discrète au doigt mouillé) sont intrinséquement différents : pas étonnant de fait de retrouver le PR "aussi bien distribué", même si logiquement, on retrouve un peu plus de très gros PR devant et de petits PR derrière (Après tout, les deux utilisent les links...)

C'est bien pour cela que je voudrais tester mon modèle dont le principe est de considérer que "rien n'est jamais joué" : ie, comparer la performance réelle de 'n' blogs à (t+1) connaissant leur performance en 't' et attendue en 't+1'... (et je sais, j'ai encore des questions pertinentes auxquelles je dois répondre...)

14 octobre, 2008 15:31  
Anonymous Anonyme a écrit...

Jean,

Ton explication est limpide

Deux questions cependant

Je vois que tu dis que wikio ne mesure les blogs qu'a partir de la blogosphère.
Question 1) C'est quoi la blogosphère? Est-ce les blogs qui sont inscrits dans la base de données wikio?

Question 2) Quand on fait un renvoi vers un blog en ne citant que le nom de domaine et non pas l'article,
est-ce que cela est pris en compte dans le classement?

Thierry

14 octobre, 2008 15:35  
Blogger Jean Véronis a écrit...

Thierry>

1) C'est quoi la blogosphère? -- je ne vais pas essayer de répondre ;-) mais en l'occurrence, ce que je voulais dire, bien sûr, ce sont les blogs répertoriés par Wikio.

2) renvoi vers un blog en ne citant que le nom de domaine -- non, ces liens là ne sont pas pris en compte, sauf pour départager les ex aequo (pour lutter contre les "chaines"); mais ça va probablement changer (je prépare un post là-dessus)

14 octobre, 2008 15:39  
Anonymous Anonyme a écrit...

Merci pour vos explications! En tant que blogobéotien, une expression technique m'a laissé perplexe: "le classement Wikio ne prend que les liens venant de flux RSS" (feu-l'URSS?). J'aurais aussi deux questions:
- tous les blogs sont-ils nécessairement des flux RSS?
- wikio rank prend-il en compte des liens venant d'autres sources RSS que les blogs ?

Damien

16 octobre, 2008 10:17  
Blogger Jean Véronis a écrit...

Damien>

tous les blogs sont-ils nécessairement des flux RSS -- il me semble que ça fait presque partie de la définition, non ? Il y a peut-être ici ou là des gens qui publient des journaux oldstyle, façon 1.0, je ne sais pas. Il peut aussi y avoir quelques cas de gens qui sont sur une plateforme de blogs et qui pour une raison qui leur est propre (ou par erreur) on fermé leur flux... Dans ce cas, il ne font pas partie de la base Wikio. Mais je crois que ce doit être marginal.

wikio rank prend-il en compte des liens venant d'autres sources RSS que les blogs -- oui, Wikio prend en compte les liens provenant des médias.

16 octobre, 2008 10:23  
Anonymous Anonyme a écrit...

"sinon la richesse que constitue cette double mesure viendrait à s'estomper"

Oui.

Mais alors, il est très important de bien faire comprendre à tous ceux pour qui Wikio est LE JUGE de l'influence d'un blog, que sa méthodologie ne donne qu'une facette des choses.

Tout le problème autour de Wikio, c'est le statut hégémonique qu'il tend à prendre, pour classer les blogs.

On ne peut pas accepter qu'un classement, dont la méthodologie est partielle, soit la mesure de tout.

Trop de journalistes et agences de pub ont maintenant tendance à se référer uniquement à la position Wikio, et cela nuit aux blogs qui ne sont pas favorisés par la méthodologie Wikio. (Les blogs qui ne font pas de polémiques, notammment. La polémique étant le critère numéro 1 pour grimper dans Wikio, on le voit très bien avec Presse Citron et la polémique Martinez. Or la polémique ne devrait pas être l'alpha et l'omega du blogging).

18 octobre, 2008 03:43  
Blogger Jean Véronis a écrit...

Anonyme> Oui, vous avez tout à fait raison. Je prends moi-même ces histoires de classement avec un certain recul, comme vous l'avez sans doute constaté. J'essaie de prêcher la raison et la modération, et de défendre des points de vue alternatifs...

18 octobre, 2008 09:18  
Blogger Vicnent a écrit...

il y a des blogs sans flux rss, totalement construits à la main : l'exemple de Denis Feldmann est désespérant.

20 octobre, 2008 17:35  
Anonymous Anonyme a écrit...

"Assouline a un lien depuis la Home de LeMonde.fr"

et un encart sur la page Culture (encart permanent ou en tout cas très fréquent):

http://www.lemonde.fr/web/sequence/0,2-3246,1-0,0.html

21 octobre, 2008 01:31  
Anonymous Lunettes Rouges a écrit...

Pour ma part, j'ai du mal à comprendre l'écart entre mon classement Wikio : 1154, même pas dans votre tableau, et mon Page Rank 6, parmi les meilleurs du Monde, derrière Passou.

26 avril, 2009 02:48  
Blogger Jean Véronis a écrit...

Lunettes Rouges>Le Page Rank Google et le Wikio Rank ne mesurent pas la même chose. Le PR Google cumule les liens sur des périodes très longues, alors que le Wikio Rank est volontairement réglé sur une période courte pour donner une image dynamique de la blogosphère. En ce qui concerne mon blog par exemple, j'ai un PR de 6, mais il est dû essentiellement à des "buzz" anciens où mon blog avait été énormément cité. Il faut reconnaître qu'en ce moment il ne l'est pas beaucoup (j'écris moins, et sur des thèmes moins "porteurs"), et il est donc normal que je sois assez bas chez Wikio.

Apparemment votre blog a été assez peu cité dans une période récente. A moins qu'il y ait un dysfonctionnement chez wikio. C'est toujours possible. Je vous invite à vérifier sur la ici (merci de me dire s'il vous manque des backlinks).

26 avril, 2009 08:38  
Anonymous Lunettes Rouges a écrit...

Merci de votre réponse.
Je ne me préoccupe guère de ces classements d'ordinaire, mais là je ne comprends pas.
J'écris toujours autant, et suis toujours autant visité et cité.
Or cette liste n'est pas du tout représentative.
Pour la seule journée d'hier (un samedi, donc faible fréquentation chez moi, seulement 2311 visites), Xiti m'indique 705 visites venant de 96 backlinks. Sur ces 96 backlinks, 11 viennent du site du Monde, 4 de mon blog même, et une dizaine de sites non-blogs (wikipedia, netvibes, technorati,..). Restent, pour une seule journée à faible fréquentation, 70 backlinks venant de blogs alors que wikio ne m'en accorde que 57 en 8 mois.
Si vous voulez plus d'informations, correspondons en privé : lunettes point rouges arrowbase wanadoo point fr

26 avril, 2009 17:58  
Anonymous marcelpierre a écrit...

bravo pour ton analyse pertinente,bien vu le classement!;) effectivement nous aussi en veile Seo White on voyait que ça n'allait pas;)

17 avril, 2010 16:45  

Enregistrer un commentaire