Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

mercredi, avril 27, 2005

Web: C'est plutôt yes !



J'ai montré dans mon étude d'hier que le Web francophone disait franchement non lorsqu'il s'agissait de Constitution Européenne. Le Web anglophone parle à l'inverse : en anglais c'est nettement yes ! Les statistiques semblent donc confirmer la position à part de la France dans le débat Européen.

Voici les résultats concernant le yes et le no dans les pages parlant de "European Constitution" (toujours avec Yahoo, pages en anglais cette fois -- j'ai mentionné que les comptes de Google sont faux et donc inutilisables pour ce type de travail) :

RequêteRésultats
"european constitution" yes -no5 830
"european constitution" -yes no132 000
"european constitution" -yes -no128 000
"european constitution" yes no99 500
"european constitution"371 000

Ce tableau amène une première constatation tout à fait surprenante. J'ai montré hier qu'il y avait 1 890 000 pages francophones contenant les mots "Constitution Européenne". Il n'y en a que 371 000 en anglais. Or on sait que les pages en anglais sont bien plus nombreuses que les pages en français sur le Web.

En interrogeant Yahoo avec une liste de 50 "mots" indépendants de la langue (http, www, nombres, etc.), selon une technique que j'ai décrite ici, j'ai pu estimer que le nombre de pages francophones indexées par Yahoo est (à la date d'aujourd'hui, 27 avril) environ de 5,7% le nombre de pages en anglais. Le diagramme ci-dessous montre le nombre de résultats retournés pour chacune des langues --c'est un peu technique, mais la pente de la droite de régression (en rose) indique la proportion de pages françaises.
correlation yahoo français-anglais
Je m'attendrais donc à observer environ 371 000 * 0,057 = 21 147 pages contenant "Constitution Européenne" en français. Or, il y en a près de 1,9 million, c'est-à-dire environ 90 fois plus. Le constat est sans appel : le Web confirme ce que nous savons déjà, à savoir que le débat sur ce thème fait actuellement rage en France.
Mais revenons au yes et au no. On observe que le no "sec" (sans yes dans la même page) est bien plus fréquent que le yes "sec". Il faut bien sûr, comme je l'ai expliqué hier, comparer avec les proportions de yes et no sur l'ensemble du Web anglophone :

RequêteRésultats
yes -no43 200 000
-yes no1 190 000 000
yes no163 000 000

Permettez-moi d'ouvrir une petite parenthèse linguistique sans rapport avec la Constitution: on s'aperçoit dans cette table que la proportion no/yes (secs) est bien plus grande en anglais qu'en français. On avait environ 3 fois plus de non que de oui en français sur l'ensemble du Web. En anglais c'est environ 28 fois. Cela tient sans doute au fait que le no anglais apparaît dans de nombreux rôles qui sont dévolus à d'autres mots en français (par exemple l'adjectif indéfini : "aucune loi" = "no bill").

Quoi qu'il en soit, ce qui nous intéresse ici c'est de comparer le rapport no/yes sur l'ensemble du web et dans les pages contenant "European Constitution". On s'aperçoit que ce rapport n'est plus que d'environ 23 fois dans ces dernières. Le "rapport de chances" (voir mon billet d'hier) est cette fois-ci de 1,22 (soit 22% de plus) mais en faveur du yes.

Ces quelques statistiques simples, au-delà de leur valeur récréative, montrent donc clairement que la France est déjà le vilain mouton noir d'Internet ;-)

Mais attention, ne prenez pas tout ça trop au sérieux, quand même !

7 Commentaires:

Blogger Luca a écrit...

je trouve toujours tes billets (j'espère que ça c'est la traduction en français de "post"... à l'école je n'ai jamais étudiée la terminologie du Web) très amusant et intéressant au même temps. Analyser le web (surtout Google) dans ton façon c'est (peut-être) une façon d'observer "quelque chose" que fait moi souvenir le concept de "Sémantique" utilisée par Niklas Luhmann. Si la Sémantique pour les Système sociaux c'est l'ensemble du Thème qui le Système Social même utilise pour reproduire la communication, on peut dire que en analysant Google (qui est surtout une sélection qui permit la reproduction de la communication) on analyse la Sémantique social.
Je sais d'avoir un peut banalisée la théorie de Luhmann, mais c'était seulement un idée. Qu'est que vous ne pensez?

27 avril, 2005 18:07  
Blogger Jean Véronis a écrit...

Grazie mille, Luca, per il tuo comentario. Si, un "post" è un "billet" in francese. Si dice anche un "post" (cioè, in "franglese" ;-)

Che dire... il fatto è che non la conosce bene, la "teoria dei sistemi" di Niklas Luhmann. La mia specialità è la linguistica più che la sociologia. Volevo leggere "La realtà dei mass media", ma non ho mai trovato il tempo. Forse lo farebbe...

27 avril, 2005 21:53  
Anonymous Anonyme a écrit...

Ja oder Nein...

Suite aux derniers billets, j'ai eu la curiosité d'aller faire un tour de l'autre côté du Rhin.
Le web germanophone dirait-il plutôt "Ja" ou plutôt "Nein" à cette chère constitution ?

Voici les résultats obtenus sur "de.yahoo.com" :

"europäische Verfassung" ja -nein : 11 400
"europäische Verfassung" -ja nein : 1 500
"europäische Verfassung" -ja -nein : 98 400
"europäische Verfassung" ja nein : 30 200

Total : 141 500

Petite parenthèse : nous avions 1 890 000 pages en français sur la "constitution européenne", nous avions 371 000 pages
en anglais sur l'"european constitution", nous en avons "seulement" 141 500 en allemand.
Nos voisins seraient-ils moins préoccupés par la question que nous ?

Bref, comme M. le Professeur Veronis nous l'a bien appris, il faut mettre ces chiffres en relation avec la proportion du
"Ja" et du "Nein" secs, sur les pages en allemand :

ja nein : 13 700 000
ja -nein : 145 000 000
-ja nein : 4 990 000

Et en termes de "rapport de chances", si mes calculs sont bons : en général "Ja" apparaît 29 fois plus souvent que "Nein" et, pour les textes sur la constitution il n'apparaît que 7,6 fois plus. Ceci nous donne donc 26% en faveur du non ...

Oui ou non...

Quoiqu'il en soit, n'oubliez pas d'aller voter le 29 mai prochain...

28 avril, 2005 11:13  
Blogger Jean Véronis a écrit...

Ach ! Si ces calculs sont bons (je n'ai pas vérifié) nous ne sommes pas seuls méchants moutons noirs ;-) il y en a peut-être tout une bergerie (à moins que nos voisins parlent beaucoup du Nein français, qui les préoccupe beaucoup !)

28 avril, 2005 21:30  
Anonymous Anonyme a écrit...

J'apprécie toujours vos billets, mais là je voudrais faire quelques remarques (ça englobe la note d'hier aussi):
1- Le web selon Google est-t-il un échantillon représentatif de la population ?
2- Le débat fait rage en France, certes. Mais la date n'a pas encore été fixée pour le référendum au Royaume-Uni, qui par ailleurs vote pour les législatives dans 6 jours (d'autres débats font rage !) : je ne m'étonne pas de retrouver peu de "european constitution"
3- Le web est-il plutôt un espace de propagande (votez oui ! ou votez non!) ou un espace de réflexion/débat, auquel cas une page qui dit "oui" dira aussi pourquoi elle ne dit pas "non".
Tout ça pour dire que à mon avis, ces résultats ne disent pas grand chose...
Ha j'oubliais : les anglais sont a priori franchement No : http://www.telegraph.co.uk/news/main.jhtml?xml=/news/2005/01/29/neu29.xml&sSheet=/news/2005/01/29/ixnewstop.html

29 avril, 2005 11:27  
Blogger Jean Véronis a écrit...

Vous avez raison, Nico :

>1- Le web selon Google est-t-il un échantillon représentatif de la population ?

Non !

>2- Mais la date n'a pas encore été fixée pour le référendum au Royaume-Uni [...] je ne m'étonne pas de retrouver peu de "european constitution"

Absolument.

>3- Le web est-il plutôt un espace de propagande (votez oui ! ou votez non!) ou un espace de réflexion/débat,

Peut-être un peu les deux ? Mais ce n'est qu'une impression. Je ne connais pas d'étude sociologique précise !

>auquel cas une page qui dit "oui" dira aussi pourquoi elle ne dit pas "non".

Vrai (mais j'ai quand même exclu les pages qui disent oui et non).

Miais, bon, tout ça c'est un peu comme les épriences de "physique amusante". A ne pas trop prendre au sérieux ;-)

29 avril, 2005 12:02  
Blogger Luca a écrit...

Je vais continuer à écrire en Français, si est possible. J'ai tellement peux d'occasion pour l'écrire/parler que je vais sûrement oublier tous choses.
"La realtà dei mass Media" c'est un livre très intéressant mais n'est pas le meilleur texte de Luhmann, souvent on dit que c'est le plus facile a la lecture... peut-être. Une chose que je pense être intéressant (et qui est liée à un autre comment) est que le web ne doit pas être un échantillon représentatif de al population mais seulement un lieux ou on peux observer la communication (les communications) est que Google est quelque chose qui nous permit d'oublier; ou mieux de différencier ce qu'on doit se souvenir et ce qu'on peut oublier.

29 avril, 2005 14:25  

Enregistrer un commentaire