|
(...)
Qu'est-ce que PageRank ?
Google et les autres moteurs de recherche de nouvelle génération
explorent non seulement un très grand nombre de pages, mais aussi classent leurs résultats par pertinence. Le mécanisme en est exposé dans l'article "Les secrets de Google - Tout sur l'algorithme PageRank". Cet algorithme de classement emploie un mécanisme similaire à celui de la notation des articles scientifiques : plus un article est cité et utilisé par d'autres, plus il fait autorité.
Transposé au Web, où les références sont matérialisées par des liens
hypertextes, PageRank s'appuie sur une analyse des connexions
hypertextes entre sites web. Ce qui nous amène à un premier principe :
Tout tient dans les liens hypertextes
*************************************
Dans l'océan de la Toile mondiale, un site n'existe quasiment que par
les liens qui y mènent (depuis d'autres sites). Les pages web vers
lesquelles ne pointent aucun lien sont comme des "îlots d'information isolés" et ce proverbe peut s'y appliquer parfaitement : "A quoi bon être le meilleur si l'on est inconnu de tous ?". Si vous créez un site dans un autre but que votre seule satisfaction personnelle, alors il vous faut nécessairement en faire une active promotion. Dans cette optique, toute campagne de cyberpromotion s'appuyant sur des moteurs de recherche doit considérer les tactiques suivantes :
1. L'efficacité par le nombre. Peu importe la taille du site qui parle
de vous. Toute référence est bonne à prendre. L'une des méthodes
classiques de cybermarketing consiste à s'inscrire dans un annuaire ou
portail par catégorie, tel Yahoo!, dmoz.org, etc. Cette méthode perd de son efficacité puisque aujourd'hui, les moteurs de recherche ne
tiennent pas compte du type de site dont part le lien. Ainsi, une
référence d'un site vers un autre a aujourd'hui beaucoup de valeur, quel que soit le site référent, qu'elle soit placée dans un article de journal, dans un forum de discussion, dans une archive de mail, etc. C'est pourquoi il faut toujours penser à inclure l'url de votre site dans la signature des messages que vous postez sur des forums importants.
L'intérêt des références mutuelles a été fort bien compris des
webloggeurs, car ils recourent énormément à cette technique - arrivant
très souvent avant les grands sites commerciaux dans le classement des
moteurs de recherche.
2. L'efficacité par la qualité.
Le nombre de liens ne fait pas tout : une référence venant d'un site
bien noté a plus de poids pour le classement par PageRank. Ce fut le cas
du présent site (mon site personnel) : je n'ai effectué d'inscription sur aucun annuaire spécialisé, mais j'ai en revanche posté quelques articles sur le site chinois de ZDNet. Chaque page de l'article
contenait un lien vers mon site et j'ai constaté au bout d'un certain temps que mon classement dans Google avait fait un bond. Ainsi la qualité (selon les critères de PageRank) des sites référents compte-t-elle parfois plus que leur nombre.
Il me faut d'ailleurs particulièrement remercier ZDNet Chine, qui fut le seul site à respecter mon droit d'auteur et citer la source de mes articles, et à faire figurer un lien renvoyant sur mon site.
3. Comprendre les critères de pondération des moteurs de recherche.
Prenons l'exemple de mon article expliquant Lucene (http://____). Dès qu'il fut cité depuis la page du projet Lucene sur Jakarta.apache.org, il fut propulsé en tête du classement PageRank. Or l'atmosphère universitaire de Google m'a toujours laissé soupçonner un biais en faveur des sites en .edu et autres organismes à but non lucratif :-)
Serait-ce que les sites en .edu et .org représenteraient davantage l'esprit de partage de connaissance censé prévaloir sur le Web ?
Autre explication, plus rationnelle : les sites dont les noms de domaine sont suffixés en .org sont bien souvent créés par des développeurs ou partisans de plates-formes technologiques libres, et arborent souvent en page d'accueil des mentions honorifiques de type "Powered by Apache", "Powered by FreeBSD", etc., comportant des liens vers ces plates-formes open source. Ce qui explique sans doute que les sites Apache, PHP et FreeBSD soient toujours classés en tête de l'algorithme PageRank. Quant aux sites universitaires en .edu, ils contiennent pour la plupart des articles académiques où il est de bon ton de faire de nombreuses références pour montrer que le propos est étayé - or c'est bien ce critère de notation sur lequel s'appuie PageRank.
(Attention : ne recourez surtout pas à la création d'une ferme de liens pour augmenter votre classement car Google sanctionne ce type d'agissement peu éthique : le site ne serait même plus cité dans les résultats... En revanche, n'ayez aucune inquiétude si une autre ferme de liens pointe sur vous; créé sans action de votre part, le lien est considéré valide par Google.)
Enfin, avant de se lancer dans la promotion de son site, il est nécessaire de faire un état des lieux de sa popularité. Je propose à cet effet le petit utilitaire suivant :
http://_________
Le principe en est très simple, ce document explique comment évaluer le popularité d'un site sur la Toile :
http://_________
La cyberpromotion n'est rien de plus qu'un moyen. Le but est de faire ressortir l'information contenue sur votre site afin que les utilisateurs qui en ont besoin la trouvent le plus rapidement possible. Un bon classement dans Google n'a pas du tout la même signification qu'un placement sur un portail de type Yahoo!. En effet, les résultats des moteurs de recherche tiennent compte, en plus du classement PageRank, de la correspondance entre les mots-clés apparents et le contenu réel de la page. Ce qui nous amène à un second point important :
Mise en valeur des mots-clés
****************************
1. Renseignez toujours le champ title de la page.
Une balise title vide n'est rien d'autre qu'un précieux espace gaspillé. Dans une page web classique, le code HTML contient des entêtes "cachées", dont l'utilité est de préciser la nature du contenu principal, à l'aide de mots-clés :
<header>
<meta name="keyword" content="mp3 download
music...">
</header>
Mais cette possibilité d'ajouter manuellement des mots-clés fit l'objet d'un trop grand nombre d'abus et un grand nombre de webmestres n'hésitaient pas à inscrire des mots-clés sans rapport avec le contenu réel de leur site, pour augmenter leur classement dans les moteurs de recherche. Aussi les moteurs de nouvelle génération ne tiennent-ils plus tant compte de ces meta-informations renseignées manuellement, mais plutôt des mots présents dans les titres.
2. Longueur et contenu du titre. Ne choisissez pas des titres trop longs. Comptez en général moins de 40 caractères et privilégiez-y les mots-clés importants. La fin d'un titre trop long étant généralement ignorée, placez les mots-clés autant que possible en début de titre. Laissez de côté les qualificatifs non indispensables, car les internautes effectuent leurs recherches en priorité sur des substantifs.
Quant au contenu du titre, optez pour des mots susceptibles d'être choisis comme mots-clés de recherche par des internautes (sans aller à l'excès bien sûr : si le titre comporte pour plus de moitié des mots qu'on ne retrouve pas dans le texte, le site risque d'être exclu des résultats par les moteurs de recherche). A cet effet, il est indispensable de se tenir au courant des statistiques de recherche par mot-clé des différents moteurs de recherche.
3. Si le site comprend un grand nombre de pages, variez les titres de vos pages pour qu'ils reflètent le plus richement possible le contenu du site. En effet, les moteurs évaluent la similarité des pages d'un même site entre elles et excluent du corpus les pages considérées comme redondantes. Par exemple, http://____________est un petit utilitaire proposé sur mon site, qui présente via une interface web les pages de manuel d'Unix. Dans sa conception première, toutes les pages dynamiques utilisaient le même titre : "____", et Google ne trouvait que 3000 pages de résultats. J'ai alors modifié le modèle de nommage de ces pages dynamiques, sur le modèle " phpMan:, ce qui dotait dynamiquement chaque page d'un titre différent. Un mois plus tard, Google trouvait 6000 pages de résultats. Ainsi, un site qui comprend un grand nombre de pages portant le même titre, par exemple "Actualités", "Forum", etc., risque de voir la plupart de ses pages considérées comme redondantes et écartées des résultats.
4. Outre la balise title, les balises h1 peuvent également servir à mettre en valeur les mots-clés importants et renforcer l'efficacité des intitulés de pages. Sur mon site, j'utilise la balise h1 pour mettre en évidence le titre - ce qui est beaucoup efficac que d'utiliser une taille de police différente...
http://www.people.com.cn/GB/it/1066/3014495.html
Les industriels chinois du logiciel expriment leur mécontentement vis-à-vis de la municipalité de Pékin, et menacent de saisir le Conseil d'état.
Le résultat de l'appel d'offres public pour l'acquisition de logiciels par la municipalité de Pékin vient d'être publié, il ne sera applicable qu'après le 26 novembre. Il a provoqué une fronde unanime des éditeurs nationaux qui critiquent le manque total de transparence du processus et menacent de saisir le Conseil d'état.
Au sujet de cet achat public, qualifié d'illégal, M. Li Wuqiang, vice-chef du cabinet pour le Développement et l'industrialisation des Nouvelles technologies (Ministère des sciences et techniques) déclare : "La loi sur les appels d'offre est très claire : les achats publics de logiciels doivent privilégier les produits nationaux, et ne recourir à des produits de marque étrangère qu'en l'absence d'équivalents fonctionnels chinois.(...)"
Après enquête, il semble que le bureau des achats publics de la municipalité de Pékin a tenu des négociations en "tête-à-tête" avec Microsoft, bafouant le principe de concurrence entre plusieurs éditeurs, l'appel d'offres ayant pour seul prestataire Microsoft et les négociations étant limitées à une discussion sur le prix des licences.
"Or le cas spécial de l'appel d'offre à prestataire unique ne se justifie que sous quatre conditions, dont la plus importante étant qu'il n'existe pas de produit national fonctionnellement équivalent. De toute évidence, aucune des quatre conditions n'est remplie", explique le vice-PDG de l'éditeur JinShan. "La publication de la réponse a stupéfait tous les éditeurs chinois. Nous avons tenté d'obtenir des explications par téléphone, en vain."
Un employé de la SSLL GongChuang ("Créer ensemble") explique que "la municipalité de Pékin n'a jamais fait mention d'achat de systèmes d'exploitation, à nous pas plus qu'aux autres sociétés proposant des systèmes basés sur Linux telle Red Flag. Nous savions que des achats publics étaient en préparation, mais uniquement dans le domaine des applications bureautiques".
Selon un éditeur de logiciel souhaitant rester anonyme : "Puisque cette politique est définie ainsi, il nous faut l'appliquer. On peut dire cependant que c'est un bien mauvais départ... Et Microsoft mène une campage très agressive de relations publiques, pas seulement à Tianjin ou Pékin."
Liu Jian, directeur commercial de Red Flag, explique que "il n'existe à présent aucun organisme pour veiller au bon équilibre offre-demande sur le marché logiciel face à des entités d'état tel le Bureau pour l'informatisation de la municipalité de Pékin et les sociétés de lancement d'appels d'offre (?) qui en dépendent, mais les éditeurs logiciels nationaux sauront s'allier pour faire appel et exiger des explications."
Le vice-PDG de l'éditeur JinShan explique que "nous nous allions avec Red Flag et Yong Zhong et tous les industriels qui ont répondu à l'appel d'offres, pour faire appel auprès du Conseil d'Etat et rectifier les anomalies de cet appel d'offres qui ne respecte pas notre code des marchés publics."
[traduit très vite, pour info - Muriel]
http://tech.china.com/zh_cn/news/product/891/20041126/11982794.html
http://tech.china.com 2004-11-26 10:54:33
Une délégation d'industriels chinois, représentée par un fonctionnaire du gouvernement chinois,
Li Wuqiang, soupçonne la municipalité de Pékin de ne pas respecter le code des marchés publics chinois dans ses acquisitions de logiciels. La réponse aux appels d'offre n'ayant pas encore été publiée, et le résultat étant encore incertain, la situation est propice à de vives polémiques.
Le point de vue officiel de la municipalité de Pékin
*******
Le site web de la municipalité de Pékin publiait aujourd'hui (26 novembre 2004) une annonce officielle intitulée "L'appel d'offre logiciel lancé par les autorités municipales de Pékin vise à régulariser l'utilisation de logiciels sans licence dans les administrations et à promouvoir l'utilisation de logiciels nationaux." On y lisait : "Pour régulariser l'emploi des logiciels dans les administrations, les autorités municipales de Pékin ont décidé de clarifier et régler une fois pour toutes le problème de l'utilisation irrégulière (sans licence) des logiciels Microsoft ou chinois. Pour cela, elles achèteront à la société Microsoft, par le biais d'un "appel d'offres à prestataire unique", un nombre global de logiciels, pour garantir que la totalité des logiciels utilisés soient couverts par une licence d'utilisation."
De façon un peu contradictoire, l'annonce disait également que "cet appel d'offres logiciel publics est une façon stratégique de promouvoir l'utilisation de logiciels nationaux, puisque une partie des logiciels acquis est de production chinoise. Il est d'autre part exigé qu'en cas d'acquisition d'ordinateurs et logiciels nouveaux, la priorité soit donnée à la production nationale."
L'acquisition publique de logiciels en Chine : une situation délicate
*****
La situation est pour le moins délicate. Il s'agit d'abord de régulariser les licences des logiciels existants, et ensuite de favoriser l'acquisition de logiciels chinois...
Selon un industriel du logiciel, l'embarras est double : d'une part, l'achat public de logiciels est problématique en soi, d'autre part, la longue histoire de piratage des logiciels Microsoft dans les administrations rend difficile le soutien d'une discrimination positive pour les produits nationaux.
Priorité est donnée à la campagne de régularisation de licences,
décidée par la vice-premier ministre Mme Wu Yi au retour de sa visite officielle aux Etats-Unis en mai dernier.
Une directive officielle (portant numéro 41) de mai exige en effet que d'ici la fin de l'année, toutes les administrations de provinces et supérieures régularisent l'utilisation de leurs logiciels, l'échéance étant reculée à la fin de l'année 2005 pour les municipalités.
Mme Wu Yi, qui occupe en personne la vice-présidence du groupe de travail national sur la propriété intellectuelle, décida en septembre 2004 d'organiser un programme de protection de la propriété intellectuelle, de septembre 2004 à août 2005.
L'opération d'achat public de logiciels est déjà déployée dans tous les gouvernements provinciaux, voire terminée dans certaines provinces, notamment Tianjin, Pékin, le Tibet, le Ouighour, etc.
Un haut fonctionnaire d'une administration révèle que "l'accent est mis sur l'acquisition de licences pour les logiciels déjà utilisés, sans prise en compte du fait qu'ils soient étrangers ou chinois, et nous faisons l'objet d'une surveillance sévère à ce titre."
Selon un distributeur de logiciels chinois, "les logiciels bureautiques chinois acquis par la Mairie de Pékin n'ont en réalité jamais été utilisés, ils furent tout de suite remplacés par des logiciels Microsoft Office piratés. Au point qu'à présent, l'idée d'utiliser des logiciels chinois inquiète les utilisateurs."
La situation est exactement la même à Tianjin. Il explique que le système de gestion administratif est ancien et fut conçu alors qu'on n'envisageait même pas la possibilité d'utiliser des logiciels nationaux. L'héritage est donc 100% Windows : "à cette époque, il n'y avait partout que du Microsoft piraté, il n'était pas imaginable qu'il faudrait à terme utiliser des produits logiciels chinois".
Un utilisateur dans une administration témoigne "la plupart des documents échangés sont basés sur la suite Microsoft Office. Même si les logiciels nationaux ont fait d'énormes progrès, ils ne sont pas aussi faciles à utiliser que les produits Microsoft. L'adaptation à des produits chinois sera vraiment malaisée - mais qui se préoccupe du confort des utilisateurs dans leur travail quotidien ? Certainement pas ceux qui vous disent qu'il faut utiliser du logiciel chinois !".
***********************************************
L'achat public "à prestataire unique" n'est-il pas illégal ?
**********
La question est de savoir si cet achat public portant sur les seuls produits Microsoft viole ou non la loi sur les appels d'offre publics.
[NdT: cf loi spécifique au logiciel n'autorisant les administrations à acheter du logiciel non chinois que s'il n'existe pas de logiciel chinois fonctionnellement équivalent]
Le 17 novembre dernier, lorsque l'appel d'offres de la municipalité de Pékin à été rendu public, la SARL pékinoise ChenTuo (NdT:"Innovation du Matin" - http://www.center.com.cn/page/CenterArticle.htm) (représentant de Microsoft) a conclu un marché avec la municipalité consistant à une vente de licences de systèmes d'exploitation et suites bureautiques pour un "prix ad hoc" de 29,25 milliards de Yuan. En contrepartie de cette somme forfaitaire, un bureau donné pourra pendant trois ans acquérir tous les logiciels Microsoft, sans limite de quantité. Pas de limite de quantité ni de type de logiciel donc, mais une durée limitée de trois ans.
Dans les résultats de l'appel d'offre figuraient trois éditeurs de suites bureautiques chinoises, GongChuang KaiYuan ("Créer ensemble du Code Ouvert"), Zhongwen Liangren et JinShan. Seuls les prix des produits étaient mentionnés, sans aucune indication de prix de gros ni de montant global...
Quant à l'acquisition de systèmes d'exploitation, il est flagrant que seul Microsoft a été considéré, ce qui constitue selon les industriels du secteur "un cas 'd'achat public à prestataire unique', dont Pékin viole manifestement les clauses décrites dans le code des marchés publics".
La 13e clause du "Code des marchés publics" chinois stipule en effet que "l'achat public à prestataire/fournisseur unique, également appelé 'achat public direct', peut être mis en oeuvre - toujours dans le cadre d'un appel d'offre public, soit parce que le produit est protégé par un brevet, soit parce qu'il est fabriqué pour la première fois, soit dans le cadre d'un renouvellement de contrat, dans le cadre de la poursuite d'un achat public ou si en raison d'un cas de force majeure il est impossible de faire appel à d'autres fournisseurs. Ce type d'achat public a pour spécificité première l'absence de toute mise en concurrence.
La négociation étant directe et en l'absence de tout mécanisme de concurrence, la situation est similaire à celle de la signature d'un contrat entre un acheteur civil et un fournisseur : il n'y a que deux parties et l'acheteur public dirige la négociation sans autre élément d'arbitrage.
Le cas est donc exposé à des abus divers et des phénomènes de corruption. Aussi est-il nécessaire de n'autoriser légalement ce type de processus d'achat que sous des conditions très strictes".
Selon le CEO du bureau de représentation de Red Flag, M. Zhao Shaoyang, "le code des marchés publics est clair, un processus d'"achat public à prestataire/fournisseur unique" ne peut avoir lieu qu'à l'une de ces trois conditions :
1. L'objet de l'appel d'offre n'a qu'un fabricant ou fournisseur.
2. Un cas de force majeure impose de ne s'adresser qu'à un fournisseur (urgence, etc.).
3. Un prestataire existant échange ou étend ses produits ou services et un changement de prestataire entraînerait des incompatibilités ou une hétérogénéité telles qu'il n'y aurait plus d'interopérabilité avec les autres produits ou qu'une certaine qualité de service ne serait plus garantie. Dans ce cas, il est possible d'effectuer un processus "d'achat public à prestataire unique" avec le même fournisseur, mais à condition que le montant d'achat ne dépasse pas 10% du montant du contrat initial.
En l'occurrence, l'achat public de systèmes d'exploitation ne répond à aucun de ces critères. De mon point de vue, cette transaction est illégale" conclut M. Zhao.
Tous les éditeurs de systèmes d'exploitation chinois s'accordent à dire qu'ils n'ont pas vu l'appel d'offre public de la municipalité de Pékin concernant l'achat de systèmes d'exploitation.
Une personne bien informée explique que "les besoins en licence n'étaient en fait pas si importants. Le problème est que cet achat par la municipalité de Pékin crée un grave précédent. Et dans la réalité, certains bureaux possèdent plus de licences que d'utilisateurs !"
Dénouement proche
*******
Un fonctionnaire du bureau des achats de la municipalité de Pékin s'exprimait ainsi en privé : "laissons parler les faits, les résultats seront publiés ce vendredi 26 novembre ".
D'autres sources d'informations semblaient cependant dire que les dés étaient joués.
Quant à la façon dont la déclaration de M. Li Wuqiang est ressentie, un fonctionnaire qui a souhaité garder l'anonymat a fini par avouer que "la question des achats publics est très complexe, il n'est pas très adéquat que M. Li Wuqiang puisse ainsi donner son avis personnel. Seul le ministère des Finances a droit de parole sur la légalité ou l'illégalité du processus."
La réponse serait donc au ministère des Finances...
Définir le besoin avant que de chercher une solution technique
(...)
Pour en revenir à des considérations techniques, existe-t-il un substitut au format .doc ?
La réponse diffère en fonction du besoin de chacun. L'exigence de l'utilisateur doit rester le tout premier critère à prendre en comppte, bien avant la maturité de tel ou tel outil.
Si vous trouvez que votre ancienne version de Word vous suffit - il fallait de toute façon bien l'utiliser avant l'apparition des nouvelles versions - et qu'il vous semble absurde et abusif d'être obligé de passer à une version supérieure, une première mesure de bon sens consiste à garder votre ancienne version de Word telle quelle - avant même qu'il soit question d'abandonner le format .doc.
Si vous trouvez en outre que de petits changements dans vos habitudes de travail et des petites imperfections de mise en page ne sont pas gênants, et que vous n'avez pas besoin d'utiliser de macros, alors OpenOffice.org peut remplacer MS-Office. En effet, le format ouvert d'OpenOffice.org permet à vos documents de n'être plus ôtages d'un logiciel donné. Vos documents peuvent être lus quel que soit le système d'exploitation et leur pérennité est garantie, même plus de vingt ans plus tard.
Plus de crainte non plus à avoir quant au risque de fuite de données confidentielles (personnelles comme professionnelles) - elles ont coûté le travail et la vie à cet expert militaire britannique dans l'affaire des fuites d'informations concernant l'attaque en Irak. Sans oublier qu'une importante source de contamination par virus est ainsi écartée...
Autant de bienfaits dont ne peuvent profiter ceux qui s'entêtent à utiliser Microsoft Office. Il leur suffirait pourtant d'être un peu plus ouverts au changement.
Si vous allez un peu plus loin et considérez que le rôle premier d'un traitement de texte, d'un tableur et d'un logiciel de présentation est d'abord de transmettre et de stocker de l'information - plutôt que de la présenter joliment - alors le format HTML remplace avantageusement les formats .doc et .ppt, et le format .csv en texte simple remplace le format .xls. J'écris moi-même tous mes cours, conférences et essais au format HTML, parfaitement adapté à l'usage que j'en fais, sans être lié à tel ou tel outil.
Cela ne veut pas dire qu'il ne faille pas utiliser ces logiciels lorsque l'usage le justifie, au contraire ! Mais la plupart du temps, nos exigences en termes de mise en forme et mise en page, lorsque nous éditons des textes, sont si faibles qu'un simple éditeur HTML (tel nvu) suffit. Il est même possible, comme je le fais, de recourir à un éditeur de texte aussi rudimentaire que vim (sorte de Bloc-notes, en mille fois plus puissant).
Les choses deviennent plus simples encore s'il s'agit juste de lire de l'information : dans ce cas, tout navigateur web convient. Les textes peuvent être à tout moment publiés sur le web et devenir accessibles, indépendamment du système d'exploitation et des logiciels dont dispose l'utilisateur.
Pour peu que l'on vous ait bien enseigné le HTML (en cours ou dans un livre), vous aurez en outre appris le principe de la séparation du contenu et de la présentation. Vous saurez générer, moyennant une feuille de styles, autant de présentations d'un même document que souhaité : une version pour l'impression, une version HTML accessible aux personnes handicapées, une version lisible depuis un PDA, etc. Et tout cela sans effort, le travail automatisable et répétitif fait à la souris étant laissé à l'ordinateur, comme cela devrait _toujours_ être le cas.
[x]
Croyez-moi, il n'y a rien là de difficile. Si les livres n'en parlent pas, c'est parce que la "mercantilisation" de notre culture informatique a rétréci le champ de vision de la majorité des auteurs de livres, qui ne sont plus capables de considérer l'intérêt à long terme de leurs étudiants.
|