lundi 24 septembre 2007

Pour que Montcuq monte sur le trône ... votez !


Quelques jours après le décès de Jacques Martin, le célèbre village de Montcuq qu'il a contribué à faire connaître via sa célèbre émission Le petit rapporteur refait parler de lui sur le Web.

C'est à l'occasion de la sortie d'une nouvelle édition du jeu de société Monopoly, dans laquelle les rues de Paris ont été remplacées par des villes. Le propriétaire Hasbro a eu l'excellente idée de réserver la case la plus chère (occupée par la rue de la Paix dans l'édition originale) au vote des internautes pour qu'ils décident de la métropole qui occupera cette place de choix.

C'est le site Trictrac.net, spécialisé dans les jeux de société, qui a lancé l'idée : et pourquoi pas Montcuq ? La consigne se répand comme une traînée de poudre sur ce web peuplé d'éternels enfants et c'est (presque) chose faite !

Ce célèbre village du Lot occupe désormais la première place du classement et, même si les tendances du vote seront bientôt secrètes jusqu'à la proclamation des résultats, on ne voit pas quel bourg serait susceptible de le détrôner - sauf manipulation à laquelle personne n'ose croire.

Après tout, quel meilleur hommage rendre à la joyeuse équipe du petit rapporteur que d'immortaliser ainsi l'un de leurs meilleurs sketchs ?

À voir :
Et puisqu'on n'y résiste pas, Daniel Prévost nous présente à nouveau Montcuq :

samedi 1 septembre 2007

Standardisation des formats XML de Microsoft

Microsoft a engagé depuis pas mal de mois une procédure de standardisation de ses formats XML, introduits par sa suite Office 2007, faisant ainsi écho à la standardisation officielle (OASIS puis ISO) des formats OpenDocument de la suite libre OpenOffice (standardisation achevée, elle).

Le processus pour Microsoft en est à l'étape ultime, celle de l'ISO (International Standards Organisation) qui, comme son nom l'indique, vise à faire adopter ce format de manière "universelle", après examen par tous les pays siégeant à cet organisme.

Le moins que l'on puisse dire est que la procédure ne passe pas sans à-coups ! Je ne suis pas particulièrement versé dans les détails de ce genre de certification, mais, pour ce que j'ai pu lire ici ou là, les pays membres peuvent voter "oui", "oui avec commentaires", "non", "non avec commentaires" ou s'abstenir. Le standard est adopté à la majorité des 2/3 si au plus 1/4 a voté contre.

Actuellement, seuls les Etats-Unis et l'Allemagne ont voté contre. La Suède avait voté Oui mais l'organisme suédois de certification (équivalent de l'AFNOR français) a changé son vote suite à des manipulations avérées (des sociétés traditionnellement proches de Microsoft s'y sont inscrites au dernier moment pour voter oui, et on parle de tractations financières de la part de Microsoft).

Peut-être faut-il avant tout rappeler l'objectif de la standardisation : c'est de créer un format entièrement spécifié (pas de "secret" dans la composition des fichiers) et surtout interopérable (ces deux caractéristiques étant bien sûr liées).

L'interopérabilité sert à s'assurer qu'un fichier créé (par exemple) avec Office 2007 est lisible et modifiable par un autre programme, sur un autre système d'exploitation éventuellement, et réciproquement : Office 2007 doit être capable d'ouvrir un fichier créé en ce format par OpenOffice sur Linux, par exemple, voire à la main. En effet, ces formats (tout comme l'OpenDocument) ont l'avantage d'être des fichiers textes (en fait XML) zippés, donc modifiables à la main.

C'est cette dernière caractéristique qui permet de se rendre compte que le format de Microsoft est totalement insuffisant de ce point de vue, comme en atteste cet article, extrêmement bien argumenté et étayé par des faits vérifiables (mais réservé aux pratiquants de la langue de Shakespeare). C'est écrit par Stéphane Rodriguez, expert français indépendant en formats de fichier.

Sans vouloir paraphraser ce billet, voici un résumé des différents reproches faits aux formats de Microsoft :

  1. Self-exploding spreadsheets : impossibilité de modifier une formule dans un document excel sans retoucher les objets "calculation chains" et provoquer peut-être des changements plus profonds.

  2. Entered versus stored values : erreurs d'arrondis énormes (et surtout d'amplitude variable et imprévisible) dans le stockage par Excel de réels en virgule flottante, et uniquement en notation anglaise ne tenant aucun compte de la locale en vigueur.

  3. Optimization artefacts become a feature instead of an embarrasment : le problème posé par Excel lorsqu'il "partage" une formule entre plusieurs cellules. Optimisation réelle pour les anciens formats de fichiers, le schéma n'est plus valable pour le nouveau format.

  4. VML isn't XML : les anciens formats de fichiers d'Office sont basés sur un langage nommé VML, qui ne respecte pas les règles du XML, et doit donc être abandonné. En réalité, le nouveau format s'arrange pour stocker des bouts de VML dans des éléments XML. La syntaxe est correct, mais le design est mauvais, et le fichier n'est pas interopérable. D'autre part, le site publie à ce sujet un email de Bill Gates himself qui en dit long au sujet de sa conception de l'interopérabilité. Je ne résiste pas à l'envie de le reproduire ici.
    From: Bill Gates
    Sent: Saturday, December 5 1998
    To: Bob Muglia, Jon DeVann, Steven Sinofsky
    Subject : Office rendering

    One thing we have got to change in our strategy - allowing Office documents to be rendered very well by other peoples browsers is one of
    the most destructive things we could do to the company.

    We have to stop putting any effort into this and make sure that Office documents very well depends on PROPRIETARY IE capabilities.

    Anything else is suicide for our platform. This is a case where Office has to avoid doing something to destroy Windows.

    I would be glad to explain at a greater length.

    Likewise this love of DAV in Office/Exchange is a huge problem. I would also like to make sure people understand this as well.

    DAV est un standard international, alors que VML est une composante (complètement fermée) d'Internet Explorer depuis la version 5.

  5. Open packaging parts minefield : en gros, il n'y a pas d'index général pour la lecture des multiples fichiers XML présents dans un seul document office, mais des règles "implicites" ("open packaging conventions").

  6. International, but US English first and foremost : 4 réglages de locale existent et entrent en jeu pour un document office (la langue du programme Office, le réglage de la langue au niveau de ce programme, le réglage de la langue au niveau du document, et le réglage de la langue au niveau du système d'exploitation). Au-delà de la langue, c'est toutes les conventions d'écriture des nombres, de la ponctuation, etc. qui sont ainsi déterminées. Microsoft Office n'utilise pour ses formats que l'anglais américain, avec toutes ses conventions. Effet notable : au niveau d'un fichier Excel, seuls les noms anglais des fonctions sont utilisés. Problème : aucune table de conversion entre les noms anglais et les noms des fonctions dans la locale n'est publiée. Impossible donc d'écrire un fichier Excel correct à coup sûr sans ces informations. De plus, il y a des exceptions qui aggravent encore la situation (voir le détail de l'article).

  7. Many ways to get in trouble : de l'incompatibilité des nombreux langages sous-jacents au format OOXML. Ici, c'est le boulet de la rétro compatibilité qui se manifeste.

  8. Windows dates : l'insistance de la part de Microsoft pour qu'on utilise non pas un format de date standard (compatible ISO) mais leur format ancien (dérivé du système OLE) un peu partout, géré par des fonctions qui font une sorte de "cuisine interne" destinée à réparé les erreurs de design.

  9. All roads lead to Office 2007 : les applications Office modifient la structure personnalisée d'un document correctement formé.

  10. A world of ZIP+OLE files : problème avec les documents protégés par mot de passe, qui ne respectent pas le standard prédéfini mais utilisent un container OLE.

  11. Document security is a (bad) joke : Faire sauter la protection d'une feuille de calcul Excel (protégé au niveau de la feuille et non du fichier) est d'une simplicité enfantine se résumant à la suppression d'un seul élément XML.

  12. BIFF is gone...not! : je n'ai pas tout compris ici, mais ça parle de la non mise à disposition par Microsoft d'un document censé expliquer certains points du format.

  13. Document backwards compatibility subject to neutrino radioactivity : un passage un peu sarcastique sur la compatibilité d'une version d'Office à l'autre, graphiques à l'appui.

  14. ECMA 376 documents just do not exist : le point sur le statut de la documentation "fournie" par Microsoft...



La position française (représentée par l'AFNOR) sera connue le 2/9/2007. Espérons que ce sera un "non avec commentaires".

----------------
Actuellement joué : Accept - Too high to get it right
via FoxyTunes