Archive pour septembre 2008

Sortir de la “chaîne de formats” dans l’édition numérique.

Samedi 27 septembre 2008

Il existe typiquement trois modèles différents, divisés en deux catégories, de fabrication de contenu texte dirigé vers l’édition:

  1. Le modèle appplicatif qui se présente sous deux formes possibles: l’application CLIENT et l’application WEB.
    Dans les deux cas, la numérisation des données en entrée est pensée pour être le plus transformable possible, pour pouvoir jouer avec les options de création de contenu et produire les formats attendus ou à venir pour répondre à un ou des besoins spécifiques. Dans la plupart des cas personne ne se soucie de la façon dont les contenus sont créés. L’accent est mis sur la finesse et l’évolutivité de la création et de ses outils. Seuls importent ensuite les formats de sortie, non plus pour création mais pour diffusion, exploitation, conservation. Savez-vous comment sont numérisés les contenus dans Indesign ou QuarkXPress? Non, et cela ne vous pose aucun problème.
  2. Vient ensuite le modèle “chaîne” de formats” avec par exemple la plate-forme CybersDocs, pour la publication des thèses en ligne, ou O’Reilly avec son schéma XML Docbook.Selon ce modèle, un format produit pour répondre à un besoin sert de base pour la production d’un autre format destiné à répondre à un autre besoin. La chaîne implique que les transformations vont se suivre les unes après les autres.

Devant la recrudescence des discours encensant les “chaînes XML” nous voulons nous arrêter sur la différence logique qui sépare ces deux approches et inciter à retourner vers le modèle applicatif.

Deux idées erronées, qui n’en sont qu’une, poussent à se tourner vers le modèle de la chaîne XML:

  1. La première idée est qu’un format est séparable du processus auquel il appartient: In, Out et média/ outils associés.
  2. La seconde consiste à penser que le passage d’un format à un autre (modèle chaîne) ne représente pas une perte dans le processus d’édition, de diffusion et d’exploitation des contenus édités. Le corollaire étant qu’il existe un BON format (global, universel, intemporel) en entrée pour toutes les sorties.

Exemple de la chaîne CyberDocs

Prenons comme exemple la chaîne CyberDocs, plate-forme de conversion principalement maintenue à travers le projet Cyberthèses:

Le module de conversion de la plate-forme Cyberdocs vise à automatiser un processus de conversion depuis un format traitement de texte vers un document structuré en format XML, selon la DTD TEI Lite. Une telle opération consiste donc à identifier le plus de structure possible dans le document original pour rendre le document XML le plus riche possible.

[...]

Le module de conversion de la plate-forme Cyberdocs ne se contente pas de produire ce

document XML de référence. En effet, une fois celui-ci obtenu, le module peut produire des versions du document prêt à une publication statique, en format HTML, XHTML ou PDF. De plus, le module va préparer un ensemble de documents qui alimenteront le module de publication pour rendre l’interface de consultation encore plus riche.(Documentation PDF, p.26)

Les objectifs:

  1. production d’un document sémantiquement structuré pour un archivage pérenne (TEI Lite),
  2. publication “statique” (HTML, XHTML, PDF)
  3. recherches documentaires précises à l’intérieur d’un document ou dans une collection de documents publiés.

Le IN: dans ce processus est déterminé par la production des auteurs dans leur logiciel bureautique de traitement de texte, par une habitude, ce qui est parfaitement légitime. C’est la contrainte de départ, du ODT.

Un OUT primaire:

  • TEI Lite comme format sémantiquement structuré, pour archivage pérenne (dont on sous-entend par ailleurs qu’il serait “dynamique”).

Les OUTs secondaires (issus de TEI Lite):

  • Fiche de métadonnées,
  • HTML statique destiné à l’affichage en flux et à produire un fichier Html de transport.
  • PDF destiné à l’impression.

Analyse de la chaîne CyberDocs

Nous avons plusieurs chaînes du type: ODT-> TEI Lite -> Format X (Html, PDF, XML métadonnées)

  1. 1ère étape: passage ODT-TEI Lite
    • la feuille de style qui prépare le document ODT à cette transformation exclut de l’importation un certain nombre d’éléments: maths, dessins, graphiques, xlink, formulaires…
    • la présence de cette feuille de style implique que l’on ne peut importer du ODT dans cette chaîne QUE s’il a été structuré à cette fin, il ne s’agit plus d’une importation de ODT comme format de “traitement de texte” mais uniquement comme format “ODT destiné à être validé en tant que TEI Lite”. Si votre thèse n’a pas été produite avec cette feuille de style son importation demandera un travail de préparation important.
  2. Cette première étape, qui pallie à l’absence de structuration sémantique “littéraire” pour laquelle ODT n’est pas fait, impose donc une perte en universalité du processus.

  3. 2nde étape: Passage TEI Lite-Html et TEI Lite-PDF

Le document “XML de référence”, l’axe de la chaîne est TEI Lite, un schéma XML (vocabulaire et grammaire) développé pour l’échange des données textuelles, notamment pour les sciences humaines et les études sur les textes littéraires. Du fait de son orientation “structuration sémantique” et de son mode de production hors ligne il convient à la production de documents statiques de stockage et d’interrogation ainsi que de fiches de métadonnées riches.

C’est à partir de ce document que CyberDocs cherche à produire du HTML et du PDF, à répondre aux besoins “affichage et diffusion en flux dynamique en réseau” et “structuration typographique destinée à l’impression”. C’est oublier que TEI Lite répond déjà à une intention précise et est presque la fin d’un processus, que nous appellerons “structuration littéraire concertée pour échange de données textuelles”. Cela revient à vouloir utiliser le OUT d’un processus comme IN dans des processus qui ne lui correspondent pas et qu’en conséquence il appauvrit.

La structure TEI Lite permet de répondre en partie aux besoins de ces deux processus. CyberDocs produit bel et bien des thèses en Html (statique, enfermé dans des cadres (frameset), peu ou pas accessible aux handicapés ou aux moteurs de recherche) et en Pdf (et pourrait en produire des versions plus riches à partir de la TEI native) .

En partant de TEI Lite statique CyberDocs renonce cependant à la part collaborative du Html puisque les contenus de production ne sont ni en ligne ni associés à des outils pouvant les rendre dynamiques. Cet aspect du Web n’est sans doute pas un argument de taille pour les universités et les chercheurs dont le travail tient encore à rester “encapsulé” avant publication officielle. Mais CyberDocs renonce également à l’intégration des contenus au Web pour une exploitation raffinée des connaissances après publication (Web services). À l’exception du catalogage et de la publication de fiches de métadonnées (localisation) les contenus ne peuvent être extraits et/ou réutilisés de façon dynamique dans d’autres ouvrages, analyses, hyper indexations, etc.

Conclusion

La première étape de la chaîne nous fait perdre en universalité, la seconde en fonctionnalités.

Qu’est ce qui même au choix d’une telle chaîne de formats?

  1. L’idée d’un format ad hoc
    • TEI, TEI Lite, Docbook sont des formats de stockage et d’interrogation exprimant chacun des besoins spécifiques…,
    • ODT pour une lecture sur un bureau et sa qualité de traitement de texte Wysiwyg en relation avec l’imprimante,
    • HTML pour une présentation en flux…
    • PDF pour une impression papier…
  2. Cette pauvreté relative (perte de l’universalité de production des contenus et staticité de la sortie Web en particulier) est ici inévitable parce que l’on fait du résultat de l’objectif 1 (TEI Lite statique hors ligne) le IN des objectifs 2 et 3.

    Ce choix provient de l’idée selon laquelle un format, et notamment le XML, est une information qui peut toujours être transformée. Or, un format, quel qu’il soit, est une réponse à un besoin. Il est engagé dans un processus qui a transformé les données…. C’est le vieux principe de McLuhan, “le message est le médium”. Il n’y a pas de transmission linéaire de l’information. D’ailleurs il n’y pas d’information au sens de message portant à lui seul un sens univoque et par conséquent compris par tous de la même façon quel que soit le contexte. Il faut donc dans un premier temps oublier cette quête quasi mystique du BON format (global, universel, intemporel).

    Dans une chaîne il y a orientation à chaque étape, orientation irréversible. Cette orientation peut être de grande qualité dans un objectif donné:

    Pour autant, faire un passage horizontal d’un format vers un autre fait toujours prendre le risque d’une perte, quoi qu’il en soit de la qualité de la feuille de transformation. La perte tient dans la négligence des différences d’objectif que sous-tendent chacun des formats, le processus auquel ils appartiennent et les outils qui y sont associés. Un format est toujours une réponse à un objectif. Ou plus exactement format et objectif fusionnent.

  3. La séparation format/processus

L’autre idée qu’il faut ici démonter est celle selon laquelle un format est séparable du processus auquel il appartient: In, Out, et média, outils associés.

Le XML est partout présenté comme LE format qui offre structuration sémantique, capacité de transformation illimitée vers une multitude d’autres formats, garant de la plus grande pérennité, et qui transporte donc toute l’information nécessaire sur un contenu donné pour son utilisation actuelle et future dans tous les contextes. N’en déplaise aux “experts”, c’est une erreur.

D’une part, le xml n’est pas un format. C’est un niveau de “numérisation” règlementé, un langage de balisage générique destiné à ranger des données textuelles, et dont le vocabulaire et la grammaire ne sont pas définis a priori. Lorsque l’on détermine des règles pour le balisage, des grammaires, celles-ci s’expriment en des schémas (DTDpar exemple), qui permettent notamment de valider automatiquement un document sur sa conformité à ce modèle. Le xml est une technique et c’est quand il est associé à un schéma qu’il devient un format! Donc, dire que le XML garantit pérennité, capacité de transformation universelle, revient à dire que l’encodage en O et 1 garantit pérennité, capacité de transformation, etc. Autant ne rien dire.

D’autre part lorsqu’il est associé à une DTD, et devient un format, le XML est déjà engagé dans un processus spécifique, une réponse à un besoin, lié à des outils (scripts), à des modes de présentation (supports de lecture) et pour lequel cette DTD a été élaborée. Il ne peut plus (ni ne dois) dès lors être appelé à répondre à tous les besoins.

Comme pour les autres formats (non xml), pas plus TEI que Docbook, xhtml, mathml, svg, etc, ne peuvent répondre à tous les besoins. Aucun d’entre eux ne peut constituer un bon IN pour tous les autres processus d’édition: Web, papier, eBook, Mobile…

Comment sortir alors de cette recherche du format ad hoc, répondre au besoin de pérennité et à la peur de la multiplication des sorties?

Revenir à la logique applicative:

  • mieux regarder l’ensemble des composants, outils de fabrication, formats d’exploitation, d’utilisation, et ainsi penser en terme de processus et non pas d’objet,
  • s’assurer de la finesse et de l’évolutivité des outils de création: pour cela ne pas chercher un format de données “brutes” normé mais au contraire hybridable avec d’autres techniques (comme LaTeX et XML) qui créent une donnée “brute” la plus transformable possible. Déhiérarchiser les processus d’édition.
  • à partir de cette donnée transformable, non normée, penser publication en étoile, chaque branche correspondant à un processus (une intention) donné. Il ne faut pas d’axe majeur, de “format de référence”.
  • s’assurer de l’accessibilité, de l’ouverture des formats et langages utilisés afin qu’ils puissent évoluer en fonction des nouveaux besoins, machines, lecteurs…
  • ne pas oublier que tous les OUT/exploitation/supports de lecture à venir ne peuvent être prévus.

__________________

Schéma (image cliquable pour une meilleure lecture) : Édition numérique à partir d’une application Web comparée à une “chaîne de formats”.

formats

Lutèce d’Or dans la catégorie “Meilleur projet d’innovation et de développement Libre réalisé”

Vendredi 26 septembre 2008

Nous avons remporté mercredi soir, 24 septembre 2008, le Lutèce d’Or dans la catégorie “Meilleur projet d’innovation et de développement Libre réalisé”, décerné lors de Paris Capitale du Libre

Malgré notre grande, grande, grande humilité nous sommes très, très, très fiers et heureux!

Nous avons été un peu (c’est un euphémisme!) tétanisés par ce parterre de 300 personnes lors de la remise des prix et n’avons donc pu remercier que très élusivement les personnes auxquelles nous devons cette fierté. Il est temps de le faire ici.

Deux ans de travail “encapsulé”, beaucoup de plaisir, d’idées, de perspectives ont donc fait de La Poule ou l’Œuf un outil innovant et professionnel reconnu par les communautés et les entreprises du logiciel libre. Merci au jury pour cette appréciation et ce soutien. Merci également, qu’ils soient jurés ou non, à Mathieu Pasquini (In Libro Véritas), Frédéric Couchet (APRIL), Sophie Gautier (OpenOffice), Alexis Kaufmann (Framasoft), Didier Roche (Ubuntu.fr), Thierry Stoehr (AFUL). Merci également à Linagora et à son équipe pour l’organisation de Paris Capitale du Libre, et en particulier à Benjamin Jean et à Nadiya Shur. Et évidemment à Nadège Dauvergne pour son graphisme et…tout le reste!

Merci aux communautés du Libre qui partagent avec nous et auxquelles nous espérons pouvoir apporter en retour savoir, savoir-faire, enthousiasme, créativité, éthique.

Bravo également aux autres lauréats bien sûr, dont la liste est accessible ici (Toolinux) ou ici (Journal du Net avec des photos!).

_________________

Pour mention, en réponse à la forte demande “Alors, qui de la Poule ou de l’Œuf?“, sachez que le paradoxe découle d’une erreur de types logiques (Russell) selon laquelle l’œuf et la poule sont envisagés comme deux éléments disctincts alors qu’il faut les penser comme un seul et même processus.

Le paradoxe de la poule et de l’œuf se présente parfaitement tel qu’il a été énoncé par Samuel Butler, biologiste anglais du XIXe siècle  et critique de Charles Darwin : « Une poule est le meilleur moyen qu’un œuf ait trouvé pour faire un autre œuf ».

Je considère que ce paradoxe est un « cancer » de la pensée parce qu’il repose sur plusieurs confusions et que ce sont précisément ces confusions qui nous empêchent de construire le processus logique de l’évolution. Voyons plutôt!
Il n’y a en fait ni œuf ni poule. Et un biologiste devrait le savoir mieux que quiconque. Car un œuf n’est qu’une poule plus jeune. Et une poule n’est qu’un vieil œuf. L’œuf et la poule n’appartiennent pas à deux classes différentes. L’œuf, mais aussi les gamètes mâles et femelles, les jeunes poules, les vieilles poules comme les coqs, appartiennent tous à la même classe ; la classe d’une espèce de gallinacées. Le paradoxe de la poule et de l’œuf repose, lui, sur une fausse distinction logique. Et ce paradoxe est rendu possible car, depuis au moins vingt-cinq siècles, nous avons été habitués à penser en termes de catégories immuables. (Jacques Jaffelin, 1993)

Les Complexes à Paris Capitale du Libre

Lundi 15 septembre 2008

Les Complexes sera présente à Paris Capitale du Libre, les 24 et 25 septembre (8h30-18h45), et La Poule ou l’Oeuf en démonstration, personnalisable bien sûr!

À bientôt donc à la Maison Internationale de Paris, 17 boulevard Jourdan 75014 Paris. RER B, arrêt Cité universitaire ou Métro ligne 4, station Porte d’Orléans.

Paris Capitale du Libre

Le 18 octobre aux JDLL de Lyon

Mardi 9 septembre 2008

Les Complexes sera présente le 18 octobre aux Journées du Logiciel Libre de Lyon organisées par CPE Lyon et l’ALDIL.

Lille, merci Chtinux.

Lundi 8 septembre 2008

Les Complexes était à Lille ce Week-end. La Poule ou l’Oeuf est repartie mouillée (bonne grosse drach conviviale dimanche matin) et réjouie d’avoir rencontré Chtinux (Merci à vous tous) et les participants du Village du Logiciel Libre.

Chtinux

À trés bientôt.

Les Complexes devient membre de l’APRIL

Jeudi 4 septembre 2008

Les Complexes est fière d’annoncer son adhésion et son soutien à l’APRIL avec laquelle nous partageons l’idée selon laquelle la liberté informatique est un enjeu de société et le logiciel libre un engagement qui dépasse les seules questions techniques.

Pionnière du logiciel libre en France, l’April est depuis 1996 un acteur majeur de la démocratisation et de la diffusion du logiciel libre et des standards ouverts auprès du grand public, des professionnels et des institutions dans l’espace francophone. Elle veille aussi, dans l’ère numérique, à sensibiliser l’opinion sur les
dangers d’une appropriation exclusive de l’information et du savoir par des intérêts privés.  L’April est le partenaire privilégié pour la promotion et la défense du logiciel libre.

Le retour…

Lundi 1 septembre 2008

Évolutions

La Poule ou l’Œuf a continué d’évoluer cet été:

- mise en place du lien RefBase/CiteProc/Poule ou l’Œuf pour la gestion des entrées bibliographiques et leur citation dans un livre: voir le rendu dans le livre Pour une théorie de l’information générale. Les tutoriels écrit et vidéo sont en cours de production, ils feront l’objet d’un post ici même.

- diverses fonctionnalités dont les raccourcis de navigation clavier et les accesskey mentionnés plus bas.

- quelques nouvelles vidéo (avec voix cette fois), etc.

Adhésion

Les Complexes est depuis le 19 août un membre convaincu et attentif de l’AFUL (Association Francophone des Utilisateurs de Linux et des Logiciels Libres).

Évènement

Nous serons présents au Village du logiciel libre de la braderie de Lille, les 6 et 7 septembre, c’est à dire ce week-end. Venez donc nous y rencontrer et profiter d’une démo in vivo de la Poule ou l’Œuf!

Le travail qui ne s’est pas arrêté reprend donc de plus belle!

Bonne rentrée à tous.

On parle de nous… en espagnol!

Lundi 1 septembre 2008

Dans un post intitulé Qué es un libro sur le blog SoyBits, Tendencias en la industria editorial, Jordi Mustieles (traducteur) s’intéresse à et salue l’approche des Complexes.

Nous apprécions beaucoup cette lecture qui tient compte de notre réflexion sur ce qu’est un livre, réflexion qui sous-tend tout le travail technique.

Accessibilité et Accesskey

Lundi 1 septembre 2008

La Poule ou l’Œuf offre un mode d’affichage linéaire destiné aux handicapés. Des accesskey ont été créées pour y accéder et y naviguer sans souris et sans javascript!

Selon les navigateurs l’activation de ces access key diffère:

FireFox: Alt + Shift + [accesskey]

a. Accéder à la page d’affichage:

a - permet d’accéder à la page pour choisir le mode d’affichage !

b. Choisir son mode d’accessibilité :

d - Style par défaut de la Poule ou l’œuf
l - Style facilitant l‘accessibilité
c - Style de la collection

c. Naviguer dans un livre

Quel que soit le mode d’affichage les access key sont les suivantes:

s - page suivante

p - page précédente

Uniquement dans le mode facilitant l’accessibilité: t - Accès à la table des matières

Retrouvez ces indications dans le manuel de La Poule ou l’Œuf au chapitre “Trucs et astuces”

Navigation au clavier

Lundi 1 septembre 2008

Il se peut que vous ayez à lire un livre Web sur un dispositif de lecture ayant un petit écran ou que vous ayez simplement envie d’avoir le texte en plein écran sans menu de gauche (Tables des matières, services, etc.). Nous avons créé une navigation au moyen des flèches et du pavé numérique qui vous évite d’avoir à cliquer où que ce soit.

a. Faire disparaître de menu de gauche

Ctrl + flêche gauche ou Ctrl + flêche Droite ou encore en cliquant sur la flèche noire au dessus du menu (évidemment la navigation au clavier fonctionne aussi en gardant le menu de gauche!).

b. Passer d’un chapitre à l’autre

Les flèches gauche et droite.

c. Passer d’une page à l’autre dans un chapitre ou dans une discussion

Maj + le chiffre de la page à atteindre ou, si vous avez un pavé numérique, tapez simplement ce chiffre sur le pavé.Pour mémoire voir la bulle au passage de la souris sur chacun des chiffres de pages.

d. Passer d’un chapitre à son espace de discussion et vice versa

Ctrl + Flèche Haut (ou flèche Bas).

e. Activer la fonction Rechercher

Chiffre 0

Retrouvez ces indications et l’emplacement de leurs mémos (bulles) dans le manuel de La Poule ou l’Œuf au chapitre “Trucs et astuces”