Présentation de “La Poule ou l’Oeuf”, Parinux 13 janvier 2009

29 décembre 2008

David Dauvergne, créateur et développeur de l’application, et Chloé Girard, chargée de projet, présenteront pour Parinux les fonctionnalités de La Poule ou l’Oeuf pour l’évolution du livre par le Web :

  • structuration et modélisation de collections,
  • édition XML Wysiwym en ligne (texte, code, tableaux, index, glossaire…),
  • publication à la carte multi-formats: Xhtml, PDF, LaTeX (ePub, ODT, Txt, Docbook et TEI en cours d’implémentation),
  • exploitation: clôture, Web-to-print, inter-connexions de contenus relation auteur/éditeur/imprimeur, flux…

Cette présentation s’adresse aux éditeurs, auteurs, développeurs, etc. Venez nombreux!

En prévision de cette présentation vous trouverez un aperçu du travail de La Poule ou l’Oeuf sur la forge Framabook, avec implémentation de la “Framaquette”: http://forge.framabook.org/

La conférence se déroulera à l’ Espace Loisirs et Multimédia, 105 avenue de La Bourdonnais, 75007 Paris (Métro : École Militaire) le mardi 13 janvier de 19h15 à 20h45.

Entrée libre, dans la limite des places disponibles. Cependant, il est conseillé de s’inscrire ici : http://www.parinux.org/content/conference-sur-la-poule-ou-loeuf



L’objet Web, la fin du document “unimorphe”

7 décembre 2008

Jusqu’à maintenant un document informatique ressemblait grosso-modo à un fichier, toujours offert − accessible − sous la même forme. Le Web est en train de transformer cette évidence. Le concept d’objet Web n’est pas encore bien formalisé mais les changements importants dans le partage et l’exploitation documentaire nous obligent à réviser nos idées sur le sujet.

Prenons un exemple simple pour montrer le changement de forme qu’ont subi les documents en passant sur le Web. La méthode la plus « simple » pour lire une vidéo, jusqu’à récemment, était de la télécharger puis de la lire avec un logiciel approprié. Des portails comme Dailymotion et Youtube offrent en plus du visionnage, à l’intérieur du navigateur, un ensemble de données supplémentaires. On trouve tags, channels, notes, commentaires, quelques méta-données (durée, posteur… ) Bref il ne s’agit déjà plus un document comme on le connaissait.

Ce qui caractérise le plus un objet Web, en plus des informations supplémentaires ou méta-données, ce sont les services qui peuvent lui être rattachés du fait de la distinction des informations qui le constituent, sans remise en cause de son unité.

Les services de communication :

La façon la plus évidente de rentrer en interaction avec un objet Web c’est la « publication web » faite principalement de pages écrites en Html. Mais on peut imaginer d’autres formats plus appropriés dans d’autres situations d’utilisations. Ici le format, prend un sens particulier par rapport à notre utilisation courante. Il devient synonyme de « méthode de communication » et implique d’utiliser des formats/protocoles ouverts.
En plus des humains et des machines qui ne cessent d’indexer, répertorier, trier… ce sont nos méthodes de connexion au Net qui ne cessent, elles aussi, de s’accroître : mobiles, netbook, gps, reader… Un ojet Web a ainsi l’obligation de la polymorphie pour offrir des services pour chacun des utilisateurs, machines comprises, avec leurs propres besoins.

Dans l’application Web La Poule ou l’ŒUF , faite pour fabriquer des objets Web-livres, nous essayons de reprendre cette logique. La polymorphie commence ici avec la construction de l’objet en facilitant l’importation depuis d’autres formats (texte « wikiisé », ODT, et dans un avenir proche Latex et epub) mais aussi avce la communication extérieure avec le PDF (pour créer une version papier), LaTeX, ODT, TEI, epub, DocBook et txt.

Des services spécialisés :

La demande peut être plus précise et porter sur certains points de l’objet Web. Au-delà des méta-données on peut ne vouloir que certains morceaux, certaines parties. Dans le cadre des objets Web-livres il peut s’agir uniquement de la bibliographie, de la table des matières, de l’index, de l’historique d’un chapitre, des notes de(s) l’auteur(s), d’un résumé, d’une dimension particulière, des noms propres dans le texte ou tout élément qui aura été marqué sémantiquement etc.

Le concept d’objet Web permet de clarifier la forme que prend le « document » sur Internet. Mais il reste beaucoup à faire et nous devons nous inspirer des métaphores mises au point dans le monde de la programmation orientée objet. Dans ce cadre les objets ont la possibilités de s’adjoindre « facilement » de nouvelles propriétés, de nouvelles fonctions. Nous n’en sommes qu’aux premierx balbutiement de ce concept promis à un grand avenir.



Livre Web: une révolution industrielle

27 novembre 2008

Qu’il s’agisse de l’économie du livre, du livre comme œuvre ou du statut de l’auteur, l’on ne cesse de tenter de transposer dans le numérique les modèles qui ont prévalu durant l’ère du papier comme support unique. L’archétype de cette transposition est la triade “fichier statique (avec ou sans DRM)/liseuse/logiciels propriétaires”.
Considérée il y a peu comme une révolution majeure par rapport au livre-papier elle apparaît aujourd’hui comme une solution acceptable bien que demandant encore quelques étapes pour être tout à fait adéquate. Elle reproduit en effet le modèle auteur/éditeur-leveur de fonds/imprimeur-libraire” indispensable à l’écosystème “tout papier”, en ignorant le changement de paradigme économique, culturel et social en cours.

On invoque aisément au sujet du Web une révolution informationnelle qui toucherait la culture par “des échanges et une collaboration à grande échelle à coûts de transaction extrêmement réduits”. La révolution est en fait d’ordre industriel. Internet a  évolué de “canal de diffusion” à “moyen de production” — Web applicatif — et il impose de passer à une logique d’édition en ligne qui va remodeler profondément l’industrie du livre, le statut des auteurs, la notion de culture, celle d’expert, celle de livre.

Les outils applicatifs du Web et leur impact sur la chaîne du livre

Les outils d’édition en ligne se perfectionnent avec le souci de l’histoire (Typographie, référence, clôture…) comme du futur du livre (production collaborative, interropérabilité, multimédia,…) et des lecteurs (expérience de lecture, qu’elle soit passive ou active, niveaux de lecture, extensions métiers, annotations, flux destinés à des publics différents tels que les handicapés, lecture vocale, lecture multilingue, etc….). Nous travaillons sur ce type d’outils d’édition et ne sommes pas les seuls.

Le Web participatif, interactif, et ses applications de blog, forum, tag, RSS, etc. à permis l’émergence de réseaux sociaux qui sont autant de réseaux de prescripteurs avertis, au sens propre comme au sens figuré. Ils sont animés et soutenus aussi bien par des particuliers que par des associations, des institutions ou des entreprises. Y interviennent des amateurs aussi bien que des professionnels des sphères d’intérêt concernées.

Les applications de service qui permettent d’exploiter les contenus (extraction de données bibliométriques, constitution et mise à jour de catalogues, production de fichiers destinés à une impression à la demande, interconnexion de contenus,… ) intègrent les livres produits à une économie large et aux réseaux d’étude et de savoirs.

De plus le droit s’adapte pour garantir aux créateurs la propriété intellectuelle de leur travail dans un contexte de réseau, qu’ils s’inquiètent de propriété patrimoniale ou non.

À court ou moyen terme les jeunes auteurs, ne seraient-ce qu’eux, vont produire leurs premiers ouvrages dans le Web et les faire connaître au moyen des différents réseaux de prescripteurs inscrits dans le réseau. Ces jeunes auteurs pour se faire connaître ne verrouilleront sans doute pas leurs ouvrages, parce qu’ils cherchent d’abord à être lus, à profiter du marketing viral offert par une diffusion libre. S’ils les verrouillent ils devront faire avec le refus des lecteurs soucieux d’intérropérabilité, avec l’obsolescence des readers ou des logiciels de lecture, ou avec les techniques de détournement des DRM. Une fois reconnus, recherchés par les lecteurs, une plate forme intelligente d’impression/distribution répondra à la demande papier.

Le métier d’éditeur-gestionnaire
La gestion de la production et de la distribution du livre papier imposait jusqu’ici la disponibilité de fonds importants garantis par l’association “éditeur-leveur de fonds” reposant elle-même sur l’auteur à succès. Cette économie, axée sur un marketing très fort et coûteux, trouvait sa légitimité culturelle dans son rôle de dénicheur de talents et dans la valorisation et le soutien de la création non directement rentable, elle-même tributaire pour exister de cette économie du livre papier. Le cercle était fermé.

La disparition, ou la répartition, du coût et de la logistique de production/distribution numérique et/ou papier rendra ce modèle obsolète.

Nous n’en sommes pas encore tout à fait là car les auteurs ont des habitudes d’écriture et ont encore du mal à changer d’outils. Il va suffire d’un premier succès d’auteur produit et directement accessible en ligne, ne serait-ce que d’un succès d’estime, pour que le basculement s’amorce. Que cet auteur soit auto-produit, soutenu par un éditeur exclusivement Web, par un regroupement ou par une association d’éditeurs (voir de blogueurs littéraires).

Le financement de la culture:
Pour financer la culture il faut pouvoir l’identifier or le Web applicatif nous fait passer de “Culture” à “cultures”. C’est déjà, et cela à toujours été, le cas. Aujourd’hui c’est outillé. Les réseaux d’intérêt et de prescription se développent, se spécialisent, se relient. Plus encore, les créateurs se multiplient. Combien de manuscrits sont-ils envoyés aux maisons d’édition chaque année en France dans l’espoir d’une publication? Il faut s’attendre à ce qu’une grande partie des refoulés finissent sur la Toile, sous une forme plus qu’acceptable, sur des sites personnels, dans des catalogues d’associations d’amateurs de littérature ou d’éditeurs en ligne. Les éditions “à compte d’auteur”, “à compte d’association”, “à compte de réseau de blogueurs”, vont se multiplier. Avec ce qu’elles offrent de bon et de moins bon. Avec ce qui sera lu et trouvera son public, avec ce qui sera vendu en impression à la demande ou en format électronique.
À ce titre les propositions de Philippe Aigrain sont vaines et symptomatiques encore une fois de cette tentative de transposition statique d’un modèle dans un autre. Il tente dans son ouvrage “Internet & Création” d’harmoniser les échanges libres des internautes et le financement de la culture. Nous saluons la noblesse de l’intention et, peut-être, l’intelligence politique, destinée à éviter le bouclage, le traçage et la pénalisation des échange de “biens culturels” sur le Net. Mais malheureusement, pas plus que la solution du bouclage celle de la “contribution créative” ne tient compte du changement de statut de l’auteur. Philippe Aigrain invoque la révolution informationnelle sans oser pousser jusqu’au bout la logique des outils de production et la vague de “création” qui submerge le Net. Il constate que “les pratiques culturelles se développent à une échelle sans précédent” sans sembler réaliser que la culture perd ainsi son statut spécifique. Qu’est-ce qu’est un créateur à l’heure du Web applicatif? Qui est digne du statut d’auteur, qui ne l’est pas? Quel réseau possède l’expertise pour en juger, lesquels ne l’ont pas?

Pour autant la littérature et la culture ne sont pas en danger dans ce processus, nonobstant le discours qui ressurgit sur la mainmise des amateurs par opposition aux experts. D’une part l’histoire a démontré l’inanité de l’argument et d’autre part rien n’empêche les experts de prendre part au mouvement. Ce qui est en “danger” c’est la gestion actuelle de la culture et le statut de l’auteur.

Toute l’architecture du financement de la culture est remise en question. Comment financer des cultures et une multitude de créateurs? Il n’y a aucun modèle actuel qui puisse répondre à cette problématique inédite sinon, selon nous, un modèle inédit issu lui-même du Web applicatif, le modèle mis en place autour du logiciel Libre. Il est basé sur la triade (une autre!) “développeurs/associations/entreprises” que l’on pourrait transposer ainsi “créateurs/associations(éditeurs-consultants)/plateformes de commercialisation (de service)”.
Il semblerait que cette proposition soit perçue comme péjorative à l’égard des créateurs, considérés ainsi comme de “simples” programmeurs (cette distinction entre celui qui fait et celui qui pense étant une réminiscence de la séparation logique entre outil et pensée!). D’autre part ce modèle est assimilé à une culture de la gratuité. C’est une erreur. Il s’agit d’une culture d’accès gratuit à la création et aux idées, financé par des services…payants. Si tant est que quelqu’un a besoin de ce service ou en a simplement envie, parce que c’est bien écrit, parce que cette production électronique est élégante et pérenne, parce qu’il veut conserver le livre papier sur son étagère, parce qu’il veut l’offrir, parce qu’il veut assister à cette lecture, à cet atelier d’écriture, parce qu’il veut pouvoir lire avant tout le monde, parce qu’il veut avoir accès à l’historique des brouillons, à la pensée en train de naître…

Il y a des services à offrir et à inventer autour du livre et de la création, et une économie de la culture Libre à bâtir (Nous ne saurions trop recommander comme source d’inspiration la lecture d’ouvrages tels que celui de François Élie sur l’Économie du Libre.)

Comme pour le logiciel Libre la vente d’exemplaires ne sera plus la source de revenus principale des éditeurs mais bien le service. Et le métier d’éditeur comme conseiller littéraire, prescripteur, dénicheur de talents devra peut-être s’articuler en marge de ces services avec un financement proche de celui du consultant indépendant. Pour cela il lui faut changer d’outils, savoir indiquer à ses auteurs des outils intelligents, passer de la tête de gondole au blog influent, à la folksonomie et aux futurs outils de réseautage. Il lui faut faire valoir en ligne son expertise culturelle et technique. Il semble que beaucoup de chemin reste à parcourir sur ce plan. Pour l’anecdote, nous avons récemment assisté à un cours donné à des étudiants en Master 2 “Métiers du livre” qui n’avaient pas la moindre idée de la façon d’ouvrir un blog sur une plate forme gratuite!

Le lecteur et le livre

Le lecteur hérite du pouvoir et des responsabilités qui y sont liées. Pouvoir de choisir les réseaux qui l’intéressent, dans les niches les plus spécialisées. Avec en conséquence la responsabilité de s’informer.

Et quant à l’expérience de lecture il n’y a aucun souci à se faire. Contrairement à une idée répandue, le livre est sans doute l’objet le moins en danger. Il ne peut que profiter de ces évolutions. Le livre Internet n’est pas le livre que nous connaissions tous jusque-là. Il est multidimensionnel. Mais rien n’empêche de l’écrire comme de le lire sur une seule dimension, papier ou électronique, et… passivement. Rien n’empêche non plus de le clore pour en faire une référence intellectuelle et culturelle. Ça n’est plus le même livre mais il en est issu et l’inclut, parce que les “développeurs” ont aussi le souci de la littérature comme de l’histoire des techniques et du lien de celle-ci à la pensée.

Passer des readers au objets Web

Les évolutions dues au passage du livre dans le Web applicatif ne seront peut-être pas exactement celles que nous disons ici. Nous ne pouvons pas non plus dessiner le modèle économique ad hoc à destination des professions en évolution. Mais il nous apparaît certain que le passage du livre numérique au livre-Internet est inévitable et souhaitable. Pour trois raisons au moins: d’une part parce qu’on ne peut pas désinventer une technologie. D’autre part parce que le Web applicatif offre un accès à la production et une responsabilité dans la sélection que beaucoup semblaient attendre, exploitent déjà et ne font que développer. Enfin parce que le livre y est plus que respecté.

Alors la forme que prend le livre numérique est signifiante, comme l’est toujours la forme quant au fond. Les “formes” que sont readers, DRM, formats statiques et logiciels de lecture dédiés constituent la négation de la transformation en cours de la production culturelle et de la culture. Elles ne doivent par conséquent pas être traitées “simplement” mais comme des impasses logiques dans l’histoire culturelle, sociale et politique du livre et de l’édition, et doivent laisser la place à des appareils munis d’une connexion à Internet, d’un navigateur Libre et d’un écran epaper.
Ces apports techniques et nouvelles perspectives de production ne sont possibles QUE parce que ces applications s’inscrivent dans le réseau. C’est ce que nous avons défini comme des applications PAR le Web et non POUR le Web. Le Web n’est pas une finalité mais un outil au service de projets d’écriture et de lecture, de partage des connaissances et de diverstissement, actuels et futurs, papier ou électronique.



Le premier adhérent!

11 novembre 2008

L’association Les Complexes est heureuse d’annoncer l’adhésion de son premier membre hors fondateurs, Yves Michon.

Nous le remercions pour son appréciation, son soutien et son engagement. Une première adhésion est importante symboliquement, reconnaissance autant qu’amorce, et formellement (nous ne sommes plus un club privé, aussi efficace soit-il, mais bel et bien une association ouverte aux idées et volontés.).

Nous avons en cette occasion créé une page de “Liste des membres”. Rejoignez-là, La Poule ou l’Œuf à besoin de voix et de bras (codeurs, auteurs, éditeurs, lecteurs…)!



La Poule ou l’Oeuf sur clef USB pour Windows

9 novembre 2008

Il s’agit pour l’instant d’une version Béta mais qui vous permet en un clic d’utiliser La Poule ou l’Œuf sous Windows.

Ça se présente sous la forme d’un fichier zippé de 490 MO qui, décompressé, en fait 973. Eh, oui, quand même !!

  • Téléchargez ce fichier: http://www.lescomplexes.com/extension/poule_usb_v0.0.1.zip
  • Dézippez ce fichier et extrayez les contenus vers votre clef USB (cela peut être long, 3/4 d’heure. Vous avez intérêt à avoir une clef de qualité et un USB 2.0 High Speed).
  • Ouvrez ensuite le fichier poule.bat qui lance les différents serveurs et firefox.

Nous avons donc dans ce kit USB prêt à l’emploi :
- wamp MSS (Mobile Storage Server) : Apache 2.2.9, MySQL 5.0.67, PHP 5.2.6 et phpMyAdmin 3.0.0-rc2
- Texlive 2008 (allégé)
- firefox PortableFirefox-3.0.0.1-fr-r02 (récupéré depuis une Framakey pratique car en français) et le plugin pour la poule (Poule Scriber V0.0.5)
- La Poule ou l’Œuf (1.2alpha) (attention ne faites aucune mise à jour, pour l’instant, depuis cette version !!!)
- le Manuel de l’utilisateur
- un livre de démo (login: demo, mot de passe:demo).

Un bug a été constaté: il empêche la compilation LaTeX dans un cas précis, quand il y a des encarts ! Ça marche sous linux pas sur windows ; pourquoi ? La discussion autour des questions concernant cette version USB pour Windows se déroule sur notre forum.

Pour l’instant évitez donc seulement de faire des encarts dans vos textes. Nous allons régler cela au plus vite. Par contre, créez des livres, personnalisez vos collections, rédigez,… Et si vous rencontrez des difficultés n’hésitez pas à nous en faire part sur le forum!



Nouveautés

9 novembre 2008

Nouveau site

Le site de La Poule ou l’Œuf a été entièrement refait (www.lescomplexes.com/pouleoeuf) et son code mis à nu au moyen de Subversion. Bienvenue aux amateurs et éventuels co-développeurs! La feuille de route est longue.

De nombreuses mises à jour ont été effectuées dans le manuel (www.lescomplexes.com/tuto) et un chapitre sur la gestion des langues ajouté.

Vidéos

Deux nouvelles vidéos (sans voix):

- gestion des langues (2,16 minutes), en rédaction et en publication.

- les replis (1,51 minutes): Les replis de niveaux linguistiques, de dimensions, de notes de bas de page, de paragraphes, etc, pour un meilleur confort de travail dans l’éditeur.

Gestion des langues: Candide en français, anglais et espagnol

Pour un exemple de la gestion des langues nous avons produit un Candide multilingue dans La Poule ou l’Œuf (merci au Projet Gutenberg). Choisissez la version de votre choix en bas du menu de gauche ou offrez vous une lecture multilangue grâce au sélecteur en haut de chacune des pages.

Publication différentielle et classement des notes (de bas de page ou dans le texte).

Suite à l’expression d’envies (ou de besoin!) ici et relayées par H. Guillaud ici nous avons préparé dans la version anglaise du Candide, aux chapitres 4 et 6, des notes insérées dans des dimensions. Elles sont par défaut désactivées. Au besoin, cliquez sur les dimensions indiquées en bas du menu de gauche pour les activer.



Présentation de La Poule ou l’Oeuf à Lyon

15 octobre 2008

Les Complexes et La Poule ou l’Œuf sont à Lyon ce samedi 18 octobre aux JDLL. Nous y serons disponibles à notre stand et présenterons l’application au public de 14h à 14h45 dans le petit amphithéâtre à CPE-Lyon.

Nous vous y attendons.



Sortir de la “chaîne de formats” dans l’édition numérique.

27 septembre 2008

Il existe typiquement trois modèles différents, divisés en deux catégories, de fabrication de contenu texte dirigé vers l’édition:

  1. Le modèle appplicatif qui se présente sous deux formes possibles: l’application CLIENT et l’application WEB.
    Dans les deux cas, la numérisation des données en entrée est pensée pour être le plus transformable possible, pour pouvoir jouer avec les options de création de contenu et produire les formats attendus ou à venir pour répondre à un ou des besoins spécifiques. Dans la plupart des cas personne ne se soucie de la façon dont les contenus sont créés. L’accent est mis sur la finesse et l’évolutivité de la création et de ses outils. Seuls importent ensuite les formats de sortie, non plus pour création mais pour diffusion, exploitation, conservation. Savez-vous comment sont numérisés les contenus dans Indesign ou QuarkXPress? Non, et cela ne vous pose aucun problème.
  2. Vient ensuite le modèle “chaîne” de formats” avec par exemple la plate-forme CybersDocs, pour la publication des thèses en ligne, ou O’Reilly avec son schéma XML Docbook.Selon ce modèle, un format produit pour répondre à un besoin sert de base pour la production d’un autre format destiné à répondre à un autre besoin. La chaîne implique que les transformations vont se suivre les unes après les autres.

Devant la recrudescence des discours encensant les “chaînes XML” nous voulons nous arrêter sur la différence logique qui sépare ces deux approches et inciter à retourner vers le modèle applicatif.

Deux idées erronées, qui n’en sont qu’une, poussent à se tourner vers le modèle de la chaîne XML:

  1. La première idée est qu’un format est séparable du processus auquel il appartient: In, Out et média/ outils associés.
  2. La seconde consiste à penser que le passage d’un format à un autre (modèle chaîne) ne représente pas une perte dans le processus d’édition, de diffusion et d’exploitation des contenus édités. Le corollaire étant qu’il existe un BON format (global, universel, intemporel) en entrée pour toutes les sorties.

Exemple de la chaîne CyberDocs

Prenons comme exemple la chaîne CyberDocs, plate-forme de conversion principalement maintenue à travers le projet Cyberthèses:

Le module de conversion de la plate-forme Cyberdocs vise à automatiser un processus de conversion depuis un format traitement de texte vers un document structuré en format XML, selon la DTD TEI Lite. Une telle opération consiste donc à identifier le plus de structure possible dans le document original pour rendre le document XML le plus riche possible.

[...]

Le module de conversion de la plate-forme Cyberdocs ne se contente pas de produire ce

document XML de référence. En effet, une fois celui-ci obtenu, le module peut produire des versions du document prêt à une publication statique, en format HTML, XHTML ou PDF. De plus, le module va préparer un ensemble de documents qui alimenteront le module de publication pour rendre l’interface de consultation encore plus riche.(Documentation PDF, p.26)

Les objectifs:

  1. production d’un document sémantiquement structuré pour un archivage pérenne (TEI Lite),
  2. publication “statique” (HTML, XHTML, PDF)
  3. recherches documentaires précises à l’intérieur d’un document ou dans une collection de documents publiés.

Le IN: dans ce processus est déterminé par la production des auteurs dans leur logiciel bureautique de traitement de texte, par une habitude, ce qui est parfaitement légitime. C’est la contrainte de départ, du ODT.

Un OUT primaire:

  • TEI Lite comme format sémantiquement structuré, pour archivage pérenne (dont on sous-entend par ailleurs qu’il serait “dynamique”).

Les OUTs secondaires (issus de TEI Lite):

  • Fiche de métadonnées,
  • HTML statique destiné à l’affichage en flux et à produire un fichier Html de transport.
  • PDF destiné à l’impression.

Analyse de la chaîne CyberDocs

Nous avons plusieurs chaînes du type: ODT-> TEI Lite -> Format X (Html, PDF, XML métadonnées)

  1. 1ère étape: passage ODT-TEI Lite
    • la feuille de style qui prépare le document ODT à cette transformation exclut de l’importation un certain nombre d’éléments: maths, dessins, graphiques, xlink, formulaires…
    • la présence de cette feuille de style implique que l’on ne peut importer du ODT dans cette chaîne QUE s’il a été structuré à cette fin, il ne s’agit plus d’une importation de ODT comme format de “traitement de texte” mais uniquement comme format “ODT destiné à être validé en tant que TEI Lite”. Si votre thèse n’a pas été produite avec cette feuille de style son importation demandera un travail de préparation important.
  2. Cette première étape, qui pallie à l’absence de structuration sémantique “littéraire” pour laquelle ODT n’est pas fait, impose donc une perte en universalité du processus.

  3. 2nde étape: Passage TEI Lite-Html et TEI Lite-PDF

Le document “XML de référence”, l’axe de la chaîne est TEI Lite, un schéma XML (vocabulaire et grammaire) développé pour l’échange des données textuelles, notamment pour les sciences humaines et les études sur les textes littéraires. Du fait de son orientation “structuration sémantique” et de son mode de production hors ligne il convient à la production de documents statiques de stockage et d’interrogation ainsi que de fiches de métadonnées riches.

C’est à partir de ce document que CyberDocs cherche à produire du HTML et du PDF, à répondre aux besoins “affichage et diffusion en flux dynamique en réseau” et “structuration typographique destinée à l’impression”. C’est oublier que TEI Lite répond déjà à une intention précise et est presque la fin d’un processus, que nous appellerons “structuration littéraire concertée pour échange de données textuelles”. Cela revient à vouloir utiliser le OUT d’un processus comme IN dans des processus qui ne lui correspondent pas et qu’en conséquence il appauvrit.

La structure TEI Lite permet de répondre en partie aux besoins de ces deux processus. CyberDocs produit bel et bien des thèses en Html (statique, enfermé dans des cadres (frameset), peu ou pas accessible aux handicapés ou aux moteurs de recherche) et en Pdf (et pourrait en produire des versions plus riches à partir de la TEI native) .

En partant de TEI Lite statique CyberDocs renonce cependant à la part collaborative du Html puisque les contenus de production ne sont ni en ligne ni associés à des outils pouvant les rendre dynamiques. Cet aspect du Web n’est sans doute pas un argument de taille pour les universités et les chercheurs dont le travail tient encore à rester “encapsulé” avant publication officielle. Mais CyberDocs renonce également à l’intégration des contenus au Web pour une exploitation raffinée des connaissances après publication (Web services). À l’exception du catalogage et de la publication de fiches de métadonnées (localisation) les contenus ne peuvent être extraits et/ou réutilisés de façon dynamique dans d’autres ouvrages, analyses, hyper indexations, etc.

Conclusion

La première étape de la chaîne nous fait perdre en universalité, la seconde en fonctionnalités.

Qu’est ce qui même au choix d’une telle chaîne de formats?

  1. L’idée d’un format ad hoc
    • TEI, TEI Lite, Docbook sont des formats de stockage et d’interrogation exprimant chacun des besoins spécifiques…,
    • ODT pour une lecture sur un bureau et sa qualité de traitement de texte Wysiwyg en relation avec l’imprimante,
    • HTML pour une présentation en flux…
    • PDF pour une impression papier…
  2. Cette pauvreté relative (perte de l’universalité de production des contenus et staticité de la sortie Web en particulier) est ici inévitable parce que l’on fait du résultat de l’objectif 1 (TEI Lite statique hors ligne) le IN des objectifs 2 et 3.

    Ce choix provient de l’idée selon laquelle un format, et notamment le XML, est une information qui peut toujours être transformée. Or, un format, quel qu’il soit, est une réponse à un besoin. Il est engagé dans un processus qui a transformé les données…. C’est le vieux principe de McLuhan, “le message est le médium”. Il n’y a pas de transmission linéaire de l’information. D’ailleurs il n’y pas d’information au sens de message portant à lui seul un sens univoque et par conséquent compris par tous de la même façon quel que soit le contexte. Il faut donc dans un premier temps oublier cette quête quasi mystique du BON format (global, universel, intemporel).

    Dans une chaîne il y a orientation à chaque étape, orientation irréversible. Cette orientation peut être de grande qualité dans un objectif donné:

    Pour autant, faire un passage horizontal d’un format vers un autre fait toujours prendre le risque d’une perte, quoi qu’il en soit de la qualité de la feuille de transformation. La perte tient dans la négligence des différences d’objectif que sous-tendent chacun des formats, le processus auquel ils appartiennent et les outils qui y sont associés. Un format est toujours une réponse à un objectif. Ou plus exactement format et objectif fusionnent.

  3. La séparation format/processus

L’autre idée qu’il faut ici démonter est celle selon laquelle un format est séparable du processus auquel il appartient: In, Out, et média, outils associés.

Le XML est partout présenté comme LE format qui offre structuration sémantique, capacité de transformation illimitée vers une multitude d’autres formats, garant de la plus grande pérennité, et qui transporte donc toute l’information nécessaire sur un contenu donné pour son utilisation actuelle et future dans tous les contextes. N’en déplaise aux “experts”, c’est une erreur.

D’une part, le xml n’est pas un format. C’est un niveau de “numérisation” règlementé, un langage de balisage générique destiné à ranger des données textuelles, et dont le vocabulaire et la grammaire ne sont pas définis a priori. Lorsque l’on détermine des règles pour le balisage, des grammaires, celles-ci s’expriment en des schémas (DTDpar exemple), qui permettent notamment de valider automatiquement un document sur sa conformité à ce modèle. Le xml est une technique et c’est quand il est associé à un schéma qu’il devient un format! Donc, dire que le XML garantit pérennité, capacité de transformation universelle, revient à dire que l’encodage en O et 1 garantit pérennité, capacité de transformation, etc. Autant ne rien dire.

D’autre part lorsqu’il est associé à une DTD, et devient un format, le XML est déjà engagé dans un processus spécifique, une réponse à un besoin, lié à des outils (scripts), à des modes de présentation (supports de lecture) et pour lequel cette DTD a été élaborée. Il ne peut plus (ni ne dois) dès lors être appelé à répondre à tous les besoins.

Comme pour les autres formats (non xml), pas plus TEI que Docbook, xhtml, mathml, svg, etc, ne peuvent répondre à tous les besoins. Aucun d’entre eux ne peut constituer un bon IN pour tous les autres processus d’édition: Web, papier, eBook, Mobile…

Comment sortir alors de cette recherche du format ad hoc, répondre au besoin de pérennité et à la peur de la multiplication des sorties?

Revenir à la logique applicative:

  • mieux regarder l’ensemble des composants, outils de fabrication, formats d’exploitations, d’utilisations, et ainsi penser en terme de processus et non pas d’objet,
  • s’assurer de la finesse et de l’évolutivité des outils de création: pour cela ne pas chercher un format de données “brutes” normé mais au contraire hybridable avec d’autres techniques (comme LaTeX et XML) qui créent une donnée “brute” la plus transformable possible. Déhiérarchiser les processus d’édition.
  • à partir de cette donnée transformable, non normée, penser publication en étoile, chaque branche correspondant à un processus (une intention) donné.Il ne faut pas d’axe majeur, de “format de référence”.
  • s’assurer de l’accessibilité, de l’ouverture des formats et langages utilisés afin qu’ils puissent évoluer en fonction des nouveaux besoins, machines, lecteurs…
  • ne pas oublier que tous les OUT/exploitation/supports de lecture à venir ne peuvent être prévus.

__________________

Schéma (image cliquable pour une meilleure lecture) : Édition numérique à partir d’une application Web comparée à une “chaîne de formats”.

formats


Lutèce d’Or dans la catégorie “Meilleur projet d’innovation et de développement Libre réalisé”

26 septembre 2008

Nous avons remporté mercredi soir, 24 septembre 2008, le Lutèce d’Or dans la catégorie “Meilleur projet d’innovation et de développement Libre réalisé”, décerné lors de Paris Capitale du Libre

Malgré notre grande, grande, grande humilité nous sommes très, très, très fiers et heureux!

Nous avons été un peu (c’est un euphémisme!) tétanisés par ce parterre de 300 personnes lors de la remise des prix et n’avons donc pu remercier que très élusivement les personnes auxquelles nous devons cette fierté. Il est temps de le faire ici.

Deux ans de travail “encapsulé”, beaucoup de plaisir, d’idées, de perspectives ont donc fait de La Poule ou l’Œuf un outil innovant et professionnel reconnu par les communautés et les entreprises du logiciel libre. Merci au jury pour cette appréciation et ce soutien. Merci également, qu’ils soient jurés ou non, à Mathieu Pasquini (In Libro Véritas), Frédéric Couchet (APRIL), Sophie Gautier (OpenOffice), Alexis Kaufmann (Framasoft), Didier Roche (Ubuntu.fr), Thierry Stoehr (AFUL). Merci également à Linagora et à son équipe pour l’organisation de Paris Capitale du Libre, et en particulier à Benjamin Jean et à Nadiya Shur. Et évidemment à Nadège Dauvergne pour son graphisme et…tout le reste!

Merci aux communautés du Libre qui partagent avec nous et auxquelles nous espérons pouvoir apporter en retour savoir, savoir-faire, enthousiasme, créativité, éthique.

Bravo également aux autres lauréats bien sûr, dont la liste est accessible ici (Toolinux) ou ici (Journal du Net avec des photos!).

_________________

Pour mention, en réponse à la forte demande “Alors, qui de la Poule ou de l’Œuf?“, sachez que le paradoxe découle d’une erreur de types logiques (Russell) selon laquelle l’œuf et la poule sont envisagés comme deux éléments disctincts alors qu’il faut les penser comme un seul et même processus.

Le paradoxe de la poule et de l’œuf se présente parfaitement tel qu’il a été énoncé par Samuel Butler, biologiste anglais du XIXe siècle  et critique de Charles Darwin : « Une poule est le meilleur moyen qu’un œuf ait trouvé pour faire un autre œuf ».

Je considère que ce paradoxe est un « cancer » de la pensée parce qu’il repose sur plusieurs confusions et que ce sont précisément ces confusions qui nous empêchent de construire le processus logique de l’évolution. Voyons plutôt!
Il n’y a en fait ni œuf ni poule. Et un biologiste devrait le savoir mieux que quiconque. Car un œuf n’est qu’une poule plus jeune. Et une poule n’est qu’un vieil œuf. L’œuf et la poule n’appartiennent pas à deux classes différentes. L’œuf, mais aussi les gamètes mâles et femelles, les jeunes poules, les vieilles poules comme les coqs, appartiennent tous à la même classe ; la classe d’une espèce de gallinacées. Le paradoxe de la poule et de l’œuf repose, lui, sur une fausse distinction logique. Et ce paradoxe est rendu possible car, depuis au moins vingt-cinq siècles, nous avons été habitués à penser en termes de catégories immuables. (Jacques Jaffelin, 1993)


Les Complexes à Paris Capitale du Libre

15 septembre 2008

Les Complexes sera présente à Paris Capitale du Libre, les 24 et 25 septembre (8h30-18h45), et La Poule ou l’Oeuf en démonstration, personnalisable bien sûr!

À bientôt donc à la Maison Internationale de Paris, 17 boulevard Jourdan 75014 Paris. RER B, arrêt Cité universitaire ou Métro ligne 4, station Porte d’Orléans.

Paris Capitale du Libre