Mythes et mutations du document numérique

Expériences graphiques, ergonomiques et interactives face aux défis de l’intelligible, de l’interopérable et du sémantique

Frank Adebiaye / Forthcome ¦ Conférences libres de l’ICAN ¦ 19 janvier 2013

Plan

    C Introduction : le document numérique, clé de voûte du monde digital

    I C Mythe n°1 : créer des documents automatiquement

    II C Mythe n°2 : reproduire la page à l’écran

    III C Mutations : intelligibilité, interopérabilité, sémantique

    C Conclusion

Introduction

    Qu’est-ce qu’un document numérique ?

Introduction

    Qu’est-ce qu’un document ?

    Pièce écrite, servant d’information ou de preuve.

    Trésor Informatisé de la Langue Française

Introduction

    Qu’est-ce qu’un document numérique ?

    Document numérique = structure + données

    [pédauque]

Introduction

    Mais encore ?

  • G Ouverture : le document numérique est altérable
  • G Automaticité : le document numérique est paramétrable
  • G Plasticité et recomposition : le document numérique est un document qui s’est « émancipé » de son support
  • [cotte]

Introduction

    Au cœur de notre environnement numérique

    Objets/concepts voisins : information, donnée, ressource, fichier, écrit, texte, image, papier, article, œuvre, livre, journal, feuille, vidéo, musique, page...

Mythe n°1 : créer des documents automatiquement

Mythe n°1 : créer des documents automatiquement

    Pourquoi ?

    G La masse d’informations à traiter, à composer, à diffuser

    G Dans les années 1970, IBM est le deuxième éditeur mondial derrière le gouvernement américain avec 11 millions de documents produits par an [sgml]

Mythe n°1 : créer des documents automatiquement

    La naissance de l’approche structurée du document

  • G GML, 1978 ; TeX, 1978 ; SGML, 1986 ; HTML, 1991 ; XML, 1998
  • G Principe général : séparation du fond et de la forme
  • G Les documents sont marqués à l’aide de balises
  • G Les balises prennent en charge la structure du document (en-tête, corps du document...) et la description du contenu.

Mythe n°1 : créer des documents automatiquement

    Typologie du marquage et du balisage des documents conçus selon une approche structurée

Mythe n°1 : créer des documents automatiquement

    Le marquage

    Marquage procédural vs marquage déclaratif

  • Marquage procédural : mettre en italique
  • Marquage déclaratif : « c’est important »

Mythe n°1 : créer des documents automatiquement

    Le balisage

    Balises de présentation vs balises de contenu / balises sémantiques

  • Balise de présentation : mettre en italique
  • Balise sémantique / de contenu : c’est une citation

Mythe n°1 : créer des documents automatiquement

    Problème : l’ordinateur sait ce que l’on fait, mais nous ne voyons pas ce que nous faisons.

Mythe n°2 : représenter la page à l’écran

Mythe n°2 : représenter la page à l’écran

    Représenter

  • G Du texte : ok
  • G Des images matricielles : ok
  • G Des formes redimensionnables : courbes de Bézier
  • G Placer tous les éléments précédents, les uns par rapport aux autres, sur une page-écran : interface graphique (métaphore du bureau) + PostScript (1982) puis PDF (1993)
  • M WYSIWYG : naissance de l’approche graphique du document

Mythe n°2 : représenter la page à l’écran

    Problème : on voit ce que l’on fait, mais l’ordinateur ne le sait pas.

Buste de Janus Bifrons, Musée du Vatican (source : Wikimedia)

Des mythes aux mutations

Janus a inspiré dans les années 1980 chez IBM des recherches autour d’un système de composition éponyme, permettant de visualiser le code sur l’écran de droite et le résultat temps réel sur l’écran de gauche.[janus]

Mutations

Mutations

    Combiner les avantages de l’approche structurée (calculabilité des données) et de l’approche graphique (visualisation du document)

Mutations

    Rôle-clé du Web et des technologies du Web

  • G Le format HTML (1991)
  • G Le format XML (1998)
  • G Le format SVG (1999-2001) s’appuyant principalement sur les formats PGML dérivé du format PostScript (Adobe, IBM, Netscape et Sun) et VML dérivé du format RTF (Autodesk, Hewlett-Packard, Macromedia, Microsoft et Visio)[svg]
  • G Les « successeurs » du PDF : le format MARS (2007) [mars] et le format EPUB 3 Fixed-Layout (février 2012)[epub]

Conclusion

Une opportunité de travailler différemment [taylor] et de concevoir plus intelligemment

  • G Travailler avec des outils et des données vraiment numériques et pas seulement numérisées | intelligibilité
  • G Pérennisation des données numériques via le recours à des formats ouverts | interopérabilité
  • G Valorisation des fonds numériques et éditoriaux via l’enrichissement et l’interrogation documentaire (données structurées + métadonnées) | sémantique

Références

  • [cotte] Cotte Dominique. Le concept de « « document numérique » Communication et langages. N°140, 2ème trimestre 2004, pp. 31-41 [en ligne] | http://bit.ly/Jc7nOL
  • [epub] EPUB 3 Fixed-Layout Documents. IDPF, 2012 [en ligne] | http://bit.ly/XZWUxy
  • [janus] D. D. Chamberlin, O. P. Bertrand, M. J. Goodfellow, J. C. King, D. R. Slutz, S. J. P. Todd, and B. W. Wade. JANUS: An interactive document formatter based on declarative tags. IBM Systems Journal, Volume 21, N° 3. 1982
  • [mars] Hardy Matthew. The Mars Project — PDF in XML. Adobe, 2007 [en ligne] | http://adobe.ly/UGAz1H

Références

  • [pédauque] Pédauque Roger. Le document à l’heure du numérique. C&F éditions. Septembre 2006.
  • [sgml] Goldfarb Charles F. SGML: The Reason Why and the First Published Hint. Journal of the American Society for Information Science. Volume 48, Number 7, July 1997 [en ligne] | http://bit.ly/13omufM
  • [svg] Secret Origin of SVG. W3C, novembre 2010 [en ligne] | http://bit.ly/lYZXSb
  • [taylor] Taylor Conrad. Mais qu’est ce qu’ont bien pu nous apporter les systèmes WYSIWYG ? Cahiers GUTenberg, n°27, juillet 1997 [en ligne] | http://bit.ly/XZvmrX

Table des abbréviations

  • EPUB : Electronic PUBlication
  • GML : Generalized Markup Language
  • HTML : HyperText Markup Language
  • IBM : Industrial Business Machines
  • PDF : Portable Document Format
  • PGML : Precision Graphics Markup Language
  • RTF : Rich Text Format
  • SGML : Standard Generalized Markup Language
  • SVG : Scalable Vector Graphics
  • VML : Vector Markup Language
  • WYSIWYG : What You See Is What You Get
  • XML : eXtensible Markup Language

Merci pour votre attention

Présentation réalisée à l’aide de reveal.js

crédits typographiques
gandhi sans de cristobal henestrorosa et raul plancarte, kontrapunkt bob de kontrapunkt, cp mono de graham smith & frth bullit de frank adebiaye

© forthcome
we compute letters & numbers
http://www.forthcome.fr
contact@forthcome.fr

présentation sous licence creative commons
paternité pas de modification pas d’utilisation commerciale partage à l’identique

Des questions

?