les langages du web:
structure et forme

1. HTML: Introduction

Tim Berners-Lee invente le HTML (HyperText Markup Language) en 1990 comme une 'lingua franca' pour le web, un langage simple pour la navigation hypertexte en utilisant des menus et des documents principalement textuels, et bien structurés. HTML n'est pas un langage de programmation, mais un système, un formalisme, d'annotation (structuration). On parle d'un langage de balisage.
HTML a été construit selon les principes de SGML (Standard Generalized Markup Language, le langage normalisé de balisage généralisé, adopté par l'ISO, l'Organisation Internationale pour la Normalisation (International Organization for Standardization), en octobre 1986).
HTML est une application SGML, assez simple en fait, contenant un ensemble fixe, rélativement petit, de balises.
Le but, de tous les langages de balisage, est de décrire un document, comme une structure hiérarchique d'éléments imbriqués, délimités par des balises (en anglais on dit 'tags') : au début une balise d'ouverture, à la fin la balise de fermeture correspondante. Chaque balise commence par le symbol <, suivi par un nom, et se termine avec le symbole >. Exemple: <p>, la balise qui, en HTML, est sensé d'indiquer le début d'un nouveau paragraphe de texte. (Notons en passant qu'en HTML l'utilisation d'une balise de fermeture - dans laquelle le nom est précédé par le symbol / - n'est pas toujours impérative ; </p> en est un exemple)
Exemple d'un élément 'p' :

<p> Ceci est un paragraphe de texte dans un document, annoté en HTML. Au début du paragraphe on a ajouté la version d'ouverture de la balise 'paragraphe', et à la fin la version de fermeture. Ainsi les balises se comportent comme des 'parenthèses' ... </p>

En général un élément peut avoir un ou plusieurs attributs, qui chaque ont une valeur. C'est à dire, la forme générale d'une balise est : <nom attribut_1="valeur_1" ... attribut_n="valeur_n"> Par exemple, l'élément 'p' peut avoir un attribut 'align' (alignement du texte) avec une valeur parmi 'left', 'right', 'center' et 'justify'. Comme beaucoup d'attributs des balises de l'HTML 'classique', 'align' est un attribut de mise en forme, un attribut de présentation. L'utilisation d'attributs de présentation est fortement déconseillée. Sauf exceptions rares, on utilise les feuilles de style CSS pour la présentation ...

La version actuelle de HTML, documentée et recommandée par le W3C, est le 4.01. C'est fort probablement la dernière et l'ultime version officielle de ce langage (la référence W3C est datée le 24 décembre 1999). Le W3C propose désormais comme remplaçant le XHTML (eXtensible HyperText Markup Language), un langage intermédiaire qui devrait faciliter la transition future vers le 'SGML du web': le XML (eXtensible Markup Language).
Mais vu le grand nombre de sites existants en HTML, et le grand nombre de sites toujours développé en ce langage obsolète, une bonne connaissance d'HTML reste pour le moment encore indispensable. Pour comprendre et éviter tous les erreurs qui ont été faites dans le passé, mais aussi pouvoir convaincre vos clients et vos employeurs de la nécessité d'une conversion douce vers 'les langage du futur'.

Creative Commons | CC | 2003-2005 Paris, HarsMedia / H. Schellinx. HTML & CSS valide.