HTML

De El Museo de los 8 Bits
Ir a la navegación Ir a la búsqueda

HTML, siglas de HyperText Markup Language (Lenguaje de Marcas de Hipertexto), es el lenguaje de marcado predominante para la construcción de páginas web. Es usado para describir la estructura y el contenido en forma de texto, así como para complementar el texto con objetos tales como imágenes. HTML se escribe en forma de "etiquetas", rodeadas por corchetes angulares (<,>). HTML también puede describir, hasta un cierto punto, la apariencia de un documento, y puede incluir un script (por ejemplo Javascript), el cual puede afectar el comportamiento de navegadores web y otros procesadores de HTML.

HTML también es usado para referirse al contenido del tipo de MIME text/html o todavía más ampliamente como un término genérico para el HTML, ya sea en forma descendida del XML (como XHTML 1.0 y posteriores) o en forma descendida directamente de SGML (como HTML 4.01 y anteriores).

Por convención, los archivos de formato HTML usan la extensión .htm o .html.

Historia de HTML

Primeras especificaciones

La primera descripción de HTML disponible públicamente fue un documento llamado HTML Tags (Etiquetas HTML), publicado por primera vez en Internet por Tim Berners-Lee en 1991.[1][2] Describe 22 elementos comprendiendo el diseño inicial y relativamente simple de HTML. Trece de estos elementos todavía existen en HTML 4.[3]

Berners-Lee consideraba a HTML una ampliación de SGML, pero no fue formalmente reconocida como tal hasta la publicación de mediados de 1993, por la IETF, de una primera proposición para una especificación de HTML: el boceto Hypertext Markup Language de Berners-Lee y Dan Connolly, el cual incluía una Definición de Tipo de Documento SGML para definir la gramática.[4] El boceto expiró luego de seis meses, pero fue notable por su reconocimiento de la etiqueta propia del navegador Mosaic usada para insertar imágenes sin cambio de línea, reflejando la filosofía del IETF de basar estándares en prototipos con éxito. [5] Similarmente, el boceto competidor de Dave Raggett HTML+ (Hypertext Markup Format) (Formato de marcaje de hipertexto), de 1993 tardío, sugería, estandarizar características ya implementadas tales como tablas.[6]

Marcado HTML

HTML consta de varios componentes vitales, incluyendo elementos y sus atributos, tipos de data, y la declaración de tipo de documento.

Elementos

Los elementos son la estructura básica de HTML. Los elementos tienen dos propiedades básicas: atributos y contenido. Cada atributo y contenido tiene ciertas restricciones para que se considere válido al documento HTML. Un elemento generalmente tiene una etiqueta de inicio (p.ej. <nombre-de-elemento>) y una etiqueta de cierre (p.ej. </nombre-de-elemento>). Los atributos del elemento están contenidos en la etiqueta de inicio y el contenido está ubicado entre las dos etiquetas (p.ej. <nombre-de-elemento atributo="valor">Contenido</nombre-de-elemento>). Algunos elementos, tales como <br>, no tienen contenido ni llevan una etiqueta de cierre. Debajo se listan varios tipos de elementos de marcado usados en HTML.

El marcado estructural describe el propósito del texto. Por ejemplo, <h2>Golf</h2> establece a "Golf" como un encabezamiento de segundo nivel, el cual se mostraría en un navegador de una manera similar al título "Marcado HTML" al principio de esta sección. El marcado estructural no define cómo se verá el elemento, pero la mayoría de los navegadores web han estandarizado el formato de los elementos. Un formato específico puede ser aplicado al texto por medio de hojas de estilo en cascada.

El marcado presentacional describe la apariencia del texto, sin importar su función. Por ejemplo, <b>negrita</b> indica que los navegadores web visuales deben mostrar el texto en negrita, pero no indica qué deben hacer los navegadores web que muestran el contenido de otra manera (por ejemplo, los que leen el texto en voz alta). En el caso de <b>negrita</b> e <i>itálica</i>, existen elementos que se ven de la misma manera pero tienen una naturaleza más semántica: <strong>enfásis fuerte</strong> y <em>énfasis</em>. Es fácil ver cómo un lector de pantalla debería interpretar estos dos elementos. Sin embargo, son equivalentes a sus correspondientes elementos presentacionales: un lector de pantalla no debería decir más fuerte el nombre de un libro, aunque éste esté en itálicas en una pantalla. La mayoría del marcado presentacional ha sido desechada con HTML 4.0, en favor de Hojas de estilo en cascada.

El marcado hipertextual se utiliza para enlazar partes del documento con otros documentos o con otras partes del mismo documento. Para crear un enlace es necesario utilizar la etiqueta de ancla <a> junto con el atributo href, que establecerá la dirección URL a la que apunta el enlace. Por ejemplo, un enlace a la Wikipedia sería de la forma <a href=”es.wikipedia.org”>Wikipedia</a>. También se pueden crear enlaces sobre otros objetos, tales como imágenes <a href=”enlace”><img src=”imagen” /></a>.

Atributos

La mayoría de los atributos de un elemento son pares nombre-valor, separados por un signo de igual "=" y escritos en la etiqueta de comienzo de un elemento, después del nombre de éste. El valor puede estar rodeado por comillas dobles o simples, aunque ciertos tipos de valores pueden estar sin comillas en HTML (pero no en XHTML).[7][8] De todas maneras, dejar los valores sin comillas es considerado poco seguro.[9] En contraste con los pares nombre-elemento, hay algunos atributos que afectan al elemento simplemente por su presencia[10] (tal como el atributo ismap para el elemento img).[11]

Códigos HTML básicos

  • <html>: define el inicio del documento HTML, le indica al navegador que lo que viene a continuación debe ser interpretado como código HTML. Esto es así de facto, ya que en teoría lo que define el tipo de documento es el DOCTYPE, significando la palabra justo tras DOCTYPE el tag de raíz, por ejemplo:
 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Strict//EN" "http://www.w3.org/TR/html4/strict.dtd">
  • <script>: incrusta un script en una web, o se llama a uno mediante src="uri del script" Se recomienda incluir el tipo MIME en el atributo type, en el caso de JavaScript text/javascript.
  • <head>: define la cabecera del documento HTML, esta cabecera suele contener información sobre el documento que no se muestra directamente al usuario. Como por ejemplo el título de la ventana del navegador. Dentro de la cabecera <head> podemos encontrar:
  • <title>: define el título de la página. Por lo general, el título aparece en la barra de título encima de la ventana
  • <link>: para vincular el sitio a hojas de estilo o iconos Por ejemplo:<link rel="stylesheet" href="/style.css" type="text/css">
  • <style>: para colocar el estilo interno de la página; ya sea usando CSS, u otros lenguajes similares. No es necesario colocarlo si se va a vincular a un archivo externo usando la etiqueta <link>
  • <meta>: para metadatos como la autoría o la licencia, incluso para indicar parámetros http (mediante http-equiv="") cuando no se pueden modificar por no estar disponible la configuración o por dificultades con server-side scripting.
  • <body>: define el contenido principal o cuerpo del documento. Esta es la parte del documento html que se muestra en el navegador; dentro de esta etiqueta pueden definirse propiedades comunes a toda la página, como color de fondo y márgenes. Dentro del cuerpo <body> podemos encontrar numerosas etiquetas. A continuación se indican algunas a modo de ejemplo:
  • <h1> a <h6>: encabezados o títulos del documento con diferente relevancia.
  • <table>: define una tabla
  • <tr>: fila de una tabla
  • <td>: columna de de una tabla
  • <a>: Hipervínculo o enlace, dentro o fuera del sitio web. Debe definirse el parámetro de pasada por medio del atributo href. Por ejemplo: <a href="http://www.wikipedia.org">Wikipedia</a> se representa como Wikipedia)
  • <div>: división de la página. Se recomienda, junto con css, en vez de <table> cuando se desea alinear contenido
  • <img>: imagen. Requiere del atributo src, que indica la ruta en la que se encuentra la imagen. Por ejemplo: <img src="./imagenes/mifoto.jpg" />. Es conveniente, por accesibilidad, poner un atributo alt="texto alternativo".
  • <li><ol><ul>: Etiquetas para listas.
  • <b>: texto en negrita (Etiqueta desaprobada. Se recomienda usar la etiqueta <strong>)
  • <i>: texto en cursiva (Etiqueta desaprobada. Se recomienda usar la etiqueta <em>)
  • <s>: texto tachado (Etiqueta desaprobada. Se recomienda usar la etiqueta <del>)
  • <u>: texto subrayado

La mayoría de etiquetas deben cerrarse como se abren, pero con una barra ("/") tal como se muestra en los siguientes ejemplos:

  • <table><tr><td>Contenido de una celda</td></tr></table>
  • <script>Código de un [[script]] integrado en la página</script>.


Nociones básicas de HTML

El lenguaje HTML puede ser creado y editado con cualquier editor de textos básico, como puede ser Gedit en Linux, el Bloc de Notas de Windows, o cualquier otro editor que admita texto sin formato como GNU Emacs, Microsoft Wordpad, TextPad, Vim, Notepad++, entre otros.

Existen además, otros editores para la realización de sitios Web con características WYSIWYG (What You See Is What You Get, o en español: “lo que ves es lo que obtienes”). Estos editores permiten ver el resultado de lo que se está editando en tiempo real, a medida que se va desarrollando el documento. Ahora bien, esto no significa una manera distinta de realizar sitios web, sino que una forma un tanto más simple ya que estos programas, además de tener la opción de trabajar con la vista preliminar, tiene su propia sección HTML la cual va generando todo el código a medida que se va trabajando. Algunos ejemplos de editores WYSIWIG son Macromedia Dreamweaver, o Microsoft FrontPage.

Combinar estos dos métodos resulta muy interesante, ya que de alguna manera se ayudan entre sí. Por ejemplo; si se edita todo en HTML y de pronto se olvida algún código o etiqueta, simplemente me dirijo al editor visual o WYSIWYG y se continúa ahí la edición, o viceversa, ya que hay casos en que sale más rápido y fácil escribir directamente el código de alguna característica que queramos adherirle al sitio, que buscar la opción en el programa mismo.

Existe otro tipo de editores HTML llamados WYSIWYM (Lo que ves es lo que quieres decir) que dan más importancia al contenido y al significado que a la apariencia visual. Entre los objetivos que tienen estos editores es la separación del contenido y la presentación, fundamental en el diseño Web.

HTML utiliza etiquetas o marcas, que consisten en breves instrucciones de comienzo y final, mediante las cuales se determina la forma en la que debe aparecer en su navegador el texto, así como también las imágenes y los demás elementos, en la pantalla del ordenador.

Toda etiqueta se identifica porque está encerrada entre los signos menor que y mayor que (<>), y algunas tienen atributos que pueden tomar algún valor. En general las etiquetas se aplicarán de dos formas especiales:

  • Se abren y se cierran, como por ejemplo: <b>negrita</b> que se vería en su navegador web como negrita.
  • No pueden abrirse y cerrarse, como <hr> que se vería en su navegador web como una línea horizontal.
  • Otras que pueden abrirse y cerrarse, como por ejemplo <p>.
  • Las etiquetas básicas o mínimas son:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> 
 <html lang="es">
   <head>
     <title>Ejemplo</title>
   </head>
   <body>
     <p>ejemplo</p>
   </body>
 </html>

Saber más

Seleccionando la opción Ver código fuente en el navegador, se puede ver realmente la información que está recibiendo éste y cómo la está interpretando. Por ejemplo: en Internet Explorer o en Firefox, simplemente hay que desplegar el menú Ver y luego elegir Código fuente. De esta forma, se abrirá el editor de texto configurado como predeterminado en el sistema con el código fuente de la página que se esté viendo en ese momento en el explorador. Otra forma más rápida consiste en hacer clic con el botón derecho del ratón en cualquier punto del área donde el navegador muestra la página web y elegir Ver código fuente.

Para el navegador Firefox existe el plugin FireBug, un depurador que permite entre otras cosas visualizar el código HTML de la página que estamos visualizando de forma dinámica, y que incluso resalta el trozo de código por el que está pasando el ratón en cada momento, por lo que es una herramienta muy útil para aprender diversos conceptos de este lenguaje.

Historia del estándar

En 1989 existían dos técnicas que permitían vincular documentos electrónicos, por un lado los hipervínculos (links) y por otro lado un poderoso lenguaje de etiquetas denominado SGML. Por entonces, Tim Berners-Lee da a conocer a la prensa que estaba trabajando en un sistema que permitirá acceder a ficheros en línea, funcionando sobre redes de computadoras o máquinas electrónicas basadas en el protocolo TCP/IP.

A principios de 1990, Tim Berners-Lee define por fin el HTML como un subconjunto del conocido SGML y crea algo más valioso aún, el World Wide Web. En 1991, Tim Berners-Lee crea el primer navegador web, que funcionaría en modo texto y sobre un sistema operativo UNIX.

Los trabajos para crear un sucesor del HTML, denominado HTML +, comenzaron a finales de 1993. HTML+ se diseñó originalmente para ser un superconjunto del HTML que permitiera evolucionar gradualmente desde el formato HTML anterior. A la primera especificación formal de HTML+ se le dio, por lo tanto, el número de versión 2 para distinguirla de las propuestas no oficiales previas. Los trabajos sobre HTML+ continuaron, pero nunca se convirtió en un estándar, a pesar de ser la base formalmente más parecida al aspecto compositivo de las especificaciones actuales.

El borrador del estándar HTML 3.0 fue propuesto por el recién formado W3C en marzo de 1995. Con él se introdujeron muchas nuevas capacidades, tales como facilidades para crear tablas, hacer que el texto fluyese alrededor de las figuras y mostrar elementos matemáticos complejos. Aunque se diseñó para ser compatible con HTML 2.0, era demasiado complejo para ser implementado con la tecnología de la época y, cuando el borrador del estándar expiró en septiembre de 1995, se abandonó debido a la carencia de apoyos de los fabricantes de navegadores web. El HTML 3.1 nunca llegó a ser propuesto oficialmente, y el estándar siguiente fue el HTML 3.2, que abandonaba la mayoría de las nuevas características del HTML 3.0 y, a cambio, adoptaba muchos elementos desarrollados inicialmente por los navegadores web Netscape y Mosaic. La posibilidad de trabajar con fórmulas matemáticas que se había propuesto en el HTML 3.0 pasó a quedar integrada en un estándar distinto llamado MathML.

El HTML 4.0 también adoptó muchos elementos específicos desarrollados inicialmente para un navegador web concreto, pero al mismo tiempo comenzó a limpiar el HTML señalando algunos de ellos como 'desaprobados'.

Accesibilidad Web

El diseño en HTML aparte de cumplir con las especificaciones propias del lenguaje debe respetar unos criterios de accesibilidad web, siguiendo unas pautas, o las normativas y leyes vigentes en los países donde se regule dicho concepto. Se encuentra disponible y desarrollado por el W3C a través de las Pautas de Accesibilidad al Contenido Web 1.0 WCAG (actualizadas recientemente con la especificación 2.0[12]), aunque muchos países tienen especificaciones propias, como es el caso de España con la Norma UNE 139803.[13]

Entidades HTML

Los caracteres especiales como signo de puntuación, letras con tilde o diéresis, o símbolos del lenguaje, disponen de su entidad HTML para mostrarlas independientemente de la fuente empleada. Si no se sustituyen, puede verse alterada su representación. Además de la entidad HTML, se admite su código en el set de caracteres.

Caracter # Entidad Nombre Entidad Descripción
" &#34; &quot; comilla doble
' &#39; &apos; apóstrofe
& &#38; &amp; ampersand
< &#60; &lt; menor que
> &#62; &gt; mayor que
  &#160; &nbsp; espacio duro
¡ &#161; &iexcl; apertura de exclamación
¢ &#162; &cent; centavo
£ &#163; &pound; libra esterlina
¤ &#164; &curren; currency
¥ &#165; &yen; yen
¦ &#166; &brvbar; pipe
§ &#167; &sect; section
¨ &#168; &uml; diéresis
© &#169; &copy; copyright
ª &#170; &ordf; ordinal femenino
« &#171; &laquo; cita izquierda
¬ &#172; &not; negación
­ &#173; &shy; soft hyphen
® &#174; &reg; Marca Registrada
¯ &#175; &macr; spacing macron
° &#176; &deg; grado
± &#177; &plusmn; mas menos
² &#178; &sup2; al cuadrado
³ &#179; &sup3; al cubo
´ &#180; &acute; acento
µ &#181; &micro; micro
&#182; &para; paragrafo
· &#183; &middot; punto medio
¸ &#184; &cedil; espacio cedilla
¹ &#185; &sup1; elevado a 1
º &#186; &ordm; ordinal masculino
» &#187; &raquo; cita derechas
¼ &#188; &frac14; 1/4
½ &#189; &frac12; 1/2
¾ &#190; &frac34; fraction 3/4
¿ &#191; &iquest; apertura de interrogación
× &#215; &times; multiplicación
÷ &#247; &divide; división
À &#192; &Agrave; A grave
Á &#193; &Aacute; A aguda
 &#194; &Acirc; A circunfleja
à &#195; &Atilde; A tilde
Ä &#196; &Auml; A diéresis
Å &#197; &Aring; A ring
Æ &#198; &AElig; AE
Ç &#199; &Ccedil; Cedilla
È &#200; &Egrave; E grave
É &#201; &Eacute; E aguda
Ê &#202; &Ecirc; E circunfleja
Ë &#203; &Euml; E diéresis
Ì &#204; &Igrave; I grave
Í &#205; &Iacute; I aguda
Î &#206; &Icirc; I circunfleja
Ï &#207; &Iuml; I diéresis
Ð &#208; &ETH; capital eth, Islandia
Ñ &#209; &Ntilde; eñe mayúscula
Ò &#210; &Ograve; O grave
Ó &#211; &Oacute; O aguda
Ô &#212; &Ocirc; O circunfleja
Õ &#213; &Otilde; O tilde
Ö &#214; &Ouml; O diéresis
Ø &#216; &Oslash; O slash
Ù &#217; &Ugrave; U grave
Ú &#218; &Uacute; U aguda
Û &#219; &Ucirc; U circunfleja
Ü &#220; &Uuml; U diéresis
Ý &#221; &Yacute; capital y, aguda
Þ &#222; &THORN; THORN, Islandia
ß &#223; &szlig; Beta, Alemania
à &#224; &agrave; a grave
á &#225; &aacute; a aguda
â &#226; &acirc; a circunfleja
ã &#227; &atilde; a tilde
ä &#228; &auml; a diéresis
å &#229; &aring; a ring
æ &#230; &aelig; ae
ç &#231; &ccedil; cedilla
è &#232; &egrave; e grave
é &#233; &eacute; e aguda
ê &#234; &ecirc; e circunfleja
ë &#235; &euml; e diéresis
ì &#236; &igrave; i grave
í &#237; &iacute; i aguda
î &#238; &icirc; i circunfleja
ï &#239; &iuml; i diéresis
ð &#240; &eth; eth, Islandia
ñ &#241; &ntilde; eñe
ò &#242; &ograve; o grave
ó &#243; &oacute; o aguda
ô &#244; &ocirc; o circunfleja
õ &#245; &otilde; o tilde
ö &#246; &ouml; o diéresis
ø &#248; &oslash; o slash
ù &#249; &ugrave; u grave
ú &#250; &uacute; u aguda
û &#251; &ucirc; u circunfleja
ü &#252; &uuml; u diéresis
ý &#253; &yacute; y aguda
þ &#254; &thorn; thorn, Islandia
ÿ &#255; &yuml; y diéresis


Véase también

Referencias

  1. «HTML Tags». World Wide Web Consortium. Consultado el 2007-04-08.
  2. «First mention of HTML Tags on the www-talk mailing list». World Wide Web Consortium (1991-10-29). Consultado el 2007-04-08.
  3. «Index of elements in HTML 4». World Wide Web Consortium (1999-12-24). Consultado el 2007-04-08.
  4. Tim Berners-Lee (1991-12-09). «Re: SGML/HTML docs, X Browser (archived www-talk mailing list post)». Consultado el 2007-06-16. «SGML is very general. HTML is a specific application of the SGML basic syntax applied to hypertext documents with simple structure.».
  5. Raymond, Eric. «IETF and the RFC Standards Process», The Art of Unix Programming. «In IETF tradition, standards have to arise from experience with a working prototype implementation — but once they become standards, code that does not conform to them is considered broken and mercilessly scrapped. …Internet-Drafts are not specifications, and software implementers and vendors are specifically barred from claiming compliance with them as if they were specifications. Internet-Drafts are focal points for discussion, usually in a working group… Once an Internet-Draft has been published with an RFC number, it is a specification to which implementers may claim conformance. It is expected that the authors of the RFC and the community at large will begin correcting the specification with field experience.»
  6. «HTML+ Internet-Draft - Abstract». «Browser writers are experimenting with extensions to HTML and it is now appropriate to draw these ideas together into a revised document format. The new format is designed to allow a gradual roll over from HTML, adding features like tables, captioned figures and fill-out forms for querying remote databases or mailing questionnaires.».
  7. «www.w3.org/TR/html401/intro/sgmltut.html#h-3.2.2».
  8. «www.w3.org/TR/xhtml1/diffs.html#h-4.4».
  9. «www.cs.tut.fi/~jkorpela/qattr.html».
  10. «www.w3.org/History/19921103-hypertext/hypertext/WWW/MarkUp/Tags.html».
  11. «www.w3.org/TR/1999/REC-html401-19991224/struct/objects.html#adef-ismap».
  12. «Web Content Accessibility Guidelines (WCAG) 2.0».
  13. Norma UNE 139803

Enlaces externos

Atribución

Este artículo proviene originalmente de Wikipedia
que lo licencia simultáneamente bajo las licencias

Creative Commons Reconocimiento - CompartirIgual 3.0
y la licencia de documentación libre GNU v.1.2 y posteriores
El Museo de los 8 Bits lo integra en su wiki bajo cc-by-sa-3.0

Creative Commons License
GNU head