/ / Marcado semántico de HTML5 para etiquetas y categorías de publicaciones de blog: xml, html5, metadata, schema.org

Marcaje semántico HTML5 para etiquetas y categorías de publicaciones de blog: xml, html5, metadata, schema.org

Muchos blogs utilizan el concepto de "etiquetas" y"Categorías" para agregar metadatos a una publicación. ¿Cuál es la mejor práctica para el marcado semántico de esta información, de manera que una máquina que lea la publicación del blog pueda identificar fácilmente las etiquetas?

Actualmente agrego "tag" al rel atributo en el enlace, por ejemplo

<a rel="tag" class="tag" href="/tags.html#site-configuration">#site-configuration</a>

Supongo que uno podría usar el formato html de Dublin Core para la palabra clave:

<meta name = "DC.Subject"
content = "site-configuration">

y agrega esto al encabezado de la página, ¿o pueden las metaetiquetas ir al cuerpo? ¿Es una u otra opción preferible, o alguna opción completamente diferente?

¿Existe una mejor estrategia en términos de proporcionar definiciones precisas y estandarizadas para el contenido?

¿Es HTML5 una opción razonable si quiero ser tan selectivo con los metadatos, o debo estar usando un doctype XML?

¿Cuáles son los pros y los contras de los diferentes enfoques?

Respuestas

14 para la respuesta № 1

los primer paso Sería obtener / usar el HTML plano semánticamente correcto. En el caso de (X) HTML5, debe crear un esquema apropiado utilizando la sección de elementos de contenido section, article, aside y nav, y use header y footer para separar el contenido de metadatos del contenido principal; También pensar en la semántica de nivel en línea como time (fecha de publicación), dfn (definiciones), abbr (abreviaturas / acrónimos) etc. Y haga uso de meta-name y rel Valores que se definen en la especificación.

los segundo paso sería utilizar valores de atributo de metadatos que no están definidos en la especificación, pero que están registrados en lugares especificados (por lo que son válidos de usar), como name palabras clave para meta elementos y rel valores para a/area/link elementos.

los tercer paso sería mejorar el marcado con anotaciones semánticas, legibles por máquina. Existen tres formas comunes de hacer esto:

  • Microformatos (utilizando predefinidos class y rel valores)
  • RDFa (usando atributos y URIs)
  • Microdatos (usando atributos y URIs)

RDFa y Microdata son similares (extensibles y bastante complejos), mientras que los Microformatos son más simples (pero no tan expresivos / extensibles). Escribí un respuesta corta en Programadores sobre las diferencias, y una respuesta más detallada sobre la Diferencias entre microdatos y RDFa..

En el caso de RDFa o Microdata, su trabajo principalsería encontrar vocabularios / ontologías que puedan describir / clasificar su contenido. Dichos vocabularios pueden ser creados por todos (incluso puede crear uno), pero a menudo es aconsejable utilizar conocidos / populares, por ejemplo, para que los motores de búsqueda puedan hacer uso de sus anotaciones (ejemplo popular: Schema.org)

En el caso de los microformatos, tendrá que encontrar un microformato (en el wiki en microformats.org) que se adapte a sus necesidades. Si no hay ninguno para su caso, podría proponer un nuevo Microformato (pero eso tomaría algún tiempo hasta que se "acepte", en todo caso).


¿Es HTML5 una opción razonable si quiero ser tan selectivo con los metadatos, o debo estar usando un doctype XML?

También puede usar XHTML5, si necesita / quiere XMLapoyo. Si "solo" usa el (X) HTML definido en la especificación y no tiene esquemas / vocabularios XML adicionales, no importará desde una perspectiva semántica si utiliza HTML (5) o XHTML (5).