martes, 23 de octubre de 2012

Dublin Core en RDF. Segunda parte

En el capítulo anterior, se explicaban algunas nociones básicas relativas al empleo de metadatos en RDF, el papel que juegan los espacios de nombres o namespaces, la estructura básica de la construcción de triples , el sujeto, predicado y objeto. En la segunda parte de la explicación, se define el modelo sintáctico para utilizar metadatos Dublin Core en RDF, de acuerdo a las normas definidas por DCMI, disponibles en: http://www.dublincore.org/documents/dc-rdf/

En primer lugar es necesario comprender que Dublin Core se aplica en RDF gracias a lo que se denomina el Dublin Core Abstract Model, también conocido como DCAM, por el que se determinan las reglas de construcción básicas en la web semántica mediante metadatos Dublin Core. El modelo dispone que el recurso web (sujeto) debe ser descrito mediante propiedades (predicado) para los que se consignan unos valores (objeto) que pueden ser de tipo literal o no literal, véase figura1.

Figura1. Modelo DCAM básico en Dublin Core. Fuente: http://dublincore.org/documents/2007/04/02/abstract-model/resource-model.jpg


Conceptos básicos del modelo DCAM
  • Description set = Conjunto de descripción .- Es el conjunto de descripciones que describe un recurso. En el caso de un documento monográfico de una biblioteca, el conjunto de descripciones configuraría la ficha catalográfica completa, considerándose el conjunto de descripción. La cardinalidad es de una o más propiedades para un único recurso.
  • Las declaraciones de cada par propiedad/valor se compone de un URI que identifica dicha propiedad de forma unívoca y un valor literal compuesto por una cadena de caracteres o no literal (0,1) de acuerdo al esquema de codificación del vocabulario.
  • La cadena de caracteres del literal puede ser de lenguaje asociado o normalizado como por ejemplo "spa" de acuerdo al schema ISO639-2 o contener una cadena de caracteres comprensible  "Oráculo manual y arte de prudencia".


Codificación de Dublin Core en RDF
  1. Primera línea del archivo RDF = <?xml version="1.0" encoding="UTF-8"?> .- Indica el tipo de documento, ya que RDF es un formato derivado de XML, por ello se indica como cabecera su versión y codificación de caracteres. Habitualmente se suele emplear la codificación universal UTF-8 más normalizada para cualquier variedad idiomática y caracteres especiales que puedan ser necesarios referir como datos en la metadescripción.
  2. Identificación del formato empleado y líneas de namespace o espacio de nombres utilizados .- lo constituyen las líneas 2 - 4 de la tabla1. Se designa el tipo de formato que se emplea como base para la descripción mediante Dublin Core. En este caso, tal como se viene explicando, RDF. La declaración de tipo de documento RDF, se expresa mediante la etiqueta de apertura <rdf:RDF> y cierre </rdf:RDF>. La etiqueta de apertura constará habitualmente de los atributos de los distintos namespaces o espacio de nombres de los formatos de metadatos que se emplearán en la descripción. Un ejemplo de atributo con su valor de namespace es xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" donde xmlns significa (XML namespace) y el valor que toma es la URL de la normativa y reglas sintácticas que rigen la construcción y terminología del formato que se especifica a través del prefijo especificado tras los dos puntos rdf. En el caso de Dublin Core, el namespace es xmlns:dc="http://purl.org/dc/elements/1.1/", cuyo prefijo es dc y sus especificaciones normativas son las especificadas en http://purl.org/dc/elements/1.1/
  3. Declaración del sujeto, recurso o documento que será descrito, véase línea 6 de la tabla1. Dicha operación se efectúa utilizando la etiqueta de apertura <rdf:Description> y </rdf:Description> de cierre. Entre ambas etiquetas se circunscribirán las etiquetas de descripción Dublin Core propiamente dichas. Obsérvese que la etiqueta de apertura consta de un atributo rdf:about="" utilizado para especificar el identificador o sujeto de la descripción, habitualmente una URI permalink del recurso que se describe.
  4. La descripción propiamente dicha mediante metadatos Dublin Core puede comprobarse en las líneas 8 - 13 en las que se pueden analizar los distintos métodos de codificación:
    • <dcterms:subject>Literatura</dcterms:subject> Corresponde a la codificación mediante anidamiento del valor literal "literatura". Se pueden crear etiquetas Dublin Core de apertura y cierre con el texto de la descripción embebido.
    • <dcterms:subject rdf:type="dcterms:UDC" rdf:object="860"/> Otra forma de expresar la materia de literatura del documento es mediante una etiqueta unimembre. Se considera una etiqueta unimembre, aquella que no requiere de etiqueta de cierre y que cumple la condición de que contenga una barra oblicua ( / backslash ) antes del cierre del etiquetado, como por ejemplo ( /> ). En este ejemplo se muestra cómo mediante el uso del atributo rdf:type="dcterms:UDC" se determina el esquema de codificación de la información del metadato dcterms:subject. El literal del metadato se expresa mediante el atributo rdf:object="860" que porta el valor numérico de la Clasificación Decimal Universal para la clasificación de literatura. No obstante, se debe advertir que existen múltiples sintaxis para expresar el mismo contenido, tal como se muestra a continuación: 
      • <dcterms:subject xml:scheme="dcterms:UDC">860</dcterms:subject>
      • <dcterms:subject xml:scheme="dcterms:UDC" rdf:object="860"/>
    • <dcterms:title xml:lang="spa">Oráculo manual y arte de prudencia</dcterms:title> Al igual que en casos anteriores se emplean etiquetas de apertura y cierre para contener el dato correspondiente al título del documento. Para especificar atributos propios de las etiquetas <meta> en HTML, se emplean atributos con prefijo ( xml:[atributo] ), como por ejemplo xml:lang="spa".
    • <dcterms:type xml:scheme="dcterms:IMT">application/pdf</dcterms:type> En este caso se emplea el atributo scheme propio de la codificación <meta> de HTML, mediante la especificación del prefijo xml:scheme necesario para su correcta validación y codificación. Obsérvese que xml:scheme actúa como atributo equivalente a rdf:type, tal como se describió anteriormente. De la misma manera el atributo xml:content sería equivalente a rdf:object, para expresar el valor, texto o contenidos del metadato.
    • <dcterms:creator>Baltasar Gracián y Morales</dcterms:creator> La sintaxis utilizada para expresar el autor, de acuerdo a los modelos descritos, también podría ser definido de las siguientes formas:
      • <dcterms:creator rdf:object="Baltasar Gracián y Morales"/>
      • <dcterms:creator xml:content="Baltasar Gracián y Morales"/>
      • <dcterms:creator rdf:resource="http://id.loc.gov/authorities/names/n50047296">Baltasar Gracián y Morales</dcterms:creator>
    • <dc:identifier rdf:resource="978-84-00-08180-5"/> En el caso de establecer algún tipo de identificador URI o referencia URL de control, se emplea el atributo rdf:resource="" que contendrá el enlace a otro recurso o página web que identifica el contenido que se pretende describir. En el ejemplo se muestra el número ISBN13 y en la línea anterior la dirección URI de la autoridad de Baltasar Gracián en el índice de autoridades de la Library of Congress.
    • <dc:relation rdf:resource="http://viaf.org/viaf/177839895/"/> Para establecer relaciones con URLs o URIs de terceros recursos, se pueden emplear los atributo rdf:resource="", xml:href="", xml:content="", rdf:object="".



<?xml version="1.0" encoding="UTF-8"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
                xmlns:dc="http://purl.org/dc/elements/1.1/"
                xmlns:dcterms="http://www.purl.org/dc/terms/">

<rdf:Description rdf:about="http://cisne.sim.ucm.es/record=b2071084~S6*spi">

<dcterms:subject>Literatura</dcterms:subject>
<dcterms:subject rdf:type="dcterms:UDC" rdf:object="860"/>
<dcterms:title xml:lang="es">Oráculo manual y arte de prudencia</dcterms:title>
<dcterms:type xml:scheme="dcterms:IMT">application/pdf</dcterms:type>
<dcterms:creator>Baltasar Gracián y Morales</dcterms:creator>
<dc:identifier rdf:resource="978-84-00-08180-5"/>
<dc:relation rdf:resource="http://viaf.org/viaf/177839895/"/>

</rdf:Description>

</rdf:RDF>

Tabla1. Ejemplo de Dublin Core en RDF

Figura2. Validación, triples y esquema de metadatos Dublin Core en RDF


Embeber y vincular Dublin Core RDF en HTML
Para lograr la indexación y recopilación de la información en webcrawlers y buscadores resulta necesario vincular de algún modo las metadescripciones elaboradas en RDF. Existen varias técnicas para conseguir este objetivo, por un lado embebiendo el código fuente de RDF y Dublin Core en el documento HTML del recurso web que se está describiendo o bien vinculándolo al archivo RDF de la descripción.
  1. Técnica de embebido de Dublin Core RDF en HTML


    <html>
    <head>
    <title>Página web del recurso</title>

    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
                    xmlns:dc="http://purl.org/dc/elements/1.1/"
                    xmlns:dcterms="http://www.purl.org/dc/terms/">

    <rdf:Description rdf:about="http://cisne.sim.ucm.es/record=b2071084~S6*spi">

    <dcterms:subject>Literatura</dcterms:subject>
    <dcterms:subject rdf:type="dcterms:UDCrdf:object="860"/>
    <dcterms:title xml:lang="es">Oráculo manual y arte de prudencia</dcterms:title>
    <dcterms:type xml:scheme="dcterms:IMT">application/pdf</dcterms:type>
    <dcterms:creator>Baltasar Gracián y Morales</dcterms:creator>
    <dc:identifier rdf:resource="978-84-00-08180-5"/>
    <dc:relation rdf:resource="http://viaf.org/viaf/177839895/"/>

    </rdf:Description>

    </rdf:RDF>

    </head>
    <body>

    <!-- [Artículo o Documento completo] -->

    </body>
    </html>

    Tabla2. Ejemplo de técnica de embebido de Dublin Core RDF en XML

  2. Vinculación de archivo Dublin Core RDF en HTML


    <html>
    <head>
    <title>Página web del recurso</title>

    <link rel="meta" type="application/rdf+xml" href="descripcion.rdf"/>

    </head>
    <body>

    <!-- [Artículo o Documento completo] -->

    </body>
    </html>

    Tabla2. Ejemplo de vinculación de archivo Dublin Core RDF en HTML
Referencias

PALMER, S.B. 2002. RDF in HTML: Approaches. Disponible en: http://infomesh.net/2002/rdfinhtml/

NILSSON, M.; POWELL, A.; JOHNSTON, P.; NAEVE. A. 2008. Expressing Dublin Core metadata using the Resource Description Framework (RDF). Disponible en: http://www.dublincore.org/documents/dc-rdf/

OCLC. 2012. VIAF: Fichero de Autoridades Virtual Internacional. Disponible en: http://viaf.org/

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.