jueves, 21 de octubre de 2010

INTERNET Y LOS METADATOS


Metadatos (del griego μετα, meta, «después de» y latín datum, «lo que se da», «dato» ), literalmente «sobre datos», son datos que describen otros datos. En general, un grupo de metadatos se refiere a un grupo de datos, llamado recurso. 

 El término «metadatos» no tiene una definición única. Según la definición más difundida de metadatos es que son «datos sobre datos». También hay muchas declaraciones como «informaciones sobre datos», «datos sobre informaciones» e «informaciones sobre informaciones».

Su uso en varios campos de la informática, como la recuperación de información o la web semántica, consultas a buscadores, bibliotecas digitales, e-gobierno,...etc. Por ejemplo, en una biblioteca se usan fichas que especifican autores, títulos, casas editoriales y lugares para buscar libros. Así, los metadatos ayudan a ubicar datos.

Debido a la gran diversidad y volumen de las fuentes y recursos en Internet, se hizo necesario establecer un mecanismo para etiquetar, catalogar, describir y clasificar los diferentes recursos con el fin de facilitar la posterior búsqueda y recuperación de la información. Este mecanismo lo constituyen los llamados metadatos.

Dublin Core


Dublin Core es un modelo de metadatos elaborado por la DCMI (Dublin Core Metadata Initiative), una organización dedicada a fomentar la adopción extensa de los estándares interoperables de los metadatos y a promover el desarrollo de los vocabularios especializados de metadatos para describir recursos para permitir sistemas más inteligentes del descubrimiento del recurso.

Las implementaciones de Dublin Core usan generalmente XML y se basan en el Resource Description Framework. Dublin Core se define por ISO en su norma ISO 15836 del año 2003, y la norma NISO Z39.85-2007.

El nombre viene por Dublín (Ohio, Estados Unidos), ciudad que en 1995 albergó la primera reunión a nivel mundial de muchos de los especialistas en metadatos y Web.

Dublin Core es un sistema de 15 definiciones semánticas descriptivas que pretenden transmitir un significado semántico a las mismas. Estas definiciones:
  • Son opcionales
  • Se pueden repetir
  • Pueden aparecer en cualquier orden
  • Este sistema de definiciones fue diseñado específicamente para proporcionar un vocabulario de características "base", capaces de proporcionar la información descriptiva básica sobre cualquier recurso, sin que importe el formato de origen, el área de especialización o el origen cultural.
Ya existen transcripciones a 20 idiomas y ha sido adoptado por el CEN/ISS y posee dos RFCs de Internet (RFC2413) y (RFC2731). Es también el estándar oficial del WWW Consortium y el estándar del Z39.50. Los metadatos Dublin Core han sido aprobados por el organismo nacional de estandarización norteamericano (ANSI/NISO Z39.85) y los utilizan como base, tanto gobiernos, como agencias supranacionales y muchas otras iniciativas de metadatos pertenecientes a comunidades específicas como bibliotecas, archivos, en educación, negocios, etc.

Su objetivo es elaborar normas interoperables sobre metadatos y desarrollar vocabularios especializados en metadatos para la descripción de recursos que permitan sistemas de recuperación más inteligentes. En concreto, la Iniciativa pretende:
  • Desarrollar estándares de metadatos para la recuperación de información en Internet a través de distintos dominios.
  • Definir el marco para la interoperabilidad entre conjuntos de metadatos.
  • Facilitar el desarrollo de conjuntos de metadatos específicos de una disciplina o comunidad que trabaja dentro del marco de la recuperación de información.
  • Clasificación y elementos

En general, podemos clasificar estos elementos en tres grupos que indican la clase o el ámbito de la información que se guarda en ellos:
  • Elementos relacionados principalmente con el contenido del recurso.
  • Elementos relacionados principalmente con el recurso cuando es visto como una propiedad intelectual.
  • Elementos relacionados principalmente con la instanciación del recurso.

Dentro de cada clasificación encontramos los siguientes elementos:

Contenido:

  • Título: el nombre dado a un recurso, habitualmente por el autor. Se refiere al título que lleva por nombre el documento. Etiqueta: DC.Title
  • Claves o Materia: los tópicos del recurso. En este campo se hace referencia a los diversos temas que puede contener el material. Típicamente, Subject expresará las claves o frases que describen el título o el contenido del recurso. Se fomentará el uso de vocabularios controlados y de sistemas de clasificación formales. Etiqueta: DC.Subject
  • Descripción: una descripción textual del recurso. En este campo se hace un breve resumen sobre el contenido del objeto. Puede ser un resumen en el caso de un documento o una descripción del contenido en el caso de un documento visual. Etiqueta: DC.Description
  • Fuente: secuencia de caracteres usados para identificar unívocamente un trabajo a partir del cual proviene el recurso actual. Es como una pequeña ficha bibliográfica que se elabora para asentar los datos sobre la procedencia del documento original. Etiqueta: DC.Source
  • Lengua o Lenguaje: lengua/s del contenido intelectual del recurso. En este campo se establecen las siglas correspondientes al idioma en que se presenta la publicación. Etiqueta: DC.Language
  • Relación: es un identificador de un segundo recurso y su relación con el recurso actual. Este campo tiene que ver con el material principal u objetos de su misma referencia, ya sea una colección, una serie, un documento, etc. Este elemento permite enlazar los recursos relacionados y las descripciones de los recursos. Etiqueta: DC.Relation
  • Cobertura: es la característica de cobertura espacial y/o temporal del contenido intelectual del recurso. La cobertura espacial se refiere a una región física, utilizando por ejemplo coordenadas. La cobertura temporal se refiere al contenido del recurso, no a cuándo fue creado (que ya lo encontramos en el elemento Date). Este campo se refiere al proyecto o sitio donde estará resguardada la información. Aquí pueden anotarse fechas, zonas geográficas. Etiqueta: DC.Coverage

Propiedad Intelectual:

  • Autor o Creador: la persona o organización responsable de la creación del contenido intelectual del recurso. Aquí se anota el autor intelectual de la obra o documento original. Por ejemplo, los autores en el caso de documentos escritos; artistas, fotógrafos e ilustradores en el caso de recursos visuales. Etiqueta: DC.Creator
  • Editor: la entidad responsable de hacer que el recurso se encuentre disponible en la red en su formato actual. Este campo se refiere al sitio o colección responsable, a la que está adscrito el material. Etiqueta: DC.Publisher
  • Colaboradores: una persona u organización que haya tenido una contribución intelectual significativa, pero que esta sea secundaria en comparación con las de las personas u organizaciones especificadas en el elemento Creator. (por ejemplo: editor, ilustrador y traductor). En este campo se anotan, si es que se da el caso, el nombre u organización que contribuyó a la creación del material, que no se especificó en la parte de Autor. Etiqueta: DC.Contributor
  • Derechos: son una referencia (por ejemplo, una URL) para una nota sobre derechos de autor, para un servicio de gestión de derechos o para un servicio que dará información sobre términos y condiciones de acceso a un recurso. Se anota en este campo el nombre o la institución a la cual pertenece el material y lo facilitó. Etiqueta: DC.Rights

Instanciación, elementos de aplicación:

  • Fecha: una fecha en la cual el recurso se puso a disposición del usuario en su forma actual. Esta fecha no se tiene que confundir con la que pertenece al elemento Coverage, que estaría asociada con el recurso en la medida que el contenido intelectual está de alguna manera relacionado con aquella fecha. Se anota la fecha de elaboración del registro. Etiqueta: DC.Date
  • Tipo del Recurso: la categoría del recurso. Por ejemplo, página personal, romance, poema, diccionario, etc. Para un objeto digital, se menciona la presentación que tiene el mismo, ya sea como texto, audio, video, etcétera. Etiqueta: DC.Type
  • Formato: es el formato de datos de un recurso, usado para identificar el software y, posiblemente, el hardware que se necesitaría para mostrar el recurso. Para un objeto digital, en este campo se registra el tipo de extensión con que se presenta el objeto digital, ya sea HTML, JPG, GIFF o PDF. Etiqueta: DC.Format
  • Identificador del Recurso: secuencia de caracteres utilizados para identificar unívocamente un recurso. Ejemplos para recursos en línea pueden ser URLs i URNs. Para otros recursos pueden ser usados otros formatos de identificadores, como por ejemplo ISBN ("International Standard Book Number").  Etiqueta: DC.Identifier
Usos
  • Cualquier persona puede utilizar los metadatos de Dublin Core para describir los recursos de un sistema de información. Las páginas Web son uno de los tipos más comunes de recursos que utilizan las descripciones de Dublin Core.
  • Los metadatos de Dublin Core están siendo utilizados como la base para los sistemas descriptivos para varios grupos de interés como por ejemplo:
    • Organizaciones educativas
    • Bibliotecas
    • Instituciones del gobierno
    • Sector científico de la investigación
    • Autores de páginas Web
    • Negocios que requieren lugares más investigables
    • Corporaciones con sistemas de gerencia extensos en conocimiento
Ventajas
  • La simplicidad
  • La flexibilidad
  • La independencia sintáctica
  • La interoperabilidad semántica
  • Alto nivel de normalización formal
  • Crecimiento y evolución del estándar a través de una institución formal consorciada: la DCMI.
  • Consenso internacional
  • Modularidad de Metadatos en la Web
  • Arquitectura de Metadatos para la Web


Fuentes:

Makx Dekkers, Managing Director and Chief Executive Officer DCMI: www.makxdekkers.com


Montse García
Marketing y Comunicación integral

No hay comentarios:

Mi primer blog de Marketing Online

Trataré varios temas de actualidad. La frecuencia? : Lo que me permita el trabajo!!

Montse García

Montse García
Marketing y Comunicación integral

Un poco sobre mí .....

Tengo una visión global de empresa, con habilidades para la gestión de proyectos y equipos en un marco de trabajo nacional-internacional, la negociación y el control de gestión. Compenso la falta de recursos económicos con iniciativa, polivalencia, creatividad y enfoque al logro, aportando calidad en el trabajo y profesionalidad. Gran orientación a resultados.
Más información @modernmarketing

.... Mi experiencia y formación