Identifiant pérenne

Apparence déplacer vers la barre latérale masquer

Un identifiant pérenne est une chaîne de caractères alphanumériques qui désigne une ressource indépendamment de son emplacement. Cette ressource peut être tout objet réel ou conceptuel. L’identifiant pérenne a généralement vocation à donner accès à cette ressource ou à un substitut acceptable de celle-ci à travers le Web.

Les causes

Les systèmes d’identifiants pérennes naissent à la fin des années 1990 à l’initiative de fournisseurs souhaitant identifier et donner accès à des ressources scientifiques et culturelles diffusées en ligne. Dans une logique de reproductibilité, il était nécessaire que ces ressources puissent être citées sans équivoque ; en outre, il était souhaitable que l’identifiant soit actionnable par machine, c’est-à-dire que les systèmes informatiques, et en particulier les navigateurs web, puissent comprendre et donner accès aux ressources identifiées.

On constate alors que les Uniform Resource Locator (URL) utilisées dans ce but ont une espérance de vie plutôt brève : réorganisation des serveurs, changements de systèmes de diffusion ou de nom de l’organisation, etc. entraînent l’obsolescence des URL, conduisant l’utilisateur à une erreur 404.

Tim Berners-Lee considère qu’une conception solide d’URI suffit à assurer la permanence de l'identifiant d'une ressource, tout en recommandant les principes d’opacité communs à la plupart des standards d’identification pérenne.

Les principes de l’identification pérenne

La solution de l’identification dite « pérenne » repose sur la distinction entre un identifiant conçu pour durer, donc libéré des contingences techniques et administratives, et une URL d’accès destinée à changer au cours du temps. Cette solution implique l’utilisation d’un outil d’attribution maintenant un registre d’association entre identifiant et URL d’accès, et d’un résolveur redirigeant l’utilisateur vers la localisation actuelle de la ressource.

Les services de gestion d’identifiant prennent souvent la forme d'organisations qui proposent des contrats payants, comme la DOI Foundation et ses agences d’attribution pour le Digital Object Identifier (DOI). Le fournisseur de ressources peut implémenter un service d’identifiant Archival Resource Key (ARK) ou souscrire une offre de gestion d’identifiant, par le service EZID de la California Digital Library (en) ou un autre prestataire.

L’adjectif « pérenne » correspond à une possibilité plus qu'à une caractéristique intrinsèque de l’identifiant. Sa durée dépend de l'entité gestionnaire des identifiants. Certains auteurs préféreraient qu'on parle d’« identifiant pérennisable » ((en) persistable identifier).

La syntaxe

Pour générer des noms non équivoques à l’échelle du monde entier, les systèmes d’identifiants pérennes définissent des syntaxes similaires :

Exemples d'identifiants :

Malgré des tentatives, les libellés (doi:, ark:, etc.) n’ont pas été inscrits comme des schémas d’URI officiels, ce qui aurait permis de les rendre actionnables par machine tels quels. Il faut pour résoudre les identifiants les préfixer par le nom de domaine d’un résolveur.

Exemples d'identifiants préfixés :

Services associés

Certains identifiants (DOI, ARK) permettent à l’utilisateur d’obtenir des métadonnées en plus de la ressource elle-même, dans un ou plusieurs schémas (schéma Datacite pour DOI, Electronic Resource Citation ou Dublin Core pour ARK).

Le standard ARK recommande également qu’une ressource à laquelle un fournisseur attribue un identifiant soit accompagnée d’un engagement de permanence de la part du fournisseur.

Différents types d’identifiants pérennes

Il existe différents types d’identifiants pérennes selon le domaine – le type de ressource à laquelle un identifiant peut être attribué :

Certains identifiants ont un domaine plus large :

Notes et références

  1. Ministère de la Culture et de la Communication, Identifiants pérennes pour les ressources numériques, 11 décembre 2015, 11 p. (lire en ligne)
  2. (en) Robert Sanderson, Mark Phillips et Herbert Van de Sompel, « Analyzing the Persistence of Referenced Web Resources with Memento », Open Repositories 2011 Conference,‎ 2011 (lire en ligne)
  3. « FAQ sur les identifiants ARK », sur lyrasis.org, 28 avril 2020 (consulté le 21 août 2020)
  4. (en) Tim Berners-Lee, « Cool URIs don't change », sur w3.org, 1998 (consulté le 21 août 2020)
  5. (en) California Digital Library, « Identifiers made easy », sur cdlib.org (consulté le 21 août 2020)
  6. (en) Lukas Koster, « Persistent identifiers for heritage objects », code{4}lib Journal, no 47,‎ 17 février 2020 (ISSN 1940-5758, lire en ligne)
  7. (en) Metadata Working Group, « DataCite Metadata Schema », sur datacite.org, 16 août 2019 (consulté le 21 août 2020)
  8. (en) John Kunze, The ARK Identifier Scheme, 21 juin 2020 (lire en ligne), section 5.3
  9. (en) John Kunze, Scout Calvert, Jeremy D. DeBarry et Matthew Hanlon, « Persistence Statements: Describing Digital Stickiness », Data Science Journal, vol. 16,‎ 14 août 2017, p. 39 (ISSN 1683-1470, DOI 10.5334/dsj-2017-039, lire en ligne, consulté le 21 août 2020)