Accessible à qui ?
Tout le monde, amateurices et professionnel⋅es.
On considère la science et les données comme un « bien commun ».
(en France)
Article 30 de la loi n° 2016-1321 du 7 octobre 2016 pour une République numérique :
Donne un nouveau droit aux auteurs de publier en accès ouvert leurs articles après un embargo de 6 (sciences de la nature et sciences formelles) à 12 (LSHS) mois, pour des recherches financées au moins à 50% sur fonds public.
L’article 6 définit le principe d’ouverture par défaut pour les données administratives : données construites dans le cadre des missions de service public, auxquelles les données de recherche appartiennent : il crée une obligation
En pratique : suivant les champs de recherche, les implémentations sont variables
Pour la plupart des champs de recherche, le modèle publish or perish sert de levier aux éditeurs pour capter indirectement des financements de recherche.
L’ouverture des données reste un champ de bataille (Stérin et Noûs, 2019)
(aussi en France)
Plan science ouverte : La France s’engage pour que les résultats de la recherche scientifique soient ouverts à tous, chercheurs, entreprises et citoyens, sans entrave, sans délai, sans payement.
L’ouverture des publications scientifiques doit devenir la pratique par défaut aussi vite que possible. […] les publications issues de recherches financées au moyen d’appels à projets sur fonds publics seront obligatoirement mises à disposition en accès ouvert, que ce soit par la publication dans des revues ou ouvrages nativement en accès ouvert, soit par dépôt dans une archive ouverte publique comme HAL.
Faire en sorte que les données produites par la recherche publique française soient progressivement structurées en conformité avec les principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable), préservées et, quand cela est possible, ouvertes.
Le succès de la science ouverte implique le développement de nouvelles pratiques quotidiennes pour les chercheurs. Cela nécessite la définition de nouvelles compétences, le développement de nouvelles formations et l’adoption de nouveaux services.
Plan S :
Les chercheureuses emploient aujourd’hui les outils numériques dans toutes les facettes de leur activité.
Cependant, ces productions scientifiques numériques de la recherche sont souvent difficilement accessibles :
→ L’utilisation pleinement efficace du numérique est entravée.
La science ouverte vise à corriger cette insuffisance :
Accès ouvert
La diversité des sujets autour des données de la recherche est illustrée par leur cycle de vie, constitué de 6 étapes :
Constat :
Objectifs :
13 principes qui se déclinent en un ensemble de caractéristiques que doivent présenter les données et les métadonnées pour faciliter leur découverte et leur utilisation par les humain⋅es et par les machines
Référence aux trois types d’entités :
Faciliter la découverte des données par les humains et les systèmes informatiques par une description et une indexation des données et des métadonnées.
Stocker durablement les données et les métadonnées et à faciliter leur accès, spécifier les conditions d’accès (ouvert ou restreint) et d’utilisation (licence) :
Intégrer les données téléchargeables, utilisables, intelligibles et combinables avec d’autres données :
Rendre les données réutilisables pour de futures recherches ou d’autres finalités (enseignement, innovation, reproductibilité, transparence) :
Hypertext Markup Language
<
et
>
sont des balises (tags,
elements)C’est une convention historique d’annotation, recyclée
Extensible Markup Language
<div type="act" n="II" xml:id="II"><head>Acte II</head>
<div type="scene" n="2" xml:id="II2"><head>Scène 2</head>
<sp><speaker>Rodrigue</speaker>
<l part="I">À moi, comte, deux mots.</l></sp>
<sp><speaker>Comte</speaker>
<l part="M">Parle</l></sp>
<sp><speaker>Rodrique</speaker>
<l part="F">Ôte-moi d'un doute</l></sp>
<sp><speaker>Comte</speaker>
<l part="I">Connais-tu bien Don Diègue ?</l></sp>
<sp><speaker>Comte</speaker>
<l part="M">Oui</l></sp>
<sp><speaker>Rodrigue</speaker>
<l part="F">Parlons bas, écoute.</l>
<l>Sais-tu que ce vieillard fut la même vertu,</l>
<l>La vaillance et l'honneur de son temps ? Le sais-tu ?</l></sp>
</div>
</div>
La « Text Encoding Initiative » (TEI) est l’un des projets les plus durables et influents du champ aujourd’hui appelé « humanités numériques ». Son but est de fournir des recommandations pour la création et la gestion sous forme numérique de tout type de données créées et utilisées par les chercheurs en sciences humaines, comme les sources historiques, les manuscrits, les documents d’archives, les inscriptions anciennes et bien d’autres.
(Burnard, 2015)
La TEI met l’accent sur ce qui est partagé par tous les types de documents, qu’ils soient représentés physiquement sous une forme numérique sur un disque ou une carte mémoire, sous une forme imprimée comme un livre ou un journal, sous une forme écrite comme un manuscrit ou un codex, ou sous une forme inscrite dans la pierre ou sur une tablette de cire.
Cette continuité facilite la migration du texte depuis des manifestations plus anciennes, comme l’imprimé ou le manuscrit, vers d’autres plus récentes comme le disque ou l’écran.
C’est pourquoi la vision de la TEI de ce qu’est le texte est largement conditionnée par ce que le texte a été dans le passé, sans toutefois trop compromettre ce que le texte peut devenir dans le futur. Elle essaie de traiter tous les types de documents numériques de la même façon, qu’ils soient « nativement numériques » ou non.
La TEI fournit le nom et la définition de centaines de balises, en même temps que des règles sur la façon dont elles peuvent être combinées. Plus précisément, les Guidelines de la TEI définissent cinq ou six cents concepts différents, avec les spécifications détaillées des éléments et classes d’éléments XML qui peuvent être utilisés pour les représenter.