Base de données bibliographiques
Une base de données bibliographique est une interface de recherche informatisée dans laquelle sont indexées les notices bibliographiques de diverses catégories d'objets bibliographiques telles que des chapitres de livres et ouvrages de référence, des articles de revues savantes et scientifiques, des articles de journaux et magazines, des actes de congrès, des rapports, des publications gouvernementales et juridiques, etc[1].
Les bases de données bibliographiques sont le fruit de l'informatisation des index imprimés et du principe de repérage manuel. Cette conversion vers un système informatisé permet aujourd’hui de sauver énormément de temps lors d’une recherche. La documentation indexée dans la base de données bibliographique peut donc être repérée de manière plus efficace, car les contenus des notices y sont décortiqués en métadonnées telles que les titres, les auteurs, les résumés, le descripteur sujet, etc[2]. Les notices bibliographiques structurées dans les bases de données bibliographiques sont plus précises qu’auparavant et permettent des recherches plus pointues. Le système permet de faire des requêtes à l'aide de mots-clefs ainsi que l'analyse des données (bibliométrie, etc.).
À ce jour, on compte un très grand nombre de bases de données bibliographique. Elles sont généralement spécialisées dans une discipline ou un domaine en particulier. Elles peuvent également avoir une portée plus générale ou couvrir un ensemble de disciplines connexes. Le texte intégral n’est pas toujours disponible dans une base de données bibliographique[3]. Certaines d’entre elles sont accessibles gratuitement, mais la plupart sont payantes. Des institutions comme des universités ou des bibliothèques en font l’achat, souvent sous la forme d’un abonnement annuel[2].
Les bases de données bibliographiques permettent également d’effectuer des recherches plus exhaustives qu’avec l’entremise d’un catalogue de bibliothèque. Certains usagers pourraient confondre les deux, car parfois un index central présent dans un catalogue de bibliothèque permet d’étendre la recherche vers des sources qui ne sont pas disponibles à la bibliothèque[4]. En effet, les catalogues de bibliothèques ne permettent généralement pas l’accès à des articles de revues et de journaux, mais plutôt des monographies complètes[1].
Historique et terminologie
[modifier | modifier le code]Anciennement, repérer des articles de périodiques n’était pas aussi rapide qu’aujourd’hui. En effet, la consultation des index imprimés et de leurs notices rudimentaires permettait de repérer la documentation répertoriée et disponible à certains points d’accès[5]. Cette méthode a été utilisée durant plusieurs décennies et il existe encore des index papier, mais très peu[2].
Les bases de données bibliographiques, aussi appelées les bases de références bibliographiques commencent à s’instaurer avec l’informatisation de la documentation vers les années 1960[6]. Depuis la Seconde Guerre, la documentation s’accumule et ne fait que croître. La recherche se développe dans divers milieux, et les revues scientifiques et professionnelles se multiplient[6].
Des techniques de traitement de l’information se mettent en place et se développent dans les années 1950 et 1960[7]. Face à cette abondance d’information, les systèmes d’indexation manuels et mécanisés ne sont plus assez efficaces pour gérer le volume élevé de documentation[7]. Les avancées technologiques et les recherches dans le domaine ont permis de développer des systèmes plus performants pour traiter et repérer l’information[7]. Avec l’arrivée de la technologie des ordinateurs, les index papier commencent à migrer sous la forme digitale[2].
Dans les années 1960-1970, le terme banque de données est privilégié. Il désigne alors des bases, à l'époque fréquemment de références bibliographiques, relatives « à un domaine défini de connaissances et organisé[ées] pour être offert aux consultations d'utilisateurs »[8],[9]. Ce terme permettait de distinguer ces systèmes documentaires des logiciels eux-mêmes ou systèmes de gestion de base de données (SGBD).
Les bases de données bibliographiques évoluent, en particulier depuis les années 2000, selon deux axes qui peuvent se combiner :
- soit en bibliothèques numériques en intégrant ou associant les ressources sur support numérique, se rapprochant ainsi fonctionnellement des systèmes de gestion électronique de documents mis en place dans les organismes dès les années 1970-1980 ou dans des secteurs spécialisés, comme le droit[10] ;
- soit en convergeant vers des bases de données non-bibliographiques en particulier des bases contenant des données (scientifiques, économiques…) pour créer des plateformes élaborées[11], comme celle proposée par les Chemical Abstracts Service intégrant des bases de données chimiques ou « Entrez » dans le monde médical.
Caractéristiques
[modifier | modifier le code]Structure des données
[modifier | modifier le code]Le terme base de données utilisé ici doit être compris avec précaution. En effet, il s'agit plutôt d'une collection de données ou de notices bibliographiques. Cette structure apparemment simple peut cacher des facteurs de complexité.
La structure des enregistrements peut être relativement élémentaire (simple collection de champs), plus complexe avec des formats MARC (ou conformes à la norme ISO 2709), et maintenant d'une structure quelconque avec XML.
Par rapport aux bases de données relationnelles, un facteur de complexité vient de l'impossibilité de figer la taille des données. Pratiquement tous les champs sont de longueur variable avec des facteurs de répétition pouvant devenir très importants. Par exemple, un nom d'auteur fait en moyenne moins de 10 caractères, mais on trouve des auteurs de plus de 100 caractères. Un article scientifique possède en moyenne 2 ou 3 auteurs mais on peut trouver des articles de physique avec 500 auteurs.
Indexation et référentiels
[modifier | modifier le code]De nombreuses bases de données bibliographiques contiennent des informations décrivant le contenu à l'aide d'une liste de termes d'indexation ou mots-clés. Ces mots-clés appartiennent souvent à des référentiels terminologiques dont la nature est variable : simple liste de mots contrôlés, plan de classement, thésaurus documentaire ou ontologie.
Les bases de données bibliographiques avec du vocabulaire contrôlé ont donc un thésaurus qui lui sont associées. Le vocabulaire contrôlé permet d’être plus spécifique dans la recherche, car on évite les problématiques de polysémie et les ambiguïtés dans les termes de recherche[5]. D’autres bases de données sont plutôt indexées avec du langage naturel, ce qui fait qu’elles n’ont pas toutes un thésaurus qui lui sont associées[5].
Outre l'indexation, de nombreuses données peuvent se référer à des référentiels spécialisés, comme les titres de périodique ou les affiliations.
Enfin certaines bases codifient également les références de la bibliographie des articles traités, comme le Science Citation Index, et la base bibliographique devient alors son propre référentiel.
Thématique et couverture
[modifier | modifier le code]Les bases bibliographiques sont également définies en fonction des thématiques choisies. Elles peuvent influencer considérablement la structure de la base (par exemple, en sciences de la vie la codification des gènes).
Une base se définit également par sa couverture, ou plus précisément la façon dont la base est constituée. Dans bien des cas (Medline, Pascal) la couverture est définie par un ensemble de revues qui sont systématiquement dépouillées. Un grand nombre de bases de données recensent des articles scientifiques de plusieurs endroits dans le monde, ce qui permet d’avoir une diversité dans les recherches[2].
Utilisation et complexité
[modifier | modifier le code]Le repérage d’information par l’entremise des bases de données bibliographiques peut s’effectuer de plus en plus sans un intermédiaire expert en raison de l’évolution technologique et la facilité d’accès aux outils par rapport à avant[7].
Cependant, certaines bases de données sont plus complexes que d’autres et l’usager peut avoir besoin de l’aide d’un ou d’une bibliothécaire pour appliquer les meilleures stratégies afin d’optimiser sa recherche quant à l’utilisation de ces outils et du langage d’interrogation spécifique[7].
Les spécialistes de l’information peuvent donc venir en aide aux utilisateurs moins expérimentés et servir de pont entre chercheurs et les bases de données. Les bibliothécaires peuvent guider l’utilisateur vers la ou les bonnes bases de données à interroger pour son besoin d’information, ainsi que les étapes afin de bien repêcher la documentation souhaitée[4].
Exemples
[modifier | modifier le code]- Chemical Abstracts — Articles scientifiques en chimie — Origine américaine, Chemical Abstracts Service (CAS).
- CINAHL - base de données en sciences infirmières paramédicales - Origine canadienne, Université de Montréal - bilingue
- Francis — Articles scientifiques en sciences humaines et sociales — Origine française (CNRS, INIST) — résumés en français — indexation bilingue (français, anglais) (la base Francis n'est plus mise à jour).
- Google Scholar — Moteur de recherche généraliste - Origine société Google, États-Unis.
- Index Theologicus — Théologie et Sciences des Religions — Origine allemande (Bibliothèque de l'Université de Tübingen).
- Medline — Base de donnéess en Science de la vie et médecine — Origine administration américaine (National Library of Medecine) - interface bilingue PubMed.
- Open Library — Catalogue collectif du projet Internet Archive.
- Pascal — Science Technique et Médecine — Origine française (CNRS, INIST) — indexation bilingue (français, anglais) (la base Pascal n'est plus mise à jour).
- Urbamet — Base de données bibliographiques — origine association Urbamet, France — Principale base de données française sur l'urbanisme, l'aménagement du territoire, les villes, l'habitat et le logement, l'architecture, les équipements collectifs, les transports, les collectivités locales, etc. qui rassemble et diffuse la mémoire de l’aménagement, de l’urbanisme et de l’habitat.
- SantéPsy — Base de données bibliographiques — origine Ascodocpsy — principale base de données française sur la psychiatrie et la santé mentale.
- WorldCat — Catalogue collectif OPAC (monographies et périodiques) — Origine OCLC (États-Unis) — parfois citée comme la plus grande base bibliographique mondiale.
Notes et références
[modifier | modifier le code]- Feather, John; Sturges, Paul, eds. (2003). International Encyclopedia of Information and Library Science (Second ed.). London: Routledge. p. 127. ISBN 0-415-25901-0.
- Cassell, K. A. et Hiremath, U. (2018). Reference and information services : an introduction. (4e éd.). Chicago: ALA Neal Schuman. p.147-148
- Reitz, Joan M. (2004). «bibliographic database». Dictionary for Library and Information Science. Westport, Connecticut : Libraries Unlimited. p.70 ISBN1-59158-075-7.
- Wong, M. A., & Saunders, L. (Eds.). (2020). Reference and information services : An introduction. Bloomsbury Publishing USA.
- Brown, C. C. (2021). Librarian’s guide to online searching : Cultivating database skills for research and instruction (6e éd). Libraries Unlimited.
- Carbone Pierre, Les bibliothèques, Paris, Presses Universitaires de France coll. « Que sais-je ? », 2012, 128 pages (ISBN 9782130594550).
- Arsenault, C., Da Sylva, L., Forest, D., Marcoux, Y., & Maurel, D. (2009). 3. La recherche d’information. In J.-M. Salaün & C. Arsenault (éds.), Introduction aux sciences de l’information (1‑). Presses de l’Université de Montréal.
- Définition donnée dans l'arrêté du , Journal Officiel, , p. 624. Consultable sur France Terme, la base des termes recommandés au Journal officiel de la République française - http://www.culture.fr/franceterme (consulté le ).
- Voir aussi la définition donnée dans le Vocabulaire de la documentation, ADBS, 2004 - http://www.adbs.fr/banque-de-donnees-16252.htm (consulté le ).
- Histoire des bases de données juridiques en France (1) - les origines, Infostratèges, 2005.
- Des formes éditoriales composites : Les revues Françaises de chimie, Sylvie Dalbin, Revue de Synthèse, , Volume 135, nos 2-3, p. 221-238. DOI 10.1007/s11873-014-0254-y (consulté le ).