Le Monde de Nalya

Actualité du monde du livre et de l'éducation. Conseils et adresses pour préparer le CAPES documentation, actualité du monde du livre.

12 avril 2008

Google et le boom des bibliothèques numériques

Pour celles et ceux qui ne serait toujours pas au point sur la question de Google et sa numérisation de masse, dont la mémoire a besoin d'être rafraichi, ou tout simplement que le sujet intéresse : voici un reportage diffusé le 23 février 2008 sur France 24.

Pour garder une trace écrite de ce sujet, je vous invite à vous rendre sur le site Web de l'émission qui propose un "article résumé" du reportage (et le reportage lui-même).

Durée du reportage : 11min 33

Posté par Nalya à 20:15 - Numérisation et archivage - Commentaires [0] - Rétroliens [0] - Permalien [#]

02 avril 2008

Question de bibliothèques

Vous ne voyez toujours pas la différence entre bibliothèque traditionnelle, bibliothèque numérique et bibliothèque virtuelle ? Ce cours est fait pour vous !
Hébergé par le site de l'Ecole Normale Supérieure de Lyon, ce cours très bien construit et synthétique (6p.) intitulé "De la bibliothèque traditionnelle à la bibliothèque numérique, en passant par la bibliothèque virtuelle" ; revient leurs définitions puis présente une typologie des différentes bibliothèques numériques.

Bonne lecture :)

Posté par Nalya à 10:25 - Numérisation et archivage - Commentaires [0] - Rétroliens [0] - Permalien [#]

13 février 2008

Archives ouvertes

En ligne, sur le site de l'URFIST de Lyon, des supports de cours en ligne sur :

Posté par Nalya à 09:16 - Numérisation et archivage - Commentaires [0] - Rétroliens [0] - Permalien [#]

22 janvier 2008

Folksonomie et culture

Vu dans l'Espresso de Télérama.fr du 22/01/08 :

Vous connaissez la "folksonomie", de l’anglais folk (peuple) et de taxonomy (taxinomie), qui désigne un système collaboratif de classement. Eh bien, figurez-vous que de vénérables institutions comme les bibliothèques et les musées commencent à l’expérimenter. La Bibliothèque du Congrès des États-Unis – qui stocke environ 12 millions de photographies – vient de mettre en ligne 3000 d’entre elles sur le site de partage Flickr. Objectif : permettre au plus grand nombre d’y accéder, de les commenter, et même d’utiliser les bonnes volontés pour contribuer au travail d’indexation ! C’est aussi le pari du Musée McCord de Montréal, qui propose sur son site de créer des tags (mots-clés) pour annoter le fonds d’archives existant, de commenter les oeuvres, d’ajouter des images personnelles qui pourraient s’y rapporter, et de parcourir ce que le musée appelle les "circuits publics" des internautes. Une nouvelle façon de naviguer et d’accéder à ces temples de la culture ? ◆ S.L.

Posté par Nalya à 08:04 - Numérisation et archivage - Commentaires [1] - Rétroliens [0] - Permalien [#]

16 décembre 2007

Le point sur l'archivage par la BNF

Résumé du bulletin des bibliothèques de france de mars 2006 : Le dépôt légal d’Internet à la BNF.

Pourquoi archiver la Toile ?

  • Parce qu’il est indispensable de conserver des traces de ce nouveau média, présent aujourd’hui dans toutes les sphères du savoir et de notre société
  • Parce que conserver la mémoire de la Toile par le biais du dépôt légal, c’est prolonger les missions historiques qui ont permis la constitution de notre patrimoine
  • Parce que le dépôt légal de la Toile est prévu par le législateur (loi DADVSI)

Initialement promulguée pour les imprimés en 1537, l’obligation de dépôt légal pour les éditeurs, imprimeurs, producteurs, distributeurs et importateurs de documents s’est progressivement étendue à tous les types d’expression et de création.

Les sites Internet s’ajoutent désormais au périmètre de production éditoriale à conserver par la Bibliothèque nationale de France.

La loi DADVSI (Droit d’auteur et droit voisin dans la société de l’information) du 3 août 2006 prévoit ainsi l’extension du dépôt légal à tous « les signes, signaux, écrits, sons ou messages de toute nature qui font l’objet d’une communication au public par voie électronique ».

Qui est concerné par ce nouveau dispositif ?

Ø Du côté des institutions de mémoire l’Institut national de l’Audiovisuel (Ina) collectera les sites relevant du domaine de la communication audiovisuelle (en particulier ceux de la radio et de la télévision) et la BnF tous les autres.

Ø Du côté des opérateurs, l’obligation de dépôt légal pèsera sur les personnes qui éditent et produisent des sites Internet. Contrairement à ce qui est pratiqué pour les autres supports, elle n’impliquera pas de démarche particulière de leur part, car la collecte sera principalement effectuée par le biais de collectes automatiques réalisées par des robots que piloteront les institutions dépositaires. La seule obligation qui incombera aux producteurs sera de fournir les codes et les informations techniques susceptibles de faciliter l’archivage de leurs sites en cas de difficulté.

Le volume des publications sur Internet est sans précédent : L’exhaustivité ne peut plus être de mise et le recours aux captures et aux traitements automatiques est la seule issue pour conserver une partie significative de cette masse éphémère.

Cette nouvelle forme d’archivage s’attache à la fois aux sites Internet en tant qu’unités et aux liens qui tissent des relations entre les pages d’un site et entre les sites eux-mêmes : ce sont des « tissus » de documents entremêlés qu’on capture.

Difficultés rencontrées : la collecte automatique ne s’applique souvent qu’à la surface des sites et se heurte aux pièges et aux barrières qui protègent l’accès au « web profond » : qu’ils soient sécurisés, ou qu’ils s’appuient sur des techniques ou des bases de données qu’un robot ne peut capturer, nombreux sont les sites dont on ne peut archiver que la « capsule ».

Le volume de la production sur Internet est exponentiel : il n’est pas possible de viser l’exhaustivité ni de procéder à une sélection manuelle des sites. Afin d’apporter une réponse pragmatique mais complète aux difficultés techniques comme aux enjeux documentaires et patrimoniaux du dépôt légal dela Toile,la BnF a choisi une approche intégrée qui conjugue trois modes de collecte complémentaires :

  • des captures massives et automatiques du domaine français ;
  • des collectes ciblées qui s’appuient sur l’expertise de bibliothécaires ;
  • des dépôts à l’unité pour un nombre limité de sites qu’on ne peut archiver autrement.

La collecte automatique : La collecte automatique à grande échelle d’instantanés du domaine français est effectuée au moyen du robot Heritrix. Dans le cadre d’un partenariat de recherche avec l’organisme américain Internet Archive, la BnF a réalisé deux instantanés du domaine «.fr », fin 2004 et fin 2005.

Des copies d’instantanés des domaines génériques et français (collections historiques de 1996 à 2004) ont également été acquises : elles représentent plus de 6 milliards de fichiers.

La collecte ciblée : Des collectes thématiques et événementielles viennent compléter ce dispositif par des sélections plus fines.

2 critères de sélection :

  • Capturer les sites qui prolongent ou remplacent des collections qui ont engagé, voire achevé, leur migration vers Internet. (Exemple : les publications en série dontla BnF conserve les collections imprimées, souvent depuis leurs origines).
  • Pour ce qui est des nouvelles formes de publications qui émergent sur la Toile , il appartient aux « veilleurs » de chaque domaine documentaire de repérer ce qui présente un intérêt particulier dans son champ éditorial et de déterminer à quelle fréquence et à quelle profondeur il faut le capturer.

Les dépôts à l’unité :De manière plus exceptionnelle compte tenu des coûts de traitement, des dépôts spécifiques pourront être effectués par les producteurs de sites à la demande de la BnF. (Exemple, depuis juin 2005, archivage quotidien de la version électronique du Journal officiel par la BnF).

Les enjeux d’évolution pour le métier.

Quantitativement, l’essentiel des données proviendra des collectes automatiques. Pour des raisons économiques évidentes, la part de la sélection humaine et « manuelle » doit se limiter à certaines traces de la Toile.
Les bibliothécaires
chargés de ces acquisitions ciblées doivent apprendre à sélectionner des ressources de l’Internet, dans une perspective de représentativité (et plus uniquement de qualité, car il s’agit de dépôt légal, donc de conserver le meilleur comme le pire), en ajustant leurs pratiques d’évaluation des contenus aux spécificités de la Toile et aux techniques d’archivage automatique.

L’autre évolution majeure du métier concerne le traitement physique et intellectuel des archives. L’automatisation de pratiquement tous les processus aujourd’hui assurés par des humains est une nécessité compte tenu du passage à grande échelle mais aussi une opportunité nouvelle liée au support – numérique – de ces nouveaux documents.

Ces évolutions impliquent la définition de nouvelles compétences et de nouveaux profils de postes : par exemple, des « opérateurs numériques » capables d’exploiter au quotidien les processus automatisés de collecte et de traitement, mais aussi des experts en mesure de superviser l’indexation à grande échelle des contenus et de gérer les risques propres à la préservation pérenne des documents numériques alors que les formats et les dispositifs de consultation évoluent et disparaissent très vite.

Un dernier pan, essentiel, de cette évolution métier concerne l’accès public aux archives en salle de lecture.

De ce point de vue, le rôle des bibliothécaires concerne d’abord la mise au point d’outils de consultation et de services de médiation adaptés aux besoins des utilisateurs. La préparation des futures conditions de consultation des archives s’appuie sur une collaboration étroite avec des représentants des usagers, notamment des communautés de chercheurs, spécialistes d’Internet et de la sociologie des médias mais aussi de l’histoire sociale.

Pour aller plus loin : Dossier de presse "les enjeux du dépôt légal de la Toile" réalisé par la BNF (décembre 2005)

Posté par Nalya à 11:28 - Numérisation et archivage - Commentaires [0] - Rétroliens [0] - Permalien [#]

04 décembre 2007

Les bibliothèques virtuelles

" L’offre de livres numériques se développe progressivement.
Mobipocket, société française rachetée en 2005 par Amazon, possède l’un des principaux catalogues en ligne, avec 60 000 titres.
Ce sont des fichiers au format standard numérique, lisibles sur des plateformes mobiles (téléphones portables, Blackberry, Pocket PC et ebook).
Mis à part 1 000 titres en français (dont l’Elégance du hérisson, de Muriel Barbery), le reste est en anglais, grâce à des partenariats avec les grands éditeurs anglo- saxons : Random House, Simon & Schuster ou récemment Harlequin.
> Mobipocket propose également 10 000 titres gratuits.
> Numilog, librairie française numérique, propose, elle, plus de 41 000 titres.
> Amazon, avec le lancement du Kindle, met à disposition 90 000 titres.
Un premier éditeur français, M21, commercialise depuis peu le Digibook Pro (le Cybook Gen3) avec 24 livres".


Vu sur Ecrans du 3/12/07, par Frédérique Roussel

Posté par Nalya à 09:53 - Numérisation et archivage - Commentaires [0] - Rétroliens [0] - Permalien [#]

24 novembre 2007

Gallica 2 en service !

2007_11_24_111109Ca y est Gallica 2 (la nouvelle version de la bibliothèque numérique de la BNF) est parmi nous, en version bêta certes, mais on peut d'ors et déjà commencer à l'explorer !

8 thèmes proposés :
* Généralité,
* Histoire et Géographie,
* Economie et Société,
* Philosophie et Psychologie,
* Religion,
* Langues,
* Littérature,
* Arts et Loisirs

Vous pouvez même créer votre propre "espace personnel" qui vous donnera la possiblité de constituer votre bibliothèque et de marquer vos documents.

Tous à vos souris : http://gallica2.bnf.fr/ !!

Posté par Nalya à 11:12 - Numérisation et archivage - Commentaires [0] - Rétroliens [0] - Permalien [#]

14 novembre 2007

Numérisation à la BNF

Branle-bas de combat à la Bibliothèque nationale de France (BNF). A l’ère des nouvelles technologies, du web 2.0 et de l’offensive des baleines privées du réseau type Google, il est plus que temps. La vieille dame se lance donc dans un projet de numérisation de masse de ses documents : 300 000 en trois ans. C’est ce changement d’échelle que le nouveau président, Bruno Racine, traduit par « des morceaux choisis aux œuvres complètes ». En clair, de l’artisanat de Gallica, la bibliothèque en ligne pionnière lancée en 1997, à l’industriel. Le contrat a été signé en septembre avec une société française privée, la Safig. Coût total du chantier : de l’ordre de 26 millions d’euros. L’Etat met au pot 8 millions dès la première année. L’investissement comprend la conservation des documents.

Sauvegardes.« Nous visons une numérisation pérenne par opposition à une numérisation jetable », a souligné Bruno Racine. En dix ans, 10 milliards de documents ont été collectés sur Internet, ce qui correspond à 110 téraoctets. Le dépôt légal numérique, dont la mission a été confiée à la BNF en 2006, n’a fait que renforcer la masse aspirée sur la Toile. Mais les supports ne sont pas éternels, même si au moins deux sauvegardes destinées à deux endroits différents sont effectuées. La BNF a développé le Spar (Système de préservation et d’archivage réparti), « véritable magasin numérique », qui permet de multiples copies et assure une surveillance continue de l’état des fichiers. Il s’agit finalement de la cinquième tour, virtuelle celle-là, en référence aux quatre de Tolbiac.

Loin d’être délaissée, Gallica, avec ses 90 000 titres numérisés, des Œuvres complètes de Rutebeuf au Lys dans la vallée de Balzac, va vivre une mutation décisive dans « l’esprit web 2.0 ». Dans un an, Gallica 2 aura fini de muer avec l’ouverture d’espaces personnels, la possibilité de créer des groupes, voire des alertes. La BNF travaille même déjà dans la perspective du web sémantique, notamment avec des systèmes qui génèrent des liens entre des textes qui se citent les uns les autres.

Copyright. Cerise sur le gâteau numérique : la BNF a conclu un accord avec le Syndicat national de l’édition (SNE) sur un modèle économique et juridique pour donner un accès public aux œuvres numérisées soumises à droits d’auteur. On a même une échéance : au prochain Salon du livre sera présenté un prototype de ce site. Il permettra l’accès gratuit aux œuvres du patrimoine (soixante-dix ans après la mort de l’auteur) et un accès aux œuvres sous droit moyennant paiement en ligne. Un des reproches faits à Google était de numériser les ouvrages en s’embarrassant peu du copyright. « Il m’est apparu que nous devions nous concerter avec les éditeurs pour éviter avec la chaîne du livre ce qu’a subi la chaîne du disque », a expliqué le président de la BNF.

Et où en est la Bibliothèque numérique européenne (Bnue), justement lancée en opposition à l’ogre Google sous l’ère Jean-Noël Jeanneney ? Une nouvelle fondation, l’European Digital Library a été mise en place à La Haye en septembre. Elle devrait présenter au deuxième semestre 2008 une version bêta de la future Bnue.

Autre chantier de la BNF : la réfection de son site historique rue de Richelieu à Paris, qui abrite 20 millions de documents. Les travaux débuteront en 2009 pour une réouverture totale en 2014. L’équivalent de 40 km de rayonnages vont être déplacés. Tant de prometteuses grandes manœuvres en perspective.

source : Ecrans ou Libération du 14/11/2007

Posté par Nalya à 14:44 - Numérisation et archivage - Commentaires [1] - Rétroliens [0] - Permalien [#]

13 novembre 2007

Archives.org : la mémoire du Web.

A l'instar des autres moteurs de recherche, Google a cessé de comptabiliser le nombre de pages Web. Archive.org, de son côté, en a archivé près de 86 milliards, correspondant à 65 millions de sites Web, en 37 langues. Sa base de données pèse près de 2 pétaoctets, soit 2 millions de gigaoctets, l'équivalent de deux cents fois le contenu de la Bibliothèque du Congrès américain.

A l'origine du projet, Brewster Kahle, un spécialiste de l'intelligence artificielle issu du célèbre Massachusetts Institute of Technology (MIT).
En 1996, constatant que la durée de vie moyenne d'une page Web était de cent jours, Brewster Kahle crée une fondation pour archiver le Web à l'intention des futures générations . Sa "machine à remonter le temps" permet ainsi, non seulement de revisiter les sites Web tels qu'ils se présentaient il y a un, cinq ou dix ans, mais aussi de retrouver la trace de ces contenus qui, depuis, ont disparu, avec une prédilection pour certains événements marquants, tels que les attentats terroristes du 11 septembre 2001, l'ouragan Katrina, qui a ravagé La Nouvelle-Orléans en 2005, ou encore le tsunami de décembre 2004, qui font l'objet de "collections".
Au-delà du Web, la richesse d'Archive.org se mesure aussi à l'aune de la diversité de sa bibliothèque multimédia, forte de près de 45 000 concerts et de plus de 100 000 films, 200 000 enregistrements audio et 290 000 livres et textes... Car Archive.org s'est également donné pour mission de mettre à disposition tous les contenus textes, audio, vidéo disponibles en format numérique. A la différence des médiathèques traditionnelles, tout ou presque y est téléchargeable gratuitement. Alimenté par des collectionneurs, des fondations, des particuliers, les rayons d'Archive.org n'ont rien à voir avec ceux d'une médiathèque traditionnelle.
Prototype emblématique des archives ouvertes, Archive.org cherche moins à rivaliser avec les services de téléchargement audio ou vidéo qu'à ouvrir la voie aux futures médiathèques numériques.

En octobre, Google annonçait avoir scanné plus d'un million de livres de 27 bibliothèques, et l'Open Content Alliance, un consortium de 80 bibliothèques réunies autour d'Archive.org, plus de 100 000 ouvrages. Il leur en coûte 10 cents la page, ou 30 dollars par livre. Le prix d'une certaine liberté : Google, tout comme Microsoft, paie en effet les bibliothèques afin d'obtenir le droit de numériser leurs ouvrages, mais interdit en contrepartie aux autres moteurs de recherche commerciaux de les indexer.

source : Extrait de l'article paru sur Le Monde du 14/11/2007.
Pour aller plus loin sur la question, je vous invite à aller lire le billet de ConstantinoplE.

Posté par Nalya à 19:29 - Numérisation et archivage - Commentaires [0] - Rétroliens [0] - Permalien [#]

11 novembre 2007

Les bibliothèques municipales face à la concurrence d'Internet

"Une enquête du Crédoc dresse un état des lieux des bibliothèques municipales en France. Fréquentation, inscriptions, comportements des usagers, expansion d’internet... Autant de facteurs qui bousculent les habitudes."

Points forts de l'enquête à lire sur Archimag.

Posté par Nalya à 19:23 - Numérisation et archivage - Commentaires [0] - Rétroliens [0] - Permalien [#]



« Accueil  1  2   Page suivante »