Accueil

prev[1].gif (221 octets)

WEB INVISIBLE : LES BASES DE DONNEES

Informations trouvées sur le site: http://c.asselin.free.fr/french/webinvisible.htm

Le "web invisible" (deep web, hidden web) désigne la partie du web non accessible aux moteurs de recherche classiques.
Et ce parce que:
- les documents sont trop volumineux pour être entièrement indexés,
- des pages sont protégées par l'auteur (balise meta qui stoppe le robot),
- des pages sont générées seulement dynamiquement, lors d'une requête par exemple,
- le format des documents n'est pas reconnu par les moteurs (de moins en moins vrai avec un moteur comme Google...).

Le web invisible est vaste puisque selon les estimations, très variables et difficiles, les meilleurs moteurs n'indexent que
3 à 10% du web.
Le web invisible comprend donc souvent des bases, banques de données et bibliothèques en ligne gratuites ou payantes...Voici une sélection de ressources permettant d'accéder à ce web invisible ou au "not pure invisible", le web "mal" indexé par les moteurs

 

Les bases de données (gratuites et payantes)

Les bases de données gratuites sur Internet (URFIST de Lyon)
L'URFIST (Unité Régionale de Formation et de Promotion pour l'Information Scientifique et Technique) de l'Université Lyon I propose une sélection de plus de 700 bases de données gratuites. Parmi les catégories accessibles, l'Agriculture bien sûr mais également les brevets, les marques, la chimie, l'environnement, l'économie, la génétique, l'histoire, l'informatique, la linguistique, les mathématiques, la médecine, les sciences et puis le cinéma, l'art, la photographie...

Les bases de données gratuites (URFIST de Nice)
L'URFIST de l'Université de Nice-Sophia Antipolis propose elle aussi une sélection de bases de données gratuites.

The Internet Archive
The Internet Archive est une bibliothèque digitale destinée a conserver tous les documents numériques issus de l'internet pour les préserver d'une disparition complète. The IA fournit des documents créés à partir de 1996 (10 milliards de pages web mais aussi usenet, films et l'ancêtre Arpanet). The Internet Wayback Machine (développée notamment avec Alexa Internet) permet à l'utlisateur de trouver des sites web archivés en tapant simplement son URL et la date désirée. Etonnant et très utile compte-tenu de la diparition fréquente de site internet. Accessible au public depuis le 24 octobre 2001.

RDN (Resource Discovery Network)  
RDN est une porte d'entrée britannique d'un réseau de portails de bases de données consacrées à une douzaine de grands thèmes représentant plus de 35000 ressources : Affaires (Business), Informatique, Ingénierie, Mathématiques, Sciences Physiques, Sciences Sociales, Sciences Humaines, Droit et à des Sujets de référence (bibliothèques, périodiques) et dans un second temps l'Education, Géographie et Sports.
Le RDN est organisé comme une coopérative avec une organisation centrale et des fournisseurs indépendants appelés les hubs ("pivots répartisseurs") comprenant notamment :

BIOME : Health and Life Sciences
EEVL :
Engineering, Mathematics and Computing
PSIgate :
Physical Sciences
R
 

Infomine 
Répertoire de bases de données à vocations scolaires et universitaires : biologie, internet, cartes, géographie, social, gouvernement, physiques, maths, sciences sociales, électronique, ressources générales pour le lycée et l'université...etc..Recherche directe par mots clés, auteur, titre, liste alphabétique, type de ressource par domaine. Pour chaque secteur, liste des bibliothèques et bases de données principales. Liste d'ouvrages de référence pour l'étudiant.

Factiva  
Accès à des publications en 22 langues provenant de plus de 110 pays. 8 000 grandes publications, 8 500 sites Internet, plus de 20000 profils de sociétés et photos récentes.


CAS (Chemical Abstracts Service) : division de l' American Chemical Society. Principal centre d'information pour la Chimie. Le service le plus connu est le Chemical Abstracts (CA).
JICST (The Japan Science and Technology Corporation, Information Center for Science and Technology) : Centre d'information pour la science et la technologie. La base de données la plus connue est le JICST-EPLUS (science naturelles, technologie et médecine).

Lexis Nexis  
Lexis Nexis permet d'obtenir des informations personnalisées à travers la définition d'un profil de recherche concernant des acteurs, des marchés, des technologies ou des concurrents à partir de 30.000 articles quotidiens. Un nombre très important de sources (journaux, bdd, rapports, brevets etc.) indexées dans tous les domaines et por de nombreux pays (plus de 90)
Lexis.com : archives juridiques
Nexis.com : archives journaux
Lexis-Nexis Alert personal : revue de presse personnalisée par mail
Lexis-Nexis Professional : service de recherche multi-critère sur base de donnée.

EINS (European Information Network Services)  
Service qui compile des bases de données techniques, médicales et scientifiques. Fournisseurs : CAS, FIZ Karlsruhe, CINECA, Questel Orbit.

Social Sciences Ressources:

One Source  
Une des plus grandes bases de donnée disponibles en ligne sur les entreprises et les secteurs d'activité. Informations sur plus d'un million d'entreprise et leur branche d'activité.
Rapport d'analystes, biographie des dirigeants, études de marchés, prévisions, cotations, statistiques sectorielles. Choix possible par nom de société, par secteur, code produit.
Produits :
US Business Browser : 250 000 entreprises aux USA et Canada
UK BB : 350 000 entreprises au Royaume Uni
Global BB : 350 000 entreprises US + Monde
European BB : 300 000 entreprises en Europe et 50 000 au Royaume Uni
Services :
Comany profiler : rapport sur historique, produit, concurrence, structure
WatchListUpdate : suivi automatique de news et documents financiers
Industry Profiler : Rapport sur marché, segmentation, tendances et prévision
Topic Search : recherche de news, rapport d'étude par sujet.
Custom alerts : alerte e-mail

Pour me signaler des liens cassés:

haut-vert.gif (1201 octets)