08 Janvier 2009
Les thèmes d'actualité
- Archivage et sauvegarde
- Banque, assurance, finance
- BI, décisionnel, SIG
- Bureautique
- Calcul scientifique
- Document, connaissances, GED
- Emploi informatique
- Finances, gestion, trésorerie
- Gestion commerciale, CRM
- Hardware
- Législation
- Licences, open source
- Localisation, traçabilité
- Locaux, sécurité physique
- Mobilité
- Politique informatique
- Production, logistique, SCM
- Programmation, développement
- Qualité, certification, référentiels
- Réseaux et communications
- Santé
- Secteur public
- Sécurité logique, virus et intrusions
- Site Internet
- Solutions globales, ERP
- Solutions RH
- Stockage, SAN, NAS
- Systèmes et infrastructure
Thomson Scientific choisit TEMIS pour automatiser l’indexation des contenus de ses sources d’information grâce au Text Mining
Novembre 2006
TEMIS et Thomson Scientific annoncent aujourd’hui la signature d’un contrat de fourniture de licence et de prestation de service. Thomson Scientific a, en effet, choisi la solution d’indexation de TEMIS pour automatiser ses processus de traitement et d’analyse de contenus.
Thomson Scientific fournit aux ingénieurs et aux chercheurs, à travers le monde, un accès à des informations stratégiques et à forte valeur ajoutée, afin d’accélérer la découverte scientifique. Ainsi, avec ISI Web of Knowledge(SM), une solution intégrée d’information pluridisciplinaire unique, Thomson Scientific permet aux chercheurs d’accéder, d’analyser et de gérer l’information.
Thomson Scientific recherchait une solution d’indexation fiable qui puisse être aisément intégrée dans son infrastructure existante et a donc confié à TEMIS l’automatisation du traitement de ses sources de données. La solution devait être capable d’exploiter un dictionnaire de plus de 2 millions d’entrées et d’annoter plus de 100.000 documents par semaine, afin de produire un contenu indexé, enrichi et accessible via le portail ISI Web of Knowledge(SM).
En répondant aux attentes de Thomson Scientific tant en terme de qualité que de montée en charge ou de fiabilité, TEMIS Insight Discoverer Extractor et TEMIS Insight Discoverer Categorizer ont rapidement été reconnus comme étant les meilleures technologies du marché pour une solution d’indexation automatique. Thomson Scientific a été particulièrement sensible à la richesse de la librairie d’annotateurs disponibles (Skill Cartridges) et la possibilité d’ajouter des lexiques simplement.
Les serveurs Insight Discoverer Extractor et Insight Discoverer Categorizer résistent parfaitement aux montées en charge. Le serveur d’extraction traite des documents* de tout type afin d’en extraire les entités, les relations, les concepts et les attributs. Le serveur de catégorisation affecte des catégories prédéfinies aux documents selon leur profil sémantique. Enfin, la solution de Text Mining de TEMIS s’appuie sur Intelligent Topic Manager de Mondeca, une solution puissante de gestion d’ontologies, pour éditer et organiser des terminologies et des taxonomies.
La solution de Text Mining de TEMIS a été déployée pour indexer les archives numérisées de la base BIOSIS, qui contient plus de 2 millions de documents scientifiques, en identifiant une grande variété d’entités: organismes, composés chimiques, maladies, lieux géographiques, etc. La solution a utilisé un ensemble de Skill Cartridges personnalisées ou standard (Medical Entity Relationships, Biological Entity Relationships, Text Mining 360°) pour enrichir le contenu de la base BIOSIS avec des métadonnées pertinentes.
Thomson Scientific envisage maintenant de nouvelles évolutions de son processus éditorial comme support à son équipe d’indexeurs, tout en conservant une étape de validation manuelle.
Thomson Scientific fournit aux ingénieurs et aux chercheurs, à travers le monde, un accès à des informations stratégiques et à forte valeur ajoutée, afin d’accélérer la découverte scientifique. Ainsi, avec ISI Web of Knowledge(SM), une solution intégrée d’information pluridisciplinaire unique, Thomson Scientific permet aux chercheurs d’accéder, d’analyser et de gérer l’information.
Thomson Scientific recherchait une solution d’indexation fiable qui puisse être aisément intégrée dans son infrastructure existante et a donc confié à TEMIS l’automatisation du traitement de ses sources de données. La solution devait être capable d’exploiter un dictionnaire de plus de 2 millions d’entrées et d’annoter plus de 100.000 documents par semaine, afin de produire un contenu indexé, enrichi et accessible via le portail ISI Web of Knowledge(SM).
En répondant aux attentes de Thomson Scientific tant en terme de qualité que de montée en charge ou de fiabilité, TEMIS Insight Discoverer Extractor et TEMIS Insight Discoverer Categorizer ont rapidement été reconnus comme étant les meilleures technologies du marché pour une solution d’indexation automatique. Thomson Scientific a été particulièrement sensible à la richesse de la librairie d’annotateurs disponibles (Skill Cartridges) et la possibilité d’ajouter des lexiques simplement.
Les serveurs Insight Discoverer Extractor et Insight Discoverer Categorizer résistent parfaitement aux montées en charge. Le serveur d’extraction traite des documents* de tout type afin d’en extraire les entités, les relations, les concepts et les attributs. Le serveur de catégorisation affecte des catégories prédéfinies aux documents selon leur profil sémantique. Enfin, la solution de Text Mining de TEMIS s’appuie sur Intelligent Topic Manager de Mondeca, une solution puissante de gestion d’ontologies, pour éditer et organiser des terminologies et des taxonomies.
La solution de Text Mining de TEMIS a été déployée pour indexer les archives numérisées de la base BIOSIS, qui contient plus de 2 millions de documents scientifiques, en identifiant une grande variété d’entités: organismes, composés chimiques, maladies, lieux géographiques, etc. La solution a utilisé un ensemble de Skill Cartridges personnalisées ou standard (Medical Entity Relationships, Biological Entity Relationships, Text Mining 360°) pour enrichir le contenu de la base BIOSIS avec des métadonnées pertinentes.
Thomson Scientific envisage maintenant de nouvelles évolutions de son processus éditorial comme support à son équipe d’indexeurs, tout en conservant une étape de validation manuelle.
Pour aller plus loin
Sélection d'actualités
Forum
Vous voulez avoir l'avis d'un expert sur ce sujet ?
Gouvernance
Document, connaissances, GEDEmploi informatique
Législation
Licences, open source
Politique informatique
Qualité, certification, référentiels
Solutions
BI, décisionnel, SIGBureautique
Finances, gestion, trésorerie
Gestion commerciale, CRM
Mobilité
Production, logistique, SCM
Solutions globales, ERP
Solutions RH
Technologies
Archivage et sauvegardeHardware
Localisation, traçabilité
Locaux, sécurité physique
Programmation, développement
Réseaux et communications
Sécurité logique, virus et intrusions
Site Internet
Stockage, SAN, NAS
Systèmes et infrastructure
Editorial
ActualitésAgenda
Annuaire
Blogs
Contributeurs
Dictionnaire
Dossiers
Emploi
Forum
Lettre
Libraire