22 Mai 2012
Les thèmes d'actualité
- Archivage et sauvegarde
- Banque, assurance, finance
- BI, décisionnel, SIG
- Bureautique et infographie
- Calcul scientifique
- Document, connaissances, GED
- Emploi informatique
- Finances, gestion, trésorerie
- Gestion commerciale, CRM
- Hardware
- Législation
- Licences, open source
- Localisation, traçabilité
- Locaux, sécurité physique
- Mobilité
- Politique informatique
- Production, logistique, SCM
- Programmation, développement
- Qualité, certification, référentiels
- Réseaux et communications
- Santé
- Secteur public
- Sécurité logique, virus et intrusions
- Site Internet
- Solutions globales, ERP
- Solutions RH
- Stockage, SAN, NAS
- Systèmes et infrastructure
Xerox propose une nouvelle génération de moteurs de recherche
Juillet 2007
Les chercheurs de Xerox viennent de développer un logiciel d’extraction d’informations de nouvelle génération suffisamment puissant pour parcourir et passer au crible la plupart des sources de données électroniques, quels que soient la langue, l’emplacement, le format ou le type de document. Ce nouvel outil d’analyse textuelle est calqué sur les processus d’information du cerveau humain et sur notre façon de penser, de nous exprimer et de poser des questions. Il fonctionne de façon intuitive, garantissant ainsi la pertinence des résultats.
Développé au Centre de Recherches Européen de Xerox (XRCE) de Grenoble, FactSpotter combine un puissant moteur linguistique capable d’analyser à la fois la sémantique et la syntaxe des mots ou des groupes de mots recherchés, tout en conservant une interface simple et accessible à tous.
Disponible d’ici 2008, FactSpotter sera intégré à la gamme Xerox Litigation Services proposée par Xerox Global Services (XGS) destinée aux services juridiques et plus particulièrement à la partie « e-discovery » (reconnaissance électronique). Cette technologie de document intelligent vient compléter le portefeuille de solutions innovantes de gestion documentaire proposé par XGS aux entreprises ayant une utilisation intensive de documents.
Grâce au logiciel FactSpotter, qui permet de réduire considérablement les délais de recherche tout en optimisant la pertinence des résultats, Xerox entend dynamiser la productivité des entreprises exploitant d’importantes quantités de données, notamment dans les domaines de la reconnaissance électronique légale, de la gestion des risques, de la recherche pharmaceutique, de l’intelligence concurrentielle, de la sécurité ou encore de la répression des fraudes.
Pour chaque requête, les moteurs de recherche traditionnels fournissent généralement une longue liste de documents assez conséquents mais ne comportant cependant que le terme recherché (un document de 20 pages ne contenant qu’une seule occurrence du terme « Tour Eiffel », par exemple). Contrairement à cela, le logiciel d’analyse textuelle de Xerox procède à une recherche intelligente et sélective et ne liste que les parties de documents contenant l’information recherchée. Mieux encore, ces parties ne doivent pas nécessairement contenir le terme exact de la demande, le logiciel pouvant également rechercher des mots ayant le même sens. FactSpotter est par exemple à même de déduire que « le plus haut monument de Paris » fait référence à la Tour Eiffel.
Ce nouveau logiciel va bien au-delà des simples moteurs de recherche déjà existants. Ces derniers imposent en effet de fractionner les requêtes selon la logique informatique en isolant les mots et ne fournissent que des résultats reprenant des groupes de mots. A l’opposé, et grâce à son interface inédite, FactSpotter permet aux utilisateurs d’effectuer leurs recherches en langage naturel.
D’autre part, le logiciel tient d’abord compte du contexte général du document avant de rechercher un groupe de mots similaires. Il introduit ainsi le concept de « relation », en procédant à une recherche dans et à travers les phrases ou les paragraphes. Enfin, il est capable de reconnaître les concepts abstraits que peuvent induire certains termes (« personne » ou « bâtiment », par exemple) et de déceler tous les mots s’y rapportant.
Ces fonctionnalités avancées permettent au nouveau logiciel de Xerox de détecter en seulement quelques secondes des informations très difficiles à trouver avec une méthode classique. FactSpotter est d’ailleurs particulièrement indiqué pour répondre aux problématiques de certains secteurs d’activités tels que la justice. Lors d’un procès, par exemple, cette méthode de reconnaissance électronique pourrait permettre de trouver rapidement des faits précis parmi des centaines (voire des millions) de documents différents. Ce moteur de recherche nouvelle génération devrait également se révéler particulièrement précieux dans d’autres situations exigeant une recherche d’informations au sein d’une base de données volumineuse, à savoir la gestion des risques, les recherches gouvernementales et d’entreprise, la lutte contre les stupéfiants et la répression des fraudes.
Développé au Centre de Recherches Européen de Xerox (XRCE) de Grenoble, FactSpotter combine un puissant moteur linguistique capable d’analyser à la fois la sémantique et la syntaxe des mots ou des groupes de mots recherchés, tout en conservant une interface simple et accessible à tous.
Disponible d’ici 2008, FactSpotter sera intégré à la gamme Xerox Litigation Services proposée par Xerox Global Services (XGS) destinée aux services juridiques et plus particulièrement à la partie « e-discovery » (reconnaissance électronique). Cette technologie de document intelligent vient compléter le portefeuille de solutions innovantes de gestion documentaire proposé par XGS aux entreprises ayant une utilisation intensive de documents.
Grâce au logiciel FactSpotter, qui permet de réduire considérablement les délais de recherche tout en optimisant la pertinence des résultats, Xerox entend dynamiser la productivité des entreprises exploitant d’importantes quantités de données, notamment dans les domaines de la reconnaissance électronique légale, de la gestion des risques, de la recherche pharmaceutique, de l’intelligence concurrentielle, de la sécurité ou encore de la répression des fraudes.
Pour chaque requête, les moteurs de recherche traditionnels fournissent généralement une longue liste de documents assez conséquents mais ne comportant cependant que le terme recherché (un document de 20 pages ne contenant qu’une seule occurrence du terme « Tour Eiffel », par exemple). Contrairement à cela, le logiciel d’analyse textuelle de Xerox procède à une recherche intelligente et sélective et ne liste que les parties de documents contenant l’information recherchée. Mieux encore, ces parties ne doivent pas nécessairement contenir le terme exact de la demande, le logiciel pouvant également rechercher des mots ayant le même sens. FactSpotter est par exemple à même de déduire que « le plus haut monument de Paris » fait référence à la Tour Eiffel.
Ce nouveau logiciel va bien au-delà des simples moteurs de recherche déjà existants. Ces derniers imposent en effet de fractionner les requêtes selon la logique informatique en isolant les mots et ne fournissent que des résultats reprenant des groupes de mots. A l’opposé, et grâce à son interface inédite, FactSpotter permet aux utilisateurs d’effectuer leurs recherches en langage naturel.
D’autre part, le logiciel tient d’abord compte du contexte général du document avant de rechercher un groupe de mots similaires. Il introduit ainsi le concept de « relation », en procédant à une recherche dans et à travers les phrases ou les paragraphes. Enfin, il est capable de reconnaître les concepts abstraits que peuvent induire certains termes (« personne » ou « bâtiment », par exemple) et de déceler tous les mots s’y rapportant.
Ces fonctionnalités avancées permettent au nouveau logiciel de Xerox de détecter en seulement quelques secondes des informations très difficiles à trouver avec une méthode classique. FactSpotter est d’ailleurs particulièrement indiqué pour répondre aux problématiques de certains secteurs d’activités tels que la justice. Lors d’un procès, par exemple, cette méthode de reconnaissance électronique pourrait permettre de trouver rapidement des faits précis parmi des centaines (voire des millions) de documents différents. Ce moteur de recherche nouvelle génération devrait également se révéler particulièrement précieux dans d’autres situations exigeant une recherche d’informations au sein d’une base de données volumineuse, à savoir la gestion des risques, les recherches gouvernementales et d’entreprise, la lutte contre les stupéfiants et la répression des fraudes.
Pour aller plus loin
Sélection d'actualités
Forum
Vous voulez avoir l'avis d'un expert sur ce sujet ?
Gouvernance
Document, connaissances, GEDEmploi informatique
Législation
Licences, open source
Politique informatique
Qualité, certification, référentiels
Solutions
BI, décisionnel, SIGBureautique et infographie
Finances, gestion, trésorerie
Gestion commerciale, CRM
Mobilité
Production, logistique, SCM
Solutions globales, ERP
Solutions RH
Technologies
Archivage et sauvegardeHardware
Localisation, traçabilité
Locaux, sécurité physique
Programmation, développement
Réseaux et communications
Sécurité logique, virus et intrusions
Site Internet
Stockage, SAN, NAS
Systèmes et infrastructure
Editorial
ActualitésAgenda
Annuaire
Blogs
Contributeurs
Dictionnaire
Dossiers
Emploi
Forum
Lettre
Libraire