Devoir de Philosophie

connaissances, extraction de - informatique.

Publié le 25/04/2013

Extrait du document

connaissances, extraction de - informatique. 1 PRÉSENTATION connaissances, extraction de, ensemble de techniques permettant de dégager des généralités de grands ensembles de données, c'est-à-dire de décrire de manière utile et compréhensible les régularités émergeant de ces données. Ces techniques peuvent être séparées en deux classes : les techniques de vérification d'hypothèses (l'algorithme vérifie que les données sont compatibles avec les prévisions), et les techniques prédictives (on construit un algorithme capable de faire des hypothèses). 2 ORIGINE Ces dernières années ont vu les bases de données croître de manière exponentielle, pour atteindre des capacités se mesurant en terabits (1012 bits). L'émergence de ces entrepôts de données (ou datawarehouse en anglais) a rendu impossible toute exploitation manuelle de ces données : il a fallu inventer de nouvelles techniques d'intelligence artificielle, ou en adapter d'anciennes, afin de pouvoir procéder à leur analyse. 3 PRINCIPE L'extraction de connaissances (ou knowledge discovery) se déroule en plusieurs étapes. La première consiste à sélectionner, dans un entrepôt de données, celles qui sont pertinentes pour le but recherché. Ces données sont ensuite transformées, réorganisées ou converties, afin de pouvoir être analysées : c'est la phase de nettoyage. L'analyse de ces données, également appelée fouille de données (ou data mining), peut alors être réalisée, à l'aide de différentes techniques d'intelligence artificielle, tels les arbres de décision et les réseaux de neurones, ou à l'aide de techniques statistiques, permettant de dégager des régularités à l'intérieur de ces données. Les résultats sont alors transformés pour permettre leur interprétation et leur visualisation en fonction du but recherché. 4 APPLICATIONS Les applications de l'extraction de connaissances sont multiples : ces techniques sont utilisées par les banques (détection de fraudes, sélection de clients susceptibles d'être intéressés par un produit particulier), les investisseurs (prédictions boursières), les scientifiques (identification et classification d'objets célestes), les services de police (recherche de transactions indiquant le blanchiment d'argent), les gérants de supermarchés (analyse des corrélations existant entre différents produits). Microsoft ® Encarta ® 2009. © 1993-2008 Microsoft Corporation. Tous droits réservés.

Liens utiles