-
lom:general :
-
lom:identifier :
-
lom:catalog :
URI
-
lom:entry :
http://ori.unit-c.fr/uid/unit-ori-wf-1-1679
-
lom:title :
-
lom:string :
Fouille de données
-
lom:language :
fre
-
lom:description :
-
lom:string :
Ce cours adopte une approche pragmatique et pratique, tout en essayant de donner
le matériel nécessaire pour comprendre ce que l'on fait : le but n'est pas d'appliquer aveuglément des algorithmes, mais de connaître des algorithmes et de
savoir quand et comment les appliquer, d'être capable de les utiliser et de juger
les résultats qu'ils fournissent. En fouille de données, on ne peut pas se contenter
d'appliquer aveuglément une méthode et de se contenter tout aussi aveuglément
du résultat obtenu, comme s'il s'agissait de LA réponse au problème. Les algorithmes d'extraction d'information constituent une boîte à outils ; ayant cette
boîte à disposition, il nous faut apprendre à les utiliser, comme l'artisan apprend à manier ces outils. Dit autrement, la fouille de données est un art : outre
les connaissances plus ou moins techniques à acquérir, il faut ensuite accumuler
beaucoup de pratique.
Au niveau pratique, on s'appuie exclusivement sur des logiciels libres : ils sont
aisément accessibles sur la Toile. Certains sont remarquables. Malheureusement,
il n'y a pas à l'heure actuelle de véritable atelier de fouille de données qui
soit libre. Ceux-ci intègrent de très nombreux outils d'analyse et de fouille de
données, de visualisation de données et des résultats de fouille, de présentation
des résultats (création de tableaux de bord) et de liaison avec des bases et
entrepôts de données : ces logiciels sont assez onéreux.
On ne s'attaque pas au problème de la gestion de gros volumes de données ;
ce que l'on raconte ici s'applique à des volumes de données raisonnables (ordre de
grandeur : méga-octets stockés dans de simples fichiers Unix : suite de
caractères non structurée ou des bases de données traditionnelles (type sql).
Au-delà, des architectures spécialisées (entrepôts de données) sont nécessaires
pour cette gestion. Ici et là, on indique comment passer à l'échelle en ce qui
concerne les algorithmes de fouille.
-
lom:keyword :
-
lom:string :
Aide à la décision
-
lom:keyword :
-
lom:string :
jeu de données
-
lom:keyword :
-
lom:string :
réseau de neurones
-
lom:keyword :
-
lom:string :
arbre de décision
-
lom:keyword :
-
lom:string :
théorème bayésien
-
lom:keyword :
-
lom:string :
classification
-
lom:keyword :
-
lom:keyword :
-
lom:string :
segmentation
-
lom:keyword :
-
lom:keyword :
-
lom:string :
apprentissage automatique
-
lom:keyword :
-
lom:structure :
-
lom:source :
LOMv1.0
-
lom:value :
atomic
-
lom:aggregationLevel :
-
lom:source :
LOMv1.0
-
lom:value :
3
-
lom:lifeCycle :
-
lom:contribute :
-
lom:role :
-
lom:source :
LOMv1.0
-
lom:value :
author
-
lom:entity :
BEGIN:VCARD
N:Preux;Philippe
FN:Philippe Preux
EMAIL;TYPE=INTERNET:
ORG:Université Lille 3
END:VCARD
-
lom:date :
-
lom:dateTime :
2008-10-09
-
lom:contribute :
-
lom:role :
-
lom:source :
LOMv1.0
-
lom:value :
publisher
-
lom:entity :
BEGIN:VCARD
N:Université de Lille III
FN:Université de Lille III
EMAIL;TYPE=INTERNET:
ORG:Université de Charles-de-Gaulle
END:VCARD
-
lom:date :
-
lom:dateTime :
2008-10-09
-
lom:metaMetadata :
-
lom:identifier :
-
lom:catalog :
URI
-
lom:entry :
http://ori.unit-c.fr/uid/unit-ori-wf-1-1680
-
lom:contribute :
-
lom:role :
-
lom:source :
LOMv1.0
-
lom:value :
creator
-
lom:entity :
BEGIN:VCARD
N:Gilles-Gallet;Isabelle
FN:Isabelle Gilles-Gallet
EMAIL;TYPE=INTERNET:
ORG:UNIT
END:VCARD
-
lom:date :
-
lom:dateTime :
2009-02-09
-
lom:contribute :
-
lom:role :
-
lom:source :
LOMv1.0
-
lom:value :
validator
-
lom:entity :
BEGIN:VCARD
N:Gilles-Gallet;Isabelle
FN:Isabelle Gilles-Gallet
EMAIL;TYPE=INTERNET:
ORG:UNIT
END:VCARD
-
lom:date :
-
lom:dateTime :
2009-02-13
-
lom:metadataSchema :
LOMv1.0
-
lom:metadataSchema :
LOMFRv1.0
-
lom:metadataSchema :
SupLOMFRv1.0
-
lom:technical :
-
lom:educational :
-
lom:learningResourceType :
-
lom:source :
LOMv1.0
-
lom:value :
lecture
-
lom:learningResourceType :
-
lom:source :
LOMv1.0
-
lom:value :
exercise
-
lom:intendedEndUserRole :
-
lom:source :
LOMv1.0
-
lom:value :
learner
-
lom:context :
-
lom:source :
LOMFRv1.0
-
lom:value :
master
-
lom:typicalAgeRange :
-
lom:difficulty :
-
lom:source :
LOMv1.0
-
lom:value :
medium
-
lom:typicalLearningTime :
-
lomfr:credit :
3 ECTS
-
lom:rights :
-
lom:cost :
-
lom:source :
LOMv1.0
-
lom:value :
no
-
lom:copyrightAndOtherRestrictions :
-
lom:source :
LOMv1.0
-
lom:value :
yes
-
lom:description :
-
lom:string :
Document soumis à la licence GFDL (http://www.gnu.org/copyleft/fdl.html)
-
lom:classification :
-
lom:purpose :
-
lom:source :
LOMv1.0
-
lom:value :
discipline
-
lom:taxonPath :
-
lom:source :
-
lom:string :
Classification UNIT
-
lom:taxon :
-
lom:id :
1407
-
lom:entry :
-
lom:string :
Systèmes d'information - Fouille de données
-
lom:taxonPath :
-
lom:source :
-
lom:taxon :
-
lom:id :
025.04
-
lom:entry :
-
lom:string :
Systèmes de stockage et de recherche d'information
|