Entrepôt ORI-OAI

responseDate	2024-04-29T17:32:09Z
request	https://ori-oai-repository.univ-rennes1.fr/repository/OAIHandler?verb=ListRecords&set=dewey_100_taxonomie_regexp:0:020&metadataPrefix=oai_dc
metadatPrefix :	oai_dc
set	dewey_100_taxonomie_regexp:0:020

ListRecords (1 record )

identifier	oai:ori-oai-repository.univ-rennes1.fr:oai:oriwww.unit.eu:unit-ori-wf-1-1679
datestamp	2011-02-28

dewey_100_taxonomie_regexp

common_lom_rights_cost:no

dewey_100_taxonomie_regexp:0

common_lom_rights_cost

dewey_100_taxonomie_regexp:0:020

dc:identifier	http://www.grappa.univ-lille3.fr/~ppreux/Documents/notes-de-cours-de-fouille-de-donnees.pdf
dc:title	Fouille de données
dc:date	2008-10-09
dc:creator	Philippe Preux
dc:publisher	Université de Lille III
dc:subject	Aide à la décision
dc:subject	jeu de données
dc:subject	réseau de neurones
dc:subject	arbre de décision
dc:subject	théorème bayésien
dc:subject	classification
dc:subject	MVS
dc:subject	segmentation
dc:subject	ACP
dc:subject	apprentissage automatique
dc:subject	fuscia
dc:description	Ce cours adopte une approche pragmatique et pratique, tout en essayant de donner le matériel nécessaire pour comprendre ce que l'on fait : le but n'est pas d'appliquer aveuglément des algorithmes, mais de connaître des algorithmes et de savoir quand et comment les appliquer, d'être capable de les utiliser et de juger les résultats qu'ils fournissent. En fouille de données, on ne peut pas se contenter d'appliquer aveuglément une méthode et de se contenter tout aussi aveuglément du résultat obtenu, comme s'il s'agissait de LA réponse au problème. Les algorithmes d'extraction d'information constituent une boîte à outils ; ayant cette boîte à disposition, il nous faut apprendre à les utiliser, comme l'artisan apprend à manier ces outils. Dit autrement, la fouille de données est un art : outre les connaissances plus ou moins techniques à acquérir, il faut ensuite accumuler beaucoup de pratique. Au niveau pratique, on s'appuie exclusivement sur des logiciels libres : ils sont aisément accessibles sur la Toile. Certains sont remarquables. Malheureusement, il n'y a pas à l'heure actuelle de véritable atelier de fouille de données qui soit libre. Ceux-ci intègrent de très nombreux outils d'analyse et de fouille de données, de visualisation de données et des résultats de fouille, de présentation des résultats (création de tableaux de bord) et de liaison avec des bases et entrepôts de données : ces logiciels sont assez onéreux. On ne s'attaque pas au problème de la gestion de gros volumes de données ; ce que l'on raconte ici s'applique à des volumes de données raisonnables (ordre de grandeur : méga-octets stockés dans de simples fichiers Unix : suite de caractères non structurée ou des bases de données traditionnelles (type sql). Au-delà, des architectures spécialisées (entrepôts de données) sont nécessaires pour cette gestion. Ici et là, on indique comment passer à l'échelle en ce qui concerne les algorithmes de fouille.
dc:format	application/pdf
dc:type	lecture
dc:type	exercise
dc:language	fre
dc:rights	Document soumis à la licence GFDL (http://www.gnu.org/copyleft/fdl.html)

Menu

Enregistrements par ensembles

Enregistrements par formats

ListRecords (1 record )

Verbe :