DPARTEMENT DE GNIE LOGICIEL ET DES TI LOG










- Slides: 10
DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG 770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Introduction à Weka Enseignant : Christian Desrosiers Chargée de laboratoire : Faten M’hiri
Classification ou clustering ? Problème Type d'apprentissage Algorithmes Classification Supervisé: On possède les attributs et l'étiquette (i. e. , classe de sortie) des exemples d'entraînement SVM, k-NN, arbres de décisions, classification de Bayes naïve, etc. Groupement (Clustering) Non supervisé: On ne possède que les attributs des exemples d'entraînement k-moyennes, mélange de modèles gaussiens, etc.
Classification • Collecter les données : – Données d’apprentissage : pour entraîner le classifieur – Données de tests : pour évaluer le classifieur • Choisir l’ensemble de caractéristiques pour les décrire (descripteurs) • Sélectionner d’un algorithme de classification supervisé • Entraîner le classifieur (avec les données d’apprentissage) • Évaluer la performance du classifieur (avec les données de test)
Introduction à Weka • Logiciel d’apprentissage machine : – Traitement de données – Forage de données – Comparaison d’algorithmes – Etc. • Site web: http: //www. cs. waikato. ac. nz/ml/weka/index. html
Introduction à Weka • • Lancer le logiciel Choisir mode « Explorer » GUI : Open File Sélectionner le fichier : « Weka/data/weather. arff »
Exemple : weather. arff • ARFF (Attribute-Relation File Format) : – Caractéristiques décrivant la météo: @relation weather @attribute @attribute outlook {sunny, overcast, rainy} temperature real humidity real windy {TRUE, FALSE} play {yes, no}
Exemple : weather. arff • ARFF (Attribute-Relation File Format) (suite) : – Ensemble de données : @data sunny, 85, FALSE, no sunny, 80, 90, TRUE, no overcast, 83, 86, FALSE, yes rainy, 70, 96, FALSE, yes rainy, 68, 80, FALSE, yes rainy, 65, 70, TRUE, no overcast, 64, 65, TRUE, yes sunny, 72, 95, FALSE, no sunny, 69, 70, FALSE, yes rainy, 75, 80, FALSE, yes sunny, 75, 70, TRUE, yes overcast, 72, 90, TRUE, yes overcast, 81, 75, FALSE, yes rainy, 71, 91, TRUE, no
Utilisation du GUI : Exemple No No Yes Sunny Yes Overcast Yes Rainy
Utilisation du GUI : Exemple choisir l’algorithme J 48 dans la section Trees
Liens • http: //www. cs. waikato. ac. nz/ml/weka/index. html • http: //www. dataminingtools. net/browsetutorials. php? tag=weka • http: //aqualonne. free. fr/Teaching/csc/DM. pdf