LSVT Voice Rehabilitation Data Set 710533117 Boosting Feature
高維度資料分析期末報告 LSVT Voice Rehabilitation Data Set 統碩二 710533117 張芳 綺
Boosting Feature Selection • 運行100次Boosting,紀錄每次Boosting所選出的前五十 個重要變數,統計這 100次中出現頻率最高的前20個變數。 DFA GNE->std Log energy Jitter->F 0_TKEO_prc 25 MFCC_2 nd coef entropy_shannon_5_coef GNE->NSR_SEO Jitter->F 0_abs_dif MFCC_3 rd coef 1 st delta VFER->SNR_SEO Shimmer-> Ampl_abs 0 th_perturb MFCC_8 th coef det_TKEO_mean_8_coef HNR-> HNR_d. B_Praat_std MFCC_12 th coef F 0_series_F 0_exp. Titze IMF->NSR_SEO MFCC_1 st coef entropy_log_4_coef
分類模型 • 將全部變數與Boosting選出的變數,利用MDS、 ISOMAP維度縮減後的結果,分別放入分類模型 • 利用 10 -folds 交叉驗證分類模型 MDS_全部變數(p=310→p=2) SVM 0. 2679 Random Forest 0. 2917 k. NN 0. 3209 MDS_Boosting (p=20→p=2) 0. 2545 0. 2699 0. 3455 ISOMAP_全部變數 (p=310→p=2) 0. 3282 0. 2859 0. 2969 ISOMAP_Boosting (p=20→p=2) 0. 3405 0. 2750 0. 3236 10
- Slides: 13