====== TFE 2010-2011 (final year project) ====== [[tfe2010-2011|Back to list]] ===== Classification supervisée en présence de variables dépendantes ===== Dans le domaine de l’apprentissage supervisé, les variables d’entrée sont souvent organisées selon une structure de voisinage données. Par exemple, en bioinformatique, plusieurs techniques de mesures fournissent des variables qui sont structurées selon une dimension (spectres de masses protéiques ou données de séquençage par exemple). En classification d’images, les variables sont les pixels qui sont distribués selon une structure en deux dimensions. Ce travail de fin d’étude visera à proposer et évaluer différentes stratégies pour prendre en compte cette structure de dépendances pour améliorer la qualité des modèles prédictifs et de la sélection de variable. Ces méthodes seront appliquées préférentiellement sur plusieurs bases de données réelles où il s’agit de classer des patients atteints de différentes maladies inflammatoires à partie de spectres de masse protéiques. == Références: == * Sparsity and smoothness via the fused lasso, R. Tibshirani and M. Saunders, J.R.Statist. Soc. B (2005), 67, Part 1, pp.91-108 http://www.stanford.edu/group/SOL/papers/fused-lasso-JRSSB.pdf * Gertheiss and Tutz. Supervised feature selection in mass spectrometry-based proteomic profiling by blockwise boosting. Bioinformatics (2009) vol. 25 (8) pp.1076-1077 http://dx.doi.org/10.1093/bioinformatics/btp094 == Renseignements, Promoteur: == [[http://www.montefiore.ulg.ac.be/~geurts/|Pierre Geurts]] ()