Informations Donnes Connaissances Informations l Donnes l Information

  • Slides: 21
Download presentation
Informations, Données, Connaissances ¡ Informations l ¡ Données l ¡ Information présentée sous forme

Informations, Données, Connaissances ¡ Informations l ¡ Données l ¡ Information présentée sous forme conventionnelle, en vue d'être traitée Connaissances l ¡ Renseignement, fait qui apporte des renseignements nouveaux Règles utilisant les données pour en déduire d'autres Informatique l Science du traitement rationnel, notamment par machine automatique, de l'information considérée comme le support des connaissances et des communications dans les domaines techniques, économiques et sociaux (Académie Française, 1967

Qualité des données ¡ ¡ Utilité : caractère indispensable Objectivité : représentation fidèle, exempte

Qualité des données ¡ ¡ Utilité : caractère indispensable Objectivité : représentation fidèle, exempte de préjugé l l l forte (réalité indépendante de celui qui interprète : illusoire ? ) faible (reproductibilité) en médecine ¡ ¡ ¡ Validité l l l ¡ signes subjectifs (interrogatoire -cliniques) signes objectifs (laboratoires - numériques) Exactitude (Exactness) : reflet de la réalité (moy. observée mesures = valeur vraie) Précision (Accuracy) : liée au niveau d'approximation, à l'unité de mesure (dépend surtout de la sensibilité : aptitude à déceler une faible différence) Fiabilité (Reliability) : confiance inspirée (en rapport avec la spécificité : mesure-t-on ce qu'on est censé mesurer ? ) Permanente / Temporaire l l Données permanentes : Sexe, date de naissance. . . Données temporaires : examen clinique, diagnostic, traitement

Exemple ¡ Exactitude et précision V Exact Peu Précis V Exact Précis V V'

Exemple ¡ Exactitude et précision V Exact Peu Précis V Exact Précis V V' Non Exact Précis

Variabilité Des sujets : variabilité biologique ¡ Des observateurs : ¡ l l ¡

Variabilité Des sujets : variabilité biologique ¡ Des observateurs : ¡ l l ¡ inter-observateurs intra-observateurs Des données et mesures : Instrumentale Observateurs Intra-Sujet V. Analytique (de mesure) Inter-Sujets V. Biologique V. TOTALE

Quelques types de données ¡ Qualitatives : l littérales (nom, adresse. . . )

Quelques types de données ¡ Qualitatives : l littérales (nom, adresse. . . ) l binaires (sexe) Nominales (couleur) l ¡ Ordinales l ¡ (dépendance) numérique continues (taille ) discontinues (nbre d'enfants) numérique entier date et heure date Quantitatives : l Dates et Heures l alphanumérique ou texte booléen code énuméré

Description clinique ¡ Interprétation des nombres et des mots l ¡ Interprétation des associations

Description clinique ¡ Interprétation des nombres et des mots l ¡ Interprétation des associations l ¡ Fréquent, souvent, …. => quelle valeur Typique, rare, …. => association fortuite ou réelle ? De la description littérale à la sémiologie quantitative

Un compte rendu d’hospitalisation Madame X a été hospitalisée en urgence pour des douleurs

Un compte rendu d’hospitalisation Madame X a été hospitalisée en urgence pour des douleurs thoraciques rétrosternales caractéristiques irradiant dans le bras gauche dont les premiers épisodes remontent à 2 ans avec survenue à l'effort ou au froid. Il n'y avait pas d'OAP. Les enzymes cardiaques étaient élevées avec un tracé ECG permettant d'affirmer le diagnostic d'infarctus postérieur du myocarde. Cette patiente, obèse (120 KG), est porteuse d'un diabète équilibré dont nous n'avons pas modifié le traitement insulinique. Elle présente également une hypercholestérolémie à 3, 2 g/l. Malgré nos recommandations, elle continue à fumer environ 2 paquets de cigarettes par jour. Au niveau gynécologique, elle a un syndrome préménopausique assez bien toléré pour lequel aucun traitement n'a été envisagé. Dans les antécédents, on ne note pas d'IVG, mais une HTA en 86. Le bilan habituel et le traitement par angioplastie endoluminale de cet infarctus ont permis de laisser sortir la patiente au bout de 15 jours.

Première étape : extraction En gras concepts sans ambiguité ¡ En italique rouge données

Première étape : extraction En gras concepts sans ambiguité ¡ En italique rouge données à interpréter en fonction du contexte et des connaissances médicales ¡ En bleu abréviations et données ininterprétables ¡

Extraction Madame X a été hospitalisée en urgence pour des douleurs thoraciques rétrosternales caractéristiques

Extraction Madame X a été hospitalisée en urgence pour des douleurs thoraciques rétrosternales caractéristiques irradiant dans le bras gauche dont les premiers épisodes remontent à 2 ans avec survenue à l'effort ou au froid. Il n'y avait pas d'OAP. Les enzymes cardiaques étaient élevées avec un tracé ECG permettant d'affirmer le diagnostic d'infarctus postérieur du myocarde. Cette patiente, obèse (120 KG), est porteuse d'un diabète équilibré dont nous n'avons pas modifié le traitement insulinique. Elle présente également une hypercholestérolémie à 3, 2 g/l. Malgré nos recommandations, elle continue à fumer environ 2 paquets de cigarettes par jour. Au niveau gynécologique, elle a un syndrome préménopausique assez bien toléré pour lequel aucun traitement n'a été envisagé. Dans les antécédents, on ne note pas d'IVG, mais une HTA en 86. Le bilan habituel et le traitement par angioplastie endoluminale de cet infarctus ont permis de laisser sortir la patiente au bout de 15 jours.

Interprétation ¡ Fonction des connaissances médicales douleurs thoraciques rétrosternales caractéristiques irradiant dans le bras

Interprétation ¡ Fonction des connaissances médicales douleurs thoraciques rétrosternales caractéristiques irradiant dans le bras gauche dont les premiers épisodes remontent à 2 ans avec survenue à l'effort ou au froid. Angor

Décodage des abréviations ¡ Parfois impossible OAP. Oedème aigu du poumon ECG Électrocardiogramme IVG.

Décodage des abréviations ¡ Parfois impossible OAP. Oedème aigu du poumon ECG Électrocardiogramme IVG. Insuffisance ventriculaire gauche / Interruption volontaire de grossesse HTA Hypertension artérielle / Hystérectomie totale par voie abdominale

Structuration par problème médical ¡ Rattacher les différents éléments à un problème médical précis

Structuration par problème médical ¡ Rattacher les différents éléments à un problème médical précis (quand cela est possible) Madame X Infarctus postérieur aigu du myocarde avec Angor ancien, tracé ECG caractéristique Enzymes cardiaques élevées sans Oedème aigu du poumon Autres problèmes actuels Diabète insulinodépendant Hypercholestérolémie Tabagisme - Obésité Syndrome préménopausique ? Problème passé pouvant avoir des conséquences Hystérectomie totale par voie abdominale en 1986 Actes diagnostiques : Bilan habituel Traitement : Angioplastie endoluminale

Codage des informations ¡ ¡ Utilisation d’un langage formel : C'est la seule manière

Codage des informations ¡ ¡ Utilisation d’un langage formel : C'est la seule manière d'éviter la polysémie et de pouvoir envisager des traitements automatiques sur les données. Nomenclatures ou catalogues : l l l ¡ Collection méthodique, liste systématique des termes ou mots en usage, des informations concernant un champ sémantique défini (art, technique, science, médecine. . . ) Un libellé (libre, ± long) <==> Un code Si possible exhaustive Objectif : décrire Exemple : la nomenclature générale des actes professionnels (NGAP) utilisée pour la tarification des actes en médecine libérale Dictionnaires : l l Recueil de mots, d'expressions d'un langage, présentés dans un ordre convenu et destiné à apporter des informations sur des termes, des signes. . . Objectif : définir

Codage des informations ¡ Thésaurus : l l Répertoire (alphabétique) de Nomenclatures Relations :

Codage des informations ¡ Thésaurus : l l Répertoire (alphabétique) de Nomenclatures Relations : ¡ ¡ l l ¡ d'appartenance de proximité sémantique (analogie) de synonymie d'exclusion Exemple : MESH Objectif : analyser et cher Classifications l l l Action de distribuer par classe, par catégorie définie a priori en fonction des connaissances du moment Consiste à ranger dans un même groupe et à désigner du même nom des faits, objets ou êtres qui possèdent en commun certaines caractéristiques Thésaurus structuré - hiérarchisé Exemple : CIM 10 Objectif : classer pouvoir rassembler de manière hiérarchique le plus souvent

Codage des informations ¡ Utilisation de classifications partagées par les pairs en vue d’obtenir

Codage des informations ¡ Utilisation de classifications partagées par les pairs en vue d’obtenir un traitement automatique de l’information par un ordinateur l ¡ Hypertension artérielle essentielle : I 10 en CIM 10 Pour l l Dénombrer et réaliser des statistiques (épidémiologie) « Connecter » l’observation à des systèmes d’aide comme les guides de bonnes pratique cliniques

Notion de diagnostic et autres motifs de recours ¡ Diagnostics : l l ¡

Notion de diagnostic et autres motifs de recours ¡ Diagnostics : l l ¡ Autres motifs de recours l l ¡ Maladies identifiées Complications Signes symptômes Facteurs de risque Circoncision rituelle …. Quelle définition pour quel usage l Exemple : ¡ ¡ ¡ certificat de mortalité PMSI Maladies à déclaration obligatoire

Sémiologie quantitative ¡ Prévalence / Incidence l l ¡ Sensibilité / spécificité l l

Sémiologie quantitative ¡ Prévalence / Incidence l l ¡ Sensibilité / spécificité l l l ¡ Prévalence : Fréquence de la maladie dans la population Incidence fréquence des nouveaux cas dans une population par unité de temps Sensibilité : fréquence de la présence d’un signe chez les malades Spécificité : fréquence de l’absence d’un signe chez les non malades Problème de la valeur seuil Valeur prédictive l l VPP : fréquence de la maladie quand le signe est présent VPN : fréquence de l’absence de la maladie quand le signe est absent

Le tableau à 4 cases dans un échantillon représentatif ¡ La notion de signe

Le tableau à 4 cases dans un échantillon représentatif ¡ La notion de signe présent l l Soit un signe qualitatif binaire : éruption… Soit une valeur quantitative supérieure (inférieure) à un seuil : glycémie > 1, 2 g/L Malade Non Malade Test + A B A+B Test - C D C+D Total A+C B+D A+B+C+D =N Prévalence Sensibilité Spécificité = (A+C)/N = A/(A+C) = D/B+D VPP VPN = A/(A+B) = D/(C+D)

Valeur seuil l Influence sur la sensibilité et la spécificité ¡ ¡ l Si

Valeur seuil l Influence sur la sensibilité et la spécificité ¡ ¡ l Si seuil se déplace vers la droite : ¡ ¡ l Spécificité = 1 – Faux positif Sensibilité = 1 – Faux négatif Augmentation de la spécificité Diminution de la sensibilité Courbe de ROC

Probabilité de trouver au moins un résultats anormal chez une personne en bonne santé

Probabilité de trouver au moins un résultats anormal chez une personne en bonne santé ¡ Calculable à partir des sensibilités, spécificité et prévalence Nombre de test pratiqués 1 6 12 20 100 Probabilité pour qu’un test soit anormal (%) 5 26 46 64 99, 4

Discussion ¡ ¡ ¡ Les indicateurs de la valeurs informationnelle sont utiles pour la

Discussion ¡ ¡ ¡ Les indicateurs de la valeurs informationnelle sont utiles pour la stratégie diagnostique. Ils peuvent être utilisés dans des systèmes informatiques d’aide à la décision Mais : l l l La description de la population étudiée correspond-elle à ma pratique ? Les sujets examinés dans l’étude sont-ils comparables à mes patients ? Quelle est la valeur du test choisi comme test de référence (gold standard) ? Permet-il d’établir le statut du patient avec certitude ? L’interprétation du test s’est-elle faire en aveugle ? Les effets de la prévalence sont-ils examinés soigneusement ?