lestimation des concentrations dans les BV dans les
l’estimation des concentrations dans les BV & dans les cours d’eau ; l’apport de la géostatistique 1. estimation géostatistique de la moyenne annuelle et du quantile 90% 2. interpolation entre stations 3. vers une amélioration des modèles et des estimations ? DIREN, 27 avril 2007
1. Indicateurs géostatistiques de la pollution dans les cours d’eau thèse de Caroline Bernard-Michel juillet 2006, Ecole des Mines de Paris
Le Loir à Lezigne, 1991 Concentration en nitrates (mg/l) Biais dû à l’échantillonnage préférentiel Numéro du mois Moyenne Quantile 90 12 mesures 17 34, 1 18 mesures 24, 16 55, 5 2 Très Bonne 10 Bonne 25 Moyenne 50 Médiocre Mauvaise
Echantillonnage préférentiel temporellement renforcé à des périodes variables suivant les stations - durant les fortes concentrations en nitrates - pendant l’étiage fréquence 6 mesures par an Numéro de mois 18 mesures par an
Echantillonnage préférentiel Exemple : par année, en Loire-Bretagne 6 mesures, plutôt en été - 18 mesures, renforcées en hiver le signe du biais varie suivant - les substances - les stations
Variations saisonnières nitrates à Orléans en 1985 moyenne mensuelle orthophosphate, station sur la Moselle pendant environ dix ans mois
Corrélation temporelle : variogramme orthophosphate, Loire variogramme temps
Variogramme : en dimension 1, 2. . . Plan de position Nuée variographique Variogramme expérimental
variogramme et covariance le variogramme généralise la covariance il est plus commode pour l’inférence variogramme covariance C(0) a a
Modèle avec structures gigognes Courte portée Structure gigogne Longue portée
Corrélation temporelle : variogramme des nutriments (LB)
Moyenne statistique n échantillons zi moyenne : précision : var (m-m*) = σ2/n, où σ : variance des n données
hypothèses On estime m, espérance de la loi de probabilité supposée identique pour tous les échantillons calcul de la précision : les échantillons sont des tirages indépendants
Quelle « moyenne » ? nitrates à Orléans La « moyenne annuelle » reste définie même en l’absence de stationnarité. Si la chronique est parfaitement connue, par exemple par les 365 valeurs journalières, la variance de l’erreur d’estimation est nulle
Krigeage de la moyenne annuelle des concentrations Pondération optimale des données Corrige l’irrégularité de l’échantillonnage Précision : variance de krigeage intervalle de probabilité
Poids de krigeage variogrammes
Exemple, moyenne annuelle Moyenne annuelle Ecart type d’estimation Statistique Géostatistique nitrates 9. 69 8. 59 0. 93 0. 69 nitrites 0. 049 0. 054 0. 007 0. 009 Caroline Bernard-Michel, juillet 2006
Simplification : segments d’influence corrige l’irrégularité de l’échantillonnage le calcul de la variance de l’erreur d’estimation nécessite le variogramme la simplifier ? 365 jours 1 D 1 2 3 D 2 D 3 4 D 4
Exemple : le Loir à Lezigne Moyenne pour les nitrates (écart-type de l’erreur d’estimation) Statistique Krigeage Segments d’influence 17. 00 12 mesures (5. 11) 16. 7 (1. 55) 16. 95 24. 16 18 mesures (5. 02) 19. 07 (1. 32) 18. 64
Moyenne annuelle nitrites, station 57800, 1996 Moyenne annuelle nitrates, station 50500, 1985 Nombre de prélèvements annuels Statistique Krigeage Segments d’influence Nombre de prélèvements annuels
Calcul du quantile pondération par les poids de krigeage de z. T interpolation linéaire du quantile empirique mais aux stations l’estimation du quantile 90% reste imprécise Caroline Bernard-Michel, Juillet 2006
Autres lois, autres ordres… Esperance du quantile 90 Loi normale (0, 1) Quantiles d’ordres variant de 10 à 90 10 Biais . . Taille de l’échantillon Associée à la pondération 90 Taille de l’échantillon
Quantiles : Pondération des données & interpolation linéaire de la fonction empirique en escalier sans pondération avec pondération
Exemple : le Loir à Lezigne Quantile 90% Statistique Krigeage Segments d’influence 12 mesures 34. 1 43. 34 44. 57 18 mesures 55. 5 48. 16 47. 38
Exemples : moyenne, quantile 90%
Exemples : moyenne, quantile 90%
Compléments sur le krigeage Estimateurs classiques Moyenne mobile Polygone d’influence Inverse des distances Ajustement polynomial par moindres carrés échantillons cible
Polygone d’influence Toute l’influence provient du point le plus proche 1 2 100% 3 0% 0% 0% 5 0% 4 Influence limitée à une seule donnée
Polygone d’influence
Inverse des distances La pondération dépend de la distance à la cible 1 2 37% 3 21% 20% 15% 5 7% 4 • Ne discrimine pas l’information redondante • Choix du degré
Inverse des distances Inverse d 2
Krigeage - Définition Le Krigeage fournit une estimation en un point, ou en moyenne sur une maille ou sur un polygone. . . On s’intéresse à l’erreur d’estimation de moyenne nulle (non biais) de variance minimale (meilleure précision)
Krigeage Variogramme linéaire - voisinage unique Variogramme exponentiel - voisinage glissant
mais la carte krigée n’est pas non plus la réalité
Cokrigeage : utilisation d’une information corrélée application : réduction du nombre de mesures de 30%
Carte d’écart-type
2. Interpolation entre stations ? modèles géostatistiques sur un réseau hydrographique
Interpoler entre stations ? ?
Conditions de cohérence aux S confluences 1 S 2 T 2 les débits ou les « écarts » s’ajoutent D 3=D 1+D 2 les concentrations, les débits spécifiques se combinent discontinuités aux confluences adapter les variogrammes usuels T 1 T 3
Modèles géostatistiques sur un « arbre » combinaison de « filets » élémentaires inférence : stationnarité, corrélation entre filets. . .
Débit spécifique T(x) Esperance des débits spécifiques 1995 Surface drainée Ensemble du réseau Débit spécifique T(x) 1999 Moselle Surface drainée
Limites actuelles pour l’inférence du modèle Trop peu de stations de mesures sur les filets élémentaires entre deux confluences informations sur le « fonctionnement » des systèmes se caler au modèle phénoménologique : hydrométéorologie. . .
Lien avec les modèles de bassins versants ? Ecarts entre le modèle de bassin et les mesures - pallier les lacunes des mesures - se caler à un « fond de carte » réaliste - rendre les variables plus stationnaires ou réciproquement, caler les modèles de bassins aux mesures ?
Perspectives Modèles débit-flux-cencentrations Modèles spatiaux-temporels sur les graphes Calculs entre stations ? moyenne annuelle quantile
3. Vers une amélioration des modèles et des estimations ?
estimation d’une moyenne annuelle Calage des résultats de Pégase aux données, en tenant compte des différences de support spatial ou temporel à x fixé, chronique temporelle à date fixée, profil longitudinal modèle géostatistique d’écart « postraitement »
Interpolation entre stations Z = « ébauche » + écart Pégase géostatistique à partir des données : estimation Z* ≠ Z ordre de grandeur du biais des calculs « statistiques » actuels ?
estimation d’une moyenne annuelle Z (x, t) valeur réelle, inconnue Z*(x, t) estimation, seule disponible Z*-Z erreur d’estimation à cause de l’erreur d’estimation: erreurs de « classement » Z* <s alors que Z >s ou Z* >s alors que Z <s probabilité de dépassement de seuil
estimation d’un quantile Z = « ébauche » + écart Pégase géostatistique Définition du quantile ? spatialement (masse d’eau) temporellement (année) support : concentrations instantanées, journalières. . .
Interpolation entre stations estimation pour les « masses d’eau » sans station de mesure « extrapolation » des écarts en référence à des milieux analogues
estimation des paramètres en entrée de Pégase données hydrométéorologiques mesurées en quelques stations débits, températures. . . sur le réseau ? études de sensibilité
Influence du modèle sur les poids Influence du choix du modèle dans le krigeage ordinaire: Pépite 25% Sphe(2 L) 25% 40. 6% 9. 4% L L 40. 6% 25% Gaus(1. 5 L) 49. 8% 0. 2% L 49. 8%
Dégroupage Sphérique, portée = 3 * rayon 33. 3% 37. 0% 26. 0% 33. 3% 25. 7% 48. 7% 37. 0% 50. 0%
Concentration Simulations Concentration Chroniques reconstituées Numéro de mois Variogramme Corrélations Variogramme Numéro de mois Nombre d’années
Quantile 90 Nombre de mesures par an Quantile empirique linéarisé
Applications (1) Bassin Loire Bretagne 269 stations 3 paramètres nitrates nitrites orthophosphates 1985 -2005
Moyennes annuelles Quantiles Applications (2) Ecart type d’estimation
Bassin Rhin Meuse Stations plus nombreuses Mesures plus régulières Restriction à la Moselle Entre stations
Que montre la covariance expérimentale? Différentes distances possibles Non stationnarité Interprétations Variogramme Covariance expérimentale Distance (km)
module concentration Module, 1996 Non Concentrations stationnarité en nitrates, 1996 Distance à l’exutoire module Surface drainée Nitrate / agriculture, 1997 concentration Nitrate / Forêt, 1997 concentration Débit / surface drainée, 1995 Distance à l’exutoire % forêt amont % agriculture amont
Filets élémentaires Modèle de même covariance C stationnarité indépendance Combinaison linéaire des filets
Modèle de covariance Covariance la distance curviligne entre x et y les filets élémentaires communs à x et y
débit 1995 Débit spécifique Filets élémentaires, rang 1 débit 1999 Distance à la source Débit spécifique Distance à la source
Vers un réseau « représentatif » de la qualité des cours d’eau ? Directive cadre européenne: 1 station pour 1000 km 2 pour la qualité physico-chimique 1200 stations du RNB, implantation préférentielle (Léonard & Crouzet, 1999) sélection de 551 stations ? ou pondération ?
Etude exploratoire des stations RNB - intensité des «pressions anthropiques » très variable sur le territoire - corrélation entre occupation du sol et concentrations en nutriments - concentrations : variabilité croissante avec le niveau on ne peut définir un réseau à densité et à précision constantes pour différents nutriments pondérer les stations pour les rendus statistiques
Actuellement, le SEQ-eau Statistiques annuelles par station : moyenne quantile 90
Hypothèses du calcul statistique classique Les mesures sont des tirages de variables aléatoires - indépendantes - de même loi dont on estime l’espérance, ou un quantile
Nutriments dans les cours d’eau Variations saisonnières moyenne mensuelle orthophosphate, Moselle mois Variogramme temporel variogramme nitrites, Loire Caroline Bernard-Michel, 2006 temps
Echantillonnage préférentiel Exemple : par année, en Loire-Bretagne 6 mesures, plutôt en été - 18 mesures, renforcées en hiver le signe du biais varie suivant - les substances - les stations
Relations aux confluences Aux confluences pour des concentrations ou des débits variance non stationnaire sur l’arbre Après n confluences
Que veut-on estimer ? Estimation ponctuelle Echantillons Estimer la valeur Z 0 aux nœuds d’une grille régulière
Que veut-on estimer ? Estimation de bloc Echantillons Estimer la valeur moyenne de Z sur le bloc
Que veut-on estimer ? Estimation de blocs irréguliers Echantillons Estimer la valeur moyenne de Z dans le polygone
- Slides: 74