Salut,
Par défaut une image est en intensité (la plaque photo est sensible à la quantité de lumière reçue dans chaque fréquence). Il y a notamment une déviation vers le bleu due à l’atmosphère, qui est d’autant plus importante que la hauteur de vol est élevée. Donc idéalement il faudrait une calibration sur une surface que tu sais être blanche et qui se situe au niveau du sol (idéalement un truc fait exprès type spectralon, sinon de la neige ça fait l’affaire. Du sable sinon. Pas les nuages qui sont en altitudes). Ça permet d’avoir quelque chose qui reflète mieux les spectres de réflectance des différents matériaux. Après ça marchera aussi sans ça, si vraiment impossible.
Une fois que c’est fait, les ombres ne sont normalement pas un problème tant que la zone n’est pas sous-exposées : l’intensité totale est différentes du reste de la photo, mais les proportions entre les différentes fréquences du spectre restent les mêmes pour un matériaux donné. Par exemple si t’as un lac, les pixels situés à l’ombre auront le même spectre que ceux au soleil, à un facteur multiplicatif près. Donc si tu crée un indice basé sur la ratio entre les fréquences rediffusées et les fréquences absorbées, tu peux détecter ton eau. Au passage, il s’agit du NDWI. Le NDVI, c’est basé sur le spectre de la chlorophylle-a et ça sert à détecter la végétation, pas l’eau.
Ensuite tu peux définir ton seuil empiriquement : tu prends un échantillon de pixels, tu mets tous les pixels dont tu es sûr qu’ils contiennent de l’eau d’un côté et tu regarde ton ndwi min. Tu peux ensuite appliquer ce seuil à tous les pixels que tu as de disponibles.
Si ta photo est de bonne qualité et possède les bonnes bandes de fréquences, c’est assez fiable. Les ambiguïté devraient surtout se trouver sur les pixels qui contiennent à la fois de l’eau et autre chose, auquel cas les bandes de fréquences vont se moyenner. Pas vraiment des erreurs au final.
Pour déterminer ton intervalle de confiance, je ne sais pas exactement s’il y a une méthode canonique dans ce genre de cas. Une idée : prendre un autre échantillon de pixel qui n’a pas été utilisé pour calibrer ton indice et regarder ta matrice de confusion. Puis inférer sur l’ensemble du jeux de données. Comme pour un sondage.
C’est aussi du ML en fait. Tes données, ce sont des pixels échantillonnés sur l’ensemble des images, puis tu a un échantillon d’entraînement (pour calibrer ton indice), un échantillon de test (pour inférer ton intervalle de confiance). Et tu pourrais éventuellement créer des échantillons de validation, faire des boostraps, etc. Bon, à ma connaissance on s’embête rarement avec se genre de truc en photogrammétrie. Quoique je débute encore dans le domaine donc je peux me tromper.