Module d'initiation à la géomatique

Description du format de données raster

Une matrice de pixels

Le format raster consiste en un échantillonnage régulier de l'espace qui permet d'affecter une mesure de la variable d'intérêt selon le même échantillonnage.

D'un point de vue numérique cela correspond à la création d'une grille de valeurs soit une matrice de pixels.

Chaque pixel stocke la valeur de la variable d'intérêt. La valeur stockée est forcément numérique. Cela n'empêche pas de recourir à des caractérisations qualitatives mais qui devront passer par un transcodage entre la valeur numérique et son équivalence textuelle.

La valeur vaudra pour toute la surface au sol couverte par le pixel.

Cette matrice devra être bornée au départ → l'utilisateur doit préciser l'étendue spatiale de la couche d'information raster, sans possibilité de l'agrandir par la suite sans avoir à créer une nouvelle couche d'information raster.

Les couches d'information raster sont adaptées pour stocker des données :

  • qualitatives (occupation du sol, zonages administratifs...)

  • quantitatives classées (échelle de mesure ordinales)

  • quantitatives continues (échelle de mesure cardinale)

Structure des fichiers

Suivant les logiciels utilisés, vous pouvez avoir des formats très spécifiques mais qui se résument à l'association de deux informations :

Une entête

Une entête qui va décrire au logiciel la structure matricielle de la couche d'information et qui peut aussi contenir des informations pour l'utilisateur de la donnée :

  • nombre de lignes et de colonnes de la matrice

  • taille d'un pixel au sol (exprimée par la mesure d'un côté dans l'unité de projection)

  • étendue spatiale

  • système de projection associé

  • description du phénomène décrit (codage numérique ou unité)

  • légende et/ou palette de couleurs

  • date de création et auteur

  • ...

Une matrice de valeur

La matrice de valeurs constituera la matrice des pixels affichée à l'écran de l'ordinateur (ou bien stockée telle quelle, soit compressée pour limiter la taille du stockage sur le disque)

Codage de l'information

En tant qu'utilisateur vous aurez à préciser quelques choix au logiciel au moment de la création d'une couche d'information raster :

L'emprise géographique de la couche d'information

L'emprise géographique est choisie une fois pour toutes et ne peut pas être modifiée par la suite, à moins de créer une nouvelle couche d'information raster soit moins étendue (extraction d'une zone d'intérêt à partir d'une couche d'information trop étendue), soit plus étendue (expansion par ajout d'information hors d'une zone géographique déjà couverte par une couche d'information raster existante).

La résolution spatiale, ou l'emprise au sol d'un pixel

Cette notion est fondamentale puisqu'elle détermine la surface du plus petit élément de description de votre variable. A travers cette notion, vous déterminez la capacité de votre couche d'information à distinguer deux valeurs spatialement proches donc sa capacité à différencier ou non des éléments de taille plus ou moins réduite.

la profondeur de codage, ou le format numérique utilisé.

Cette notion recoupe la capacité d'un format à stocker un nombre de valeurs numériques différentes plus ou moins important. Il s'exprime souvent en bits. Il dépend aussi du besoin de stocker des nombre réels ou simplement des entiers...

Par exemple, combien de valeurs différentes de température existent sur votre zone d'étude ? Un codage en 2 bits pourra coder 2^2 valeurs différentes, soit 4 valeurs...

Un codage en 8 bits codera 2^8, soit 256 valeurs différentes.

Nombre de bits

Nombre de valeurs gérées

1

2

2

4

4

16

8

256

16

65 536

32

4 294 967 296

Attention

La taille du fichier et donc les contraintes numériques (transfert, calculs...) augmentent avec la profondeur de codage.

En tant qu'utilisateur vous devez vous assurer que vous choisissez la profondeur de codage la plus adaptée à la donnée que vous devez manipuler.

Qui peut le plus peut le moins ! Mais appliquer cette règle systématiquement en choisissant la profondeur de codage la plus élevée est à terme une mauvaise solution car elles est coûteuse en temps de transfert pour l'échange des données et temps de traitement (temps CPU...)

Remarque

A noter que certains formats (comme le NetCDF) ont la capacité de stocker dans un même fichier raster plusieurs dimensions de l'information. C'est très utilisé pour stocker par exemple des chroniques de températures sur une même zone géographique où chaque dimension correspond à une date (date des relevés de température, par exemple).

La représentation des données raster à l'écran

Choix de la palette de couleur

L'affichage dans un SIG des données raster passe par la mise en correspondance des valeurs numériques contenues dans les matrices de valeurs avec une palette de couleurs, choisies par l'utilisateur, et qui seront affichées à l'écran.

Principe d'affichage d'une couche d'information raster - de la valeur du pixel à la couleur écran

Il arrive fréquemment que l'affichage par défaut d'une couche d'information raster soit mauvais, peu lisible... Il revient donc à l'utilisateur de choisir la palette de couleur ou le mode d'affichage le plus adapté aux caractéristiques de sa donnée.

Discrétisation pour former des classes

Une phase de discrétisation des données continues (température, altitude, pente...) est souvent nécessaire soit pour générer des classes d'ensemble de valeurs, soit pour mettre en relation des fourchettes de valeurs et des dégradés de couleurs.

Cette discrétisation passe par des outils statistiques plus ou moins sophistiqués suivant les logiciels dont vous disposez. Dans tous les cas il y a la possibilité de visionner un histogramme de valeurs permettant de voir de façon très synthétique l'information disponible.

En abscisse les valeurs stockées dans les pixels de la matrice, en ordonnée le nombre de pixels présent dans l'ensemble de la couche d'information raster (fréquence d'occurrence des différentes valeurs de pixels).

Ainsi, une même couche d'information raster peut donner lieu à des représentations très différentes (appariement entre les valeurs numériques des pixels et les couleurs de la palette) en fonction des méthodes de discrétisation choisies. On voit ici le rôle important de l'utilisateur qui peut plus ou moins altérer une information objective par les choix de discrétisation effectués.

Impact du choix de la méthode de discrétisation de l'histogramme des valeurs des pixels sur l'affichage d'une couche d'information raster

Conclusions sur le format raster

complémentarité raster/vecteur

Les données continues dans l'espace caractérisant généralement une variable sur le milieu physique sont représentées à l'aide du format Raster.

La relative « rusticité » du format Raster ne doit pas être vue sans tenir compte de la richesse des bibliothèques d'algorithmes des logiciels SIG qui permettent la réalisation de calculs complexes et irréalisables en mode vectoriel.

Ce qui vient d'être énoncé pour le format Raster n'est pas valable dans son intégralité pour les données images dans les SIG. Ces dernières sont un cas un peu particulier du format Raster.

Encore une fois, la complémentarité des deux formats (Raster/vecteur) doit être l'objectif d'une utilisation optimale des SIG.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Devaux Nicolas Paternité - Pas d'Utilisation Commerciale - Partage des Conditions Initiales à l'IdentiqueRéalisé avec Scenari (nouvelle fenêtre)