Mémoire Vive Numéro 6
EDITORIAL
Le thème du présent numéro est la représentation
cartographique en histoire. Son orientation est très pédagogique.
A cela plusieurs raisons.
Les arcanes de la cartographie semblent être moins bien maitrisés
par les historiens que ceux de la statistique. C'est probablement une des causes
du constat de Serge Bonin dans son article introductif au dossier : la carte,
trop souvent considérée comme une illustration est construite
après coup et indépendemment du texte. Elle est alors peu utile,
voire pas du tout ni pour l'auteur, ni pour le lecteur. Le traitement cartographique
a pourtant largement sa place dans le processus de la recherche et se revelle
un outil précieux d'analyse.
D'autre part, la cartographie par ordinateur a pris son envol dans les toutes
dernières années : la multiplication des logiciels de cartographie
sur Pc et Mac, notamment, rendait nécessaire de faire le point.
On ne peut d'ailleurs que constater la part très active des enseignants
d'histoire et géographie dans le développement de nombreux logiciels
actuellement disponibles en France. Ce n'est pas un hasard, les vertus pédagogiques
de la construction d'une carte en histoire et en géographie ne sont
plus à démontrer. Personne ne s'étonnera, d'autre part,
que la géographie est une part importante dans ce numéro auquel
ont très largement participé les professeurs d'histoire et géographie.
Qu'ils soient tous remerciés ici et tout particulièrement Daniel
Letouzey qui a bien voulu assumer la lourde tâche de la coordination
de l'ensemble du dossier.
Cartographie oblige, nous souhaitions vous présenter un numéro très illustré et qui reflète le maximum d'aspects possibles. Les contraintes matérielles nous ont obligés à tenir en 84 pages. Nous avons donc dû faire des choix dans les illustrations qui nous ont été envoyées et les réduire au maximum - suffisamment pour qu'elles ne prennent pas trop de place, pas trop pour qu'elles restent lisibles -, ce ne fut pas toujours facile et nous espérons que ces réductions ne paraîtront pas inconsidérées. Nous avons dû, d'autre part, faire passer en noir et blanc des cartes couleur, opération qui ne les favorise guère !
Reflèter le maximum d'aspects possibles, disions-nous à l'instant, en fait ce numéro ne fait pas le tour des méthodes. Nous avions, notamment, espéré pouvoir y insérer un article sur les Chorèmes dont il est question plusieurs fois dans ces pages. Cela n'a pas été possible, malheureusement.
Avec ce numéro s'achève notre dossier de 1991 sur la représentation graphique des données historiques. Le thème et le contenu du numéro de Juin 1992 sont déjà arrêtés : nous irons faire un tour du coté de la prosopographie et des destinées individuelles des hommes et de leurs biens. En Décembre 1992, le comité de rédaction souhaiterait présenter un dossier sur l'informatique aux Archives. Les questions que nous envisageons de traiter concernent d'une part les produits informatiques offerts par les archives, d'autre part l'utilisation de l'informatique dans les archives par les historiens et par les archivistes eux-mêmes. Nous ferons donc dans le courant du premier trimestre, une enquête auprès des responsables d'archives. Si vous souhaitez participer à ce numéro, contactez-nous.
Caroline BOURLET
LE DOSSIER
Utilité et utilisation de la cartographie dans la recherche en sciences sociales
Serge Bonin Laboratoire de Graphique Ecole des Hautes Études en Sciences Sociales
Un logiciel de cartographie assistée par ordinateur en collège et lycée.
Eliane PFLIEGER Formateur académique Animatrice du GAULE (Groupe Académique pour l'Utilisation de Logiciels Educatifs) MAFPEN de Lyon
Si l'usage d'un tel outil par des spécialistes et des étudiants déja spécialisés paraît évident, il n'en est pas de même pour les élèves de nos lycées et collèges. Les déboires de " CARTAX Nano-Reseau " ont contribué à cette image d'outil inadapté aux besoins de nos classes. Pourtant, quand on réfléchit et que l'on se demande ce que l'on peut réaliser et faire réaliser avec ces outils, on se rend compte que les outils, mêmes les plus imparfaits, peuvent conduire à une réflexion sur la représentation graphique et statistique des phénomènes géographiques. Nous envisagerons deux niveaux d'utilisation, et plusieurs usages dans ces deux niveaux.
1. L'outil professeur.
Avoir à sa disposition un outil permettant la réalisation rapide de documents au tracé net est appréciable à plusieurs niveaux :
1.1. Création de cartes à jour
Lequel d'entre nous n'a pas déploré un jour que les cartes
de son manuel datent de trois ou quatre ans, alors qu'il a sous la main
des statistiques toutes fraîches.
Les logiciels de cartographie assistée par ordinateur permettent la
mise à jour des statistiques, de rentrer ses propres données,
et parfois ses fonds de carte et donc d'actualiser ses cartes, tant en histoire
qu'en géographie. On peut alors travailler avec des outils fiables et
précis.
1.2. Création d'outils propres
On peut de la même manière personnaliser ses cartes, se
créer des séries utilisables en comparaison (identité de
critères, de tracés...), mettre en valeur sa propre perception
de la réalité (ne plus être contraint d'utiliser
des cartes fausses...)
Suivant le logiciel dont on dispose, on peut obtenir des tracés sur
papier noir et blanc ou couleur (en fonction de l'imprimante), sur transparent
rétro suivant l'usage que l'on veut en faire.
Tous les logiciels n'offrent pas le même confort d'utilisation. Il me
semble que la plupart ne nécessitent que quelques heures d'entraînement
pour réaliser des cartes honorables en quelques minutes.
2. L'outil élève.
Les usages sont multiples :
2.1. Apprentissage de la cartographie
Cheminement de la construction de la carte : cela peut être fait dès le collège. La plupart des logiciels utilisent une démarche très analytique des préalables : choix des données, choix du fond de carte, choix d'une échelle et d'une légende. On peut donc aisément montrer à des élèves que tout cela est nécessaire pour réaliser une carte.
Traitement des statistiques : les problèmes de discrétisation, de choix des " tranches " montrent que la réalité n'est jamais simple à représenter, et que la représentation est toujours une image. Une carte est donc la représentation d'une idée, ou la base de refléxion qui permet de découvrir cette idée. La même réalité peut avoir des représentations très différentes : le logiciel permet la réalisation rapide de cartes différentes à partir des mêmes données.
2.2. En classe, illustrer le cours, démontrer une idée, corriger une idée reçue
Si l'on dispose d'une tablette rétroprojetable et d'un poste de travail en classe, le logiciel de cartographie peut intervenir à tout moment du cours : répondre à une question, situer un événement, une région : nous disposons d'autant de cartes que nous le voulons sans avoir à nous déplacer dans les couloirs, avec des cartes murales encombrantes et souvent désuettes. Les écrans se succèdent sans difficulté, sans manipulations accrobatiques. Projetées sur un tableau vert, certaines cartes se lisent fort bien et peuvent alors être traitées à grands coups de craie sans dommage.
2.3. En TP (travail individuel ou travail de groupe, surtout lycée)
Le travail s'organise autour du thème : comment représenter
les données statistiques ? Il est intéressant de le mettre
en relation avec un travail sur un grapheur (tableur de WORKS par exemple).
On démontre alors que le travail de traitement mathématique
et graphique ne suffit pas à montrer la répartition spatiale
d'un phénomène, et qu'elle ne permet pas toujours de " trouver " des
relations entre certains phénomènes. Il faut alors, par
tâtonnements successifs, arriver à la représentation
idéale, par rapport à la série, ou aux séries
de données, de la complexité des phénomènes
géographiques.
Il est important de montrer que la représentation de données
croisées peut passer par des graphismes divers.
2.3.1. Le choix des graphismes.
Prenons l'exemple de la population francaise, en utilisant le nombre d'habitants par département. Il est évident que dans ce cas là une représentation en trame colorée, même si on isole par le choix des seuils les départements ayant plus d'un million d'habitants et ceux ayant moins de 200 000 habitants, ne donnera pas l'importance de la région parisienne. Si on choisit dans ce cas-là une représentation par surfaces proportionnelles (que permet LOGICARTE ; cf. carte ci-dessous), on voit alors la concentration de ces figures au centre du bassin parisien et les trois autres pôles de concentration de la population.
Certains logiciels travaillent avec des anamorphoses, comme ceux de la Maison de la Géographie de Montpellier. C'est une lecture à laquelle nous sommes encore mal formés mais qui est aussi très performante.
Si on passe, sur les mêmes bases territoriales à la répartition par secteurs d'activité de la population active, y compris la part des chômeurs, on se rend compte que ces représentations ne sont plus valables. Il faut alors passer par des histogrammnes situés, ou des " camemberts " proportionnels à l'importance de la population active, et divisés en secteurs de façon traditionnelle. On démontre ainsi que le type de représentation choisi dépend des phénomènes que l'on veut mettre en évidence.
2.3.2. Le choix des échelles.
Tous les logiciels ne permettent pas les " zooms ". Mais il est évident
qu'une petite échelle ne permet pas une analyse aussi pertinente
qu'une grande échelle pour des phénomènes localisés.
Si on utilise le département comme cellule de base, la répartition
des résidences secondaires ne fera pas ressortir les contrastes
entre le bord de mer et l'arrière pays des Alpes-Maritimes et
du Var, ce que permet une représentation à l'échelle
communale. Les logiciels ne proposent pas en général de
fonds de carte régionaux en version standard, mais fournissent
de plus en plus fréquemment des modules de création de
fond de cartes. Certains éditeurs proposent des bibliothèques
supplémentaires (voir Cartax Nanoréseau et son complément
Cartax-régions).
La lecture de l'échelle est cependant nécessaire quand l'écran
fournit des images de la même dimension pour tous les pays : la CEE a
les mêmes dimensions que l'Union Soviétique (10 fois plus étendue).
2.3.3. Le choix des seuils (discretisation)
Nous ne pouvons pas faire l'économie d'un minimum de notions mathématiques et statistiques. Il est facile de montrer que le choix des seuils est déterminant dans toute représentation cartographique de données. Il suffit pour la même série de passer par un certain nombre d'exemples absurdes, faisant disparaître les différences ou au contraire, les rendant intolérables. On arrive à montrer que le choix des seuils permet de différencier des situations voisines (y a t-il une grande différence entre 35,5 % et 35,6 % ?).
Exemple pratique à proposer à des élèves
de première (dans le cadre d'une enquête sur le malaise
paysan) :
On fait réaliser trois cartes : chaque groupe d'élèves
est libre du choix des types de représentation (graphisme et seuils).
La première situe le nombre d'exploitants par département. La
deuxième montre la part des exploitants dans la population active. La
troisième porte soit sur la densité de la population agricole,
soit sur les revenus agricoles par départements. Un dossier de presse
a permis de situer les " points chauds ".
Le travail est alors un travail classique d'analyse, et en comparant les différentes
représentations, on peut choisir et analyser celle qui paraît
la plus pertinente.
Conclusion
Je voudrais insister sur le fait que la carte reste avant tout, tant dans sa lecture que dans sa réalisation un outil de réflexion. Le logiciel de cartographie assisté par ordinateur est un auxiliaire efficace, car il permet dans un minimum de temps de tracer plusieurs cartes nettes et justes (voir la lenteur et la maladresse générale des tracés à la main). L'analyse de la représentation multiple d'un phénomène unique est un entraînement à la critique du document cartographique : quelle idée démontre une carte ? Cette idée est-elle juste ? Et n'est-ce pas là un des apprentissages fondamentaux de la géographie dans nos classes ?
Cartes et ordinateur au lycée
Daniel Letouzey Professeur de lycée
Tenter un bilan sur l'utilisation de la cartographie en histoire peut paraître prématuré et présomptueux ; prématuré car le prix des logiciels en a limité la diffusion, présomptueux car des pistes nouvelles sont en cours d'exploration :
- renouvellement de l'expression graphique par les géographes (cartes modèles, chorèmes utilisés par le G.I.P Reclus).
- réflexion théorique sur l'espace et son rôle en histoire.
Pourtant l'abondance des publications récentes sur la cartographie
en général prouve la réalité du travail en
cours et l'intérêt porté par les enseignants à cet
outil. La cartographie assistée par ordinateur pourrait profiter
de ce mouvement, ainsi que de la chute spectaculaire des coûts
(ordinateurs à 5000 F, logiciels autour de 1000 F).
Il importe aussi de relativiser le rôle de la cartographie en histoire.
En France, les enseignants sont bivalents, et l'apprentissage s'appuie davantage
sur des exemples géographiques. Les logiciels disponibles ne couvrent
pas tous les types de cartographie mais presqu'exclusivement la cartographie
statistique. Enfin ce travail n'est qu'un élément des activités
possibles avec un ordinateur : initiation aux statistiques descriptives, formation à l'usage
du langage graphique. Il permet de réinvestir ces acquis, et il démontre
de façon spectaculaire l'intérêt d'intégrer l'ordinateur
dans l'enseignement de l'histoire.
Il paraît donc possible, à travers des exemples concrets, d'analyser
ces avantages, de repérer les blocages, de suggérer quelques
pistes d'utilisation.
1. La cartographie automatique depuis 1982.
1.1. Son essor dans l'enseignement secondaire est récent et spectaculaire.
De fait, il n'y a toujours pas de nom accepté par tous les spécialistes : C.A.O vaut aussi pour conception assistée par ordinateur (C.A.D en anglais), et cartomatique proposé par R. Brunet sacrifie beaucoup à la mode.
1.1.1. Dans un premier temps, les contraintes liées au matériel (type d'écran, taille mémoire) ont limité la cartographie aux machines puissantes et aux laboratoires spécialisés (universités, EPHE...). Un des premiers logiciels développé pour compatibles vers 1985 exigeait un écran couleur EGA, un disque dur de 10 Mo et un coprocesseur arithmétique, équipements peu répandus à cette date.
1.1.2. La généralisation des ordinateurs Thomson a constitué la
2ème étape : ils permettaient l'emploi de la couleur, des
contours précis. De nombreux logiciels concernaient l'apprentissage
des localisations (carte de France, capitales) : ils justifiaient le
recours au crayon optique ; ils ont accaparé le marché familial.
D'autres essais ignoraient les besoins et les pratiques des historiens
: le logiciel Cartegéo utilisait les codes ASCII comme symboles.
Avec ce même matériel, a été tentée une diffusion
des règles de la sémiologie graphique définies par J Bertin
:
- CRECARTE de R. Gimeno permettait de réaliser une carte de France stylisée en 22 régions, et représentait en carrés noirs gradués en 8 paliers toute donnée régionale. Il manquait à ce logiciel un traitement statistique, une variété de fonds de carte. Ce petit logiciel servait à la présentation des rudiments de la cartographie statistique, et les données exploitables en 4e, en 3e, en 1ère étaient illimitées.
- CARTAX VERSION NANORESEAU cumulait des mérites importants et des défauts majeurs. Ce logiciel intégrait toutes les règles de la cartographie statistique (discrétisation, trames...), expliquées dans un manuel qui peut toujours servir de référence. De plus, il offrait une base de données très étoffée. Mais il était inadapté au nanoréseau et souffrait d'une lenteur rhédibitoire de fonctionnement. De plus, le choix des contours orthogonaux, du noir et blanc peut toujours se discuter.
- Enfin, aux limites de la cartographie, des auteurs ont développé des logiciels de simulation intégrant la dimension spatiale : la Ville idéale, la Planète bleue, Ecorégion, Esporif.
1.1.3. La 3ème étape a vu l'élaboration de logiciels de cartographie statistique de plus en plus performants :
- CARTO 2D sur Macintosh.
- De nombreux logiciels pour IBM :
- Les travaux pionniers de Th. Hatt (atlas des régions européennes, carte des séismes) n'ont pas eu la diffusion souhaitable.
- Les professionnels ont développé des produits performants mais coûteux : GEO2 puis CARTES ET BASES d'Adde Marketing, ATLAS GRAPHICS d'Uniware, MAPINFO.
- Certains logiciels sont plus accessibles pour l'éducation : CARTAX PC en licence mixte depuis 1991, CARTO de G. Compan, LOGICARTE en 2 versions (version 1 matricielle, version 2 vectorielle en licence mixte) et son application éducation (Educarto diffusé par Hachette).
- D'autres logiciels ont été mis au point dans les universités, mais sont moins diffusés et ne sont pas toujours portables sur ordinateur personnel.
1.1.4. Les logiciels étrangers sont moins connus. A Montpellier, deux logiciels allemands ont été présentés:
Un logiciel de l'Université de Mayence (A. Kunz) ; MERCATOR
History et Computing a publié des cartes d'Ecosse conçues avec
GIMM'S et il doit exister de nombreux logiciels américains : le seul
francisé est PC GLOBE, et PC USA, vendu par Nathan : il s'agit plus
d'un atlas sur ordinateur que d'un logiciel de cartographie.
2. Quelle place pour la cartographie en histoire au lycée ?
Trois sources majeures peuvent alimenter la réflexion d'un enseignant en vue d'établir des stratégies pédagogiques :
2.1. La référence scientifique vient
plus des travaux et des réflexions des géographes que des
historiens : dans les publications récentes, R. Brunet donne à voir
une multitude de cartes possibles; C. Cauvin fait le point sur les principales
méthodes de discrétisation.
En dehors des travaux essentiels de J. Bertin déjà cités,
un article récent associant un historien (B. Lepetit) et des géographes
(C. Cauvin) sur la France postale au XVIIIème siècle suggère
des applications de la cartographie des flux à l'histoire.
Au lycée, il paraît trop ambitieux de vouloir pratiquer l'analyse
spatiale ou de chercher à repérer à partir de séries
de chiffres des ensembles géographiques cohérents ; par contre
il est plus aisé de faire analyser des nuances régionales d'un
phénomène (implantation d'un parti politique, pratiques culturelles...).
2.2. Les instructions officielles. Dans les deux dernières décennies, les programmes semblent connaître la même accélération que celle des faits historiques, et de nouveaux programmes sont en préparation pour 1992.
Nous ne pouvons nous appuyer que sur les derniers : ceux de 1987 rappellent les compétences acquises au collège en histoire : lecture et construction de documents simples. Ils souhaitent " la multiplication des représentations dans l'espace de phénomènes complexes : diffusion des idées et des techniques, expansion européenne, mouvements nationaux, progrès des moyens de communication ".
En première et en terminale, la carte est conçue comme un support pour la synthèse, un point de départ pour élaborer des tableaux du monde à différentes dates. Elle est présentée comme un moyen de traiter plus rapidement (et plus efficacement ?) certaines questions.
2.3. Les manuels suggèrent des applications possibles (cf. tableau ci-joint).
2.4. Ces trois références permettent d'envisager des stratégies pédagogiques. La carte peut être élaborée et analysée dans plusieurs situations (cf. l'article d'E. Pflieger) :
- outil pour l'enseignant en vue de préparer des documents,
- outil pour l'élève en classe pour analyser la distribution d'un phénomène dans l'espace,
- outil pour l'élève en documentation pour compléter son information.
Les thèmes les plus couramment utilisés concernent la démographie (chiffres accessibles, variés), l'économie (productions, niveaux de prix), la société (niveau de vie, critères culturels).
2.5. Sur le plan informatique, les conditions minimales peuvent s'énoncer ainsi :
- une salle informatique suffisamment équipée : 8 à 12 ordinateurs, dotés d'écrans de qualité (carte graphique Hercules au moins ou mieux VGA) ;
- un ou des logiciels simples d'apprentissage installables sans difficulté sur chaque poste (licence sur site) ;
- des données significatives en quantité maîtrisable.
Les TD de cartographie représentent au mieux 2 à 3 séances sur ordinateur dans une année : plus qu'une base de données lourde et complexe, il est préférable de disposer d'une dizaine de cas montrant les principaux problèmes et leurs solutions. Il faut noter qu'une fiche de travail papier guide utilement le travail des élèves et que l'impression des résultats peut être différée pour des questions de temps, et la photocopie rend alors de grands services (noir plus intense).
3. L'intérêt de l'ordinateur en cartographie : la réalisation des fonds de carte.
Plusieurs questions propres à la cartographie statistique sont renforcées par l'usage de l'ordinateur et obligent à des choix raisonnés de l'utilisateur.
3.1 La première question concerne l'échelle retenue et la taille des unités spatiales : ces unités doivent être adaptées aux faits étudiés.
Pour la France depuis 1790, le département est un cadre intéressant
: données chiffrées abondantes, nombre de cas raisonnable
pour une étude statistique, étendue relativement homogène.
Mais tous les faits ne s'y moulent pas : la représentation d'une
culture comme la vigne a besoin d'une autre échelle ; et cette échelle
ne permet pas une étude fine des densités.
Le bilan est aussi contrasté pour l'échelle régionale
: elle n'est utilisée en France que depuis 1962, et les chiffres antérieurs
sont seulement des reprises à partir du département ; elle permet
un représentation manuelle rapide mais n'autorise pas une analyse en
profondeur ; la taille des régions n'est pas homogène, pas plus
que l'importance économique. Et cette diversité est encore plus
grande au niveau européen : il n'y a rien de commun entre les unités
allemandes et leur équivalent espagnol.
Les mêmes observations valent pour les pays à l'échelle
d'un continent (tailles du Brésil et de l'Equateur en Amérique
latine, dimensions des Républiques de l'ancienne Union soviétique...)
3.2 La seconde concerne la réalité historique.
3.2.1. L'exactitude des fonds.
Elle dépend de la qualité du support original. Les fonds à étudier
sont dans l'ensemble bien établis, et ont fait l'objet de publication
dans des atlas historiques récents. Les difficultés sont
aisément surmontables pour la période récente, plus
complexes pour la France de l'Ancien Régime : dans ce dernier
cas, la certitude moindre des données chiffrées oblige
aussi à la prudence.
Avec l'ordinateur, le tracé des limites peut être détaillé ou
schématisé. La simplification excessive ne rend pas compte de
la réalité vécue : par exemple les enclaves, les limites
complexes. Mais un fonds trop détaillé exige davantage de place
en mémoire et peut influer sur la représentation finale.
3.2.2. Les changements de frontières
Cette difficulté apparaît quand on veut suivre l'évolution
d'une répartition spatiale sur une longue durée. Par exemple
la France au siècle dernier oblige à des modifications
pour le Comté de Nice, la Savoie, l'Alsace-Lorraine, sans oublier
les changements de limites départementales pour la région
parisienne en 1962. L'étude de l'Allemagne ou de la Pologne depuis
le XVIIIème siècle pose des problèmes de même
nature.
L'un des exemples retenu ici - le prix du blé par départements
- oblige à prendre en compte cette réalité : le département
de la Seine a été redessiné, la Savoie est intégrée
pour 1812. Deux entorses volontaires ont été commises : la présence
des limites actuelles de Paris sert de repère, le comté de Nice
présent dans les statistiques n'est pas figuré.
3.3.La dernière concerne la préparation des fonds de carte informatique.
3.3.1.Dans la plupart des cas, professeurs et élèves peuvent utiliser les fonds standard fournis avec les logiciels (France par départements, par régions, par bassins d'emploi, Etats aux USA...).
3.3.2. Par contre la saisie est souvent nécessaire pour les fonds locaux (cantons, communes, bassins d'emploi), ou pour disposer de fonds à échelles différentes (emboîtées ?).
Trois solutions sont alors possibles :
- employer un module de dessin s'il existe pour le logiciel. Par exemple un contour simplifié peut être dessiné au moyen des touches du clavier, à partir d'un transparent posé sur l'écran
- pour obtenir des fonds rigoureux, la table à digitaliser s'impose : les coordonnées des contours sont repérées par un logiciel adéquat. Cette table est souvent disponible dans les lycées techniques, dans les C.R.D.P.
- le scanner permet un transfert plus rapide des fonds.
3.3.3. En informatique, deux types de représentation sont accessibles :
- des cartes matricielles où les coordonnées des points sont fixes, et liées à un seul type d'écran. L'affichage est très rapide mais ne gère pas la variété des écrans présents dans certains lycées.
- des cartes vectorielles où les coordonnées sont relatives. Ces mêmes fonds peuvent être lus sur tous les types de carte graphique. Les documents obtenus peuvent être lus par les logiciels de PAO et l'impression est alors parfaite.
4. L'analyse statistique des données.
4.1. Le premier souci concerne la disponibilité des données.
Les séries du XIXe siècle sont nombreuses et ont parfois été publiées à nouveau
: ainsi le prix du blé par départements vient d'une reprise
en 1970 de sources publiées en 1872. En ce qui concerne la démographie,
l'INSEE a publié en 1966 un Annuaire statistique reprenant les
résultats des recensements depuis 1801.
Mais les données spatiales sont parfois absentes : les Britanniques
utilisent moins que nous cette dimension dans les statistiques récentes
(cf. Eurostat). Et la publication est souvent tardive : les résultats
du recensement de 1990 aux Etats-unis n'étaient pas disponibles en novembre
1991 au service culturel de l'ambassade. Les chiffres retenus dans l'exemple
choisi sont donc ceux d'une estimation en janvier 1990. Cette réalité est
encore plus embarrassante pour les enseignants dont le lieu de travail est éloigné des
Archives ou des Bibliothèques universitaires.
4.2. Une fois les données collectées, leur validité doit être critiquée:
Certaines données peuvent être élaborées directement par les élèves, par exemple lors d'une enquête : dans ce cas, un traitement partiel en cours d'enquête permet de repérer erreurs, omissions et sert à vérifier la pertinence des questions posées.
La plupart viennent de sources publiées.
Les chiffres peuvent varier selon la source retenue : un exemple permet
de comparer pour la France de 1817 les chiffres publiés en 1949
par A. Chabert et ceux établis en 1970 par E. Labrousse et ses
collaborateurs.
La saisie des chiffres est la principale source d'erreur. Le travail des élèves
en binômes réduit ce risque. Et une vérification est nécessaire
une fois la carte obtenue.
4.3 L'historien doit choisir entre données brutes et calculs.
Les chiffres bruts sont en général préférables car plus proches de la réalité, mais calculs de pourcentages ou d'indices facilitent comparaisons, mise en évidence d'une évolution. Dans ce cas, une décision est à prendre quant au nombre de chiffres après la virgule, celui-ci pouvant modifier la composition des classes. De même, les logiciels doivent prévoir la gestion des données manquantes.
4.4. Discrétisation en classes : l'étape essentielle, en vue de la cartographie, consiste à grouper les valeurs en groupes homogènes Discrétisation en classes.
L'ensemble des solutions possibles est décrite en détail dans l'ouvrage de C. Cauvin. Dans le cadre de cet article, nous nous limiterons aux méthodes les plus courantes, expliquées à partir de l'exemple du prix du blé en 1812.
Les logiciels usuels repèrent pour chaque série les valeurs significatives (nombre de données, valeurs extrêmes, moyenne, médiane, écart-type). Ils traduisent la série en graphique de répartition (nombre de valeurs réparties en sous-classes, de la valeur la plus faible à la plus forte), ou de distribution (graphe ordonné de toutes les valeurs).
(Hélas, les différents exemples illustrés ne peuvent apparaître dans cette version informatique du journal)
4.5.L'intérêt de l'ordinateur apparaît à ce niveau du travail :
La rapidité des calculs permet de tester l'effet d'une variation du nombre de classes, les conséquences d'un déplacement des seuils. L'apprentissage des choix, leur justification ont un rôle pédagogique important. C'est un moyen de faire comprendre que toute carte est une construction reposant sur des choix pas toujours explicites ;
L'ordinateur permet de confronter plusieurs séries, en vue d'une typologie, de combiner deux ou plusieurs séries pour suggérer des relations, de rapprocher plusieurs séries dans un traitement matriciel. Dans tous ces cas, des données nouvelles, élaborées en cours de travail servent de base à la représentation.
Il importe cependant de ne pas exploiter les immenses possibilités de calcul de la machine, et de préférer conserver la maîtrise de l'analyse statistique des données.
5. L'ordinateur et le choix des modes de représentation graphique.
5.1. Trois grands types sont possibles :
- des formes géométriques proportionnelles pour figurer des chiffres absolus,
- un tramage de surfaces pour traiter des indices ou des pourcentages,
- des symboles isolés.
5.2. Les règles scientifiques sont bien établies depuis les travaux de J. Bertin, ou ceux plus récents de R. Brunet. Elles sont reprises dans la publication dirigée par M. Hagnerelle.
Les données numériques peuvent être soit continues,
soit opposer valeurs négatives/valeurs positives. Dans le premier
cas, le tramage doit être progressif, aller du clair au foncé,
qu'il s'agisse d'un traitement monochrome ou d'une figuration utilisant
les nuances d'une couleur. Le tramage doit tenir compte de la répartition
des valeurs : la carte peut être plus claire si les valeurs faibles
sont plus nombreuses ; pour 4 classes, il est possible de ne garder qu'une
trame sur deux. Il faut se méfier du blanc qui peut cacher une
absence de données ou une erreur de tramage.
Dans le second cas, pour opposer des valeurs il faut combiner deux figurations
: couleurs froides (vert, bleu) et couleurs chaudes (jaune, rouge). Certains
spécialistes utilisent en noir et blanc l'opposition points et hachures.
5.3. Quel est l'intérêt de l'ordinateur ?
Il réveille le débat entre partisans du noir et blanc/tenants de la couleur. Les écrans VGA couleur de plus en plus répandus, le prix des imprimantes couleurs renforcent les positions des seconds : la lecture des valeurs extrêmes est facilitée ; la couleur exerce un attrait puissant et elle est généralisée dans les manuels, même lorsqu'elle n'apporte aucune information supplémentaire. Il est difficile de ne pas en tenir compte. Et il reste possible de revenir au monochrome pour les imprimantes meilleur marché, pour la photocopie (celle-ci peut guider le choix des trames, car elle fait disparaître certaines nuances), ou pour Mémoire Vive...
L'ordinateur permet de tester plusieurs solutions, quant au choix du tramage, au nombre de classes (4 ou 5 semblent raisonnables, en fonction des règles visuelles). L'exemple du prix du blé en 1812 montre deux possibilités parmi les plus couramment utilisées : des hachures obliques, des trames en losange. Chaque méthode a ses avantages et ses inconvénients, et les logiciels autorisent tous les choix, certains permettant même de redéfinir une nouvelle bibliothèque de trames.
Dans tous les cas, l'ordinateur épargne une réalisation
manuelle longue et fastidieuse, et offre un niveau de qualité graphique
difficile à dépasser.
Mais ce tramage a le défaut de dépendre de la taille des unités
statistiques : dans une carte par pays en Amérique latine, le Brésil
a une place démesurée ; dans une carte des régions en
Europe, les unités allemandes paraissent minuscules. Il suppose une
répartition homogène dans l'espace retenu.
Pour pallier ces défauts, il faut alors faire appel à d'autres
solutions :
Les figurés sont obtenus instantanément (cercles, carrés,
barres). Ils peuvent être proportionnels aux valeurs. L'ordinateur permet
de chercher par calcul ou par tâtonnement l'échelle assurant le
meilleur effet visuel.
La combinaison de figurés et de trames permet de combiner deux séries
: dans la carte des USA représentant les estimations de janvier 1990,
un même pourcentage d'accroissement n'a pas la même signification
pour la Californie de 29 millions d'habitants et pour le Nevada avec 1 million
d'habitants. Dans une telle carte, le manque de couleurs opposées est évident.
Pour l'étude des élections, les formes proportionnelles adaptées
au nombre de suffrages exprimés atténuent l'effet des pourcentages
obtenus par chaque parti : le vote conservateur dans le Bocage Virois est plus
important dans les communes rurales que dans les petites villes. Le nombre
de classes a été limité à trois pour une plus grande
lisibilité.
En conclusion :
Les logiciels actuels comportent encore des lacunes.
La figuration ponctuelle n'est guère envisagée : par exemple, l'implantation précise des clubs sous la Révolution exigerait autant de localisations que de cas...Ils peuvent fournir une grande variété de symboles, mais peu intègrent la mise à disposition des chorèmes : ils favorisent énormément l'approche quantitative qui n'est qu'un aspect de la méthode historique ; ils gèrent encore mal la figuration des flux et des réseaux malgré l'exemple de la France postale au XVIIIe siècle étudiée par B. Lepetit.
Ces logiciels offrent cependant des avantages décisifs :
- Ils permettent une initiation rapide au langage graphique et cartographique, fondée sur des démarches concrètes.
- Ils préparent à la méthode historique, en particulier au va et vient entre un questionnement, des hypothèses, une vérification expérimentale. La disponibilité des cartes permet de tenter des comparaisons, de varier les échelles.
- Ils assurent un travail soigné, et l'enseignant peut être plus exigeant sur la qualité des cartes produites.
- Ils offrent les avantages de l'automatisation dans le traitement statistique ou dans le choix du tramage.
- Ils permettent d'actualiser, de personnaliser les données analysées.
Au total la cartographie par ordinateur est un outil exceptionnel de démocratisation du savoir. Mais ses utilisateurs doivent apprendre à gérer l'abondance des cartes produites pour que le média n'étouffe pas le message.
CARTOGRAPHIE ACTIVE ou " Pérestroïka et Infographie " ?
Claude Bourges Animateur du G.R.A.F. Géographie C.I.A.P. Grenoble
Poser un problème de géographie, c'est souvent le construire
sous forme cartographique : les conséquences spatiales étant
l'essentiel de sa réalité.
Cela implique l'emploi d'une méthode rigoureuse de travail
aux trois étapes : préparation des données, analyse
statistique, traduction visuelle.
Les exemples retenus proviennent du travail accompli dans le cadre du GRAF
(Groupe Recherche Action Formation en Géographie) au C.I.A.P de Grenoble
de 1988 à 1990. Le groupe a étudié surtout la situation
de l'Union soviétique (situation des nationalités en 1988, comparaison
entre Républiques pour l'économie ou la puissance militaire).
D'autres travaux ont porté sur les différences entre quartiers
de Grenoble.
Le premier pas consiste à rechercher les statistiques par
républiques. Dans les manuels scolaires, elles sont souvent
partielles sinon inexistantes. Il en est de même pour les productions
INSEE courantes. Au mieux, elles donnent les populations globales avec
les taux de natalité, de mortalité ou de fécondité.
Le pire concerne les revenus et l'économie : une brochure soviétique
de 1989, quasi officielle ne fournit que des indices annuels de croissance...
La pertinence des données est ainsi difficile à obtenir
pour cette organisation spatiale et les lacunes obligent à négliger
certaines séries.
Ensuite la fiabilité des données est à contrôler,
et ce n'est pas une mince affaire ! Citer la source et ne considérer
que l'ordre de grandeur ou les grandes phases de l'évolution temporelle
est parfois la seule solution honnête.
Enfin la durée de validité de ces données est
fort courte : un travail sur les Républiques en 1989 peut-il encore
servir en 1991 quand la structure de l'Union est bouleversée par la
révolution d'août ?
-
Pour ce T.P informatisé, les objectifs théoriques sont :
- Localiser les Républiques dans le territoire de l'Union.
- Repérer les groupes de Républiques selon des thèmes précis.
- Voir synthétiquement l'ensemble soviétique.
-
Les objectifs informatiques sont :
- Utiliser une base de Cartes pour localiser les diverses rubriques et l'imprimer.
- Travailler à son rythme et s'entraîner à l'autonomie devant des documents écrits, informatiques.
-
Les objectifs pédagogiques sont :
- Lire une série de cartes avec leurs légendes.
- Classer des informations visuelles et statistiques, regrouper ces observations,
- Commenter un document pour préparer au Brevet des collèges ou au passage en Seconde.
La réalisation pratique de ce T.P., en 1989, a duré deux heures avec une classe entière et 14 postes MO5 répartis pour moitié dans deux salles voisines. Des fiches mode d'emploi, consignes de travail, ont été fournies aux élèves. La fiche compte rendu de l'application pédagogique ainsi qu'une copie d'écran de cartes créées pour cette leçon sont fournies en figure 3 et 4.
Cartax (NR) permet de superposer par transparence deux cartes, pour
faire apparaître des groupes de régions dont les trames
ont la même intensité ou des nuances plus ou moins nettes
: ce qui démontrerait des relations possibles entre deux phénomènes
décrits. Des problèmes de lisibilité des légendes
se posent alors.
Avec Cartax des définitions d'emplacement pour les titres, les légendes,
les échelles sont nécessaires pour les exercices de superposition.
Le choix de trames obliques semble utile. Les fonds de cartes sont en " marches
d'escalier ".
Cette pratique met en évidence trois directions :
Une analyse statistique sur des variables, simple ou brute : " discrétisation " afin de créer des groupes de régions selon un classement logique, comparaison de deux variables socio-culturelles (quartiers de Grenoble recensement de 1982).
Logicarte ajoute une possibilité d'interrogation d'une base de données : la carte obtenue affiche seulement les régions où un phénomène sera compris entre une fourchette de valeurs précise et un autre (ou d'autres) fait(s) a(auront) une valeur définie. Cela s'apparente à des " tris croisés " et tout un raisonnement logique et géographique peut s'exercer pour produire des documents répondant à un questionnement.-
Recherche de lisibilité : Cartax (NR) fournit de nombreuses trames, Logicarte (version 1.3 testée), fournit trames (ou couleurs) et symboles ponctuels proportionnels (carrés,cercles, barres).
-
Communication visuelle : la précision des fonds de carte, la typographie choisie pour les titres et la légende, le recours à la couleur, des possibilités de zoom donnent plus d'efficacité au document scientifique obtenu.
Ces documents peuvent prendre place dans des dossiers où seraient inclus des productions à partir des logiciels graphiques comme Works, Graph in the Box, Excel, Harvard Graphics. Il serait possible de montrer l'évolution temporelle et spatiale de certains facteurs économiques ou sociaux.
En conclusion, trois remarques :
Les progrès technologiques sont étonnants :
- Les produits Nanoréseau sont peu ergonomique, réclament une prise en main longue et difficile (deux niveaux de stage autour de Cartax). La réalisation d'une carte est longue, les résultats sont de petite taille et limités au noir et blanc. L'avantage principal tient au faible coût : 296.50 pour équiper une salle comportant jusqu'à 30 postes.
- Les versions PC sont de maniement bien plus facile, les productions sont de meilleure qualité, mais les prix sont encore élevés (Cartax PC en licence mixte 1190 F en monoposte ou 1990 F sur site, Logicarte en licence mixte 1990 F ou 5950 F sur site. Educarto vaut 1100 F. Un produit " fermé " comme PCGlobe est bien moins cher, mais c'est plus un atlas sur ordinateur qu'un logiciel de cartographie. Ces logiciels permettent de travailler sur toutes les échelles : quartiers de villes, départements, régions, pays. Des bases de données importantes accompagnent en général ces outils.
La Cartographie active nécessite des produits ouverts qui réclament un temps de travail important et une formation non négligeable. Beaucoup de fonctions sont quasiment professionnelles : la qualité des travaux étonne. Cependant si les traitements statistiques sont " transparents ", ils doivent être contrôlés car ces logiciels sont des outils dont les résultats ne sont pas garantis : ce ne sont pas des didacticiels ni des systèmes-experts en cartographie.
L'expérimentation en classe introduit à la pédagogie différenciée et au travail autonome des élèves. Elle est difficile vu les effectifs des classes entières dans notre discipline, en attendant la réforme des modules au lycée. Les contraintes matérielles sont parfois lourdes : la gestion de la salle informatique et de son accès, les machines vite obsolètes ou trop peu nombreuses. Il ne faudrait pas que ces conditions conduisent à reconstituer le cours magistral avec ordinateur et projection au service du professeur ou d'un groupe d'élèves. La rotation de tous les élèves est-elle plus active que le travail continu et responsable de binômes pendant toute une séance ?
LOGICIELS
Une formation "sur le tas"
Madeleine Bonin Laboratoire de Graphique École des Hautes Études en Sciences Sociales
Deux exemples d'application à l'histoire d'un logiciel de cartographie
Claude Loudenot Agrégée d'histoire Professeur à l'IUFM de Versailles Centre d'Antony Val de Bièvre
Comparaison de logiciels de cartographie
Daniel Letouzey Professeur au lycée de Vire
Pour ce numéro, le choix des logiciels a été déterminé par le thème du dossier : la cartographie. Nous avons retenu 7 logiciels diffusés en ce moment en France : 1 pour Macintosh (Carto 2D), 4 pour IBM (Cartax, Carto, Logicarte, Cartes et Bases), 2 communs (Atlas GIS, Mapinfo).
1. Un tableau esquisse une comparaison des fonctionnalités de ces différents logiciels. Ce tableau s'appuie tantôt sur la connaissance pratique, tantôt sur des brochures commerciales : toutes les informations souhaitables ne sont pas toujours réunies. Ainsi les prix appellent à la prudence : pour certains, il faut parfois acheter des modules complémentaires pour utiliser la pleine capacité de ces logiciels (ou acheter cher les fonds de carte adaptés à l'utilisateur) ; d'autres fournissent tous les outils nécessaires. Les lecteurs intéressés pourront s'adresser au diffuseur pour obtenir une disquette de démonstration ou pour obtenir des renseignements plus détaillés.
2. Nous avons aussi voulu montrer des cartes réalisées
avec ces logiciels, faute de pouvoir les faire essayer en grandeur réelle.
Le projet d'origine consistait à reproduire une carte en trames,
une carte en figuré. Nous avions expédié aux diffuseurs
le tableau des recensements de 1801 à 1886,le tableau des villes
en France de 1700 à 1836.
Plusieurs diffuseurs nous ont retourné une collection de cartes, mais
tous n'ont pu nous retourner des cartes qui correspondent aux tableaux distribués
: nous publions les plus significatives, ou celles qui permettent de comparer
ces logiciels en deux dossiers : cartes en trames et cartes en figuré.
Le lecteur devra se reporter à l'article de Cl. Loudenot,qui précède
celui-ci, pour l'illustration de CARTAX.
Il faut enfin garder en mémoire que cette comparaison doit inclure la
facilité de manipulation pour un utilisateur occasionnel, et que presque
tous les logiciels affichent des cartes en couleur ou des zooms que nous n'avons
pas pu reproduire.
ESPORIF Simulation de l'évolution de la répartition de la population en Ile-de-France
Paulette Vidal Professeur au lycée C. Sée, Paris
Production du CRPD de Paris, 37 rue Jacob, 75006 PARIS Réalisation initiale de J. Foucher, chercheur à l'IAURIF (Institut d'aménagement et d'urbanisme de la région Ile-de-France)
Réalisation pédagogique d'ESPORIF : Paulette Vidal, professeur agrégée de géographie
Réalisation informatique d'ESPORIF : Bertrand Le Guern, professeur agrégé de mathématiques
Compatibles PC
Croquis et cartes en noir et blanc et en couleurs selon la carte graphique.
ESPORIF est un logiciel destiné à simuler l'évolution
de la répartition de la population en Ile-de-France à l'horizon
2010. Il permet aussi de simuler la répartition de la population
active et celle de la consommation d'espace par l'urbanisation.
Il résulte de la réécriture d'un logiciel de travail réalisé par
l'IAURIF au début des années 80 pour fonder les grandes lignes
de l'aménagement régional. Le logiciel, dans sa version scolaire,
a changé de nom et de forme. Devenu ESPORIF (espace/population/région
Ile-de-France), il a changé de présentation pour s'adapter aux élèves
mais a conservé toutes ses qualités initiales.
C'est avant tout un logiciel de géographie.
Intérêt d'ordre épistémologique.
ESPORIF permet de faire le lien entre la géographie-à-l'école et la géographie-sur-le-terrain, celle du décideur qui aménage l'espace en fonction des logiques du moment.
Intérêt géographique du modèle.
ESPORIF concerne le fonctionnement interne de l'espace régional
découpé en 9 secteurs qui se distinguent par leurs densités
d'habitat, leurs taux d'emploi, leurs caractéristiques fonctionnelles.
Cette différenciation interne, spécifiquement géographique,
appelle deux remarques :
- elle souligne l'inéluctabilité d'un découpage fonctionnel
dans le domaine de la géographie active ;
- elle peut servir de référence à d'autres découpages
en sous espaces régionaux mais ne peut être transférée
telle quelle à d'autres régions françaises.
Intérêt scientifique.
Toutes les données sur lesquelles se fonde le modèle proviennent de sources fiables : INSEE, INED, IAURIF. Certaines d'entre elles ont fait l'objet de traitements mathématiques avant d'être intégrées dans la simulation. Le modèle a été conçu selon une approche systémique du fonctionnement de la région ; et les tendances à la périurbanisation y figurent tout autant que les hypothèses de densification du centre, ou la simple aptitude de l'industrie du bâtiment à construire à un rythme satisfaisant.
ESPORIF est un logiciel d'usage simple.
Le choix d'un itinéraire se fait sur un MENU, entre trois options
initiales possibles : fond d'informations, simulation, applications.
Des pages de menu articulent les différentes parties.
Les définitions et éclaircissements nécessaires s'affichent
dans une fenêtre à la demande.
Les représentations graphiques autorisant toutes comparaisons se font
automatiquement et se juxtaposent.
Des " applications " au niveau communal (comparaison entre les chiffres de
population simulés et réels - RGP 1900 - et aussi simulation
de la consommation d'espace pour 80 communes) sont aisément accessibles.
ESPORIF est un outil pédagogique moderne.
Il offre une grande variété de représentations graphiques : courbes, histogrammes, diagrammes circulaires, cartes, et la possibilité d'affichages simultanés. Il fait appel à la méthode comparative pour leur examen. Il facilite le travail autonome du fait de sa structure (approche simple de la simulation/approfondissement et la prise de décisions/exercices d'application), du jeu des questions, du rappel des résultats à analyser. En montrant les résultats réels du RGP de 1990, ESPORIF favorise la réflexion sur la valeur et les limites d'une simulation et sur la prudence nécessaire à son utilisation.
En travaillant à la réécriture d'ESPORIF, on a visé quelques objectifs précis :
- mettre à la disposition des élèves un document moderne, initialement réservé à l'usage d'un très petit nombre de professionnels.
- renforcer l'ouverture sur le monde extérieur : celui de la gestion de l'espace, celui des décideurs qui fondent leurs stratégies sur des simulations. En ce sens, nous l'avons vu, ESPORIF, dont la version initiale a été utilisée par les aménageurs, est un document historique qui illustre l'entrée de l'informatique dans la préparation à la décision.
- intégrer l'outil informatique dans le déroulement " normal " du cours de géographie. Faire faire aux élèves une simulation qui s'inscrit précisément dans les programmes et dont la valeur scientifique est garantie, la consommation en temps faible (en 1ère, 2 à 3 heures).
- affiner la connaissance de la RIF et des mécanismes qui expliquent les flux de population dans une grande région urbaine (appréhension du fonctionnement d'un système urbain, modélisable).
- placer l'élève dans la situation du chercheur en sciences humaines qui, ne pouvant réaliser d'expériences en vraie grandeur, est contraint de simuler ; qui doit construire un corpus d'hypothèses cohérent avant de donner une valeur aux variables ; qui, lucidement, sait que la réalité sera différente de ce qu'il a simulé.
- placer l'élève dans la situation du décideur qui doit choisir une stratégie en fonction de l'hypothèse d'évolution retenue et ainsi contribuer à la formation du citoyen.
- proposer un logiciel aussi près que possible du rigoureux travail réalisé en amont de la situation et aussi facile d'accès que possible afin qu'un professeur non formé aux techniques de l'informatique puisse l'utiliser aisément.
ESPORIF trouve sa place à divers niveaux d'enseignement.
Il s'inscrit très simplement dans le déroulement des programmes des lycées classiques et modernes : en seconde (l'urbanisation) ; en première (Paris et sa zone d'influence). Il trouve également sa place dans les lycées d'enseignement technique. Par ailleurs, la qualité scientifique du modèle et sa valeur documentaire en font aussi un logiciel qui a sa place dans le premier cycle des études universitaires.
Les difficultés rencontrées au moment de la réalisation
d'ESPORIF ne manquent pas, et avant tout celles liées à la
réécriture et à l'expérience d'une première
production. Rappelons qu'il existe une version d'ESPORIF utilisable
sur le nanoréseau. La version actuelle présente sur l'ancienne
tous les avantages que permettent les capacités des compatibles.
Mais la question essentielle demeure : comment rendre attractif un
logiciel non ludique ?
La multiplication des cartes et graphiques y contribue mais la diversité des
cartes graphiques des appareils en usage interdit l'usage de la couleur dans
tous les cas. On a, pour cette raison, étudié les représentations
graphiques en fonction, du noir et blanc essentiellement.
Par ailleurs, comment éviter que l'élève nourri du spectaculaire
médiatisé ne soit déçu par la faible amplitude
des résultats de ses simulations ?
Enfin, comment satisfaire aux besoins d'information et aux impératifs
de la rigueur sans alourdir et lasser par des rappels de connaissance ?
On s'est efforcé, autant que possible, de faciliter l'accès aux
explications, aux justifications... La présence du professeur en classe
les rend en partie inutiles mais dans la perspective d'un travail autonome,
elles peuvent se révéler juste suffisantes. Le dosage est délicat,
entre l'insuffisant, l'indispensable et l'excessif.
FORMATION
Le feuilleton de Mémoire Vive
Tout ce que vous avez toujours voulu savoir sur l'exploitation informatique
des corpus par les historiens sans avoir jamais osé le demander
Cinquième épisode : Y-a-t-il encore un pilote sur cette base
de données ?
André Zysberg Professeur à l'Université de Caen
Poursuivons ensemble cet âpre et sévère, mais ô combien captivant cheminement intellectuel, qui vous mènera vers le brevet de pilote de corpus historique...
La plupart des commandes, celles que nous avons déjà étudiées et celles que nous verrons ultérieurement, peuvent comporter un bloc condition.
Savoir manipuler un bloc condition, c'est se donner le moyen de piloter
une base de données afin d'aboutir aux résultats souhaités.
Le langage booléen existe peu ou prou sur tous les logiciels de
gestion de fichier. On le retrouve aussi dans diverses applications,
telles le dépouillement d'enquête, la cartographie, les
tableurs, à chaque fois qu'il faut exprimer logiquement des choix
et désigner sans ambiguité un sous-ensemble.
Rappelons (voir Mémoire Vive, n 5) qu'un bloc condition est toujours
introduit par le mot FOR, suivi par une ou plusieurs expressions comprenant
des variables (ou champs) et/ou des constantes (ou valeurs invariables) qui
sont reliés entre elles au moyen d'opérateur booléens
: et (.and.), ou (.or.), pas (.not.). Le résultat d'un bloc condition,
quel que soit sa complexité, est toujours vrai ou faux. Si la réponse
est vraie, le traitement ou la commande accompagnant le bloc est exécuté pour
un enregistrement, puis on passe à l'enregistrement suivant, et ainsi
de suite jusqu'à la fin du fichier actif.
Un bloc condition peut s'appliquer aux commandes de gestion de fichier : COPY, APPREND FROM, DELETE et RECALL.
Exemple :
.USE NEGRIERS
.COPY TO ECHANT FOR TONNAGE >=150
178 enregistrements copiés
A partir du fichier NEGRIERS, on crée un autre fichier, qui ne comprendra que les enregistrements pour lesquels la valeur du champ tonnage est égale ou supérieur à la valeur numérique 150. Ceci permet de générer très aisément des fichiers d'exploitation, que l'on peut ensuite détruire après usage... La commande APPEND FROM peut être aussi employée dans cette optique. Si nous avons une base de données répartie sur trois fichiers nommés NGR1, NGR2 et NGR3, nous pouvons commander un fichier ECHANT (le même nom que dans l'exemple précédent) répondant à tel et/ou tel critère :
.USE NGR1
.COPY TO ECHANT FOR TONNAGE <200 .AND. LIEUVENTE="CAP FRANCAIS"
C: ECHANT.DBF existe déjà, confirmez-vous son écrasement
? (O/N)
Il faudra répondre O pour provoquer l'exécution de la commande. Et ensuite enchaîner les commandes suivantes en n'oubliant pas de changer de fichier actif :
.USE ECHANT
.APPEND FROM NGR2 FOR TONNAGE <200 .AND. LIEUVENTE="CAP FRANCAIS"
Message du logiciel (nombre de fiches ajoutées)
.APPEND FROM NGR3 FOR TONNAGE <200 .AND. LIEUVENTE="CAP FRANCAIS"
Les blocs conditions s'appliquent aussi aux ordres DELETE ET RECALL pour effacer des enregistrements (DELETE) ou rappeler (RECALL) des enregistrements précédemment effacés.
.USE NEGRIERS
.DELETE ALL FOR TONNAGE >250
L'on vous indique que 134 enregistrements répondant à cette condition ont été effacés. Si, ensuite, vous exécutez la commande PACK, ces enregistrements seront effectivement supprimés du fichier NEGRIERS...
L'usage judicieux d'un bloc condition permet aussi de modifier ou de remplir automatiquement le contenu d'une rubrique selon tel ou tel cas : il permet notamment le " codage " de tous les types d'information.
On se propose d'ajouter à la structure du fichier NEGRIERS un champ nommé TXMORTEQ, où nous mettrons, quand le calcul sera possible, le taux de mortalité de l'équipage (exprimé sous la forme d'un pourcentage).
On commence par modifier la structure du fichier :
En créant la rubrique TXMORTEQ, qui sera définie comme un champ numérique de largeur 5 avec un chiffre décimal (soit deux entiers+le point décimal+1 chiffre décimal).
.USE NEGRIERS
.MODIFY SRUCTURE
Puis nous remplissons le champ TXMORTEQ à l'aide de la commande REPLACE en nous servant d'un bloc condition :
On commence par envisager le cas de la non réponse dans le champ TXMORTEQ, autrement dit, quand l'absence de l'une ou l'autre des informations nécessaires (nombre d'hommes d'équipage ou nombre de décès) ne permet pas d'effectuer le calcul :
.REPLACE ALL TXMORTEQ WITH 999 FOR NBEQUIPAGE=999 .OR. NBDCEQUIP=999
26 remplacement(s)
Puis on calcule le pourcentage de décès parmi l'équipage :
.REPLACE ALL TXMORTEQ WITH NBDCEQUIP*100/NBEQUIPAGE FOR TXMORTEQ <>999
172 remplacement(s)
La commande REPLACE associée à un bloc condition permet aussi de coder ou de diviser le contenu le contenu d'une rubrique en classes.
On voudrait classer les différentes valeurs du champ TONNAGE
selon 5 intervalles :
-moins de 200 tonneaux,
-200 à 299 tonneaux,
-300 à 399 tonneaux,
-400 à 499 tonneaux,
-500 tonneaux et plus.
A chaque classe on fera correspondre un code numérique de 1 à 6 (en tenant compte d'une classe supplémentaire pour la non réponse). Il faut d'abord effectuer un MODIFY STRUCTURE pour ajouter une rubrique à la structure du fichier, que nous dénommons CODETON, puis on remplit automatiquement le nouveau champ avec une série de REPLACE. Avant d'effectuer toutes ces manipulations, rappelons la prudence la plus élémentaire consiste à sauvegarder une version antérieure du fichier de données, car en cas de mauvaise manoeuvre, il est impossible d'"effacer" le résultat d'une commande REPLACE...
.REPLACE ALL CODETON WITH 6 FOR TONNAGE=9999
2 remplacement(s)
.REPLACE ALL CODETON WITH 1 FOR TONNAGE <200
44 remplacement(s)
.REPLACE ALL CODETON WITH 2 FOR TONNAGE >=200 .AND. TONNAGE <300
30 remplacement(s)
.REPLACE ALL CODETON WITH 3 FOR TONNAGE >=300 .AND. TONNAGE <400
44 remplacement(s)
.REPLACE ALL CODETON WITH 4 FOR TONNAGE >=400 .AND. TONNAGE <500
39 remplacement(s)
.REPLACE ALL CODETON WITH 5 FOR TONNAGE >=500 .AND. TONNAGE <>9999
39 remplacement(s)
Cette méthode vaut pour toutes les catégories de données, sauf pour les champs de type logique, qui sont déjà codés.
Quittons les navires négriers pour choisir un autre exemple, celui de CONTRIB, le fichier des contribuables d'un bourg de Basse-Normandie (environ 600 feux) vers le milieu du XVIIIe siècle. Le document mentionne le nom, l'état ou la profession du contribuable et le montant de sa cote d'imposition en livres, sous et deniers tournois. Il s'agit du Vingtième, un impôt direct qui était assis sur le revenu de la propriété foncière. Les informations ont été enregistrées sous leur forme originelle, y compris les variations orthographiques pour désigner un même métier...
A la structure initiale du fichier, on ajoute (avec MODIFY STRUCTURE)
trois rubriques qui faciliteront l'analyse des données :
- CSP, c'est la catégorie socio-professionnelle selon un code alphabétique
de 5 caractères;
- TOTIMPOT, c'est le montant total de la contribution exprimé en livres
avec une partie décimale à deux chiffres;
- NIVIMPOT, c'est la tranche d'imposition selon un code numérique à deux
chiffres.
La première opération consiste à remplir le champ TOTIMPOT.
D'abord avec les non réponses :
.REPLACE ALL TOTIMPOT WITH 999 FOR LIVRES=999
Puis on effectue la conversion et le calcul du montant de l'imposition en système décimal:
.REPLACE ALL TOTIMPOT WITH ((LIVRES*240)+(SOLS*12)+DENIERS)/240 FOR LIVRES <>999
En partant de TOTIMPOT, on va déterminer des niveaux d'imposition, donc créer et remplir une rubrique NIVIMPOT comprenant 11 échelons. Nous ne détaillerons pas le moyen d'y parvenir, car la procédure est exactement identique à celle que nous avons déjà suivie pour la classification des tonnages de bâtiments négriers. Après l'étude de la série de chiffres fournies par TOTIMPOT, on a choisi les tranches suivantes pour le codage de NIVIMPOT :
0--> 0
1--> <5
2--> 5-9
3--> 10-14
4--> 15-19
5--> 20-29
6--> 30-39
7--> 40-49
8--> 50-99
9--> >=100
99--> 999 ou sans réponse
La taxinomie des " états " apparaît moins évidente. Nous avons affaire à une information plutôt qualitative et non pas à une mesure. On imprime d'abord une liste triée du vocabulaire de la rubrique ETAT (en recourant à la commande SORT), qui désigne à la fois la condition sociale et le métier; puis il s'agit de réfléchir en dépouillant cette liste, afin de confectionner des catégories socio-professionnelles. Nous aurons le droit à l'expérience, à l'erreur ou au repentir, car le "codage" ne portera pas directement sur le contenu de la rubrique primitive, mais sur le champ CSP. Si la classification ne convient pas, nous pouvons la remodeler à notre guise...
Tri et édition du contenu de la rubrique ETAT :
.SORT ON ETAT TO TRIETAT
.USE TRIETAT
.LIST ETAT TO PRINT
L'étude de la liste nous conduit à envisager 16 catégories socio-professionnelles.
SEIGN : Seigneurs FERMI : Fermiers
ECUYR : Ecuyers VALOC : "Faisant valoir" ou "Occupant"
MARCH : Marchands JOURN : Journaliers
BOUTI : Boutiquiers VALET : Valets, domestiques
ARTIS : Artisans (sauf textile) DIVER : Divers
TOILI : Toiliers et tisserands SSMET : Sans vacation
LABOU : Laboureurs VEUVE : Veuve de ou fils de, au métier inconnu
MEUNI : Meuniers INDET : Indéterminé
Il faut maintenant remplir le champ CSP avec le code de 5 lettres qui a été défini pour représenter chaque catégorie. Au plan informatique, le codage d'une information qualitative s'avère plus long et plus fastidieux que celui d'une information quantitative.
On peut procéder de deux manières.
Soit remplir le champ CSP à l'aide du mode BROWSE, enregistrement par enregistrement ou ligne par ligne, en prenant la précaution de " geler " le champ de travail (voir Mémoire Vive, n° 4, pp. 28-29), c'est à dire que l'on pourra accéder exclusivement au champ CSP, sans risquer d'opérer des modifications malencontreuses sur les autres champs qui sont présents à l'écran (il serait aussi judicieux d'utiliser le paramètre FIELD de la commande BROWSE pour visualiser uniquement les champs nécessaires).
Soit remplir en une seule fois pour un sous-ensemble d'enregistrements le champ CSP avec une commande REPLACE, puis passer au sous-ensemble suivant, jusqu'à ce que tous les codes aient été attribués. Voici quelques exemples :
.USE CONTRIB
.REPLACE ALL CSP WITH "BOUTI" FOR ETAT="Boucher"
3 remplacement(s)
.REPLACE ALL CSP WITH "ARTIS" FOR ETAT="Charpentier"
8 remplacement(s)
.REPLACE ALL CSP WITH "JOURN" FOR ETAT="Journalier"
85 remplacement(s)
etc...
Le cas de la catégorie " VEUVE " est plus délicat. En observant le contenu de la rubrique nom, on s'est aperçu que la plupart des imposés dont nous ignorons la condition sociale sont des veuves ou des orphelins mineurs. Le codage " VEUVE " du champ CSP ne s'appuiera donc pas sur le contenu du champ ETAT (qui est " blanc " dans ce cas), mais sur celui de la rubrique NOM, où l'on nous dit qu'une telle est la veuve de un tel... Même chose s'il s'agit d'un orphelin, qualifié comme fils un tel. pour code le champ CSP des veuves et des orphelins sans état, on peut utiliser le mode BROWSE ou employer une commande REPLACE assez complexe, que voici :
.REPLACE ALL CSP WITH "VEUVE" FOR ("veuve"$NOM .or. "fils"$NOM) .and.
ETAT=" "
117 remplacement(s)
Le signe $ correspond à une fonction qui teste la présence d'un groupe de caractères dans une chaîne de caractères. Nous verrons la syntaxe de cette fonction avec celles des autres fonctions dans une prochain épisode. Traduisons néanmoins en langage clair cette commande plutôt ésotérique :
-remplace pour chaque enregistrement le contenu du champ CSP par "VEUVE" si et seulement si le champ NOM contient la sous-chaîne de caractère "veuve" ou la sous-chaîne de caractères "fils" et si le champ ETAT ne contient que des blancs...
Trier sous condition
Revenons à nos négriers pour montrer comment la commande SORT fonctionne également avec un bloc condition.
On veut créer un sous-fichier comprenant toutes les expéditions négrières pour lesquellles le taux de mortalité de l'équipage est égal ou supérieur à 15 %. Ce sous-fichier sera trié selon l'ordre alphabétique des noms de navires :
.USE NEGRIERS
.SORT ON NOMNAVIRE TO NGR15 FOR TXMORTEQ>=15 .AND. TXMORTEQ <>999
66 tri terminé
N'oubliez pas, si vous voulez utiliser de suite ce nouveau fichier, de préciser avant toute chose :
.USE NGR15
De cette façon, on peut générer, soit avec les commandes COPY TO ou APPEND, soit avec la commande SORT si l'on a besoin d'un fichier trié, des sous-ensembles de données, autant de fichiers d'exploitation, qui préparent des éditions de résultats.
CHERCHE MOI
Comment rechercher et afficher pas à pas les enregistrements ? Avec la commande LOCATE FOR. Attention : le mot FOR, qui introduit le bloc condition, n'est pas facultatif ou optionnel comme c'était le cas avec toutes les commandes précédentes. Un ordre LOCATE non suivi d'un FOR avec n'existe pas.
.LOCATE FOR NOMNAVIRE="AMOUR"
Enregistrement=9
.EDIT
Le pointeur d'enregistrement se positionne sur la première "fiche" répondant à la condition. Oui, il y avait des navires négriers qui s'appelaient "AMOUR".... On peut ensuite effectuer toutes les commandes possibles, puis donner l'ordre de reprendre la recherche avec :
.CONTINUE
Enregistrement=37
On effectue n'importe quelle commande...
.CONT
(les quatre premières lettres suffisent)
Enregistrement=66
.CONT Enregistrement=105
.CONT
Fin de la zone de recherche.
Quand le logiciel ne trouve plus d'enregistrement satisfaisant à la
condition, le pointeur est mis sur la fin du fichier.
La commande LOCATE s'avère très utile pour effectuer des modifications
raisonnées. Vous avez repéré des erreurs répétitives
qui ne peuvent pas être corrigées avec une commande REPLACE, car
il vous faut, à chaque fois, visualiser un enregistrement avant de prendre
une décision. La commande LOCATE FOR vous permettra de détecter
et de mettre à jour les " lots " d'enregistrements répondant à tel
ou tel critère.
L'usage judicieux des blocs condition permet de mieux préparer son corpus,
de l'exploiter avec art et méthode en vue de l'épreuve ultime
qui guette sournoisement l'historien: l'extraction de résultats.
Le prochain épisode de notre captivant feuilleton sera voué aux commandes de comptage, de calcul, aux fonctions (notamment les opérations sur les dates) et à la gestion des variables "mémoire". Car, comme le disait Saint Hollerith (ermite irlandais, vers 835-901), un corpus sans mémoire n'est qu'un corpus inachevé...
André ZYSBERG