La définition en mathématiques

Pourquoi définir ? Comment les communiquer et les enseigner ?

Il vous est certainement familier qu'un cours de mathématiques commence généralement par énoncer un certain nombre de définitions. Ces définitions servent alors à démontrer des premières propriétés (par exemple des relations de calculs) qui servent ensuite à démontrer des théorèmes.

Les théorèmes et propositions sont alors dans un mouvement mathématique, ils sont introduits par les objets précédemment définis. Mais d'où viennent les définitions ? Et pourquoi définit-on ?

Qu'est-ce qu'une définition ? Comment apparaissent-elles ?

Avant de rentrer dans un propos d'épistémologie, il est peut-être utile de rappeler le statut mathématique d'une définition. Nous allons utiliser la caractérisation suivante : une définition est une phrase mathématique dont la proposition peut être vraie ou fausse selon l'objet auquel on l'applique.

Par exemple, la définition du réel positif : « C'est une limite positive d'une suite de Cauchy à valeurs rationnelles. ». Cela donne la phrase « être un réel positif » et c'est une proposition qui peut être vraie : « $2$ est un réel positif » ou fausse : « $-1$ est un réel positif ».

On demande également à ce qu'une définition vérifie les propriétés suivantes :

  • elle doit introduire des concepts nouveaux par rapport à ceux connus (c'est-à-dire que l'on définit un objet par des objets plus simples) ;
  • elle doit être cohérente.

Le premier point exprime le fait qu'on se refuse à définir un objet par lui-même, en d'autres termes vous ne pouvez pas définir $A$ par $B$ puis $B$ par $A$. Le second exprime le fait que l'on peut supposer qu'un objet existe et vérifie la définition donnée, par exemple « être un réel nul et non nul » n'est pas une définition puisque aucun réel ne vérifie cette proposition.1

Où et pourquoi définit-on ?

Faire des mathématiques, c'est avant tout faire des preuves. C'est en quelque sorte l'activité principale d'un mathématicien.

C'est ainsi le rôle premier d'une définition : elle doit être utile pour démontrer. On voit aisément apparaître alors deux types de définition :

  • les définitions qui permettent de caractériser les objets d'une hypothèse ou d'une conclusion ;
  • les définitions qui apparaissent comme objets intermédiaires dans une preuve.

Si on prend pour exemple le très fameux théorème de Pythagore : « Un triangle rectangle vérifie l'égalité suivante : la somme des carrés des côtés adjacent à l'angle droit est égale au carré de l'hypoténuse. », dans cet énoncé, il y a une hypothèse (un triangle rectangle) et une conclusion (l'égalité donnée). Mais cela présuppose par exemple que l'objet « triangle » soit bien défini ainsi que l'opération « mettre au carré ».

Il existe ainsi des théorèmes strictement équivalent à celui du théorème de Pythagore, en changeant par exemple uniquement le mot « triangle » par l'une de ses définitions.

Mais toutes les définitions ne nous apparaissent pas comme également utile ou simples. C'est alors que le mathématicien doit arriver à caractériser suffisamment simplement un objet pour pouvoir l'utiliser facilement. Il y a là une première action didactique : écrire simplement et véritablement la description d'un objet.

Ce n'est pas une tâche facile, et on va voir que ça n'est pas la seule à réaliser pour comprendre la nature d'un objet. En effet, en plus de la définition, il faut donner une confrontation à des objets existants.

Appliquer des définitions

Même si formellement cela n'apporte rien (vérifier si un objet vérifie une proposition se fait machinalement), l'être humain qu'est le mathématicien a besoin d'une compréhension de l'objet. Dans l'acte de création il faut une appropriation, sinon on réduit l'activité mathématique à de la manipulation symbolique ce qui n'est évidemment pas le cas.

De telle sorte qu'une définition se suit généralement d'exemples et de contre-exemples. Pour rappel, un contre-exemple ne dit pas qu'une propriété est fausse mais que si on modifie les hypothèses, la propriété devient alors fausse. Dans le cas d'une définition, cela revient à donner un objet qui ne correspond pas à la caractérisation donnée.

Une autre manière d'apporter de la compréhension à une définition est d'accompagner cette dernière par des théorèmes d'équivalence, dits de « caractérisation ». Ce sont ces théorèmes qui vous disent par exemple qu'un graphe est un arbre si, et seulement si, il est connexe sans cycle. Ces théorèmes sont des équivalences entre la proposition « vérifier la définition donnée » et une autre propriété (que l'on espère différente de celle donnée par la définition, dans le cas contraire le théorème n'a pas d'intérêt).


  1. Des développements assez simples (mais non triviaux) de logique mathématique montrent qu'une théorie est cohérente si, et seulement si, elle admet un modèle. C'est pourquoi nous dirons qu'une définition est cohérente si, et seulement si, on peut exhiber un exemple qui vérifie les hypothèses de cette définition. Par exemple, la théorie des groupes a un modèle : $(\mathbf{Z},+)$. Un modèle d'une théorie, $T$, c'est la donnée d'un ensemble, de l'interprétation du langage de $T$ et tels façon qu'ils vérifient les axiomes de $T$. En théorie des groupe, le seul symbole à interpréter est la loi de composition et les axiomes sont ceux de la théorie des groupes (existence du neutre par exemple). 

Quel enseignement des définitions ?

Comment définit-on dans un cours ?

L'introduction donne en partie la réponse. L'enseignement traditionnel (venu de la tradition bourbakiste) est de procéder à un exposé axiomatique qui est formel, unificateur et général (dit FUG). Par exemple la notion d'espace vectoriel est défini dans les classes préparatoires et universitaire de sa manière la plus générale possible (en caractérisant les lois de compositions).

Ainsi, les définitions sont données avec (en général) peu ou pas d'introduction épistémologique ou mathématique au problème que l'on va traiter. Un élève normalement constitué se demandera toujours « pourquoi est-ce que je définis un espace vectoriel de cette façon et pas d'une autre ? ».

C'est une question naturelle évitée en grande partie par l'enseignement actuel mais pourtant tout à fait centrale :

  • pour la compréhension ;
  • dans la création mathématique.

En effet, un mathématicien n'a pas un dictionnaire de définitions inconnues et utilisables pour son problème : il construit par lui-même les objets qui lui seront utiles dans la démonstration. Rappelons une fois de plus, qu'une définition sert principalement à démontrer alors que les discours actuels tendent à faire comprendre qu'un objet vérifie des propriétés qui apparaissent miraculeusement (alors que bien plus souvent, un objet est défini pour vérifier certaines propriétés).

Comment faire progresser cet enseignement ?

Du fait d'une incompréhension quasi générale des élèves, il paraît nécessaire de changer (au moins en partie) cette approche. Actuellement plusieurs pistes sont explorées :

  • commencer par des études de problèmes (par une réflexion de recherche) et ensuite dégager les objets abstraits et unificateurs qui apparaissent ;
  • retracer le parcours historique d'une notion (par exemple la notion de continuité a une très riche histoire) ;
  • reprendre un cheminement intellectuel cohérent avec l'activité de recherche : commencer par énoncer des théorèmes que l'on veut démontrer et dégager les objets qui permettent de tels résultats.

Il y a une différence entre le premier point et le dernier. Dans le premier point, on procède à une abstraction : de cas particuliers on cherche un cas général. Mais on le fait sans chercher à vérifier des propriétés comme on le ferait dans la troisième proposition. Dans cette dernière, on cherche explicitement à vérifier un résultat lors de la construction de la définition.

Ces approches paraissent satisfaisante moralement. Mais sont-elles applicables ? En effet, l'exposé axiomatique (FUG) présente l'avantage d'être extrêmement efficace du point de vue suivant : une notion sera abordée rapidement et appliquée rapidement.


Ce court article se termine. De façon intentionnelle, le débat devrait s'amorcer. Comment en tant qu'élève ou enseignant réagit-on face aux définitions, comment aimerions-nous qu'elles soient abordées ?

Références

Remerciements

Un grand merci à Gabbro d'avoir fait la validation de ce contenu, en un délai très court et avec d'excellentes remarques. Merci aussi à Arius d'avoir géré cette validation effectuée par un membre non-staff de ZdS.

14 commentaires

Hey, en tant qu'étudiant en mathématique, je trouve cet article très intéressant. En effet, avant d'arriver à l'université, la théorie ne m'intéressait qu'assez peu car les définitions me donnaient l'impression de tomber du ciel et je n'en voyais pas toujours le sens. C'est vraiment dans mon premier cours d'algèbre que j'ai commencé à saisir le sens d'une définition qui est donner un nom à une classe d'objets que l'on va utiliser pour démontrer des résultats.

Je trouve que tu le résumes assez bien et de manière très simple. C'est un très bon article que je m'en vais de ce pas partager !

EDIT: Sinon pourquoi le symbole $\partial$ comme image de l'article ?

+7 -0

Ah oui, vu comme ça. Je l'associe (forcément) instinctivement aux dérivées partielles, je n'avais pas directement pensé à la lettre d.

Voici mesdames et messieurs le 111 111e message posté sur ZdS, merci beaucoup, merci, oh non arrêtez, c'est trop ! :D

+3 -0

Actuellement plusieurs pistes sont explorées :

  • commencer par des études de problèmes (par une réflexion de recherche) et ensuite dégager les objets abstraits et unificateurs qui apparaissent ;
  • retracer le parcours historique d'une notion (par exemple la notion de continuité a une très riche histoire) ;
  • reprendre un cheminement intellectuel cohérent avec l'activité de recherche : commencer par énoncer des théorèmes que l'on veut démontrer et dégager les objets qui permettent de tels résultats.

La première approche est utilisée parfois dans le début du supérieur. Je me souviens pour l'enseignement des groupes anneaux etc. L'approche intuitive était de dire : regardez (Z,+), on a une addition, on a un zéro : c'est généralisable dans la notion de groupe. Elle me plaît beaucoup personnellement.

La deuxième notion à mon avis est extrêmement dure à mettre en place. Par exemple pour les nombres complexes, on peut voir ça comme un outils pour la résolution des équations de degré 3… mais personne à ce niveau ne sait que c'était vraiment un gros problème à l'époque, et il faut tout expliquer, revenir sur le second degré. Ça reste faisable (cf. Micmaths), mais galère parfois.

Autrement, il y a une autre approche, dont tu ne parles pas et qui est très utilisée en pratique, c'est le raffinement successif. Je m'explique : au début, on a une approche intuitive des notions (par exemple, une ligne est selon Euclide « une longueur sans largeur » ), ensuite on peut raffiner avec d'autres notions (une droite c'est un point et un vecteur directeur) et voir qu'on garde bien les propriétés, et continuer encore construisant des espaces affines, etc. Ça donne une approche pratique des maths, mais ça ne résout pas l'impression que ça tombe du ciel, au moins un peu. Ça rejoint peut-être la troisième approche dans l'esprit.

Autrement, il y a une autre approche, dont tu ne parles pas et qui est très utilisée en pratique, c'est le raffinement successif.

Ça me fait assez penser à la première solution qui consiste à abstraire des cas particuliers. Pourquoi est-ce que tu considères que c'est différent ?

Autrement, il y a une autre approche, dont tu ne parles pas et qui est très utilisée en pratique, c'est le raffinement successif.

Ça me fait assez penser à la première solution qui consiste à abstraire des cas particuliers. Pourquoi est-ce que tu considères que c'est différent ?

Holosmos

Là où ça diffère, c'est que la définition est améliorée (plus rigoureuse, concepts plus fondamentaux) plutôt qu'issue d'une généralisation. Les deux sont pas antithétiques d'ailleurs.

Merci pour cet article, Holosmos. Je trouve ça très bien que ZdS aie du contenu un peu atypique dans plein de domaines différents, y compris les maths que les cours de lycée ou collège ne permettent pas vraiment d'apprécier à mon sens, j'avais l'impression de recracher des méthodes. Ton article permet de voir au-delà et comprendre un peu comment les mathématiciens raisonnent, ce qui est très intéressant.

EDIT: Jeu sé pa ekrir avèque switfkey

+4 -1

Autrement, il y a une autre approche, dont tu ne parles pas et qui est très utilisée en pratique, c'est le raffinement successif.

Ça me fait assez penser à la première solution qui consiste à abstraire des cas particuliers. Pourquoi est-ce que tu considères que c'est différent ?

Holosmos

Là où ça diffère, c'est que la définition est améliorée (plus rigoureuse, concepts plus fondamentaux) plutôt qu'issue d'une généralisation. Les deux sont pas antithétiques d'ailleurs.

Aabu

Pour la rigueur je suis d'accord qu'on peut procéder ainsi.

Mais je n'arrive pas à saisir la différence entre généralisation et concepts plus fondamentaux. Ce qu'on généralise, ce sont les faits les plus fondamentaux aux exemples que l'on a à notre disposition, non ?

Merci pour cet article, qui fournie une réflexion de fond intéressante et en effet manquante dans beaucoup de cours.

J'ajoute ma pierre à l'édifice.

Il me semble que l'incompréhension des élèves, et le fait que certaines définitions paraissent "arbitraires" (pour reprendre les mots de certains de mes camarades) provient d'une approche "physique" des mathématiques.

Je m'explique. En physique, la réalité nous est donné. Les objets, on les a sous les yeux. On peut les observer et ils ont, pou cette raison, déjà un nom. L'étude de ces objets nous renseigne alors sur leurs propriétés. L'enjeu de cette investigation est bien de caractériser entièrement les propriétés de notre objet.

En mathématiques, on prend le raisonnement à l'envers. On a une collection d'objets qui vérifient certaines propriétés, et ces seules propriétés permettent la démonstration de théorèmes intéressants (pas besoin de faire appel à d'autres propriétés qui seraient spécifiques à chaque objet de la collection). Il est donc logique, par soucis d'économie et d'abstraction, de nommer cette collection.
Ainsi tout théorème démontré à partir de ces hypothèses se généralise à n'importe quel objet vérifiant ces propriétés. Le travail de définition consiste donc essentiellement à nommer. À nommer quelque chose qui existe déjà. Et le débat du "pourquoi ces propriétés et pas d'autres ?" disparaît alors. Contrairement en physique, où les propriétés sont dégagées après que l'existence de l'objet ait été établie.

Comme la plupart des étudiants n'ont pas de reçu de formation quant à la notion d'axiome ou les théorèmes d'incomplétude de Gödel, pour eux les mathématiques sont une construction unique et absolue, qui peut s'étudier comme la réalité qui nous entoure. C'est vrai jusque dans une certaine mesure, mais il ne faut pas oublier que contrairement au monde qui nous entoure les bases d'une théorie mathématique ont été établi artificiellement.

mais il ne faut pas oublier que contrairement au monde qui nous entoure les bases d'une théorie mathématique ont été établi artificiellement.

C'est un point de vue assez tranché sur la relation de l'Homme au mathématiques. Mais il est vrai qu'on a adopté une axiomatisation. Cela ne s'est pas fait sans discussions, sans diverses tentatives infructueuse et un accord non global. Mais je crois que ce qui compte le plus en mathématiques, c'est démontrer. Finalement, peu importe les objets en jeu, ce qu'on apprécie avant tout ce sont les idées nouvelles.

Merci pour cet article intéressant. Pourquoi n'est-il pas sous la forme d'un tutoriel d'ailleurs ?

Le second exprime le fait que l'on peut supposer qu'un objet existe et vérifie la définition donnée […] Des développements assez simples (mais non triviaux) de logique mathématique montrent qu'une théorie est cohérente si, et seulement si, elle admet un modèle

Tu parles de définition, puis de théorie… Je ne vois pas ce qui nous empêche d'écrire une définition impossible à réaliser. Après tout, c'est souvent l'objet des mathématiques de trouver des exemples après s'être posé des questions existentielles. Ou alors tu voulais dire que potentiellement toute définition mathématique est en standbye jusqu'à que l'on trouve un exemple qui réalise la définition ? Dans ce cas comment appeler la définition en standbye ?

Ces théorèmes sont des équivalences entre la proposition « vérifier la définition donnée » et une autre propriété (que l'on espère différente de celle donnée par la définition, dans le cas contraire le théorème n'a pas d'intérêt).

Dans cette partie on peut aussi dire qu'il y a équivalence entre (l'objet vérifie la définition n°2 ) et (l'objet vérifie la définition n°1 ainsi que telle propriété), par exemple (G est un arbre) <=> (G est un graphe ET G est connexe sans cycles).

+0 -0

Bonjour. Ayant travaillé à remettre au propre les fondements des mathématiques, le concept de définition fait partie de ce que j’ai eu l’occasion de clarifier, et qui reste vague dans les enseignements habituels. Quelques réactions à cet article:

une définition est une phrase mathématique dont la proposition peut être vraie ou fausse selon l’objet auquel on l’applique

Si j’écris: "soit f la fonction de R dans R donnée par x ↦ 2x+1", n’est-ce pas une définition qui ne ressemble pas tellement à une phrase vraie ou fausse suivant l’objet auquel on l’applique ?

…une définition vérifie les propriétés suivantes .... doit introduire des concepts nouveaux …doit être cohérente…par exemple « être un réel nul et non nul » n’est pas une définition puisque aucun réel ne vérifie cette proposition

Si, il est cohérent de définir l’ensemble des réels nuls et non nuls, sauf que c’est une nouvelle définition de l’ensemble vide qu’on connaissait déjà. Or si ce cas particulier est évident, il y a d’autres cas où on a besoin d’introduire une définition dans le seul but de servir d’intermédiaire pour finalement démontrer qu’il s’agissait en fait, justement, d’une nouvelle définition de l’ensemble vide… donc non, il n’y a pas à poser de telle restriction.

Le premier point exprime le fait qu’on se refuse à définir un objet par lui-même

Certes évidemment, aucune bonne définition n’aura une forme de cercle vicieux, mais cela ne dit toujours pas exactement (ne définit pas) ce qu’est précisément une définition.

une théorie est cohérente si, et seulement si, elle admet un modèle

Oui en effet. C’est le théorème de complétude qui l’assure. Mais pour le cas de théories incluant l’arithmétique, il y a aussi le théorème d’incomplétude, d’après lequel cette cohérence n’est pas démontrable dans la même théorie mais seulement dans une théorie "plus forte". Dans ces conditions on ne peut pas beaucoup se permettre de se restreindre à l’étude de théories dont la cohérence serait déjà démontrée.

C’est pourquoi nous dirons qu’une définition est cohérente si, et seulement si, on peut exhiber un exemple qui vérifie les hypothèses de cette définition

L’équivalence entre cohérence et existence d’un modèle est un théorème assez non-trivial. Il serait largement abusif de déguiser ce théorème en définition. De plus, si la démonstration de ce théorème procède effectivement, en un certain sens, sous forme de construction d’un modèle de la théorie sous l’hypothèse de sa cohérence, cette construction n’est, dans son cas général, pas du tout bien gentille comme on peut avoir l’habitude d’exhiber des exemples d’objets mathématiques, mais est non-algorithmique, faisant appel à un oracle résolvant le problème de l’arrêt travaillant sur la structure formelle de la théorie explicitement supposée cohérente. Et si les preuves d’indépendance d’axiomes comme l’hypothèse du continu en théorie des ensembles procèdent par "constructions de modèles" de théories modifiées, ces "constructions" ne peuvent pas se faire dans le vide mais sur la base de modèles supposément existants mais non "exhibés" d’une première version de la théorie des ensembles.

Comme remarquait tit_toinou, l’article confond 2 concepts distincts: d’une part les définitions, d’autre part les théories. Voici un résumé de ce que j’ai expliqué dans mon travail.

Une théorie est un système formel constitué d’une liste de types, une liste de symboles et une liste d’axiomes, visant à décrire tout système d’objets partitionné suivant ces types, reliés par des structures nommés par les symboles, et satisfaisant ces axiomes.

Par ailleurs, étant donné une théorie, il est possible de la développer en lui ajoutant des constituants suivant des règles précises pour que cela reste "essentiellement la même théorie":

  • Une preuve ajoute son théorème à la liste d’axiomes
  • Une définition dans une théorie lui ajoute un symbole et un axiome
  • Une construction lui ajoute un type, au moins un symbole et au moins un axiome.

On peut être tenté d’appeler "définition" non seulement une définition dans une théorie à proprement parler, mais aussi, soit la donnée d’une théorie, soit une construction dans une théorie. En un sens c’est abusif, en un autre sens, ces 2 autres concepts se transforment de fait en définitions lors de l’absorption de cette théorie dans la théorie des ensembles (1.3).

edit de modération (Holomos) : suppression des nombreuses pub pour pouvoir parler du fond

+0 -0

Si j’écris: "soit f la fonction de R dans R donnée par x ↦ 2x+1", n’est-ce pas une définition qui ne ressemble pas tellement à une phrase vraie ou fausse suivant l’objet auquel on l’applique ?

Ta définition est conditionnée par le fait que la définition $x\mapsto 2x+1$ soit correcte. Il n’est d’ailleurs pas rare en mathématiques de devoir vérifier qu’une définition est bien posée. Par exemple qu’elle ne dépend pas du représentant d’une classe d’équivalence choisi.

En l’occurrence, il faudrait entre autre vérifier que quelque soit la suite de Cauchy tendant vers $x$, $2x+1$ ne dépend pas de ce choix. Mais comme c’est évident, on le passe sous silence.

Si, il est cohérent de définir l’ensemble des réels nuls et non nuls, sauf que c’est une nouvelle définition de l’ensemble vide qu’on connaissait déjà. Or si ce cas particulier est évident, il y a d’autres cas où on a besoin d’introduire une définition dans le seul but de servir d’intermédiaire pour finalement démontrer qu’il s’agissait en fait, justement, d’une nouvelle définition de l’ensemble vide… donc non, il n’y a pas à poser de telle restriction.

C’est que tu n’as pas compris mon passage. Il s’agissait de décrire les conditions que posent un mathématicien lors de l’élaboration d’une définition. Conditions philosophiques, pas formelles.

Mais pour le cas de théories incluant l’arithmétique, il y a aussi le théorème d’incomplétude, d’après lequel cette cohérence n’est pas démontrable dans la même théorie mais seulement dans une théorie "plus forte". Dans ces conditions on ne peut pas beaucoup se permettre de se restreindre à l’étude de théories dont la cohérence serait déjà démontrée.

Ce n’est pas ce que je propose.

L’équivalence entre cohérence et existence d’un modèle est un théorème assez non-trivial. Il serait largement abusif de déguiser ce théorème en définition.

C’est non trivial, et alors ? Je ne vois pas en quoi c’est abusif.

De plus, si la démonstration de ce théorème procède effectivement, en un certain sens, sous forme de construction d’un modèle de la théorie sous l’hypothèse de sa cohérence, cette construction n’est, dans son cas général, pas du tout bien gentille comme on peut avoir l’habitude d’exhiber des exemples d’objets mathématiques, mais est non-algorithmique

Le problème du constructivisme n’est pas celui que j’aborde. Mais il est vrai que c’est une question importante. C’est juste pas le sujet.

Comme remarquait tit_toinou, l’article confond 2 concepts distincts: d’une part les définitions, d’autre part les théories. Voici un résumé de ce que j’ai expliqué dans mon travail.

Il n’y a pas de confusion si tu prêtes suffisamment attention à ce que j’ai écrit.


Mon sujet n’est pas de définir en termes de logique formelle ce qu’est une définition. Ce qui m’a intéressé, c’est ce que fait un mathématicien lorsqu’il définit un objet.

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte