Note liminaire : Tout ce qui suit est une fiction narrative. Les résultats mathématiques sont documentés ; la conversation est inventée. Al-Tūsī, Newton et Leibniz ne se sont jamais rencontrés.
Al-Khayyām, un siècle avant moi, a classé toutes les équations cubiques et les a résolues géométriquement par intersection de coniques. Mais il ne pouvait pas toujours dire à l’avance si une équation avait des solutions positives ou non.
Moi, je veux un critère. Prenons l'équation :
Elle a des solutions positives si et seulement si le membre de droite \(bx\) peut « rattraper » le membre de gauche \(x^3 + a\). Autrement dit, il faut que la courbe \(f(x) = bx - x^3\) monte assez haut pour atteindre la valeur \(a\).
La question devient : quel est le maximum de \(f(x) = bx - x^3\) ?
Al-Tūsī cherche le maximum de \(f(x) = bx - x^3\) sur les réels positifs.
Étape 1 — Comparer \(f(x)\) et \(f(x + h)\).
Si \(f\) atteint son maximum en \(x_0\), alors pour tout petit déplacement \(h\), on doit avoir \(f(x_0 + h) \leqslant f(x_0)\), c’est-à-dire \(f(x_0 + h) - f(x_0) \leqslant 0\).
Calculons cette différence :
Développons \((x+h)^3 = x^3 + 3x^2h + 3xh^2 + h^3\) :
Étape 2 — Quand \(h\) est très petit.
Si \(h\) est petit, les termes \(3xh\) et \(h^2\) deviennent négligeables. Le signe de \(f(x+h) - f(x)\) dépend de :
C’est exactement ce que vous appelez aujourd’hui la dérivée \(f'(x) = b - 3x^2\).
Étape 3 — Trouver le maximum.
Le maximum est atteint quand cette expression s’annule :
Et la valeur du maximum est :
Étape 4 — Le critère.
L'équation \(x^3 + a = bx\) a des solutions positives si et seulement si :
C’est un discriminant pour les cubiques — l’analogue de \(\Delta = b^2 - 4ac\) pour les quadratiques.
L'équation \(x^3 + 2 = 12x\) a-t-elle des solutions positives ?
Ici \(a = 2\), \(b = 12\). Le maximum de \(f(x) = 12x - x^3\) :
Or \(a = 2 \leqslant 16\) : oui, l'équation a des solutions. ✓
Vérification : \(f(x) = 12x - x^3 - 2\). On teste \(x = 1\) : \(12 - 1 - 2 = 9 > 0\). Et \(x = 4\) : \(48 - 64 - 2 = -18 < 0\). Par le théorème des valeurs intermédiaires, il y a bien une racine entre 1 et 4.
Je n’ai jamais écrit le symbole \(f'(x)\). Je n’ai pas le concept de « dérivée » au sens où vous l’entendez. Mais j’ai fait exactement le même calcul : développer \(f(x+h) - f(x)\), ignorer les termes en \(h^2\) et plus, et trouver où le terme restant s’annule. C’est la dérivée sans le mot.
Note historique : L’interprétation du travail d’al-Tūsī fait débat parmi les historiens. Roshdi Rashed considère qu’il utilise systématiquement une forme de dérivation. D’autres historiens notent qu’il n’explicite jamais l’expression de la dérivée en tant que telle. Ce qui est certain, c’est qu’il trouve les maxima des polynômes par un calcul équivalent à l’annulation de la dérivée.
Sources : Roshdi Rashed, Sharaf al-Dīn al-Tūsī, Œuvres mathématiques, 1986 ; Sinaceur, 1990 (Zotero) ; Hogendijk, « Le calcul du maximum et la dérivée selon al-Tūsī », HAL, 2008.
Je pense aux grandeurs comme des quantités qui coulent — qui varient continûment dans le temps. Si \(x\) change avec le temps, sa vitesse de changement est sa fluxion, que je note \(\dot{x}\). Pour une fonction \(y = x^n\), la fluxion est :
C’est ce que vous appelez aujourd’hui \(\dfrac{dy}{dx} = nx^{n-1}\).
Newton part de \(y = x^n\) et considère un accroissement infiniment petit \(o\) de \(x\) :
Il développe par le binôme :
En soustrayant \(y = x^n\) et en divisant par \(o\) :
En « posant \(\dot{x} = 1\) » (c’est-à-dire en prenant \(x\) comme variable indépendante) :
C’est la formule de dérivation des puissances, fondement de tout le calcul.
Votre raisonnement est proche du mien. Moi aussi, je calculais \(f(x+h) - f(x)\) et je négligeais les puissances supérieures de \(h\). La différence, c’est que vous avez généralisé : votre méthode s’applique à toute fonction, pas seulement aux polynômes.
Note historique : Newton développe ses fluxions en 1665–1666 (les annus mirabiles, pendant la peste de Londres) mais ne publie qu’en 1704. Ce retard sera au cœur de la querelle de priorité avec Leibniz.
Newton a les idées, mais sa notation est obscure. Ses « fluxions » et ses \(\dot{x}\) sont liés au temps, ce qui est gênant quand on étudie la géométrie ou l’algèbre.
Moi, j’invente une notation algébrique. Je note \(dx\) un accroissement infiniment petit de \(x\), et \(dy\) l’accroissement correspondant de \(y\). Le rapport :
est la dérivée. C’est un symbole, pas une division — mais il se comporte comme une division dans les calculs, ce qui le rend extraordinairement maniable.
Leibniz établit les règles fondamentales que vous utilisez en Première :
Dérivée d’une somme :
Dérivée d’un produit :
Dérivée d’un quotient :
Vérification sur un exemple : \(f(x) = x^2 \cdot (3x + 1)\).
Avec la règle du produit : \(f'(x) = 2x(3x+1) + x^2 \cdot 3 = 6x^2 + 2x + 3x^2 = 9x^2 + 2x\).
Vérification en développant d’abord : \(f(x) = 3x^3 + x^2\), donc \(f'(x) = 9x^2 + 2x\). ✓
Tout cela, je l’avais déjà. Leibniz l’a juste écrit avec de jolis symboles.
Les « jolis symboles » comptent, Newton. Votre notation \(\dot{x}\) est ad hoc. Ma notation \(\dfrac{dy}{dx}\) rend les règles de calcul transparentes. C’est pour cela que c’est ma notation que le monde entier utilise aujourd’hui — pas la vôtre.
Note historique : La querelle de priorité entre Newton et Leibniz (1699–1716) est l’un des conflits les plus célèbres de l’histoire des sciences. Le consensus moderne est que les deux ont inventé le calcul indépendamment — Newton en premier (1666) mais Leibniz en premier à publier (1684). La notation de Leibniz l’a emporté : \(\dfrac{dy}{dx}\), \(\displaystyle\int\), \(dx\) sont ses créations.
Ni Newton ni Leibniz n’ont défini rigoureusement la dérivée. Leurs « infiniment petits » posaient des problèmes logiques. C’est Cauchy (1821) qui donne la définition moderne — celle que vous utilisez en Première :
Exemple : pour \(f(x) = x^3\), calculons \(f'(2)\) :
Quand \(h \to 0\) : \(f'(2) = 12\). C’est aussi \(3 \times 2^2 = 12\). ✓
Remarquez : le calcul de Cauchy est exactement celui d’al-Tūsī — développer \(f(x+h) - f(x)\), diviser par \(h\), puis faire tendre \(h\) vers 0.
Au maximum, la courbe « hésite » — elle ne monte plus et ne descend pas encore. La pente de la tangente est nulle. Donc :
Et pour distinguer un maximum d’un minimum, on regarde le signe de la dérivée autour du point :
Soit \(f(x) = 12x - x^3\). Trouvons ses extremums.
Dérivée : \(f'(x) = 12 - 3x^2\)
Annulation : \(12 - 3x^2 = 0 \iff x^2 = 4 \iff x = \pm 2\)
Tableau de signes :
| \(x\) | \(-\infty\) | \(-2\) | \(2\) | \(+\infty\) | |||
|---|---|---|---|---|---|---|---|
| \(f'(x)\) | \(-\) | 0 | \(+\) | 0 | \(-\) | ||
| \(f\) | \(\searrow\) | \(-16\) | \(\nearrow\) | \(16\) | \(\searrow\) |
Maximum en \(x = 2\) : \(f(2) = 24 - 8 = 16\). C’est exactement le résultat d’al-Tūsī ! ✓
Son critère \(a \leqslant 16\) pour \(b = 12\) correspond au fait que \(x^3 + a = 12x\) a des solutions positives si et seulement si la droite \(y = a\) coupe la courbe \(y = 12x - x^3\) — c’est-à-dire si \(a\) ne dépasse pas le maximum.
Je ne connaissais ni les limites, ni les infiniment petits, ni votre notation \(\dfrac{dy}{dx}\). Mais je savais que pour trouver le sommet d’une courbe, il fallait annuler quelque chose — cette quantité qui mesure la pente. Vous l’avez appelée « dérivée ». Moi, je la calculais sans la nommer.
Et c’est la leçon profonde : les idées mathématiques ne naissent pas d’un seul coup, dans un seul esprit. Elles émergent quand un problème l’exige — les cubiques pour al-Tūsī, le mouvement des planètes pour moi, les courbes pour Leibniz. La dérivée était inévitable.
| Date | Auteur | Contribution |
|---|---|---|
| vers 1200 | Al-Tūsī (Mossoul/Iran) | Maximum des cubiques par un calcul équivalent à \(f'(x) = 0\) |
| vers 1630 | Fermat (Toulouse) | Méthode des maxima et minima (adequality) |
| 1666 | Newton (Cambridge) | Fluxions : \(\dot{y} = nx^{n-1}\dot{x}\), calcul intégral |
| 1684 | Leibniz (Hanovre) | Notation \(\dfrac{dy}{dx}\), \(\displaystyle\int\), règles du produit et du quotient |
| 1821 | Cauchy (Paris) | Définition rigoureuse par les limites |
Idée centrale : La dérivée n’est pas une invention soudaine du XVIIe siècle. Al-Tūsī calculait déjà des maxima de polynômes par un procédé équivalent, cinq siècles avant Newton. La contribution décisive de Newton et Leibniz a été de transformer un outil ponctuel en une théorie générale applicable à toutes les fonctions — et de l'équiper d’une notation puissante.