La dérivée avant la dérivée — Al-Tūsī, Newton et Leibniz

Mossoul, vers 1200. Cambridge, 1666. Hanovre, 1684. Un journaliste imaginaire réunit trois mathématiciens que cinq siècles séparent. Le premier cherche les extremums d’une cubique sans le savoir. Le deuxième invente les « fluxions ». Le troisième crée la notation que nous utilisons encore aujourd’hui. Ensemble, ils racontent l’invention de la dérivée.

Note liminaire : Tout ce qui suit est une fiction narrative. Les résultats mathématiques sont documentés ; la conversation est inventée. Al-Tūsī, Newton et Leibniz ne se sont jamais rencontrés.

Acte I — Le problème d’al-Tūsī : quand une cubique a-t-elle des solutions ?

Journaliste : Al-Tūsī, vous travaillez sur les équations cubiques au XII^e siècle. Quel problème vous occupe ?

Sharaf al-Dīn al-Tūsī (Tus, Iran, vers 1135 – vers 1213)

Al-Khayyām, un siècle avant moi, a classé toutes les équations cubiques et les a résolues géométriquement par intersection de coniques. Mais il ne pouvait pas toujours dire à l’avance si une équation avait des solutions positives ou non.

Moi, je veux un critère. Prenons l'équation :

$$x^3 + a = bx$$

Elle a des solutions positives si et seulement si le membre de droite $bx$ peut « rattraper » le membre de gauche $x^3 + a$. Autrement dit, il faut que la courbe $f(x) = bx - x^3$ monte assez haut pour atteindre la valeur $a$.

La question devient : quel est le maximum de $f(x) = bx - x^3$ ?

Le calcul d’al-Tūsī — détaillé pas à pas

Al-Tūsī cherche le maximum de $f(x) = bx - x^3$ sur les réels positifs.

Étape 1 — Comparer $f(x)$ et $f(x + h)$.

Si $f$ atteint son maximum en $x_0$, alors pour tout petit déplacement $h$, on doit avoir $f(x_0 + h) \leqslant f(x_0)$, c’est-à-dire $f(x_0 + h) - f(x_0) \leqslant 0$.

Calculons cette différence :

$$f(x+h) - f(x) = b(x+h) - (x+h)^3 - bx + x^3$$

Développons $(x+h)^3 = x^3 + 3x^2h + 3xh^2 + h^3$ :

$$f(x+h) - f(x) = bh - 3x^2h - 3xh^2 - h^3 = h\big(b - 3x^2 - 3xh - h^2\big)$$

Étape 2 — Quand $h$ est très petit.

Si $h$ est petit, les termes $3xh$ et $h^2$ deviennent négligeables. Le signe de $f(x+h) - f(x)$ dépend de :

$$b - 3x^2$$

C’est exactement ce que vous appelez aujourd’hui la dérivée $f'(x) = b - 3x^2$.

Étape 3 — Trouver le maximum.

Le maximum est atteint quand cette expression s’annule :

$$b - 3x_0^2 = 0 \quad \Longrightarrow \quad x_0 = \sqrt{\frac{b}{3}}$$

Et la valeur du maximum est :

$$f(x_0) = b\sqrt{\frac{b}{3}} - \left(\sqrt{\frac{b}{3}}\right)^3 = \frac{2b}{3}\sqrt{\frac{b}{3}}$$

Étape 4 — Le critère.

L'équation $x^3 + a = bx$ a des solutions positives si et seulement si :

$$\boxed{a \leqslant \frac{2b}{3}\sqrt{\frac{b}{3}}}$$

C’est un discriminant pour les cubiques — l’analogue de $\Delta = b^2 - 4ac$ pour les quadratiques.

Interlude — Exemple numérique

L'équation $x^3 + 2 = 12x$ a-t-elle des solutions positives ?

Ici $a = 2$, $b = 12$. Le maximum de $f(x) = 12x - x^3$ :

$$x_0 = \sqrt{\frac{12}{3}} = 2 \qquad f(2) = 24 - 8 = 16$$

Or $a = 2 \leqslant 16$ : oui, l'équation a des solutions. ✓

Vérification : $f(x) = 12x - x^3 - 2$. On teste $x = 1$ : $12 - 1 - 2 = 9 > 0$. Et $x = 4$ : $48 - 64 - 2 = -18 < 0$. Par le théorème des valeurs intermédiaires, il y a bien une racine entre 1 et 4.

Al-Tūsī

Je n’ai jamais écrit le symbole $f'(x)$. Je n’ai pas le concept de « dérivée » au sens où vous l’entendez. Mais j’ai fait exactement le même calcul : développer $f(x+h) - f(x)$, ignorer les termes en $h^2$ et plus, et trouver où le terme restant s’annule. C’est la dérivée sans le mot.

Note historique : L’interprétation du travail d’al-Tūsī fait débat parmi les historiens. Roshdi Rashed considère qu’il utilise systématiquement une forme de dérivation. D’autres historiens notent qu’il n’explicite jamais l’expression de la dérivée en tant que telle. Ce qui est certain, c’est qu’il trouve les maxima des polynômes par un calcul équivalent à l’annulation de la dérivée.
Sources : Roshdi Rashed, Sharaf al-Dīn al-Tūsī, Œuvres mathématiques, 1986 ; Sinaceur, 1990 (Zotero) ; Hogendijk, « Le calcul du maximum et la dérivée selon al-Tūsī », HAL, 2008.

Acte II — Newton et les fluxions (1666)

Journaliste : Newton, vous inventez le calcul différentiel en 1666, pendant la peste. Qu’est-ce qu’une « fluxion » ?

Isaac Newton (Woolsthorpe, 1643 – Londres, 1727)

Je pense aux grandeurs comme des quantités qui coulent — qui varient continûment dans le temps. Si $x$ change avec le temps, sa vitesse de changement est sa fluxion, que je note $\dot{x}$. Pour une fonction $y = x^n$, la fluxion est :

$$\dot{y} = n x^{n-1} \dot{x}$$

C’est ce que vous appelez aujourd’hui $\dfrac{dy}{dx} = nx^{n-1}$.

Le raisonnement de Newton — détaillé

Newton part de $y = x^n$ et considère un accroissement infiniment petit $o$ de $x$ :

$$y + \dot{y}\,o = (x + \dot{x}\,o)^n$$

Il développe par le binôme :

$$(x + \dot{x}\,o)^n = x^n + n x^{n-1} \dot{x}\,o + \underbrace{\text{termes en } o^2, o^3, \ldots}_{\text{négligeables}}$$

En soustrayant $y = x^n$ et en divisant par $o$ :

$$\dot{y} = n x^{n-1} \dot{x}$$

En « posant $\dot{x} = 1$ » (c’est-à-dire en prenant $x$ comme variable indépendante) :

$$\boxed{\frac{dy}{dx} = nx^{n-1}}$$

C’est la formule de dérivation des puissances, fondement de tout le calcul.

Al-Tūsī (songeur)

Votre raisonnement est proche du mien. Moi aussi, je calculais $f(x+h) - f(x)$ et je négligeais les puissances supérieures de $h$. La différence, c’est que vous avez généralisé : votre méthode s’applique à toute fonction, pas seulement aux polynômes.

Note historique : Newton développe ses fluxions en 1665–1666 (les annus mirabiles, pendant la peste de Londres) mais ne publie qu’en 1704. Ce retard sera au cœur de la querelle de priorité avec Leibniz.

Acte III — Leibniz et la notation (1684)

Journaliste : Leibniz, vous publiez votre calcul différentiel en 1684 — vingt ans après Newton. Qu’apportez-vous de différent ?

Gottfried Wilhelm Leibniz (Leipzig, 1646 – Hanovre, 1716)

Newton a les idées, mais sa notation est obscure. Ses « fluxions » et ses $\dot{x}$ sont liés au temps, ce qui est gênant quand on étudie la géométrie ou l’algèbre.

Moi, j’invente une notation algébrique. Je note $dx$ un accroissement infiniment petit de $x$, et $dy$ l’accroissement correspondant de $y$. Le rapport :

$$\frac{dy}{dx}$$

est la dérivée. C’est un symbole, pas une division — mais il se comporte comme une division dans les calculs, ce qui le rend extraordinairement maniable.

Les règles de Leibniz

Leibniz établit les règles fondamentales que vous utilisez en Première :

Dérivée d’une somme :

$$d(u + v) = du + dv \qquad \Longrightarrow \qquad (u + v)' = u' + v'$$

Dérivée d’un produit :

$$d(uv) = u\,dv + v\,du \qquad \Longrightarrow \qquad (uv)' = u'v + uv'$$

Dérivée d’un quotient :

$$d\!\left(\frac{u}{v}\right) = \frac{v\,du - u\,dv}{v^2} \qquad \Longrightarrow \qquad \left(\frac{u}{v}\right)' = \frac{u'v - uv'}{v^2}$$

Vérification sur un exemple : $f(x) = x^2 \cdot (3x + 1)$.

Avec la règle du produit : $f'(x) = 2x(3x+1) + x^2 \cdot 3 = 6x^2 + 2x + 3x^2 = 9x^2 + 2x$.

Vérification en développant d’abord : $f(x) = 3x^3 + x^2$, donc $f'(x) = 9x^2 + 2x$. ✓

Newton (agacé)

Tout cela, je l’avais déjà. Leibniz l’a juste écrit avec de jolis symboles.

Leibniz

Les « jolis symboles » comptent, Newton. Votre notation $\dot{x}$ est ad hoc. Ma notation $\dfrac{dy}{dx}$ rend les règles de calcul transparentes. C’est pour cela que c’est ma notation que le monde entier utilise aujourd’hui — pas la vôtre.

Note historique : La querelle de priorité entre Newton et Leibniz (1699–1716) est l’un des conflits les plus célèbres de l’histoire des sciences. Le consensus moderne est que les deux ont inventé le calcul indépendamment — Newton en premier (1666) mais Leibniz en premier à publier (1684). La notation de Leibniz l’a emporté : $\dfrac{dy}{dx}$, $\displaystyle\int$, $dx$ sont ses créations.

Interlude mathématique — La dérivée rigoureuse (Cauchy, 1821)

Ni Newton ni Leibniz n’ont défini rigoureusement la dérivée. Leurs « infiniment petits » posaient des problèmes logiques. C’est Cauchy (1821) qui donne la définition moderne — celle que vous utilisez en Première :

$$f'(a) = \lim_{h \to 0} \frac{f(a+h) - f(a)}{h}$$

Exemple : pour $f(x) = x^3$, calculons $f'(2)$ :

$$\frac{f(2+h) - f(2)}{h} = \frac{(2+h)^3 - 8}{h} = \frac{8 + 12h + 6h^2 + h^3 - 8}{h} = 12 + 6h + h^2$$

Quand $h \to 0$ : $f'(2) = 12$. C’est aussi $3 \times 2^2 = 12$. ✓

Remarquez : le calcul de Cauchy est exactement celui d’al-Tūsī — développer $f(x+h) - f(x)$, diviser par $h$, puis faire tendre $h$ vers 0.

Acte IV — Variations et extremums : le lien

Journaliste : Revenons à la question d’al-Tūsī — trouver le maximum d’une fonction. Comment la dérivée répond-elle à cette question ?

Newton

Au maximum, la courbe « hésite » — elle ne monte plus et ne descend pas encore. La pente de la tangente est nulle. Donc :

$$\text{Si } f \text{ a un extremum en } a, \text{ alors } f'(a) = 0$$

Leibniz

Et pour distinguer un maximum d’un minimum, on regarde le signe de la dérivée autour du point :

$f'$ passe de $+$ à $-$ : la fonction monte puis descend → maximum
$f'$ passe de $-$ à $+$ : la fonction descend puis monte → minimum

Exemple complet — la cubique d’al-Tūsī revisitée

Soit $f(x) = 12x - x^3$. Trouvons ses extremums.

Dérivée : $f'(x) = 12 - 3x^2$

Annulation : $12 - 3x^2 = 0 \iff x^2 = 4 \iff x = \pm 2$

Tableau de signes :

$x$	$-\infty$		$-2$		$2$		$+\infty$
$f'(x)$		$-$	0	$+$	0	$-$
$f$		$\searrow$	$-16$	$\nearrow$	$16$	$\searrow$

Maximum en $x = 2$ : $f(2) = 24 - 8 = 16$. C’est exactement le résultat d’al-Tūsī ! ✓

Son critère $a \leqslant 16$ pour $b = 12$ correspond au fait que $x^3 + a = 12x$ a des solutions positives si et seulement si la droite $y = a$ coupe la courbe $y = 12x - x^3$ — c’est-à-dire si $a$ ne dépasse pas le maximum.

Acte V — L’héritage

Al-Tūsī

Je ne connaissais ni les limites, ni les infiniment petits, ni votre notation $\dfrac{dy}{dx}$. Mais je savais que pour trouver le sommet d’une courbe, il fallait annuler quelque chose — cette quantité qui mesure la pente. Vous l’avez appelée « dérivée ». Moi, je la calculais sans la nommer.

Newton

Et c’est la leçon profonde : les idées mathématiques ne naissent pas d’un seul coup, dans un seul esprit. Elles émergent quand un problème l’exige — les cubiques pour al-Tūsī, le mouvement des planètes pour moi, les courbes pour Leibniz. La dérivée était inévitable.

Épilogue — Chronologie

Date	Auteur	Contribution
vers 1200	Al-Tūsī (Mossoul/Iran)	Maximum des cubiques par un calcul équivalent à $f'(x) = 0$
vers 1630	Fermat (Toulouse)	Méthode des maxima et minima (adequality)
1666	Newton (Cambridge)	Fluxions : $\dot{y} = nx^{n-1}\dot{x}$, calcul intégral
1684	Leibniz (Hanovre)	Notation $\dfrac{dy}{dx}$, $\displaystyle\int$, règles du produit et du quotient
1821	Cauchy (Paris)	Définition rigoureuse par les limites

Idée centrale : La dérivée n’est pas une invention soudaine du XVII^e siècle. Al-Tūsī calculait déjà des maxima de polynômes par un procédé équivalent, cinq siècles avant Newton. La contribution décisive de Newton et Leibniz a été de transformer un outil ponctuel en une théorie générale applicable à toutes les fonctions — et de l'équiper d’une notation puissante.

Sources

Roshdi Rashed, Sharaf al-Dīn al-Tūsī, Œuvres mathématiques. Algèbre et géométrie au XII^e siècle, Les Belles Lettres, 1986.
Sinaceur, recension de Rashed 1986, 1990 (Zotero : Sinaceur – 1990).
Jan P. Hogendijk, « Le calcul du maximum et la « dérivée » selon Sharaf al-Dīn al-Tūsī », HAL, 2008.
Victor J. Katz, A History of Mathematics: An Introduction, 3^e éd., Addison-Wesley, 2009.
J. J. O’Connor et E. F. Robertson, « Sharaf al-Din al-Tusi », MacTutor History of Mathematics.

Cet article est une fiction narrative à visée pédagogique. Les résultats mathématiques sont documentés ; la conversation est inventée. La dérivation est au programme de Première spécialité (chapitres 4 et 5). L’interprétation du travail d’al-Tūsī comme proto-dérivation fait l’objet d’un débat académique ; les deux points de vue sont présentés dans l’article.

\(x\)	\(-\infty\)		\(-2\)		\(2\)		\(+\infty\)
\(f'(x)\)		\(-\)	0	\(+\)	0	\(-\)
\(f\)		\(\searrow\)	\(-16\)	\(\nearrow\)	\(16\)	\(\searrow\)