洛必达法则的几种不同的证明

前言

洛必达法则我想甚至不少高中生甚至初中生都听说过,知道怎么进行简单的应用。简单点说,处理\(\frac{0}{0}\)的函数时,对上下进行求导,可能会很大程度上简化计算。但是洛必达法则为什么能奏效? 能不能用严格的数理语言进行论证? 这是这篇文章需要解决的。

本博文于2022年10月4日对利用中值定理的证明进行了重新编排。编排的过程中发现最后两步在之前其实是没解释清楚的,甚至存在错误。

洛必达法则的完整论述

\(f\)\(g\)\((a,b)\)上的实可微函数,且在\((a,b)\)区间上总有\(g'(x) \ne 0\). 设

\[ \frac{f'(x)}{g'(x)} \to A \quad (x \to a). \]

\[ f(x) \to 0, g(x) \to 0 \quad (x \to a) \]

或仅有

\[ g(x) \to \pm \infty \quad (x \to a) \]

\[ \frac{f(x)}{g(x)} \to A \quad (x \to a). \]

其中\(x \to a\)自然也可以换成\(x \to b\). 这里把发散到无穷也看作是极限,也就是说\(-\infty \le A \le \infty\)\(-\infty \le a < b \le +\infty\).

证明1:线性近似

波努利最开始的”证明”

洛必达法则首次出现于1696年洛必达的 Analyse des Infiniment Petits pour l'Intelligence des Lignes Courbes 一书中。这本书当然以”洛必达法则”闻名于世。证明是这样完成的: \[ \frac{f(a+dx)}{g(a+dx)}=\frac{f(a)+f’(a)dx}{g(a)+g’(a)dx}=\frac{f’(a)dx}{g’(a)dx}=\frac{f’(a)}{g’(a)} \]

这个证明很好理解,线性近似展开,再考虑到\(f(a)=g(a)=0\)就得到结果。但是这个做法肯定是不合适的,\(dx\)在这里非常模糊,也不方便表达\(x\to\infty\)的情况。关于历史内容可以参见 The Historical Development of the Calculus 一书。

线性近似的严格证明

首先,这里只讨论\(h\to0\)的情况。实际上,对于其他情况,可以作换元。例如\(h\to\infty\)时,可以利用\(u=\frac{1}{h}\),那么又转换成了\(u\to0\)的情况。另外我们只讨论函数趋近于\(0\)的情况。因为趋近于无穷时函数的线性近似可能无法处理。例如\(y=\frac{1}{x}\)\(x=0\)附近是没有近似的。

对函数导数有

\[ f'(x) = \lim_{h\to 0} \frac{f(x+h)-f(x)}{h}, \]

我们可以写成

\[ f'(x) = \frac{f(x+h)-f(x)}{h} + r(h) \]

其中\(\lim\limits_{h\to0}r(h)=0\),且\(r(h)\)为连续函数。进行代数变形(这里\(r(h)\)的正负进行了调整),我们的得到线性近似

\[ f(x+h)=f(x)+f'(x)h+r(h)h \]

同样可以写出\(g(x)\)的线性近似

\[ g(x+h)=g(x)+g'(x)h+s(h)h \]

那么就能得到

\[ \frac{f(a+h)}{g(a+h)}=\frac{f(a)+f'(a)h+r(h)h}{g(a)+g'(a)h+s(h)h}=\frac{f'(a)h+r(h)h}{g'(a)h+s(h)h}=\frac{f'(a)+r(h)}{g'(a)+s(h)} \]

\(h\to0\)时,\(r(h)\to0\)\(s(h)\to0\),故得到了结论。

证明2:中值定理

这个证明中,我们会利用柯西中值定理(GMVT)对所有的情况进行完整的证明,这期间涉及到一些不等式运算技巧。证明来自W. Rudin的 Principles Of Mathematical Analysis,我会在其中加上一些额外的解释。关于\(g(x) \to \pm\infty\)的情况,我们在此只讨论\(+\infty\).

情况1: \(-\infty\leq{A}<+\infty\)

选取实数\(q>A\),再选取\(\varepsilon>0\)使得\(A+\varepsilon<q\). 因为\(\frac{f(x)}{g(x)}\to{A}\),根据极限的定义,必定有实数\(\delta\in(0,b-a)\),使得对于所有\(a<x<a+\delta\),始终有\(-\varepsilon<\frac{f'(x)}{g'(x)}-A<\varepsilon\). 也就是说

\[ \frac{f'(x)}{g'(x)}<A+\varepsilon. \]

对任意\(a<x<y<a+\delta\),由GMVT可知,存在\(t\in(x,y)\)使得不等式(A)成立:

\[ \frac{f(x)-f(y)}{g(x)-g(y)}=\frac{f'(t)}{g'(t)}<A+\varepsilon \]

最后一个不等式成立是因为\(t\in(x,y)\subset(a,a+\delta)\),而在\((a,a+\delta)\)中这个不等式成立。接下来,我们根据\(g(x)\)\(x \to a\)时的取值,分别讨论,会发现结果其实类似。

情况1.1: \(g(x)\to 0\)\(f(x) \to 0\)

在不等式(A)中,令\(x \to a\),会发现有不等式(B)成立:

\[ \frac{0-f(y)}{0-g(y)}=\frac{f(y)}{g(y)}=\frac{f'(t)}{g'(t)} \leq A+\varepsilon<q \]

更正式地说,对任意的\(q>A\), \(0<\varepsilon<q-A\),都存在\(\delta>0\),使得对任意的\(a<y<a+\delta\),均满足不等式(B)

\[ \frac{f(y)}{g(y)} \le A+\varepsilon<q. \]

(注意:我们这里并没有证明收敛,而只证明了收敛的一半,接下来的情况1.2也是类似的。在接下来我们不刻意地写\(\delta\),而是写成指定存在的实数,这样的写法是等价的,虽然初学微积分时可能会比较陌生。)

情况1.2: \(g(x)\to+\infty\)

固定不等式(A)中的\(y\). 因为\(g(x) \to +\infty\),在\((a,y)\)一定存在\(c_1\)使得对于任意\(a<x<c_1\),总是有\(g(x)>g(y)\)\(g(x)>0\)同时成立。将不等式(A)两边同时乘以\([g(x)-g(y)]/g(x)\),我们得到

\[ \frac{f(x)-f(y)}{g(x)-g(y)}\frac{g(x)-g(y)}{g(x)}< (A+\varepsilon)\frac{g(x)-g(y)}{g(x)}. \]

此即

\[ \frac{f(x)}{g(x)}<(A+\varepsilon)\left(1-\frac{g(y)}{g(x)}\right) +\frac{f(y)}{g(x)} \quad (a<x<c_1). \]

根据\(g(x) \to +\infty\)的定义,存在\(c_2 \in (a,c_1)\)使得不等式(D)成立:

\[ \frac{f(x)}{g(x)} < A+\varepsilon<q. \]

情况1.1和1.2的整合

不等式(B)和(D)都只说明,存在\(c\in(a,b)\)使得对于所有\(x\in(a,c)\),满足\(\frac{f(x)}{g(x)}<q\).但是\(\frac{f(x)}{g(x)}\)\(A\)的关系并不知道。但是,如果\(A=-\infty\),那么我们已经证明了\(\frac{f(x)}{g(x)} \to -\infty\)的成立。

情况2: \(-\infty<{A}\leq+\infty\)

这个情况是和情况1完全类似的。同理可证,对任意\(p\),当且仅当\(p<A\)时,总有\(c'\in(a,b)\),使得对于所有\(x\in(a,c')\),满足\(p<\frac{f(x)}{g(x)}\). 如果\(A=+\infty\),那么我们已经证明了\(\frac{f(x)}{g(x)} \to +\infty\)的情况。

除去\(A=\pm\infty\),综合情况1和2,我们发现,对任意的\(p,q\)满足\(p<A<q\),若取\(c_0=\min\{c,c'\}\),则对于任意\(x \in (a,c_0)\),一定有

\[ p<\frac{f(x)}{g(x)}<q. \]

这其实就等价于\(\lim_{x \to a}\frac{f(x)}{g(x)}=A\). \(\square\)

证明中几个小问题

不等式(A)第一项的分母为什么一定有意义?

假设它无意义。如果有\(g(x)=g(y)\),那么有\({x}<t<y\)使得\(g'(t)=0\),此时不满足

\[ f'(t)/g'(t)<A+\varepsilon. \]

也就不满足\(f'(t)/g'(t) \to A\),与原假设冲突。

不等式(B)中为什么变成小于等于?

每次改变\(x\)\(t\)也发生改变,记为\(t(x)\),此时可能有\(\lim\limits_{x\to{a}}\frac{f'(t(x))}{g'(t(x))}=r\).