高等数学入门:上下确界及其极限形式

问题的引入: 最大值、最小值的局限性

我们先考虑一个简单的函数: \[ f(x)=x\quad x\in(0,1) \]

那么问题来了: 这个函数有没有最小值或者最大值? 答案是没有. 定义域中的严格不等式给我们制造了无法得到严格解的麻烦. 可能读者会想到, 这是个单调函数, 可以使用极限解决这个问题. 但是这样做局限性太大了. 如果我们连函数的表达式都不知道, 又要到哪个极限找“最值”呢? 我们要做的是, 找到一个数, 它描述集合的范围时, 不依赖于最大值最小值的存在, 而且它不依赖于极限.

理论基础: 实数是有序的

我们一直以来接触各种不等式, 最基本的理论依据就是, 实数的顺序. 这个顺序的意思就是大小关系. 没有顺序关系的数也是有的, 例如复数. 实数的顺序其实可以叙述成以下两点:

  1. 如果\(x\in\mathbb{R}\)而且\(y\in\mathbb{R}\), 那么下面三个关系有且仅有一个成立 \[ x<y\quad x=y\quad y<x \]
  2. 如果\(x,y,z\in\mathbb{R}\), 而且有\(x<y\)\(y<z\), 那么\(x<z\)

至于“\(\leq\)”,应该理解成小于或等于, “或”的意思在这里是并没有强调哪个一定成立.

确界的定义

我们接下来只讨论上界. 也就是说, 我们只讨论小于的情况. 至于另一侧, 将小于号换成大于号即可.

什么叫有上界

取集合\(E\subset\mathbb{R}\), 如果存在\(\beta\in\mathbb{R}\)使得对任意\(x\in{E}\)满足不等式\(x\leq\beta\), 那么就称\(E\)有上界, \(\beta\)就是\(E\)的一个上界.

这其实就是一个存在命题. 只要满足就够了. 满足之后呢? 没有然后了. 剩下的细节在这里不重要. 这和极限很类似. 一个很简单的例子: \((-\infty,1]\)就是有上界的. 而且任意的上界\(\beta\)都满足\(\beta\in[1,+\infty)\).

上确界: 最小的上界

有的时候, 我们需要知道一个严格最小的上界, 这就是上确界. 首先, 我们给出上确界的定义.

对于有上界的集合\(E\), 假设存在一个\(\alpha\in\mathbb{R}\)满足以下条件, 那么就称它为\(E\)的上确界, 记作\(\alpha=\sup{E}\):

  • \(\alpha\)\(E\)的一个上界

  • 如果\(\gamma<\alpha\), 那么\(\gamma\)不是\(E\)的上界

下确界可以通过相反的不等式进行确定, 记作\(\alpha=\inf{E}\). 当然\(\sup\)\(\inf\)后面也不一定要跟一个集合, 也可以跟一个函数或者数列. 回到开头的那个函数, 我们能很容易得到 \[ \sup{f(x)}=1\quad\inf{f(x)}=0 \]

这时我们不再依赖于极限, 也可以发现, 如果函数的最大值或最小值存在, 那么它一定等于上确界或下确界, 但是上下确界存在时, 最值不一定存在. 在函数最值不存在时, 我们仍然能利用确界对函数的范围进行严格的分析, 而且不一定需要求极限, 这体现了上下确界的价值所在. 在这里建议读者写几个函数, 再试着求以下上下确界.

确界的极限形式(上极限、下极限)

数列形式

\(\{a_n\}\)\(\mathbb{R}\)里的一个数列, 并且定义 \[ b_k=\sup\{a_k,a_{k+1},a_{k+2},\cdots\} \]

再定义 \[ \beta=\inf\{b_1,b_2,b_3,\cdots\} \]

那么就有 \[ \beta=\limsup_{n\to\infty}a_n \]

这就完成了上极限的定义. 而下极限的求法就是将上面的上确界、下确界交换顺序即可. 可是这里为什么出现了极限符号? 这是因为 \[ b_1\geq b_2\geq b_3\geq\cdots\geq\beta \]

所以有 \[ \lim\limits_{k\to\infty}b_k=\beta \]

此外,\(\{a_n\}\)中有一个子列\(\{a_{n_i}\}\)收敛于\(\beta\), 而且\(\beta\)是具有这个性质最大的数.

这其实还是解决了一件事情, 如果一个数列发散, 我们还是有可能利用上下确界的极限形式来研究极限的一些性质. 一个很简单的例子比如 \[ \limsup_{n\to\infty}{(-1)^n}=1\quad\liminf_{n\to\infty}{(-1)^n}=-1 \]

函数形式

函数中上下极限的求法其实和数列形式是非常类似的. 我们先举一个上极限的例子, 理解构建过程时也可以利用这个例子: \[ \limsup_{x\to{0}}\sin\frac{1}{x}=1 \]

对于函数, 值域可能是连续集合. 求\(x\to{a}\)时的上极限, 我们先求出\(x\to{a}\)时, \(f(x)\)的上确界构成的集合 \[ U=\{y|y=\sup\{f(x)|x\in(a-\varepsilon,a+\varepsilon)\}\} \]

那么上极限就是 \[ \limsup_{x\to{a}}f(x)=\inf{U} \]

总结

我们单纯利用不等式, 建立起一个非常严格,也非常有应用价值的概念: 确界. 这个概念源于最值, 又高于最值. 当然确界和最值什么时候相等又是一个拓扑学问题. 这又是另外一个话题了.

洛必达法则的几种不同的证明

前言

洛必达法则我想甚至不少高中生甚至初中生都听说过,知道怎么进行简单的应用。简单点说,处理\(\frac{0}{0}\)的函数时,对上下进行求导,可能会很大程度上简化计算。但是洛必达法则为什么能奏效? 能不能用严格的数理语言进行论证? 这是这篇文章需要解决的。

本博文于2022年10月4日对利用中值定理的证明进行了重新编排。编排的过程中发现最后两步在之前其实是没解释清楚的,甚至存在错误。

洛必达法则的完整论述

\(f\)\(g\)\((a,b)\)上的实可微函数,且在\((a,b)\)区间上总有\(g'(x) \ne 0\). 设

\[ \frac{f'(x)}{g'(x)} \to A \quad (x \to a). \]

\[ f(x) \to 0, g(x) \to 0 \quad (x \to a) \]

或仅有

\[ g(x) \to \pm \infty \quad (x \to a) \]

\[ \frac{f(x)}{g(x)} \to A \quad (x \to a). \]

其中\(x \to a\)自然也可以换成\(x \to b\). 这里把发散到无穷也看作是极限,也就是说\(-\infty \le A \le \infty\)\(-\infty \le a < b \le +\infty\).

证明1:线性近似

波努利最开始的”证明”

洛必达法则首次出现于1696年洛必达的 Analyse des Infiniment Petits pour l'Intelligence des Lignes Courbes 一书中。这本书当然以”洛必达法则”闻名于世。证明是这样完成的: \[ \frac{f(a+dx)}{g(a+dx)}=\frac{f(a)+f’(a)dx}{g(a)+g’(a)dx}=\frac{f’(a)dx}{g’(a)dx}=\frac{f’(a)}{g’(a)} \]

这个证明很好理解,线性近似展开,再考虑到\(f(a)=g(a)=0\)就得到结果。但是这个做法肯定是不合适的,\(dx\)在这里非常模糊,也不方便表达\(x\to\infty\)的情况。关于历史内容可以参见 The Historical Development of the Calculus 一书。

线性近似的严格证明

首先,这里只讨论\(h\to0\)的情况。实际上,对于其他情况,可以作换元。例如\(h\to\infty\)时,可以利用\(u=\frac{1}{h}\),那么又转换成了\(u\to0\)的情况。另外我们只讨论函数趋近于\(0\)的情况。因为趋近于无穷时函数的线性近似可能无法处理。例如\(y=\frac{1}{x}\)\(x=0\)附近是没有近似的。

对函数导数有

\[ f'(x) = \lim_{h\to 0} \frac{f(x+h)-f(x)}{h}, \]

我们可以写成

\[ f'(x) = \frac{f(x+h)-f(x)}{h} + r(h) \]

其中\(\lim\limits_{h\to0}r(h)=0\),且\(r(h)\)为连续函数。进行代数变形(这里\(r(h)\)的正负进行了调整),我们的得到线性近似

\[ f(x+h)=f(x)+f'(x)h+r(h)h \]

同样可以写出\(g(x)\)的线性近似

\[ g(x+h)=g(x)+g'(x)h+s(h)h \]

那么就能得到

\[ \frac{f(a+h)}{g(a+h)}=\frac{f(a)+f'(a)h+r(h)h}{g(a)+g'(a)h+s(h)h}=\frac{f'(a)h+r(h)h}{g'(a)h+s(h)h}=\frac{f'(a)+r(h)}{g'(a)+s(h)} \]

\(h\to0\)时,\(r(h)\to0\)\(s(h)\to0\),故得到了结论。

证明2:中值定理

这个证明中,我们会利用柯西中值定理(GMVT)对所有的情况进行完整的证明,这期间涉及到一些不等式运算技巧。证明来自W. Rudin的 Principles Of Mathematical Analysis,我会在其中加上一些额外的解释。关于\(g(x) \to \pm\infty\)的情况,我们在此只讨论\(+\infty\).

情况1: \(-\infty\leq{A}<+\infty\)

选取实数\(q>A\),再选取\(\varepsilon>0\)使得\(A+\varepsilon<q\). 因为\(\frac{f(x)}{g(x)}\to{A}\),根据极限的定义,必定有实数\(\delta\in(0,b-a)\),使得对于所有\(a<x<a+\delta\),始终有\(-\varepsilon<\frac{f'(x)}{g'(x)}-A<\varepsilon\). 也就是说

\[ \frac{f'(x)}{g'(x)}<A+\varepsilon. \]

对任意\(a<x<y<a+\delta\),由GMVT可知,存在\(t\in(x,y)\)使得不等式(A)成立:

\[ \frac{f(x)-f(y)}{g(x)-g(y)}=\frac{f'(t)}{g'(t)}<A+\varepsilon \]

最后一个不等式成立是因为\(t\in(x,y)\subset(a,a+\delta)\),而在\((a,a+\delta)\)中这个不等式成立。接下来,我们根据\(g(x)\)\(x \to a\)时的取值,分别讨论,会发现结果其实类似。

情况1.1: \(g(x)\to 0\)\(f(x) \to 0\)

在不等式(A)中,令\(x \to a\),会发现有不等式(B)成立:

\[ \frac{0-f(y)}{0-g(y)}=\frac{f(y)}{g(y)}=\frac{f'(t)}{g'(t)} \leq A+\varepsilon<q \]

更正式地说,对任意的\(q>A\), \(0<\varepsilon<q-A\),都存在\(\delta>0\),使得对任意的\(a<y<a+\delta\),均满足不等式(B)

\[ \frac{f(y)}{g(y)} \le A+\varepsilon<q. \]

(注意:我们这里并没有证明收敛,而只证明了收敛的一半,接下来的情况1.2也是类似的。在接下来我们不刻意地写\(\delta\),而是写成指定存在的实数,这样的写法是等价的,虽然初学微积分时可能会比较陌生。)

情况1.2: \(g(x)\to+\infty\)

固定不等式(A)中的\(y\). 因为\(g(x) \to +\infty\),在\((a,y)\)一定存在\(c_1\)使得对于任意\(a<x<c_1\),总是有\(g(x)>g(y)\)\(g(x)>0\)同时成立。将不等式(A)两边同时乘以\([g(x)-g(y)]/g(x)\),我们得到

\[ \frac{f(x)-f(y)}{g(x)-g(y)}\frac{g(x)-g(y)}{g(x)}< (A+\varepsilon)\frac{g(x)-g(y)}{g(x)}. \]

此即

\[ \frac{f(x)}{g(x)}<(A+\varepsilon)\left(1-\frac{g(y)}{g(x)}\right) +\frac{f(y)}{g(x)} \quad (a<x<c_1). \]

根据\(g(x) \to +\infty\)的定义,存在\(c_2 \in (a,c_1)\)使得不等式(D)成立:

\[ \frac{f(x)}{g(x)} < A+\varepsilon<q. \]

情况1.1和1.2的整合

不等式(B)和(D)都只说明,存在\(c\in(a,b)\)使得对于所有\(x\in(a,c)\),满足\(\frac{f(x)}{g(x)}<q\).但是\(\frac{f(x)}{g(x)}\)\(A\)的关系并不知道。但是,如果\(A=-\infty\),那么我们已经证明了\(\frac{f(x)}{g(x)} \to -\infty\)的成立。

情况2: \(-\infty<{A}\leq+\infty\)

这个情况是和情况1完全类似的。同理可证,对任意\(p\),当且仅当\(p<A\)时,总有\(c'\in(a,b)\),使得对于所有\(x\in(a,c')\),满足\(p<\frac{f(x)}{g(x)}\). 如果\(A=+\infty\),那么我们已经证明了\(\frac{f(x)}{g(x)} \to +\infty\)的情况。

除去\(A=\pm\infty\),综合情况1和2,我们发现,对任意的\(p,q\)满足\(p<A<q\),若取\(c_0=\min\{c,c'\}\),则对于任意\(x \in (a,c_0)\),一定有

\[ p<\frac{f(x)}{g(x)}<q. \]

这其实就等价于\(\lim_{x \to a}\frac{f(x)}{g(x)}=A\). \(\square\)

证明中几个小问题

不等式(A)第一项的分母为什么一定有意义?

假设它无意义。如果有\(g(x)=g(y)\),那么有\({x}<t<y\)使得\(g'(t)=0\),此时不满足

\[ f'(t)/g'(t)<A+\varepsilon. \]

也就不满足\(f'(t)/g'(t) \to A\),与原假设冲突。

不等式(B)中为什么变成小于等于?

每次改变\(x\)\(t\)也发生改变,记为\(t(x)\),此时可能有\(\lim\limits_{x\to{a}}\frac{f'(t(x))}{g'(t(x))}=r\).