高等数学入门:上下确界及其极限形式

问题的引入: 最大值、最小值的局限性

我们先考虑一个简单的函数: \[ f(x)=x\quad x\in(0,1) \]

那么问题来了: 这个函数有没有最小值或者最大值? 答案是没有. 定义域中的严格不等式给我们制造了无法得到严格解的麻烦. 可能读者会想到, 这是个单调函数, 可以使用极限解决这个问题. 但是这样做局限性太大了. 如果我们连函数的表达式都不知道, 又要到哪个极限找“最值”呢? 我们要做的是, 找到一个数, 它描述集合的范围时, 不依赖于最大值最小值的存在, 而且它不依赖于极限.

理论基础: 实数是有序的

我们一直以来接触各种不等式, 最基本的理论依据就是, 实数的顺序. 这个顺序的意思就是大小关系. 没有顺序关系的数也是有的, 例如复数. 实数的顺序其实可以叙述成以下两点:

  1. 如果\(x\in\mathbb{R}\)而且\(y\in\mathbb{R}\), 那么下面三个关系有且仅有一个成立 \[ x<y\quad x=y\quad y<x \]
  2. 如果\(x,y,z\in\mathbb{R}\), 而且有\(x<y\)\(y<z\), 那么\(x<z\)

至于“\(\leq\)”,应该理解成小于或等于, “或”的意思在这里是并没有强调哪个一定成立.

确界的定义

我们接下来只讨论上界. 也就是说, 我们只讨论小于的情况. 至于另一侧, 将小于号换成大于号即可.

什么叫有上界

取集合\(E\subset\mathbb{R}\), 如果存在\(\beta\in\mathbb{R}\)使得对任意\(x\in{E}\)满足不等式\(x\leq\beta\), 那么就称\(E\)有上界, \(\beta\)就是\(E\)的一个上界.

这其实就是一个存在命题. 只要满足就够了. 满足之后呢? 没有然后了. 剩下的细节在这里不重要. 这和极限很类似. 一个很简单的例子: \((-\infty,1]\)就是有上界的. 而且任意的上界\(\beta\)都满足\(\beta\in[1,+\infty)\).

上确界: 最小的上界

有的时候, 我们需要知道一个严格最小的上界, 这就是上确界. 首先, 我们给出上确界的定义.

对于有上界的集合\(E\), 假设存在一个\(\alpha\in\mathbb{R}\)满足以下条件, 那么就称它为\(E\)的上确界, 记作\(\alpha=\sup{E}\):

  • \(\alpha\)\(E\)的一个上界

  • 如果\(\gamma<\alpha\), 那么\(\gamma\)不是\(E\)的上界

下确界可以通过相反的不等式进行确定, 记作\(\alpha=\inf{E}\). 当然\(\sup\)\(\inf\)后面也不一定要跟一个集合, 也可以跟一个函数或者数列. 回到开头的那个函数, 我们能很容易得到 \[ \sup{f(x)}=1\quad\inf{f(x)}=0 \]

这时我们不再依赖于极限, 也可以发现, 如果函数的最大值或最小值存在, 那么它一定等于上确界或下确界, 但是上下确界存在时, 最值不一定存在. 在函数最值不存在时, 我们仍然能利用确界对函数的范围进行严格的分析, 而且不一定需要求极限, 这体现了上下确界的价值所在. 在这里建议读者写几个函数, 再试着求以下上下确界.

确界的极限形式(上极限、下极限)

数列形式

\(\{a_n\}\)\(\mathbb{R}\)里的一个数列, 并且定义 \[ b_k=\sup\{a_k,a_{k+1},a_{k+2},\cdots\} \]

再定义 \[ \beta=\inf\{b_1,b_2,b_3,\cdots\} \]

那么就有 \[ \beta=\limsup_{n\to\infty}a_n \]

这就完成了上极限的定义. 而下极限的求法就是将上面的上确界、下确界交换顺序即可. 可是这里为什么出现了极限符号? 这是因为 \[ b_1\geq b_2\geq b_3\geq\cdots\geq\beta \]

所以有 \[ \lim\limits_{k\to\infty}b_k=\beta \]

此外,\(\{a_n\}\)中有一个子列\(\{a_{n_i}\}\)收敛于\(\beta\), 而且\(\beta\)是具有这个性质最大的数.

这其实还是解决了一件事情, 如果一个数列发散, 我们还是有可能利用上下确界的极限形式来研究极限的一些性质. 一个很简单的例子比如 \[ \limsup_{n\to\infty}{(-1)^n}=1\quad\liminf_{n\to\infty}{(-1)^n}=-1 \]

函数形式

函数中上下极限的求法其实和数列形式是非常类似的. 我们先举一个上极限的例子, 理解构建过程时也可以利用这个例子: \[ \limsup_{x\to{0}}\sin\frac{1}{x}=1 \]

对于函数, 值域可能是连续集合. 求\(x\to{a}\)时的上极限, 我们先求出\(x\to{a}\)时, \(f(x)\)的上确界构成的集合 \[ U=\{y|y=\sup\{f(x)|x\in(a-\varepsilon,a+\varepsilon)\}\} \]

那么上极限就是 \[ \limsup_{x\to{a}}f(x)=\inf{U} \]

总结

我们单纯利用不等式, 建立起一个非常严格,也非常有应用价值的概念: 确界. 这个概念源于最值, 又高于最值. 当然确界和最值什么时候相等又是一个拓扑学问题. 这又是另外一个话题了.

调和级数发散的若干证明

命题的提出

\(S_n=1+\frac{1}{2}+\frac{1}{3}+\cdots+\frac{1}{n}\), 求证\(\{S_n\}\)发散

这个数列的发散是很难通过直觉猜出来的, 因为它的增长速度很慢, 会给人以收敛的错觉. 如果用计算机手动运算, 会发现直到\(12367\)项, 这个数列的值才超过\(10\). 但缓慢的增长速度不能说明敛散性. 接下来会给出一系列精彩的证明, 从14~17世纪纯粹的分式不等式到近现代涉及到微积分等方法.

遥远的中世纪: Nicole Oresme(1350?-1360?)

这个证明方式是历史上最早的证明, 涉及到简单的不等式放缩和数学归纳.

考虑到不等式 \[ \underbrace{\frac{1}{n+1}+\frac{1}{n+2}+\cdots+\frac{1}{2n}}_{\text{$n$项}}>n\cdot\frac{1}{2n}=\frac{1}{2} \]

我们分析\(\{S_{2^n}\}\)这个数列, 发现 \[ S_1=1+0\cdot\frac{1}{2} \] \[ S_2=1+1\cdot\frac{1}{2} \] \[ S_4=1+\frac{1}{2}+\frac{1}{2+1}+\frac{1}{2\cdot{2}}>1+\frac{1}{2}+\frac{1}{2}=1+2\cdot\frac{1}{2} \] \[ S_8=S_4+\frac{1}{4+1}+\cdots+\frac{1}{4\cdot{2}}>1+3\cdot\frac{1}{2} \]

递推下去, 我们能得到 \[ S_{2^n}\geq 1+n\cdot\frac{1}{2} \]

这说明\(S_n\)有一个子列无界, 故原数列发散. 证毕.

其实不用局限在\(2^n\)这一部分, 用同样的办法, 我们能得到 \[ S_{M^n}\geq 1+n\cdot\frac{M-1}{M} \]

Pietro Mengoli(17世纪中叶)

考虑不等式 \[ \frac{1}{n-1}+\frac{1}{n}+\frac{1}{n+1}=\frac{1}{n}+\frac{2n}{n^2-1}>\frac{1}{n}+\frac{2n}{n^2}=\frac{3}{n} \]

假设原级数收敛到\(S\), 那么有 \[ \begin{aligned} S&=1+\left(\frac{1}{2}+\frac{1}{3}+\frac{1}{4}\right)+\left(\frac{1}{5}+\frac{1}{6}+\frac{1}{7}\right)+\cdots\\ &>1+\frac{3}{3}+\frac{3}{6}+\frac{3}{9}+\cdots\\ &=1+S \end{aligned} \]

\(S>1+S\)无解, 这说明极限不存在. 证毕.

Bernoulli兄弟(1689)

Bernoulli兄弟的证明发布于 Tractatus de se-riebus infinitis 一书中.

Jacob Bernoulli

对任意正整数有 \[ \underbrace{\frac{1}{n+1}+\frac{1}{n+2}+\cdots+\frac{1}{n^2}}_\text{$n^2-n$项}>\frac{n^2-n}{n^2}=1-\frac{1}{n} \]

也就是说 \[ \frac{1}{n}+\frac{1}{n+1}+\cdots+\frac{1}{n^2}>1 \]

因此有 \[ \begin{aligned} \sum_{n=1}^{\infty}\frac{1}{n}&=1+\left(\frac{1}{2}+\frac{1}{3}+\frac{1}{4}\right)+\left(\frac{1}{5}+\cdots+\frac{1}{25}\right)+\cdots\\ &>1+1+1+\cdots \end{aligned} \]

原级数发散. 证毕.

Johann Bernoulli

考虑级数 \[ \sum_{n=k}^{\infty}\left(\frac{1}{n}-\frac{1}{n+1}\right)=\sum_{n=k}^{\infty}\frac{1}{n(n+1)}=\frac{1}{k} \]

同样, 我们假设级数收敛于\(S\) \[ \begin{aligned} S&=1+\frac{1}{2}+\frac{1}{3}+\frac{1}{4}+\frac{1}{5}+\cdots\\ &=1+\frac{1}{2}+\frac{2}{6}+\frac{3}{12}+\frac{4}{20}+\frac{5}{30}+\cdots\\ &=1+\left(\frac{1}{2}+\frac{1}{6}+\frac{1}{12}+\cdots\right)+\left(\frac{1}{6}+\frac{1}{12}+\frac{1}{20}+\cdots\right)+\cdots\\ &=1+1+\frac{1}{2}+\frac{1}{3}+\cdots\\ &=1+S \end{aligned} \]\(S=1+S\)无解, 这说明极限不存在.

三种Cauchy判别法

Cauchy的三种判别法是比较常见且应用非常广泛的, 在微积分课程中也是常客, 现将三种方法列在下面

Cauchy积分判别法

\(f\)\([1,+\infty)\)单调减少, 则级数\(\sum_{n=1}^{\infty}f(n)\)与广义积分\(\int_{1}^{\infty}f(x)dx\)同敛散

代入\(f(x)=\frac{1}{x}\)即可.

Cauchy凝聚判别法

\(\{a_n\}\)是单调减少的整数列, 则正项级数\(\sum_{n=1}^{\infty}a_n\)收敛的充分必要条件是凝聚项级数\(\sum_{n=1}^{\infty}2^na_{2^n}\)收敛

这个判别法可以很简单地对\(a_n=\frac{1}{n^p}\)对应级数的敛散性进行讨论.

Cauchy收敛准则

可以发现, \(S_{2n}-S_n=\frac{1}{n}+\frac{1}{n+1}+\cdots+\frac{1}{2n}>\frac{n}{2n}=\frac{1}{2}\).

这说明, 存在\(\varepsilon=\frac{1}{2}\), 总有\(|S_{2n}-S_n|>\varepsilon\). 这说明了这个级数的发散.

Honsberger(1976)

这个证明是\(e^{x}\geq{1+x}\)的巧用.

考虑\(e^{S_n}\)这个数列, 有

\[ \begin{aligned} e^{S_n}&=\text{exp}\left(1+\frac{1}{2}+\frac{1}{3}+\frac{1}{4}+\cdots+\frac{1}{n}\right)\\ &=e^{1}e^{\frac{1}{2}}e^{\frac{1}{3}}e^{\frac{1}{4}}\cdots e^{\frac{1}{n}}\\ &>\left(1+1\right)\left(1+\frac{1}{2}\right)\cdots\left(1+\frac{1}{n}\right)\\ &=n+1 \end{aligned} \] \(e^{S_n}\)的发散便说明了\(S_n\)的发散.

洛必达法则的几种不同的证明

前言

洛必达法则我想甚至不少高中生甚至初中生都听说过,知道怎么进行简单的应用。简单点说,处理\(\frac{0}{0}\)的函数时,对上下进行求导,可能会很大程度上简化计算。但是洛必达法则为什么能奏效? 能不能用严格的数理语言进行论证? 这是这篇文章需要解决的.

洛必达法则的完整论述

假设有定义在\((a,b)\)可导的实函数\(f\)\(g\),且\(g’(x)\neq0\)对所有\(x\in(a,b)\)恒成立,其中\(a\)\(b\)满足 \[ -\infty\leq{a}<{b}\leq+\infty.\]
若有\[\lim_{x\to a}\frac{f’(x)}{g’(x)}=A,\]且如果\[\lim_{x\to a}f(x)=\lim_{x\to a}g(x)=0,\]\[\lim_{x\to a}g(x)=+\infty,\]那么\[\lim_{x\to a}\frac{f(x)}{g(x)}=A\]类似的结论对\(x\to{b}\)或者\(g(x)\to-\infty\)也成立。

证明1:线性近似

波努利最开始的”证明”

洛必达法则首次出现于1696年洛必达的 Analyse des Infiniment Petits pour l'Intelligence des Lignes Courbes 一书中。这本书当然以”洛必达法则”闻名于世。证明是这样完成的: \[ \frac{f(a+dx)}{g(a+dx)}=\frac{f(a)+f’(a)dx}{g(a)+g’(a)dx}=\frac{f’(a)dx}{g’(a)dx}=\frac{f’(a)}{g’(a)} \]

这个证明很好理解,线性近似展开,再考虑到\(f(a)=g(a)=0\)就得到结果。但是这个做法肯定是不合适的,\(dx\)在这里非常模糊,也不方便表达\(x\to\infty\)的情况。关于历史内容可以参见 The Historical Development of the Calculus 一书。

线性近似的严格证明

首先,这里只讨论\(h\to0\)的情况。实际上,对于其他情况,可以作换元。例如\(h\to\infty\)时,可以利用\(u=\frac{1}{h}\),那么又转换成了\(u\to0\)的情况。另外我们只讨论函数趋近于\(0\)的情况。因为趋近于无穷时函数的线性近似可能无法处理。例如\(y=\frac{1}{x}\)\(x=0\)附近是没有近似的。

对函数导数有 \[ f’(x) = \lim_{h\to 0} \frac{f(x+h)-f(x)}{h}, \]

我们可以写成 \[ f’(x) = \frac{f(x+h)-f(x)}{h} + r(h) \]

其中\(\lim\limits_{h\to0}r(h)=0\),且\(r(h)\)为连续函数。进行代数变形(这里\(r(h)\)的正负进行了调整),我们的得到线性近似 \[ f(x+h)=f(x)+f’(x)h+r(h)h \]

同样可以写出\(g(x)\)的线性近似 \[ g(x+h)=g(x)+g’(x)h+s(h)h \]

那么就能得到 \[ \frac{f(a+h)}{g(a+h)}=\frac{f(a)+f’(a)h+r(h)h}{g(a)+g’(a)h+s(h)h}=\frac{f’(a)h+r(h)h}{g’(a)h+s(h)h}=\frac{f’(a)+r(h)}{g’(a)+s(h)} \]

\(h\to0\)时,\(r(h)\to0\)\(s(h)\to0\),故得到了结论。

证明2:中值定理

这个证明中,我们会利用柯西中值定理(GMVT)对所有的情况进行完整的证明,这期间涉及到一些不等式运算技巧。证明来自W. Rudin的 Principles Of Mathematical Analysis,我会在其中加上一些额外的解释。

情况1: \(-\infty\leq{A}<+\infty\)

选取实数\(\varepsilon>0\)\(q\)使得\(A<A+\varepsilon<q\)。因为\(\frac{f(x)}{g(x)}\to{A}\),必定有实数\(\delta\in(0,b-a)\)使得对于所有\(a<x<a+\delta\),始终有\(-\varepsilon<\frac{f’(x)}{g’(x)}-A<\varepsilon\)。也就是说 \[\frac{f’(x)}{g’(x)}<A+\varepsilon.\]

\(a<x<y<c\),由GMVT可知,存在\(t\in(x,y)\)使得不等式(A)成立: \[ \frac{f(x)-f(y)}{g(x)-g(y)}=\frac{f’(t)}{g’(t)}<A+\varepsilon \] 最后一个不等式成立是因为\(t\in(x,y)\subset(a,b)\),而\((a,b)\)中这个不等式成立。

情况1.1: \(g(x)\to0\)

\(x\to{a}\),此时关于\(x\)\(y\)的不等式会有\(\frac{f(y)}{g(y)}\leq{A+\varepsilon}<q\quad(a<y<a+\delta)\)

也就是说,对任意实数\(\varepsilon>0\),有\(\delta>0\),使得\(a<y<a+\delta\)时,满足不等式(B): \[ \frac{f(y)}{g(y)}\leq\varepsilon+A<q \]

(注意:这个地方并没有用\(\varepsilon-\delta\)证明了这个情况下的收敛)

情况1.2: \(g(x)\to+\infty\)

\(r=A+\varepsilon\)。固定不等式(A)中的\(y\),因为\(g(x)\to+\infty\),能找到一个值\(c\in(a,b)\)使得\(g(x)>g(y)\)\(g(x)>0\)对所有\(x\in(a,c)\)同时成立。那么不等式(A)两边同时乘以\([g(x)-g(y)]/g(x)\),能得到不等式(C) \[ \frac{f(x)}{g(x)}<r-r\frac{g(y)}{g(x)}+\frac{f(y)}{g(x)}\quad(a<x<c) \]

\(x\to{a}\),因为\(g(x)\to+\infty\),有点\(c_1\in(a,c)\)使得不等式(D)成立: \[ \frac{f(x)}{g(x)}<q\quad(a<x<c_1) \]

情况1.1和1.2的整合

不等式(B)和(D)都只说明,存在\(c\in(a,b)\)使得对于所有\(x\in(a,c)\),满足\(\frac{f(x)}{g(x)}<q\).但是\(\frac{f(x)}{g(x)}\)\(A\)的关系并不知道。

这里要注意,不等式(B)和(D)都只在\(q>A\)时成立,也就是说,如果\(q=A\),那么有\(\frac{f(x)}{g(x)}\geq{q}=A\)。也就是说,对于所有\(q>A\),都存在\(c\in(a,b)\),使得对于所有\(x\in(a,c)\),满足 \(A\leq\frac{f(x)}{g(x)}<q\),若令\(q\to{A}\),就能得到\(\frac{f(x)}{g(x)}\to{A}\)

情况2: \(-\infty<{A}\leq+\infty\)

这个情况是和情况1完全类似的。同理可证,对任意\(p\),当且仅当\(p<A\)时,总有\(c’\in(a,b)\),使得对于所有\(x\in(a,c’)\),满足\(p<\frac{f(x)}{g(x)}\leq{A}\)

结合\(A\)的这两种情况,原命题得证。

证明中几个小问题

不等式(A)第一项的分母为什么一定有意义?

假设它无意义。如果有\(g(x)=g(y)\),那么有\({x}<t<y\)使得\(g’(t)=0\),此时不满足 \[ f’(t)/g’(t)<A+\varepsilon \] > 不等式(B)中为什么变成小于等于?

每次改变\(x\)\(t\)也发生改变,记为\(t(x)\),此时可能有\(\lim\limits_{x\to{a}}\frac{f’(t(x))}{g’(t(x))}=r\)

优美的Fourier级数(二): 有界差分下的收敛(Jordan判别法)

前言

如果你和Fourier级数打交道,那么在处理间断函数,特别是锯齿状函数的时候,有没有注意过间断处的形状?它为什么会处在中间位置?什么时候会出现这种情况?这就是接下来要解决的问题. 这篇文章中, 会涉及到各种与三角函数、定积分、导函数有关的基本重要技巧. 还是那句话,Fourier级数绝对不仅仅是处理一系列三角函数. 还要注意,这里我们探讨的函数应该是定义在\([-\pi,\pi]\)的实函数. 这篇文章中实际要做的事情是, 利用定积分的各种性质, 进行无穷小量的分析.

Jordan判别法

如果\(f\)是有界差分,那么 \[ s_N(x)\to\frac{f(x^+)+f(x^-)}{2} \]

其中\(f(x^+)=\lim\limits_{h\to0^+}f(x+h)\), \(f(x^-)=\lim\limits_{h\to0^+}f(x-h)\)

理论准备1: 有界差分

有界差分可以看成推广的“弧长”. 在\([a,b]\)上,\(f(x)\)的总差分的定义是这样: \[ T_f(x):=\sup\{\sum_{i=1}^n|f(x_i)-f(x_{i-1})||a=x_0<x_1<\cdots<x_n=x\} \] 对于连续函数来说,这就是\(f(x)\)\([a,x]\)的弧长. 而如果\(f(x)\)\([a,b]\)上的有界差分,那么只需要满足\(T_f(b)<\infty\).

注意到, \(f(x)\)还可以写成

\[ f(x)=\frac{1}{2}[T_f(x)+f(x)]-\frac{1}{2}[T_f(x)-f(x)] \]

\(\frac{1}{2}[T_f(x)+f(x)]\)\(\frac{1}{2}[T_f(x)-f(x)]\)都是非负的单调增函数. 事实上,有界差分一定可以写成两个单调增函数的差,具体证明可以参见这里.

理论准备2: 积分第二中值定理

如果定义在\([a,b]\)上的实函数\(f\)\(g\)满足\(f\)连续且\(g\)单调,那么存在\(c\in(a,b)\)使得 \[ \int_a^bf(x)g(x)dx=g(a^+)\int_a^cf(x)dx+g(b^-)\int_c^bf(x)dx \]

这个定理的证明可以参见这里,也可以用Abel变换进行证明.

回到Jordan判别法的证明

因为\(D_N(x)\)是偶函数,\(S_N(x)\)可以重写成 \[ S_N(x)=\frac{1}{2\pi}\int_0^{\pi}(f(x-t)+f(x+t))D_N(t)dt \]

如果我们定义\(g(t)=f(x+t)+f(x-t)\), 那么就有 \[ g(0^+)=f(x^+)+f(x^-) \]

原命题即证明 \[ \frac{1}{2\pi}\int_0^{\pi}g(t)D_N(t)dt\to\frac{g(0^+)}{2} \]

又考虑到\(g(t)\)是有界差分,可以写成两个单调增函数的差. 那么这里只需要这个极限对单调增函数成立即可.

设有单调增函数\(h(t)\), 定义\(H(t)=h(t)-h(0^+)\); 注意到 \[ \frac{1}{2\pi}\int_0^{\pi}H(t)D_N(t)dt\to\frac{H(0^+)}{2}=0 \] 当且仅当 \[ \frac{1}{2\pi}\int_0^{\pi}h(t)D_N(t)dt\to\frac{h(0^+)}{2} \] 这是因为\(\frac{1}{2\pi}\int_0^{\pi}D_N(t)dt=\frac{1}{2}\). 那么不失一般性,可以设\(h(0^+)=0\), 那么需要证明, \[ \frac{1}{2\pi}\int_0^{\pi}h(t)D_N(t)dt\to 0\quad(N\to\infty) \]

因为\(h(0^+)=0\), 根据连续的定义, 对任意\(\varepsilon>0\), 有\(\delta>0\)使得对任意\(0<x<\delta\)\(0<h(x)<\varepsilon\). 原积分可以展开为 \[ \frac{1}{2\pi}\int_0^{\pi}h(t)D_N(t)dt=\frac{1}{2\pi}\int_0^{\delta}h(t)D_N(t)dt+\frac{1}{2\pi}\int_{\delta}^{\pi}h(t)D_N(t)dt \]

注意到最后一个积分可以写成 \[ \frac{1}{2\pi}\int_0^{\pi}\frac{h(t)}{\sin(t/2)}\chi_{[\delta,\pi]}\sin(N+\frac{1}{2})tdt \]

其中 \[ \chi_E=\begin{cases}1,x\in E \\ {0}, x\notin E\end{cases} \]

那么这个积分的讨论就和上一篇里收敛性证明的最后利用Bessel不等式的推论的过程一样了, 将\(\sin(N+\frac{1}{2})t\)展开之后, 我们得到,这个积分的极限为\(0\). 证明在此略去.

第一个积分我们用积分第二定理展开, 得到: \[\begin{equation} \begin{aligned} \frac{1}{2\pi}\int_0^{\delta}h(t)D_N(t)dt&=\frac{1}{2\pi}h(\delta^-)\int_c^{\delta}D_N(t)dt\\ &\leq\frac{\varepsilon}{2\pi}\int_c^{\delta}D_N(t)dt \end{aligned} \end{equation}\]

其中\(0<c<\delta\). 如果我们能证出\(\int_c^{\delta}D_N(t)dt\)是有界的,那么\(\varepsilon\to0\)时,就有所求结论. 注意到 \[ \left\vert\int_c^{\delta}D_N(t)dt\right\vert\leq \left\vert\int_c^{\delta}\sin(N+\frac{1}{2})t(\frac{1}{\sin(t/2)}-\frac{1}{t/2})dt\right\vert+\left\vert\int_c^{\delta}\frac{\sin(N+\frac{1}{2})t}{t/2}dt\right\vert \] 因为\(\lim\limits_{t\to0}\frac{1}{\sin(t/2)}-\frac{1}{t/2}=0\), 而且这个函数在\((0,\pi]\)上连续有定义,故\(\frac{1}{\sin(t/2)}-\frac{1}{t/2}\)\([0,\pi]\)上可积. 再利用Bessel不等式的推论,不等式右侧第一个积分趋近于0, 同时也是有界的.

针对另一个积分的讨论,我们首先令\(u=(N+\frac{1}{2})t\), 那么能得到 \[ \int_c^{\delta}\frac{\sin(N+\frac{1}{2})t}{t/2}dt=2\int_{(N+\frac{1}{2})c}^{(N+\frac{1}{2})\delta}\frac{\sin u}{u}du \]

这个积分的有界性可以通过探讨函数\(y=\int_0^{x}\frac{\sin x}{x}dx(x>0)\)得到. 通过很多办法可以发现,\(\lim\limits_{x\to\infty}y=\frac{\pi}{2}\). 具体可以参见这里. 接下来, 我们通过基本的导数和单调性的关系分析它的有界性. 我们要做的是, 证明\(y(\pi)\)\(y\)的最大值(考虑到\(\frac{\sin{x}}{x}\)\((0,\pi]\)处处有界, 必然有\(y(\pi)<\infty\)).

因为\(y’=\frac{\sin x}{x}\), \(y\)\([2k\pi,(2k+1)\pi]\)递增,在\([(2k-1)\pi,2k\pi]\)递减.

\(y\)\([0,\pi]\)递增,所以\(0<x<\pi\)时,\(y(x)<y(\pi)\).

又考虑到 \[ y((2k-1)\pi)-y((2k+1)\pi)=\int_{(2k-1)\pi}^{(2k+1)\pi}\frac{\sin x}{x}dx \]\[ \int_{(2k-1)\pi}^{(2k+1)\pi}\frac{\sin x}{x}dx>\int_{(2k-1)\pi}^{(2k+1)\pi}\frac{\sin x}{(2k+1)\pi}dx=0 \] 从而有 \[ y(\pi)>y(3\pi)>\cdots>y((2k+1)\pi) \] 而根据函数的单调性,一定有 \[ \begin{cases} y(2k\pi)<y((2k-1)\pi)\\ y(2k\pi)<y((2k+1)\pi) \end{cases} \] 因此\(y\)的最大值为\(y(\pi)\). 用类似的办法还可以发现\(y(0)\)为最小值. 这说明,\(y\)是有界的.

再回到原来的积分,有 \[ 2\left\vert\int_{(N+\frac{1}{2})c}^{(N+\frac{1}{2})\delta}\frac{\sin u}{u}du\right\vert=2\left\vert y((N+\frac{1}{2})\delta)-y((N+\frac{1}{2})c)\right\vert<2y(\pi) \]

至此,我们证明了\(\int_c^{\delta}D_N(t)dt\)是有界的. 进一步也得出了想要的收敛性的结论.

总结&其他想说的

至此,Jordan判别法得到了证明. 但千万不要认为,Fourier级数的收敛是这么简单的一件事情. 这可能会让人觉得,既然有界差分就有这么好的收敛现象,那么连续函数一定就收敛得更好. 但实际情况完全不一样:存在至少有一点发散的连续函数的Fourier级数(du Bois Reymond, 1873). 此外,甚至存在每点都发散的Fourier级数(Kolmogorov, 1926). 这和处处连续但处处不可导的函数一样,很难想象,但是理论上确实存在.

优美的Fourier级数(一): 绝对不只是求表达式的问题

前言

Fourier级数是相当优美的一类级数,但它涉及到的问题绝对不仅仅是通过各种运算技巧求表达式。 相反,它是一个很复杂、很困难的大话题。 我在这里会把一些基本内容和一系列严格的证明整理下来。 从Fourier级数出发,我们能看到很多重要的基本技巧的应用,也会遇见和实际应用息息相关的问题。 当然这些内容里不会包括如何求表达式,我觉得计算机做得比我好多了。

Fourier级数

在读这篇文章时, 你可能已经学到了一些求Fourier级数系数的技巧, 这可以看成一元微积分的角度的理解。 接下来, 我们希望从向量几何的角度看待Fourier级数。 当然, 这里不是要求画出几何图像, 而是要求理解运算规则。

级数的表达

最常见的Fourier级数是这种形式: \[ f(x)=a_0+\sum_{n=1}^{\infty}(a_n\cos nx+b_n\sin nx)\quad x\in\mathbb{R} \]

这里的\(a_n\)\(b_n\)既可以是实数又可以是复数(但我们接下来主要讨论实数函数\(f\))。 有的地方把第一项写成\(\frac{a_0}{2}\), 这是考虑到积分时会多出来的一个\(\frac{1}{2}\)。 两种写法单纯是关于如何统一表达,在后面会解释。 考虑到\(e^{ix}=\cos x+i\sin x\), 上面的式子可以写成 \[ f(x)= \sum_{-\infty}^{\infty}c_ne^{inx}\quad x\in\mathbb{R} \]

用这种表达方式时不用考虑\(c_n\)的细节。 注意到\(a_0\)可以写成\(a_0\cos 0x + b_0\sin 0x\)

关于级数的系数,即函数的“坐标”

单位正交系

我们先回忆线性代数里的知识。 一个行向量和一个列向量的乘积是这样的:

\[\begin{equation} \begin{bmatrix}a&b\end{bmatrix}\begin{bmatrix}c\\d\end{bmatrix}=ac+bd \end{equation}\] 进一步,第一个行向量可以看成列向量的转置。 那么这个\(ac+bd\)就是两个2维平面内列向量的内积。这就是高中数学中所讲的“向量乘法”。 这涉及到经典欧基里德空间的内积定义。 而谈到向量,单位正交向量肯定是非常有探讨价值的。因为一般情况下其他向量可以用单位正交向量比较简介地表示出来。 但是向量内积不仅仅存在于经典的欧氏空间。我们可以定义一系列定义域相同的函数,例如\([a,b]\)上的函数\(f\)\(g\)的内积可以定义成 \[ (f,g):=\int_a^b f(x)\overline{g}(x)dx \] 其中\(\overline{g}\)表示\(g\)的共轭复数。

在内积空间里, 两个向量的内积为\(0\), 说明两个向量正交(这和欧几里得空间是一致的)。 或者更形象地说, 夹角为\(\frac{\pi}{2}\)。 而向量的模的平方即自身和自身的内积。 我们可以定义函数的“单位正交系”

若定义在\([a,b]\)上的一系列函数\(\{\varphi_n(x)\}\)若满足\((\varphi_n,\varphi_n)=1\)\((\varphi_n,\varphi_m)=0(m\neq n)\), 则被称为单位正交系。

再看Fourier级数

可以验证,在\([-\pi,\pi]\)上,下列两组函数是满足单位正交的条件的: \[ \frac{e^{ix}}{\sqrt{2\pi}},\frac{e^{2ix}}{\sqrt{2\pi}},\frac{e^{3ix}}{\sqrt{2\pi}},\cdots \] \[ \frac{1}{\sqrt{2\pi}},\frac{\cos x}{\sqrt{\pi}},\frac{\sin x}{\sqrt{\pi}}, \frac{\cos 2x}{\sqrt{\pi}},\cdots \]

读到这里可以发现,\(a_0\)\(\frac{a_0}{2}\)的表示应该和\(\frac{1}{\sqrt{2\pi}}\)或者\(\frac{1}{\sqrt{\pi}}\)有关。

\(\mathbb{R}^n\)里,如果知道单位正交向量\(\mathbf{e_1},\cdots,\mathbf{e_n}\), 那么任意向量都可以唯一表示成\(x_1\mathbf{e_1}+\cdots+x_n\mathbf{e_n}\)。 向量\(\mathbf{\alpha}\)在的第\(k\)坐标分量为\((\mathbf{\alpha},\mathbf{e_k})\)。 通过这个角度看Fourier级数,就会发现,各项的系数就是函数的坐标: \[ c_m=\int_a^bf(x)\overline{\varphi_m}(x)dx \] 如果我们再看第二个复函数形式的表达式,就有 \[ c_m=\frac{1}{2\pi}\int_{-\pi}^{\pi} f(x)e^{-imx}dx \] 为了得到这个形式(\(c_m\)不受影响), 我们先用\(\frac{e^{imx}}{\sqrt{2\pi}}\)表示\(f\), 应该有 \[ \frac{f(x)}{\sqrt{2\pi}}=\sum_{-\infty}^{\infty}c_n\frac{e^{inx}}{\sqrt{2\pi}} \]

这里到底发生了什么? 我们把傅里叶级数的问题放到了一个以函数为元素的空间中, 然后选择了一组空间的, 然后求出的系数就是这组基下的坐标。 于是, 我们找到了傅里叶级数的几何意义(抽象上的), 这使我们能像高中平面几何、空间几何一样利用向量的性质解决一些问题, 尽管傅里叶级数涉及到的空间的维度是无穷大。

内积运算的规则

下列内积运算的规则会在接下来用到。 涉及到复数, 因此和经典欧基里德空间有不同之处(但是考虑到实数的共轭复数是本身, 最后一个性质其实是一样的)。 但是可以一个一个进行验证。

  • \((a+c,b)=(a,b)+(c,b)\)

  • \((a,b+c)=(a,b)+(a,c)\)

  • \((ka,b)=k(a,b)\)

  • \((a,kb)=k(a,b)\)

  • \((a,b)=\overline{(b,a)}\)

Dirichlet核

定义式

Dirichlet核的定义是这样的: \[ D_N(x)=\sum_{-N}^N e^{inx} = \frac{\sin(N+\frac{1}{2})x}{\sin\frac{x}{2}} \]

第二个等号既可以直接合并\(e^{inx}\)\(e^{-inx}\)得到\(\cos nx\)的式子从而进行积化和差,又可以利用等比数列的性质得到。

搭建起Dirichlet核和原函数的桥梁

针对文章开头提到的第二种定义,可以定义函数数列 \[ s_N(x)=\sum_{-N}^N c_ne^{inx} \]\(c_n\)展开,有 \[\begin{equation} \begin{aligned} s_N(x)&=\sum_{-N}^N\left(\frac{1}{2\pi}\int_{-\pi}^{\pi}f(t)e^{-int}dt\right)e^{inx}\\ &=\int_{-\pi}^{\pi} \frac{1}{2\pi}f(t)\sum_{-N}^Ne^{in(x-t)}dt\\ &=\frac{1}{2\pi}\int_{-\pi}^{\pi} f(t)D_N(x-t)dt\\ &=\frac{1}{2\pi}\int_{-\pi}^{\pi} f(x-t)D_N(t)dt \end{aligned} \end{equation}\] 最后一个等号通过函数的周期性和简单的换元运算得到。 至此,Dirichlet核和原函数的桥梁就被搭建起来了。 接下来,需要证明,以这个函数核构建的函数收敛于\(f\)

Bessel不等式以及其重要推论

\(f(x)\)在正交函数系\({\varphi_n(x)}\)下的系数为\({c_n}\), 则有\(\sum_{n=1}^{\infty}|c_n|^2\leq(f,f)\)

\(s_n(x)=\sum_{m=1}^n c_m\varphi_m(x)\), 其中\(c_m=\int_a^b f(x)\overline{\varphi_m}(x)dx\)。 下面通过讨论\(s_n(x)\)\(f(x)\)的误差得到这个不等式和一个重要的推论。

注意到\((f,s_n)=\int_a^b f(x)\sum\overline{c_m}\overline{\varphi_m(x)}dx=\sum\overline{c_m}\int_a^b f(x)\overline{\varphi_m(x)}dx=\sum|c_m^2|=\overline{(f,s_n)}=(s_n,f)\), 以及\((s_n,s_n)=\sum|c_m^2|\)\[\begin{equation} \begin{aligned} (f-s_n,f-s_n)&=(f,f-s_n)-(s_n,f-s_n)\\\ &=(f,f)-(f,s_n)-(s_n,f)+(s_n,s_n)\\\ &=(f,f)-(s_n,s_n)\\\ &\geq 0 \end{aligned} \end{equation}\] 也就是说, \[ (s_n,s_n)=\sum_1^n|c_m|^2\leq(f,f) \] \(n\to\infty\)时,就是所谓的Bessel不等式。 也可以发现,函数的Fourier系数\(c_m\)满足\(\lim\limits_{n\to\infty}c_m=0\)。 这个推论会在下面Dirichlet核收敛的证明中用到。

收敛证明

(Dini's Test)若对一些\(x\)有常数\(\delta>0\)\(M<\infty\)使得 \[ |f(x+t)-f(x)|\leq M|t| \] 对所有\(t\in(-\delta,\delta)\)成立,那么有 \[ \lim\limits_{n\to\infty}s_N(x)=f(x) \]

要注意的是,我们在这里只讨论逐点收敛。 其他形式的收敛会在接下来的文章中讨论

定义函数 \[ g(t)= \begin{cases} \frac{f(x-t)-f(t)}{\sin(t/2)},0<|t|<\pi\\ 0,t=0 \end{cases} \] 考虑到 \[ \frac{1}{2\pi}\int_{-\pi}^{\pi}D_N(x)dx=1 \] 因此有 \[ \frac{1}{2\pi}\int_{-\pi}^{\pi}D_N(t)f(x)dt=f(x) \] 所求函数和原函数做差,就有 \[\begin{equation} \begin{aligned} s_N(x)-f(x)&=\frac{1}{2\pi}\int_{-\pi}^{\pi}g(t)\sin\left(N+\frac{1}{2}\right)tdt\\ &=\frac{1}{2\pi}\int_{-\pi}^{\pi}\left[g(t)\cos\frac{t}{2}\right]\sin Ntdt+\frac{1}{2\pi}\int_{-\pi}^{\pi}\left[g(t)\sin\frac{t}{2}\right]\cos Ntdt \end{aligned} \end{equation}\] 根据\(f(x)\)的条件和\(g(x)\)的定义,\(g(x)\cos(t/2)\)\(g(x)\sin(t/2)\)是有界的。 利用Bessel不等式的推论可以发现,这两个积分趋近于\(0\)。 这就证明了结论。

总结&我接下来想写的

写到这里,已经涉及到了很多数学中的基本技巧:三角函数、向量内积、复变函数、等比数列、函数项数列收敛等等。 Fourier级数可以说是相当“优美”的一类级数。 在一些领域中,展开式中每一项均具有物理意义这是其他级数难以企及的。 我们又可以看到,Fourier级数还可以跳出三角函数的限制, 放在普遍的无穷维空间的规范正交基。 此外,它的收敛定理相比幂级数而言也是很宽松的。

接下来还有很多内容,我暂时的打算是这样的(已基本放弃;以后可能会有比较专门的调和分析内容):

  • Jordan’s criterion(关于\(s_N(x)\)收敛什么时候收敛到什么值),涉及到“有界差分”的概念

  • Parseval等式和应用(Fourier分析理论的核心内容之一),如三角函数系的完备性

  • Fejer核、Poisson核(一致收敛问题)

压缩定理和其应用

什么是压缩

压缩(contraction)的准确描述是这样的:

取完备度量空间\(X\), 度量\(d\), 函数\(\varphi\)\(X\)到本身的映射, 且满足

\[ d(\varphi(x),\varphi(y)) \leq cd(x,y). \] 其中\(x,y\in{X}\), \(c<1\). 那么\(\varphi\)就是一个从\(X\)到本身的压缩.

一个最简单的例子是, \(y=\frac{x}{2}\). 这是一个“平缓”的函数. 平缓的程度是怎样呢? 斜率小于1.

而压缩定理指出, 对于这个函数, 有且仅有一个\(x\)使得\(\varphi(x)=x\). 例如上面的例子, 只有\(0=0\)这一个点. 接下来要给出证明.

压缩的证明

任取\(x_0\in{X}\), 按照如下方法定义数列\(x_n\):

\[ x_{n+1}=\varphi(x_n) \]

从而会有

\[d(x_2,x_1)=d(\varphi(x_1),\varphi(x_0))\leq cd(x_1,x_0)\] (如果你不理解这里的\(d(x,y)\), 可以简单地看成\(|x-y|\)) 推广下去, 就有

\[d(x_{n+1},x_n)\leq c^nd(x_1,x_0)\]

对于\(n<m\), 就有 \[\begin{equation} \begin{aligned} d(x_n,x_m)\leq\sum_{i=n+1}^m d(x_i,x_{i+1})\leq(c^n+c^{n+1}+\cdots+c^{m-1})d(x_1,x_0)\leq\frac{c^n}{1-c}d(x_1,x_0) \end{aligned} \end{equation}\] 这说明, \(x_n\)是一个Cauchy数列, 又考虑到\(X\)是完备空间, 因此\(x_n\)收敛. 设\(x_n\)的极限为\(x\). 由压缩的定义可知, \(\varphi\)为一致连续的函数, 从而有 \[ \varphi(x)=\lim\limits_{n\to\infty}\varphi(x_n)=\lim\limits_{n\to\infty}x_{n+1}=x \] 至于唯一性的证明, 可设\(\varphi(x)=x\), \(\varphi(y)=y\). 从而有\(d(\varphi(x),\varphi(y))=d(x,y)\leq cd(x,y)\) 这只有在\(d(x,y)=0\)时成立. 唯一性得到证明.

简单应用

下面是一道数学专业研究生入学考试题. 在这个题中可以发现, 在指定的条件下, 利用“压缩”这个工具, 问题的解决变得非常简单.

已知\(0\leq a\leq 1, b \geq2\), 有数列\({x_n}\) 满足\(x_0=0\), 且有递推关系\[x_{n+1}=x_n-\frac{1}{b}(x_n^2-a),\]求证此数列收敛, 并求出极限.

在这里设\(\phi(x)=x-\frac{1}{b}(x^2-a)\), 那么有\(x_{n+1}=\varphi(x_n)\). 如果能证出\(\varphi\)为一个压缩, 极限的问题就迎刃而解了.

证明

\(\varphi(x)=x-\frac{1}{b}(x^2-a)\). 则\(x_{n+1}=\varphi(x_n)\). 在这里\(x_1=\varphi(x_0)=\frac{a}{b}\). 现证明对所有\(n>0\)\(\frac{a}{b}\leq x_n\leq 1\), 对\(n\)进行归纳.

\(n=1\)时, 不等式已成立.

假设\(n=k\)时成立, 则\(n=k+1\)时, 有 \[ x_{k+1}=\frac{a}{b}-\frac{bx_k-x_k^2}{b} \] 考虑到\(y=bx-x^2\)\([\frac{a}{b},\frac{b}{2}]\)单调递减, 而\(\frac{b}{2}\geq1\), 故有 \[ x_{n+1}\leq\frac{a}{b} +\frac{b-1}{b}\leq 1 \]\(y(\frac{a}{b})\geq y(0)=0\), 故\(x_{n+1}\geq\frac{a}{b}\).

因此不等式对所有\(n>0\)成立.

利用这个不等式, 得到 \[ |f(x)-f(y)|=|x-y||1-\frac{x+y}{b}|\leq|x-y||1-\frac{2a}{b^2}|, \quad \frac{a}{b}\leq x,y \leq 1 \]

\(a=0\)时, 得到\(x_1=x_2=\cdots=0\), 故极限存在且为\(0\).

\(a\neq 0\)时, 令\(c=|1-\frac{2a}{b^2}|\), 则始终有\(c<1\). 此时就是上文中所提到的压缩. 收敛的证明略去.

\(\lim\limits_{n\to\infty}x_n=x\), 则\(x=\varphi(x)\). 解得\(x=\sqrt{a}\). 这在\(a=0\)时也成立.

综上, \(\lim\limits_{n\to\infty}x_n\)存在, 且值为\(\sqrt{a}\).

总结

压缩映射在处理迭代生成的数列时很有效, 而且可以推广到多维甚至无穷维中. 但是要注意, 这个映射实质上是在处理局部性质, 大范围的非线性的问题则不能处理. 处理迭代数列是它在离散形式下的基本应用, 但压缩在连续形式下也有很多重要的应用, 例如在\(\mathbb{R}^n\)中证明隐函数定理

关于度量

度量函数\(d(x,y)\)即表示两点之间的距离, 满足以下三个条件:

  • \(d(x,y)\geq 0\), 等号成立当且仅当\(x=y\).

  • \(d(x,y)=d(y,x)\).

  • \(d(x,y) + d(y,z) \leq d(x,z)\) (三角形不等式)

而度量空间即一个有度量函数的集合. 度量空间的完备性指, 这个空间的任意Cauchy列都收敛. 一个简单的例子是, 全体实数\(\mathbb{R}\), 度量函数\(d(x,y)=|x-y|\).

\(\mathbb{Q}\)在这个相同的度量下是发散的. 例如Cauchy数列\(\{\left(1+\frac{1}{n}\right)^n\}\)这个数列收敛到\(e\), 而\(e\notin{\mathbb{Q}}\).