抽象Lebesgue积分的构建

从一个”难题”入手

\(\{f_n\}\)是一个定义在\([0,1]\)上的连续函数列,且\(0\leq f_n\leq 1\). \(n\to\infty\)时,对任意\(x\in[0,1]\)\(f_n(x)\to{0}\). 求证 \[ \lim_{n\to\infty}\int_{0}^{1}f_n(x)dx=0 \]

在Riemann积分下这个命题的证明确实很头疼。虽然说有\(\lim\limits_{n\to\infty}f_n(x)=0\),但是这里并不是一致收敛,所以不能直接将极限号和积分号交换。但是也没有别的信息,只能从连续性入手。

Riemann积分在讨论函数列的时候往往需要考虑是否一致收敛,这往往很麻烦。19世纪末,很多数学家都主张,高等数学课中的Riemann积分(这也是每个人都要学的)应该被新的一种更普遍、更灵活、更方便解决极限问题的积分替代。那个时期很多的数学家都进行了尝试,Lebesgue的办法可以说是集大成者。粗略地说,Riemann积分是由下面这个和式逼近的: \[ \sum_{i=1}^{n}f(t_i)\Delta{x_i} \]

也就是所谓面积的极限。\(f(t_i)\)是矩形的高,\(\Delta{x_i}\)是矩形的宽。当然还有Darboux上和、Darboux下和等等概念,然后讨论两者的差,在\(\varepsilon-N\)语言下严谨地逼近,这就是所谓可积性。讨论一个指定函数的积分,函数已经确定了,但这里的\(\Delta{x_i}\)还可以做文章。对于\(\Delta{x_i}=x_i-x_{i-1}\),它代表了区间\([x_{i-1},x_i]\)的长度,而区间是一个集合。能不能通过讨论集合的”大小”来解决积分问题呢?

这篇博客里讨论的集合是任意的(这也是博客标题里”抽象”所指)。既可以考虑经典的Euclidean空间,又可以考虑概率论中的事件空间,或者是其他。它们都可以统一到Lebesgue积分中,而Riemann积分在很多时候也可以通过Lebesgue测度”\(m\)“进行计算(粗略地说,\(m(E)\)就是\(E\)的“体积”)。另外,最开始的这个题在Lebesgue积分下也是很简单的。

\(\pi\)-系统、\(\lambda\)-系统、\(\sigma\)-代数

函数的值域

如果要给一个集合定义一个”大小”,也就是对应一个值,那么需要定义一个函数,这个函数建立起集合到实数或者复数的映射。例如定义\(m([a,b])=b-a\),这就是集合\([a,b]\)的长度,\(b-a\)就是一个实数。这个函数的值域可以是\(\mathbb{R}\)或者\(\mathbb{R}^2\)的一个子集,而定义域是怎样的呢? 首先,它应该是一个由集合构成的集合。比如一个集合\(A\)的幂集\(\mathcal{P}(A)\)。但是一定是幂集吗? 可不可以小一点或者大一点? 它又能不能保证一些运算的合理性? 这就是这里需要解决的问题。接下来,我们会一步步把这个”定义域”所需要满足的条件逐步勾勒出来。这也是Lebesgue积分的”主战场”。


一个由集合\(X\)子集构成的集合\(\mathcal{P}\)在满足如下条件时被称为\(\pi\)-系统: 如果\(A\in{P}\)\(B\in\mathcal{P}\),那么\(A\cap{B}\in\mathcal{P}\).

\(\pi\)-系统保证了这个集合族在有限次交运算的封闭性。一个最简单的\(\pi\)-系统是\(\mathbb{R}\)中所有闭区间(注意把\(\varnothing\)也算上)构成的集合。两个闭区间的并集必定是闭区间或\(\varnothing\),而\(\varnothing\)和闭区间的并集是\(\varnothing\)。这就是一个\(\pi\)-系统。但是不一定保证无穷次运算的封闭,也不保证并集的封闭。

概率论中的样本空间也是一个\(\pi\)-系统。两个事件的交也在一个样本空间中。这自然是合理的。但是只是\(\pi\)-系统肯定不够。就比如说,一个事件的否定该怎么办? 无穷个事件(这可能涉及到概率论中的收敛问题)又该怎么办? 如果积分是定义在\(\pi\)-系统上也不行,不能只考虑全体闭区间。接下来会引入另一个系统。

一个由集合\(X\)子集构成的集合\(\mathcal{L}\)在满足如下条件时被称为\(\lambda\)-系统:

  1. \(X\in\mathcal{L}\).
  2. \(A, B\in\mathcal{L}\),且\(B\subset{A}\),那么\(A-B\in\mathcal{L}\).
  3. \(A_n\in\mathcal{L}\),且\(A_n\subset{A_{n+1}}\),那么有\(\bigcup_{n=1}^{\infty}A_n\in\mathcal{L}\).

样本空间也是一个\(\lambda\)-系统,有了一些\(\pi\)-系统中没有的合理性质。比如全事件,两个事件的差,单调事件列的极限的封闭性。


\(\sigma\)-代数,两个系统的结合

已经看到,两种系统各有优劣,都只能锁定一部分性质。实际上,两种系统结合起来,就是一个合理定义的最精炼的”定义域”,也就是\(\sigma\)-代数。如果一个集合\(X\)的子集族\(\mathfrak{M}\)既是\(\pi\)-系统又是\(\lambda\)-系统,那么\(\mathfrak{M}\)被称为定义在\(X\)上的\(\sigma\)-代数。

继续从样本空间出发考虑概率论中的例子。首先空集和全事件是肯定要有的。\(\lambda\)-系统就保证了这一点。根据1和2,\(X-X=\varnothing\in\mathcal{L}\)。如果将2中的\(A\)固定为\(X\),那么又可以发现,任意子集的补集也在\(\mathcal{L}\)中。

最后需要考虑可数个并集的情况(这涉及到加法)。考虑到De Morgan定律,这也就解决了交集的问题。\(\pi\)-系统只交代了有限个的交运算,\(\lambda\)-系统只解决了单调集合列的运算,这两个单独看局限性肯定是很大的。但是结合起来就能得到任意可数个并集的情况了。这一点的论证是一个非常有意思的集合运算技巧,在这里演示一下。

设对于\(n=1,2,\cdots\)\(A_n\in\mathfrak{M}\),已经有\(A_n^c\in\mathfrak{M}\)。不难验证\(B_n=\bigcup_{i=1}^{n}A_i=\left(\bigcap_{i=1}^{n}A_i^c\right)^c\in\mathfrak{M}\)。又有\(B_{n}\subset B_{n+1}\),所以\(\bigcup_{n=1}^{\infty}B_n=\bigcup_{n=1}^{A_n}\in\mathfrak{M}\)

综上,定义在\(X\)上的\(\sigma\)-代数\(\mathfrak{M}\)满足三个性质:

  1. \(X\in\mathfrak{M}\).
  2. \(A\in\mathfrak{M}\),那么\(A^c\in\mathfrak{M}\)(这里\(A^c=X-A\)).
  3. 若对\(n=1, 2, \cdots\)\(A_n\in\mathfrak{M}\),那么\(\bigcup A_n\in\mathfrak{M}\).

这时,\(X\)称为可测空间,\(\mathfrak{M}\)中的元素称为可测集合。

一些评注和补充

  1. 不难证明,\(\sigma\)-代数既是\(\pi\)-系统又是\(\lambda\)-系统。也就是说,它满足这两个系统本身的性质,所以集合的差,有限个集合的交、并自然不在话下。
  2. \(\sigma\)-代数中的元素可以有很多个,比如\(\mathcal{P}(X)\),也可以有两个,比如\(\{\varnothing,X\}\)。实际上,\(X\)的任何子集族都可以生成一个最小的\(\sigma\)-代数。特别地,由\(X\)的全体开子集生成的\(\sigma\)-代数\(\mathcal{B}\)是一个有特殊地位的代数,它能和谐地处理连续函数(广义的)。\(\mathcal{B}\)的元素称为Borel集。
  3. \(\pi-\lambda\)定理(两种系统的关系):设\(\mathcal{P}\)\(\mathcal{L}\)分别是一个\(\pi\)-系统和一个\(\lambda\)-系统,而且\(\mathcal{P}\subset\mathcal{L}\),设包含\(\mathcal{P}\)的最小\(\sigma\)-代数为\(\sigma(\mathcal{P})\),那么有\(\sigma(\mathcal{P})\subset\mathcal{L}\)

可测函数

对于一个有界函数,如果这个函数Riemann可积,那么这个函数几乎处处连续。例如单调函数、有可数个甚至有限个间断点的函数。但是在这里讨论Lebesgue函数时并不考虑函数是否连续(尽管连续函数和可测函数有很多联系,这不是这篇博客的重点)。

设函数\(f:X\to{Y}\),定义在\(X\)上的\(\sigma\)代数为\(\mathfrak{M}\),若对任意的开集\(V\subset{Y}\)都有\(f^{-1}(V)\in\mathfrak{M}\)。其中\(f^{-1}(V)=\{x\in{X}:f(x)\in{V}\}\)

如果不了解什么是”开集”,可以先看作开区间的推广,即不包括边界点的集合。比如开区间、平面中不包含边界的集合,而开集的补集为闭集。开集是一个拓扑的基本元素,可测函数的定义保证这样的函数是”不病态”的。其实很好理解: 我们花好大功夫规定了\(\sigma\)-代数,是为了方便我们积分,结果值域里一个开区间就找不到\(\sigma\)-代数里对应的一个\(X\)的合理的子集,那肯定是不合理的。至于闭集。闭集是开集的补集,严格地说,一个集合是开集当且仅当其补集为闭集。又考虑到\(\sigma\)-代数对补集和并集的封闭性,可测函数的合理性就更清楚了。

对于实函数,有一种很有用的判别方法:

如果\(f(x)\)的值域为\(\mathbb{R}\),对于任意的\(\alpha\in\mathbb{R}\)都有\(\{x\in{X}:f(x)>\alpha\}\in\mathfrak{M}\),那么\(f\)为可测函数。

这也是一个最基本的限制条件。考虑到\(\sigma\)-代数的几条性质,不难对全体开区间进行分析。对于复函数,考虑\(f=u+iv\)。如果\(u,v\)都是可测函数,那么\(f\)是可测函数。

对于连续函数,如果\(\mathfrak{M}\)包含全体Borel集,那么连续函数可测。因为对于连续函数\(f\)\(f^{-1}(V)\)一定为开集(可以从\(\varepsilon-\delta\)语言的角度考虑一下)。

特征函数、简单函数

如果\(E\)为可测集,定义函数 \[ \chi_E(x)=\begin{cases}1\quad{x\in{E}}\\ 0\quad{x\notin{E}}\end{cases} \] 那么\(\chi_E(x)\)是一个可测函数。对于离散集合,每个点都应该看成开集。\(\chi\)被称为特征函数。


简单函数是指值域只有有限个点的函数,也就是所谓”阶梯函数”,但是要注意这里的阶梯并不一定是单调的。Lebesgue积分就是用阶梯函数的积分逼近的。如果找出每个取值点的原象,那么一个简单函数可以写成特征函数的形式。也就是说,设简单函数\(s\)的取值为\(\alpha_1,\cdots,\alpha_n\),又令\(A_i=\\{x:s(x)=\alpha_i\\}\),那么不难得到 \[ s=\sum_{i=1}^{n}\alpha_i\chi_{A_i} \] 也不难发现,如果每个集合\(A_i\)都是可测集,那么\(s\)为可测函数。

任意可测函数都可以用简单函数逼近。也就是说,

设函数\(f:X\to[0,+\infty]\)为可测函数,存在定义在\(X\)上的可测简单函数\(s_n(x)\)使得

  1. \(0\leq s_1\leq s_2\leq\cdots\leq f\).
  2. 对任意\(x\in{X}\)\(s_n(x)\to f(x)(n\to\infty)\).

如果\(f\)既有正值又有负值,那么可以讨论\(f^{+}=\text{max}(f,0)\)\(f^{-}=-\text{min}(f,0)\)即可,这两部分分别逼近之后又可以通过\(f=f^{+}-f^{-}\)结合起来。

测度、测度空间

做完了被积函数的工作之后再回到集合的”大小”这个概念上。实际上概率论中某一事件的概率就 一种测度。只不过这一测度的值域是\([0,1]\),而一般的测度的值域是\([0,+\infty]\)。概率是一个从集合到\([0,1]\)的映射,另外还有一点我想大家都很熟悉。如果\(A\cap{B}=\varnothing\),那么\(P(A\cup{B})=P(A)+P(B)\)。这其实是基于测度定义的一个推广,严格地说,

一个正测度是定义在一个\(\sigma\)-代数\(\mathfrak{M}\)上的函数\(\mu\),其值域为\([0,+\infty]\),而且满足可列可加性。也就是说,对互不相交的集合列\(\\{A_k\\}\),有 \[ \mu(\bigcup_{k=1}^{\infty}A_i)=\sum_{i=1}^{\infty}\mu(A_i) \]

对于\(\mu\),假设至少有一个\(A\in\mathfrak{M}\)使得\(\mu(A)<+\infty\)

和Riemann积分最接近的测度就是Lebesgue积分\(m\)。粗略地说,\(m([a,b])=b-a\)。这代表了Euclidean空间中点集的”体积”。如果是离散集合,设\(\mu(E)\)表示\(E\)中元素的个数,那么\(\mu\)也构成一个测度。但是一个集合是不是Lebesgue可测是一个比较复杂的问题。这在以后会解释。

一个测度空间指的是一个可测空间和一个定义在可测空间的\(\sigma\)-代数上的正测度。复测度是一个复值函数,定义域和正测度相同,而且满足可列可加性。

不难发现,\(\mu(\varnothing)=0\),对于有限个互不相交的集合,可列可加性也是成立的(对于\(n\)个集合,将\(n+1\)个以后的集合看成空集即可)。

Lebesgue积分的构造

终于到了Lebesgue积分了。在进行之前先回顾一下我们做了什么工作。首先,考虑到积分是在集合的子集上(可以考虑\(\mathbb{R}\)的一些子集)下文章,我们找到了这个子集族需要满足的条件,也就是说,是一个\(\sigma\)-代数。为了测量一个集合的”大小”,我们定义了测度这个概念。这是”区间长度”的非常和谐的抽象推广。从一般的函数到所有可测的实函数、复函数,主要会通过下面三步进行。

简单函数

考虑非负可测简单函数(其他情况会另外考虑)\(s=\sum_{i=1}^{n}\alpha_{i}\chi_{A_i}\)\(s\)为可测函数也就是说,对任意的\(A_i\)都有\(A_i\in\mathfrak{M}\),这样的话\(\mu(A_i)\)就是存在的,否则运算没法进行,这也是函数可测性的意义体现。

回到博客开头,考虑面积,就需要考虑函数值(\(\alpha_i\))和区间长度。这里的抽象的”区间长度”变成了\(\mu(A_i)\)。如果积分的集合是\(E\in\mathfrak{M}\),那么就有\(A_i\cap{E}\in\mathfrak{M}\)(因为\(\mathfrak{M}\)\(\pi\)-系统!)。那么直接求和就行了: \[ \int_{E}sd\mu = \sum_{i=1}^{n}\alpha_{i}\mu(A_i\cap{E}) \]

如果\(\mu\)表示的是实际的区间长度,那么这就是简单的面积求和; 如果\(\mu\)是一个概率测度,那么这就是计算了数学期望(随机变量是一个可测函数)。这里还有一个很有意思的例子:

如果\(X\)表示了你全部的课程,每门课用\(A_i\)表示,\(\mu(A_i)\)表示了这门课的学分,\(\alpha_i\)表示了这门课的绩点,那么这个Lebesgue积分再除以总学分就是你的GPA。

这里还需要定义\(0*\infty=0\)。可能有点别扭,但是这种情况还是要考虑的。比如有的时候\(\alpha_i=0\)(别考虑GPA了!)而\(\mu(A_i\cap{E})=\infty\)。这个定义也是有必要的。比如\(f(x)=0\)\(\mathbb{R}\)上的积分应该是\(0\)而不是别的。

全体非负可测实函数

如果\(f:X\to[0,+\infty]\)为可测函数,那么对于\(E\in\mathfrak{M}\)定义 \[ \int_{E}fd\mu=\sup\int_{E}sd\mu \] 其中上确界取遍所有\(0\leq{s}\leq{f}\)的可测简单函数。而我们已经知道,可测函数可以被简单函数逼近。所以这可以看成一个被简单函数逼近的过程。

全体复函数

最开始我们只讨论了非负实函数。其余两种情况,如果涉及到负数,可能计算上确界有点不合适; 对复数更不合适,因为复数没有大小。但是好在我们可以将这两种情况统一起来。设\(f=u+iv\)(\(v\)可能恒等于\(0\)),那么就设 \[ \int_{E}fd\mu=\int_{E}u^+d\mu-\int_{E}u^-d\mu+i\left(\int_{E}v^+d\mu-\int_{E}v^-d\mu\right) \]

总而言之,从计算矩形面积,变成计算抽象的集合测度和函数值的乘积,推广之后就得到了Lebesgue积分。以后会详细论证Riemann积分和Lebesgue积分的具体关系。Lebesgue积分虽然在计算上并不一定有很好的优势,但是在抽象论证过程中有了更多的可能性。以后也会讲到,Lebesgue积分在处理收敛问题时的便利之处,最开始的一个题也就很简单了。

优美的Fourier级数(一): 绝对不只是求表达式的问题

前言

Fourier级数是相当优美的一类级数,但它涉及到的问题绝对不仅仅是通过各种运算技巧求表达式。 相反,它是一个很复杂、很困难的大话题。 我在这里会把一些基本内容和一系列严格的证明整理下来。 从Fourier级数出发,我们能看到很多重要的基本技巧的应用,也会遇见和实际应用息息相关的问题。 当然这些内容里不会包括如何求表达式,我觉得计算机做得比我好多了。

Fourier级数

在读这篇文章时, 你可能已经学到了一些求Fourier级数系数的技巧, 这可以看成一元微积分的角度的理解。 接下来, 我们希望从向量几何的角度看待Fourier级数。 当然, 这里不是要求画出几何图像, 而是要求理解运算规则。

级数的表达

最常见的Fourier级数是这种形式: \[ f(x)=a_0+\sum_{n=1}^{\infty}(a_n\cos nx+b_n\sin nx)\quad x\in\mathbb{R} \]

这里的\(a_n\)\(b_n\)既可以是实数又可以是复数(但我们接下来主要讨论实数函数\(f\))。 有的地方把第一项写成\(\frac{a_0}{2}\), 这是考虑到积分时会多出来的一个\(\frac{1}{2}\)。 两种写法单纯是关于如何统一表达,在后面会解释。 考虑到\(e^{ix}=\cos x+i\sin x\), 上面的式子可以写成 \[ f(x)= \sum_{-\infty}^{\infty}c_ne^{inx}\quad x\in\mathbb{R} \]

用这种表达方式时不用考虑\(c_n\)的细节。 注意到\(a_0\)可以写成\(a_0\cos 0x + b_0\sin 0x\)

关于级数的系数,即函数的“坐标”

单位正交系

我们先回忆线性代数里的知识。 一个行向量和一个列向量的乘积是这样的:

\[\begin{equation} \begin{bmatrix}a&b\end{bmatrix}\begin{bmatrix}c\\d\end{bmatrix}=ac+bd \end{equation}\] 进一步,第一个行向量可以看成列向量的转置。 那么这个\(ac+bd\)就是两个2维平面内列向量的内积。这就是高中数学中所讲的“向量乘法”。 这涉及到经典欧基里德空间的内积定义。 而谈到向量,单位正交向量肯定是非常有探讨价值的。因为一般情况下其他向量可以用单位正交向量比较简介地表示出来。 但是向量内积不仅仅存在于经典的欧氏空间。我们可以定义一系列定义域相同的函数,例如\([a,b]\)上的函数\(f\)\(g\)的内积可以定义成 \[ (f,g):=\int_a^b f(x)\overline{g}(x)dx \] 其中\(\overline{g}\)表示\(g\)的共轭复数。

在内积空间里, 两个向量的内积为\(0\), 说明两个向量正交(这和欧几里得空间是一致的)。 或者更形象地说, 夹角为\(\frac{\pi}{2}\)。 而向量的模的平方即自身和自身的内积。 我们可以定义函数的“单位正交系”

若定义在\([a,b]\)上的一系列函数\(\{\varphi_n(x)\}\)若满足\((\varphi_n,\varphi_n)=1\)\((\varphi_n,\varphi_m)=0(m\neq n)\), 则被称为单位正交系。

再看Fourier级数

可以验证,在\([-\pi,\pi]\)上,下列两组函数是满足单位正交的条件的: \[ \frac{e^{ix}}{\sqrt{2\pi}},\frac{e^{2ix}}{\sqrt{2\pi}},\frac{e^{3ix}}{\sqrt{2\pi}},\cdots \] \[ \frac{1}{\sqrt{2\pi}},\frac{\cos x}{\sqrt{\pi}},\frac{\sin x}{\sqrt{\pi}}, \frac{\cos 2x}{\sqrt{\pi}},\cdots \]

读到这里可以发现,\(a_0\)\(\frac{a_0}{2}\)的表示应该和\(\frac{1}{\sqrt{2\pi}}\)或者\(\frac{1}{\sqrt{\pi}}\)有关。

\(\mathbb{R}^n\)里,如果知道单位正交向量\(\mathbf{e_1},\cdots,\mathbf{e_n}\), 那么任意向量都可以唯一表示成\(x_1\mathbf{e_1}+\cdots+x_n\mathbf{e_n}\)。 向量\(\mathbf{\alpha}\)在的第\(k\)坐标分量为\((\mathbf{\alpha},\mathbf{e_k})\)。 通过这个角度看Fourier级数,就会发现,各项的系数就是函数的坐标: \[ c_m=\int_a^bf(x)\overline{\varphi_m}(x)dx \] 如果我们再看第二个复函数形式的表达式,就有 \[ c_m=\frac{1}{2\pi}\int_{-\pi}^{\pi} f(x)e^{-imx}dx \] 为了得到这个形式(\(c_m\)不受影响), 我们先用\(\frac{e^{imx}}{\sqrt{2\pi}}\)表示\(f\), 应该有 \[ \frac{f(x)}{\sqrt{2\pi}}=\sum_{-\infty}^{\infty}c_n\frac{e^{inx}}{\sqrt{2\pi}} \]

这里到底发生了什么? 我们把傅里叶级数的问题放到了一个以函数为元素的空间中, 然后选择了一组空间的, 然后求出的系数就是这组基下的坐标。 于是, 我们找到了傅里叶级数的几何意义(抽象上的), 这使我们能像高中平面几何、空间几何一样利用向量的性质解决一些问题, 尽管傅里叶级数涉及到的空间的维度是无穷大。

内积运算的规则

下列内积运算的规则会在接下来用到。 涉及到复数, 因此和经典欧基里德空间有不同之处(但是考虑到实数的共轭复数是本身, 最后一个性质其实是一样的)。 但是可以一个一个进行验证。

  • \((a+c,b)=(a,b)+(c,b)\)

  • \((a,b+c)=(a,b)+(a,c)\)

  • \((ka,b)=k(a,b)\)

  • \((a,kb)=k(a,b)\)

  • \((a,b)=\overline{(b,a)}\)

Dirichlet核

定义式

Dirichlet核的定义是这样的: \[ D_N(x)=\sum_{-N}^N e^{inx} = \frac{\sin(N+\frac{1}{2})x}{\sin\frac{x}{2}} \]

第二个等号既可以直接合并\(e^{inx}\)\(e^{-inx}\)得到\(\cos nx\)的式子从而进行积化和差,又可以利用等比数列的性质得到。

搭建起Dirichlet核和原函数的桥梁

针对文章开头提到的第二种定义,可以定义函数数列 \[ s_N(x)=\sum_{-N}^N c_ne^{inx} \]\(c_n\)展开,有 \[\begin{equation} \begin{aligned} s_N(x)&=\sum_{-N}^N\left(\frac{1}{2\pi}\int_{-\pi}^{\pi}f(t)e^{-int}dt\right)e^{inx}\\ &=\int_{-\pi}^{\pi} \frac{1}{2\pi}f(t)\sum_{-N}^Ne^{in(x-t)}dt\\ &=\frac{1}{2\pi}\int_{-\pi}^{\pi} f(t)D_N(x-t)dt\\ &=\frac{1}{2\pi}\int_{-\pi}^{\pi} f(x-t)D_N(t)dt \end{aligned} \end{equation}\] 最后一个等号通过函数的周期性和简单的换元运算得到。 至此,Dirichlet核和原函数的桥梁就被搭建起来了。 接下来,需要证明,以这个函数核构建的函数收敛于\(f\)

Bessel不等式以及其重要推论

\(f(x)\)在正交函数系\({\varphi_n(x)}\)下的系数为\({c_n}\), 则有\(\sum_{n=1}^{\infty}|c_n|^2\leq(f,f)\)

\(s_n(x)=\sum_{m=1}^n c_m\varphi_m(x)\), 其中\(c_m=\int_a^b f(x)\overline{\varphi_m}(x)dx\)。 下面通过讨论\(s_n(x)\)\(f(x)\)的误差得到这个不等式和一个重要的推论。

注意到\((f,s_n)=\int_a^b f(x)\sum\overline{c_m}\overline{\varphi_m(x)}dx=\sum\overline{c_m}\int_a^b f(x)\overline{\varphi_m(x)}dx=\sum|c_m^2|=\overline{(f,s_n)}=(s_n,f)\), 以及\((s_n,s_n)=\sum|c_m^2|\)\[\begin{equation} \begin{aligned} (f-s_n,f-s_n)&=(f,f-s_n)-(s_n,f-s_n)\\\ &=(f,f)-(f,s_n)-(s_n,f)+(s_n,s_n)\\\ &=(f,f)-(s_n,s_n)\\\ &\geq 0 \end{aligned} \end{equation}\] 也就是说, \[ (s_n,s_n)=\sum_1^n|c_m|^2\leq(f,f) \] \(n\to\infty\)时,就是所谓的Bessel不等式。 也可以发现,函数的Fourier系数\(c_m\)满足\(\lim\limits_{n\to\infty}c_m=0\)。 这个推论会在下面Dirichlet核收敛的证明中用到。

收敛证明

(Dini's Test)若对一些\(x\)有常数\(\delta>0\)\(M<\infty\)使得 \[ |f(x+t)-f(x)|\leq M|t| \] 对所有\(t\in(-\delta,\delta)\)成立,那么有 \[ \lim\limits_{n\to\infty}s_N(x)=f(x) \]

要注意的是,我们在这里只讨论逐点收敛。 其他形式的收敛会在接下来的文章中讨论

定义函数 \[ g(t)= \begin{cases} \frac{f(x-t)-f(t)}{\sin(t/2)},0<|t|<\pi\\ 0,t=0 \end{cases} \] 考虑到 \[ \frac{1}{2\pi}\int_{-\pi}^{\pi}D_N(x)dx=1 \] 因此有 \[ \frac{1}{2\pi}\int_{-\pi}^{\pi}D_N(t)f(x)dt=f(x) \] 所求函数和原函数做差,就有 \[\begin{equation} \begin{aligned} s_N(x)-f(x)&=\frac{1}{2\pi}\int_{-\pi}^{\pi}g(t)\sin\left(N+\frac{1}{2}\right)tdt\\ &=\frac{1}{2\pi}\int_{-\pi}^{\pi}\left[g(t)\cos\frac{t}{2}\right]\sin Ntdt+\frac{1}{2\pi}\int_{-\pi}^{\pi}\left[g(t)\sin\frac{t}{2}\right]\cos Ntdt \end{aligned} \end{equation}\] 根据\(f(x)\)的条件和\(g(x)\)的定义,\(g(x)\cos(t/2)\)\(g(x)\sin(t/2)\)是有界的。 利用Bessel不等式的推论可以发现,这两个积分趋近于\(0\)。 这就证明了结论。

总结&我接下来想写的

写到这里,已经涉及到了很多数学中的基本技巧:三角函数、向量内积、复变函数、等比数列、函数项数列收敛等等。 Fourier级数可以说是相当“优美”的一类级数。 在一些领域中,展开式中每一项均具有物理意义这是其他级数难以企及的。 我们又可以看到,Fourier级数还可以跳出三角函数的限制, 放在普遍的无穷维空间的规范正交基。 此外,它的收敛定理相比幂级数而言也是很宽松的。

接下来还有很多内容,我暂时的打算是这样的(已基本放弃;以后可能会有比较专门的调和分析内容):

  • Jordan’s criterion(关于\(s_N(x)\)收敛什么时候收敛到什么值),涉及到“有界差分”的概念

  • Parseval等式和应用(Fourier分析理论的核心内容之一),如三角函数系的完备性

  • Fejer核、Poisson核(一致收敛问题)