高等数学入门: 静态的极限、静态的导数

September 14, 2019
数学分析/Mathematical Analysis 高等数学入门

从伯克莱悖论到静态的不等式

我所非议的不是你的结论, 而是你的逻辑和方法. 你是怎样证明的? 你所熟悉的对象是什么? 你有没有表述清楚? 你遵循的原则是什么? 它们是否可靠? 你是如何应用它们的? 我必须强调, 我不关心你的定理是否正确, 但是关心你得到它们的方法. 这种方法合理吗? 清晰吗? 科学吗? ——《分析学家,或致一位不信神的数学家》(伯克莱主教)

牛顿和莱布尼兹发明微积分可以说是形成了高屋建瓴势如破竹的局面, 所以接下来二百年之内巨人辈出也可以说是时势造英雄. 对后来的巨人而言, 一个很重要的工作就是搞明白各种遗留的问题, 否则数学是不可能发展的. 但是伯克莱主教的抨击和质问在数学家的心头萦绕了接近两百年. 虽然伯克莱主教的主要目的是为了维护神学, 他的质问针针见血. 牛顿在“曲线求积术”中给$x$一个非零的增量$h$, 作了一些代数运算, 再令$h=0$. 这违背了逻辑学中最起码的矛盾律: $A$和$非A$真假相反. 牛顿自己说, “数学中最微小的误差也不可以忽略”. 而他这种论证方法也着实是自己对自己无奈的讽刺. 如果牛顿看到这本《分析学家》, 会是什么感受? 理不直, 气不壮, 有苦说不出.

但是微积分真的有“消逝量的鬼魂”吗? 微积分能成为非常实用的工具真的是因为“所有这些错误碰巧抵消了”吗? 数学家们花了接近200年才否定了这两个问题. 阿贝尔对分析中缺少严格性痛心疾首. 无奈自己贫病交加英年早逝. 贡献最大的还是柯西和魏尔斯特拉斯. 我们先考虑一个问题: 把极限局限在运动、几何中,真的合适吗? 在这里我想举出两个例子. 中国古代数学家算圆周率时, 利用圆内接正多边形. 是不是说$n\to\infty$时, 这个正$n$边形就是圆了? 是不是说这个多边形变成了圆, 有了圆的性质? 另外一个例子. 我们真的能“测量”出一个“间距”为$0$的“时间段”从而确定瞬时速度吗? 如果把极限局限在运动、几何中, 会产生不必要的混乱. 此外, 对于一些很难描述的函数(尽管19世纪这样的函数例子可能不是很多), 如果还局限在几何中, 只会给自己增加麻烦.

柯西做出最大的贡献就是, 对极限进行“去几何化”、“去运动化”. 他在19世纪20-30年代, 写了几本教科书:《工科大学分析教程》《无穷小计算概要》, 给出了极限的明确定义:

极限是一个数, 所谓$x$趋近$a$时$f(x)$以$A$为极限的定义就是, 若代表变量$x$的一串数值无限趋近$a$, 且其差可以任意小时, $f(x)$和$A$的差也可以任意小.

但是这仍然不够严格. “趋近”、“任意小”这种描述还残留着几何、运动的痕迹. 但是这种表述至少从根本上抛弃了“先不等于$0$再等于$0$”这种逻辑错误.

后来魏尔斯特拉斯对这种表述不够满意, 给出了更优良的定义, 这种定义沿用至今. 也就是我在上一篇文章中讲到的:

函数$f(x)$在$x$趋近于$a$时以$A$为极限的定义是: 设$a,A\in\mathbb{R}$, 函数$f$在点$a$的一个邻域中有定义, 若对每个给定的$\varepsilon>0$, 存在$\delta>0$, 使得$-\delta<x-a<\delta$时, 成立不等式$|f(x)-A|<\varepsilon$.

这种描述方式完全清洗掉了几何和运动的痕迹, 变成了静态的不等式. 而且很容易推广到更抽象的领域, 只要能表示这个不等式即可. 不等式可以说是源于几何但是又高于几何的. 可以再回去看那两个例子. 正$n$边形会不会完全和圆重合? 我们有$\lim\limits_{n\to\infty}P_n=S$, 但是每个$P_n$都不是$S$, $\{P_n\}$中也没有最后一个元. 至于瞬时速度, 它不过是$\Delta{t}\to 0$时一个让不等式成立的数罢了. 没必要扯上什么原子、不可分量, 无穷小量不过是极限为$0$的变量罢了.

时隔接近200年, 数学家们终于可以理直气壮地反驳伯克莱主教了: 我们应用的原则是不等式, 是合理的, 清晰的, 科学的. What’s your problem? 对此, 哲学家拉卡托斯发出感慨: “牛顿等了两百多年, 才有人出来拯救了他的灵魂, 进入了数学的天堂.”

在最初接触极限的概念时, 可能觉得很难理解、理解但很难应用. 这是很正常的. 后来人不可能简简单单走过数学家们200年曲折的路.

“静止”的导函数——代数化地看待导函数的概念

说到导函数, 可能读者首先想到的就是, 曲线的切线、物体运动的瞬时速率等等很直观的观念. 可是这真的足够吗? 曲线切线、瞬时速率这些概念, 给导函数赋予了几何意义、物理意义. 数学家们花了200年时间把极限从几何、物理的世界中抽象出来, 然而导数——其实就是一个函数极限——就要区别对待吗? 如果一个函数的定义域是二维值域是三维, 那要怎么探讨它的几何意义? 我们也需要把导数从几何、物理的世界中抽象出来. 接下来我们在实数范围进行探讨. 的f

设函数$f$在$x_0$处某邻域有定义, 如果存在实数$A$使得[\lim\limits_{h\to{0}}\frac{f(x_0+h)-f(x_0)}{h}=A]则称函数$f$在$x_0$处可导, 并记[f’(x_0)=A]

一个函数在$x_0$处的导数实际上是一个$\frac{0}{0}$型不定式的极限. 也就是说, 一个满足一系列不等式成立的“值”. 它不是通过点移动作割线变成切线的斜率. 我们不能再犯“这条线和曲线有两个交点, 又只有一个交点”的逻辑错误了. 也不要通过测量时长为$0$的“时间段”求所谓瞬时速度了. 当然不是说导函数和切线斜率、瞬时速度没有关系. 而是说, 不应该划上等号. 应该说, 导函数在几何上体现为切线斜率. 这个值是静止的, 就在那儿. 也不必考虑“这条线和曲线有两个交点, 又只有一个交点”这种不是悖论的悖论了. 因为割线永远有两个交点. 我们关心的是, 这个切线于割线的斜率是不是可以让不等式恒成立. 而切线仅仅是几何范围内的一个例子. 通俗易懂的例子可以帮助理解, 也赋予了应用价值, 但是我们不应该把例子和实际情况划上等号.

为什么“值”要打上引号呢? 如果定义域和值域是高维空间(不妨设分别为$n$维和$m$维), 那么这个导数是一个$m\times n$矩阵. 实际上也可以把值域定义域都是实数的函数的导数看成$1\times 1$矩阵. 这个时候可以说, 一个函数在一点的函数是个线性变换, $n$维空间的点映射到$m$维空间. 一个函数的求导运算也是一个函数, 将函数的定义域映射到一个$m\times n$矩阵空间. 当然矩阵的内容超出了这篇文章的范围.


如果您或您的朋友在Pocket等网站阅读本文, 建议使用“阅读原文”功能, 否则可能无法看到由Mathjax生成的数学公式

利用隐函数存在定理解决解析几何问题

October 17, 2019
数学分析/Mathematical Analysis 解析几何/Analytical Geometry

压缩定理解决一致收敛的问题

October 4, 2019
数学分析/Mathematical Analysis

优美的Fourier级数(六): Poisson核的一致收敛

September 27, 2019
数学分析/Mathematical Analysis Fourier分析/Fourier Analysis 优美的Fourier级数
comments powered by Disqus