Aug 192020
 

从模函数到单值化定理 Ⅴ

秋水无涯

Prologue:

…It is true that Mr. Fourier had the opinion that the principal purpose of mathematics was the benefit of the society and the explanation of phenomena of nature; but a philosopher like he should know that the sole purpose of science is the honor of the human mind, and under this title, a question about numbers is as valuable as a question about the system of the world…

——C. G. Jacobi, Letter to Legendre

 

紧Riemann面是代数几何学家感兴趣的对象,因为可以将其视为复射影空间中的代数曲线。在接下来的两章中,我们利用单值化定理对紧Riemann面做一个初步的讨论。

以 $\mathbb{\bar{C}}$ 为万有覆叠的紧Riemann面$S$ 解析同构于$ \mathbb{C}P^{1}$,有理函数是其上仅有的亚纯函数。拓扑上我们得到了一个亏格为$0$的闭曲面(球面)。这一情形是简单的。

以$\mathbb{C}$为万有覆叠的紧Riemann面S解析同构于$\mathbb{C}/\Lambda$,$\Lambda$是某个格。从拓扑上看,这是一个亏格为$1$ 的闭曲面(环面)。

和亏格$0$ 的情形不同,并非所有亏格 $1$ 的紧Riemann面都彼此解析同构。假定$ \Lambda$ 的基按逆时针排列,即$\Im(\omega_{2}/\omega_{1})\gt 0$。对同一个格可以选取不同的基,彼此相差一个$PSL(2,\mathbb{Z})$中的线性变换。将相差伸缩和旋转变换的格视为等价的,则等价类可以用 $\mathbb{H}/ PSL(2,\mathbb{Z})$进行参数化。通过覆叠映射定义$S$上的复结构,容易证明 $S$ 和 $S^{\prime}$ 解析同构当且仅当$\Lambda$ 和$\Lambda^{\prime}$ 等价。今后我们总是假定讨论的格带有标准基$1,\tau,\Im(\tau)\gt0$。

我们希望实现代数曲线 $S $ 到 $\mathbb{C}P^{N}$ 的嵌入。最直接的想法是在 $S$ 上找不同时为$0$ 的 $N+1$ 个全纯函数构作射影坐标系。然而紧Riemann面上不存在全纯函数。一个变通方案是在$\hat{S}$上寻找有特殊对称性的全纯函数f。具体地说,视单值群 $G$ 为 $Aut(\mathbb{C})$的子群,我们希望对 $g \in G,f_{i}(gz)=\gamma_{g}(z)f_{i}(z),\gamma_{g}(z)$是仅依赖于 $g$ 的整函数且处处不为 $0$。这样利用等价关系仍可以同时消去所有的$\gamma_{g}(z)$。

实际上我们拥有了一个单值群G到整函数环的乘法群的同态。如果我们取同态象的生成元为$1$和 $e^{-2k\pi iz}$,就得到:

$$f_{i}(z+1)=f_{i}(z),f_{i}(z+\tau)=e^{-2k\pi iz}f_{i}(z)$$

这时满足条件的 $f_{i}$可以用Fourier展开直接构造出来。计算指出其Fourier系数满足一个$k$ 阶递推关系,且对任意选取的初始值收敛,故这些函数构成一个k维函数空间。

$S$ 当然不能嵌入 $\mathbb{C}P^{1}$。取 $k=3$,利用上述的 $f_{i}$ 可完成 $S$ 到 $\mathbb{C}P^{2}$ 的嵌入。我们不再讨论技术性的细节,而是指出类似的想法可以推广到高维。高维复环面可以嵌入射影空间当且仅当其周期矩阵满足Frobenius关系。

按上述方式定义的 $f_{i}$是一种特殊的theta函数。k称为theta函数的权。我们利用theta函数来研究 $S$ 上的亚纯函数。亏格为 $1$ 的紧Riemann面上的亚纯函数对应 $\mathbb{C}$上的双周期函数,沿用历史上的叫法,也称为椭圆函数。现在很容易构造这样的函数:取两个权为 $k$ 的theta函数的商即可。这个利用theta函数的商构作椭圆函数的想法是Jacobi的。椭圆函数论是一门不小的学问,和很多有趣的话题有关。这里我们想指出的是,椭圆函数是 $\mathbb{C}$上$G$-不变的亚纯函数。在 $\triangle$ 上 $G$-不变的亚纯函数称为自守函数。在第6章中我们将会看到Jacobi的想法如何启发了Poincaré在自守函数方面的工作。

Weierstrass提出了另一种构造椭圆函数的方法,即利用Weierstrass $\mathfrak{P}$函数。这方法简洁明了,被大多数现代课本采用。然而值得指出的是,theta函数处在数论、自守形式、函数论和数学物理的交叉点上,研究其性质有极高的附加价值。在第7章中有一个重要的例子:尖点形式$\Delta$。

在Jacobi看来,纯数学和应用数学是一体的(Bourbaki,尤其是Dieudonné鼓吹的“为了人类心智的荣耀”是对Jacobi可耻的断章取义)。在对theta函数的研究中他身体力行地实践了这一哲学。在现代,这一传统的有力继承者是Arnold,因而引用Arnold的话来结束是适当的:

Jacobi noted, as mathematics’ most fascinating property, that in it one and the same function controls both the presentations of a whole number as a sum of four squares and the real movement of a pendulum.

These discoveries of connections between heterogeneous mathematical objects can be compared with the discovery of the connection between electricity and magnetism in physics or with the discovery of the similarity between the east coast of America and the west coast of Africa in geology.

The emotional significance of such discoveries for teaching is difficult to overestimate. It is they who teach us to search and find such wonderful phenomena of harmony of the Universe.

 Posted by at 1:21 pm
Jul 252020
 

Author: KKK

In this short note, we will give a simple proof of the Gauss-Bonnet theorem for a geodesic ball on a surface. The only prerequisite is the first variation formula and some knowledge of Jacobi field (second variation formula), in particular how its second derivative (or the second derivative of the Jacobian) is related to the curvature of the surface. This is different from most standard textbook proofs at the undergraduate level. (Of course, this is just a local version of the Gauss-Bonnet theorem and topology has not yet come into play.)

Let $M$ be a surface equipped with a Riemannian metric. We will fix a point $p$ in $M$ and from now on $B_r$ always denotes the geodesic ball of radius $r$ centered at $p$, and $\partial B_r$ its boundary, which is called the geodesic sphere. In geodesic polar coordinates, let the area element of $M$ be locally given by

$$\displaystyle \begin{array}{rl} \displaystyle dA=f(\theta, r) dr d\theta, =f_\theta(r) dr d\theta, \end{array} $$

where $f(\theta, r)$ is the Jacobian (with respect to polar coordinates). For our purpose it is more convenient to regard $f_\theta(r)$ as a one-parameter family of functions in the variable $r$. It is well-known that $f_\theta$ satisfies the Jacobi equation (here $’=\frac{d}{dr}$ )

$$\displaystyle \begin{array}{rl} \displaystyle {f_\theta}”(r)=-K(\theta, r) f_\theta(r),\quad f_\theta(0)=0,\quad {f_\theta}'(0)=1 \ \ \ \ \ (1)\end{array} $$

where $K=K(\theta, r)$ is the Gaussian curvature (in polar coordinates). Indeed, if we fix a geodesic polar coordinates, and $\gamma_\theta(t)$ is the arc-length parametrized geodesic with initial “direction” $\theta$ starting from $p$, then we can define a parallel orthonormal frame $e_1(t), e_2(t)=\gamma_\theta'(t)$ along $\gamma_\theta(t)$. Then $Y(t)=f_\theta(t)e_1(t)$ is a Jacobi field and so

$$\displaystyle \begin{array}{rl} \displaystyle Y”(t)={f_\theta}”(t) e_1 (t) =- R(Y(t), \gamma_\theta'(t))\gamma_\theta'(t) =& \displaystyle -K(\theta, t) Y(t)\\ =& \displaystyle -K(\theta, t) f_\theta (t) e_1(t). \end{array} $$

From this (1) follows.

The first variation formula says (here $s$ is the arclength parameter)

$$\displaystyle \begin{array}{rl} \displaystyle \frac{d}{dt} \left(\mathrm{Length}(\partial B_t)\right) =\frac{d}{dt} \left(\int_0^{2\pi}f_\theta( t) d\theta\right) =\int_{ \partial B_t}k_g ds =\int_0^{2\pi} k_g(\theta, t) f_\theta( t)d\theta. \end{array} $$

Here $k_g$ is the geodesic curvature of the geodesic circle $\partial B_t$. (Indeed, the differential version $\frac{f_\theta’}{f_\theta}=k_g$ is already true for the geodesic circle.) This implies

$$\displaystyle \begin{array}{rl} \displaystyle \int_{\partial B_t}k_g ds =\int_{0}^{2\pi} f_\theta'(t) d\theta. \end{array}$$

So by the fundamental theorem of calculus and (1), we have

$$\displaystyle \begin{array}{rl} \displaystyle \int_{\partial B_t}k_g ds =& \displaystyle \int_{0}^{2\pi}\left({f_\theta}'(0)+\int_0^t {f_\theta}”(r)dr\right)d\theta\\ =& \displaystyle \int_{0}^{2\pi}\left(1-\int_0^t K (\theta, r)f_\theta(r)dr\right)d\theta\\ =& \displaystyle 2 \pi-\int_{B_t} K dA. \end{array} $$

This is exactly the Gauss-Bonnet theorem (for a geodesic ball), which is usually written as

$$\displaystyle \begin{array}{rl} \displaystyle \int_{B_r}K dA+\int_{\partial B_r}k_g ds=2\pi. \end{array} $$

Jul 132020
 

作者:秋水无涯

Prologue:

要善于“退”,足够地“退”,退到最原始而不失去重要性的地方。 ——华罗庚

 

“转换原理”可以粗略地叙述如下:如果对“有界”函数叙述的较弱命题成立,则对“在 \(\mathbb{C} \) 上有2个空隙值”的函数所叙述的较强命题也成立。

我们用具体的例子来说明。首先是经典的Liouville定理:

任何一个在 \(\mathbb{C}\)上有界的全纯函数f必为常值函数。

“转换原理”将其加强为著名的Picard小定理:

任何一个在 \(\mathbb{C} \)上有2个空隙值的全纯函数F必为常值函数。

下面来证明Picard小定理,借以说明“转换原理”的运作机制:

首先注意到,我们可以把Liouville定理中的有界性要求替换为 \(Im(f) \subset \triangle\).

假设全纯函数 \(F \) 在 \(\mathbb{C}\) 上有2个空隙值。考虑复合函数\(\mu=\lambda ^{-1} \circ F\)。任取 \(z_0 \in \mathbb{C},F(z_0)=w_0\)。在 \(w_0\) 的邻域中\(\lambda^{-1}\)可取到某一单值分支。由于\(\lambda\)是覆叠映射, 定义在单连通区域 \(\mathbb{C}\)上的 \(\mu\)可延拓成一个单值函数,并满足 \(Im(\mu) \subset \triangle\)。由Liouville定理,\(\mu\) 为常值函数,从而\(F\)为常值函数。

此证明最早由Picard给出。

C.E.Picard (1856-1941)

C.E.Picard (1856-1941)

 

和Picard小定理相比,Picard大定理更加微妙。我们需要更多的准备。

首先陈述经典的Weierstrass定理:

解析函数在本性奇点的每一邻域中都任意地逼近于任意复数值。

为应用“转换原理”,我们将其重新叙述为(较弱的):

命题1:若解析函数f在孤立奇点的某一邻域内“有界”,则此奇点不是本性奇点(从而是可去奇点或极点)。

此处的“有界”指的是:视\(\mathbb{\bar{C}}\) 为球面,则此邻域的象包含在球面上的某大圆中。对于可去奇点,其邻域的象点“聚拢”到复平面上的某一常点;对于极点则“聚拢”到无穷远点。在这两种情况下,我们都得到广义的“有界性”。而对于本性奇点,任一邻域的象都“分散”在整个球面上。

通过一个Möbius变换,我们可以进一步将“广义有界”的要求替换为:存在某邻域的象落在 \(\triangle\) 中。

同时我们也对“转换原理”稍作推广:对\(\mathbb{\bar{C}}\) 上的广义“有界”函数成立的命题对“在 \(\mathbb{\bar{C}}\)上有3个空隙值”的函数亦成立。

不妨假定奇点为0。推广后的“转换原理”将命题1转换为Picard大定理:若解析函数\(F: \mathbb{\bar{C}}\backslash\{0\} \to \mathbb{\bar{C}}\)在奇点的某一邻域内有3个空隙值(计入\(\infty\)),则0不是本性奇点。

换言之,解析函数在本性奇点的任一邻域中至多有2个空隙值(计入\(\infty\))。

证明:选取以0为圆心且半径充分小的穿孔圆盘\(\Omega\backslash\{0\}\) 使其满足假设。将F 限制到 \(\Omega\backslash\{0\}\)上。同样的,考虑复合函数\(\mu=\lambda ^{-1} \circ F\)。此处的困难是\(\Omega\backslash\{0\}\)并非单连通域,故证明Picard小定理时所用的解析延拓未必给出单值函数。这要求我们推广命题1为:

命题2:若多值解析函数f(更准确地说,给定的初始函数芽在穿孔圆盘上延拓而成的全局解析函数)在孤立奇点的某一邻域内“有界”,则此奇点是代数奇点(支点)。

一个简单的证明手法是利用单值化定理对f进行单值化,从而化归为命题1。

总而言之,就其本质而言,Picard大定理是一个应当在Riemann面上陈述的定理。

最后我们希望对“转换原理”做一个一般的讨论。复分析中隶属于值分布论的结果一般都是比较深刻的。“转换原理”允许我们“足够地退”,退到论证“有界性”。讨论后者时,常有更多分析的手段可以采用。例如Liouville定理和Weierstrass定理都可以通过初等估计来证明。在第3章中我们要将函数的有界性和函数空间的“紧致性”联系起来。

 Posted by at 1:09 am
Jul 062020
 

非欧几何是一个时代的结束?还是开始?

作者: 4分33 秒

数学史家Judith Grabiner说过:
If you ask a mathematician “why?” the mathematician will give you a proof.
But when you ask a historian “why?” the historian will tell you a story.

几何学是数学中最古老的一门分科。如果从欧几里得的《几何原本》算起,至今已有两千三百多年的历史,而且该学科长盛不衰,其内涵一直在不断地延展之中,以至于现在人们很难确切地回答「甚么是几何学?」这个问题。

相传几何学起源于古埃及尼罗河氾滥后为整修土地而产生的测量学。它的英文名称“geometry”是由“geo”和“metry”组成的,其意义就是“土地测量”。在1607年利马窦和徐光启把欧几里得的《Elements》译成中文,取“geo”的音为「几何」,而「几何」二字中文原意又有「衡量大小」的意思,音义兼顾,确是神来之笔。

长期以来,数学家们发现欧几里得的第五公设和前四个公设比较起来,显得文字叙述冗长,而且也不那么显而易见。而且欧几里得在《几何原本》一书中直到第29个命题中才用到它。也就是说,在《几何原本》中可以不依靠第五公设而推出前28个命题。因此,一些数学家提出,第五公设能不能不作为公设,而作为定理?能不能依靠前四个公设来证明第五公设?这就是几何发展史上最著名的,争论了长达两千多年的关于「平行线理论」的讨论。由于证明第五公设的问题始终得不到解决,人们逐渐怀疑证明的路子走的对不对?第五公设到底能不能证明?

命题29:一条直线与两条平行线相交,则所成内错角相等,同位角相等,且同傍内角的和等于二直角。(欧几里得没有平角的定义,所以他一律使用两个直角的和)

设准 vs. 公理

设准、公理、共有概念这些词有甚么不同?当然现今这些概念是都混在一起用了。

Postulate = Special Notion vs. Common Notion = Axiom

爱因斯坦在《论动体的电动力学》中写道:
We will raise this conjecture (the purport of which will hereafter be called the “Principle of Relativity”) to the status of a postulate, and also introduce another postulate, which is only apparently irreconcilable with the former, namely, that light is always propagated in empty space with a definite velocity:c which is independent of the state of motion of the emitting body. These two postulates suffice for the attainment of a simple and consistent theory of the electrodynamics of moving bodies based on Maxwell’s theory for stationary bodies. The introduction of a “luminiferous aether” will prove to be superfluous inasmuch as the view here to be developed will not require an “absolutely stationary space” provided with special properties, nor assign a velocity-vector to a point of the empty space in which electromagnetic processes take place.

数学史家:设准 vs. 共有概念

为何爱因斯坦使用postulate而非axiom?
在建立叙述句理论(theory of statements)时,亚里斯多德如何区别「设准」及「共有概念」?
所有演绎科学(deductive science)都接受的根本真理,称之为共有概念(common notion),例如:「等量相加,其和相等」,后来泛称为公理(axiom)。
特定科学(例如几何学)中的根本真理,称之为特殊概念(special notion),后来改称为「设准」(假设成为准则),此翻译十分精确!

数学真理的相关议题

何谓真理(truth)?
真理的「朴素」定义:去括号法则!
“Snow is white” is true if snow is white.
要件:一个叙述句或命题必须在实在(或现实世界reality)有所指涉,也就是其中所涉概念必须要有参考物(referent)。
现在回到数学!所谓的数学真理或是几何真理意义何在?

爱因斯坦的反思!

Morris Kline在《数学:确定性的失落》中写道:「倘若数学命题是对现实(reality)的描述,它们就不是确定的(certain);倘若它们是确定的,那它们就不是描述现实。……然而另一方面,可以确定的是,不论就数学整体或是单就几何而言,它们的存在都是我们想要得知实际物体的性质。
数学知识的本质(nature)究竟为何?数学(例如几何学)的「确定性」基于有效的逻辑推论,也基于「设准为真」?

康德有关空间的思辨

康德主张:欧氏几何学是一种综合先验(synthetic a priori)的知识系统,它是有关空间世界的唯一真实几何学(true geometry)。既然如此,那当然不可能有非欧几何学了!
康德提问:为什么接受数学公设与定理都是真理?这当然无法单单藉由经验来确认,但是如果可以回答数学知识如何形成这个大问题,那么,前述问题就可以回答了。
康德回答:无人的心灵(mind)拥有时间和空间的形式。时间和空间是知觉的模态(mode),康德称之为直觉(intuition)。我们依据这些心灵形式来感觉、组织和理解经验。它们就像模子塑造麵团成形一样地塑造经验。心灵将这些模态施加在接收的感官印象上,把这些感觉纳入内定的模式裡。

一旦空间的直觉源自心灵,心灵便自动接受了空间的某些性质,像是直线是两点之间的最短距离、三点决定一个平面,还有平行公设之类的原理,康德称之为综合先验真理,它们是人类心智能力的一部分。几何学不过是探索了这些原理的逻辑结果。心灵就其「空间结构」来检视经验,此一事实意谓了经验将会与基本原理和定理一致。
既然康德是从人类脑细胞製造出空间的概念,他看不出它如何不是欧氏空间。因为想像不出另一种几何,所以,他相信除了欧氏几何之外,不可能再有别的几何。

在《丈量世界》中有一段高斯拜访康德的桥段:「高斯说他有个想法,但找不到人谈。他似乎觉得欧几里得的空间并不像《纯粹理性批判》裡所认为,是人类的一种直观形式,我们所有的经验都必须服膺于它。欧氏空间其实是一种幻觉,是一场美梦。真相其实很可怕,「两条平行线永远不可能相交」的命题从来没有被证实过,欧几里得自己也没有证明过,没有任何人证明过。它绝不像我们认为的那样是不证自明的。」

非欧几何的历史

欧氏几何在19世纪之前,被认为是绝对真理,康德甚至在1781年出版的《纯粹理性批判》中,用一种绝妙论证,证成欧氏几何。
因天文学和航海绘製地图的需要而发展的球面几何学,源自于希腊时代,从现代观点可想成一种非欧几何,但古代没有人这样思考,他们理所当然地认为这从属于欧氏几何。
15世纪文艺复兴绘画开始发展的「透视」和「无穷远点」等射影几何概念,不被想成「非」欧氏几何,而是关联于欧氏几何发展的领域。

谈非欧几何的重点在于:
1. 绝对欧氏空间的扬弃,把实际空间还给物理学,把欧氏几何想成一种可能的几何(最简单的)。
2. 非欧几何必须相应处理原来欧氏几何的几何概念:长度、角度、面积、体积等。

Non-Euclidean geometry

欧氏平面与空间的代数化

坐标几何或解析几何发源自17世纪,主要推手是笛卡儿和费马,所以我们熟悉的直角坐标,也称为笛卡儿坐标。笛卡儿和费马的座标法将变数引进了数学,从而将运动引进了数学,因此为微积分的发明创造了必要的环境和条件。微积分要解决的首要问题是求曲线的切线斜率,以及曲线所围区域的面积,所以微积分在它产生的时刻就是和解决几何问题联繫在一起的。

藉由16世纪末Viète推动的代数符号,数学家开始引入代数工具解决几何问题,开启欧氏几何的全新格局,不但出现许多新几何形体,也採用新颖的分析方法,用代数演算取代逻辑推理,以解析几何(analytic geometry)取代综合几何(synthetic geometry)。「解析」在此无函数或微积分的意思,单纯只是「代数」而已。解析几何最初没有负数(只有第一象限),轴未必垂直,只处理平面,算式只有多项式,但是到欧拉的18世纪中期,已经是现代的模样。

高斯新几何观的背景

新几何的背景就是解析几何,研究的是欧氏平面或空间中的曲线或曲面,推动这些研究是科学的应用,因此经常出现困难课题先行,理论在后收拾的情况。
新几何最重要的工具是微积分与微分方程,因此也称为微分几何,在18世纪中探讨了很多困难的课题。
发展微分几何过程出现的「曲率」概念,后来在微分几何理论扮演关键角色,不但促成高斯和黎曼的新几何概念的发展,最后甚至在物理学—广义相对论和量子场论—中找到根本的应用。

曲面

曲面作为空间中的形体,从17世纪解析几何萌芽,到18世纪迅速发展,比曲线有更複杂的课题。促使曲面论发展的实际应用课题包括地图製作(developable surface)与测地线(geodesic, 测地问题),名家包括:欧拉, Monge, 高斯。
高斯用所谓「曲面即世界」的观点来理解曲面问题。实际上,高斯是在反省他的研究后,才产生这个想法,这是新几何观点的起点。曲面是平面的推广,曲面曲线是平面曲线的推广。

高斯绝妙定理

第一基本形式作为量度长度的「量尺」,决定了某二维的生物(例如蚂蚁)世界所有的几何量:长度、角度、面积。
若两曲面(局部)相对应的第一基本形式相同,则蚂蚁将(局部)无法分辨这两个「世界」。
第一基本形式决定的几何性质称为曲面的内禀(intrinsic)性质,是蚂蚁能察觉的几何性质。
令人意外的是,蚂蚁能够判断自己曲面的一部分曲率。这就是高斯绝妙定理:高斯曲率由第一基本形式决定,即高斯曲率是内禀的。

高斯曲率是内禀的几何量

除了长度、角度、面积,测地线(「直线」)和高斯曲率也都是内禀的(对我们最新奇的是「曲率也是几何量」)。相反的,平均曲率、主曲率、主方向、法曲率这些量,都属于曲面在背景空间中的外在弯曲,是蚂蚁无法感知的。
两曲面若相对应的高斯曲率不同,则对蚂蚁而言就是不同的「世界」。例如平面和球面是两个截然不同的世界,但平面和柱面却是(局部)上相同的。
一般来说,高斯曲率相等是两张曲面能够建立保长对应的必要条件,不是充分条件。

Non-Euclidean geometry

测量高斯曲率

Gauss-Bonnett定理之原版:三角形内角和

\[\theta_1  + \theta_2+ \theta_3=\iint_{\triangle} K\mathrm dA.\]

曲面上的三角形是以测地线为边的三角形。

高斯绝妙定理和Gauss-Bonnett定理两重要定理出自高斯1827年发表的《Disquisitions Generales circa Superficies Curvas》(《曲面论》),时年50岁。两年后,37岁的Lobachevsky发表非欧几何的论文,再三年,30岁的Bolyai完成非欧几何的论文。

高斯, Lobachevsky, Bolyai公案

高斯从未发表非欧几何的结果(高斯对于非欧几何的研究都只写在与友人的通信中,他不敢发表因为那时的人还是把非欧几何视为邪教),但他在检阅Bolyai(1832年)和Lobachevsky(1846年)的工作后,虽然都不吝称讚他们的想法很有天份,但也同时表示他对这些结果早就了然于胸,无法给予更多的讚誉。

高斯50岁以前的通信显示,他14岁开始思考非欧几何,22岁已经怀疑欧氏几何的真确性。在40岁给友人的信件裡,已经直言几何的经验性,说出:「我们几何信念的必然性无法证明」「几何不应与先验的算术并置,而该和力学归到同一类。」高斯不但发明「非欧几何」这个词,也明白表示欧氏几何是非欧几何的退化情况。

高斯虽然没有发表,但在早期信件中已经描述许多他证明的非欧几何关键定理。1831年,他表示曾多次重证这些性质,现在怕这些结果跟他一起腐朽,想要写下来。不过隔年他看到Bolyai的论文,或许就此打住。

总之,从他1827年的经典论文,就可以知道高斯在这个议题上的广度和深度早已超越Lobachevsky和Bolyai。黎曼才是真正继承高斯思想的人!

黎曼登场

高斯的新观点包括「曲面本身就是几何空间」(「曲面就是世界」);第一基本式决定内禀几何;不同世界几何性质的差异源于内禀曲率。

黎曼为取得Privatdozent职位,在准备「教师资格演讲」(Habilitation lecture)时, 提出三个讲题(一个是关于电磁学和另一个关于複变函数),77岁高龄的高斯出乎意外挑了与几何有关的第三个讲题。1854年6月10日,黎曼以Über die Hypothesen welche der Geometrie zu Grunde liegen(《论几何基础的假设》)为题演讲,由于内容高深,听众基本上只有高斯能够理解,但他给黎曼的演讲非常高的评价。一年后高斯便与世长辞。

讲稿本身哲学气味重(他当时是要申请哲学教职,底下听众大多是哲学系的教授,所以可能只有高斯能真的听懂),没有太多数学算式,可谓艰涩隐晦,通常要配合他另一篇著于1861年的论文阅读。

杨振宁曾写过一首诗讚美陈省身先生:「天衣岂无缝,匠心剪接成,浑然归一体,广燧妙绝伦:造化爱几何,四力纤维能,千古寸心事,欧高黎嘉陈。」高斯在几何学中起到了继往开来的作用,融合了自古希腊到17世纪的所有知识,并在他死后将衣钵传承给了黎曼。陈省身也对杨振宁说:物理学不过是几何学的子集。

黎曼在演讲一开头,就说明空间和空间公设之间的关係仍藏于黑暗:「我们既不能感知这样的关联是否或相当程度有其必要,也无法先验决定这是否可能。」空间的度量关係可能有很多系统,其中最知名的是欧氏几何,黎曼说这些系统「只具备经验确定性,但并非必然,全部都只是假说。」

黎曼重新检视研究几何的策略,放弃欧几里得等人传统全知的公设系统(尤其牵涉整体空间平行公设的正反),从局部且内部(蚂蚁的)观点,检视所知的几何关係,从第一基本形式的开始,採行分析学的道路,扩展高斯的想法,发展n维空间的概念(称为n维流形)。不但定于一尊的欧氏几何,变成存在各式各样的几何,而且完全不需要背景空间。

以经验决定几何空间会触及巨观和微观的限制。在巨观时,他特别区分无界(unboundedness)和无穷(infinite extent)的不同,强调我们基于经验经常混淆两者(康德在论及空间的二律背反时,便以此误解论证空间必须无穷)。黎曼隐含我们生存的空间可能是无界而非无穷。

鑑于经验观察将造成干扰,即使力学使用微积分而大成,但对人类观察不能及的微观世界,黎曼认为:「无穷小空间的度量关係绝非肤浅的问题。」微观几何的原理可能不同于前述的几何假设,他的演讲结尾竟然是:「这引领我们到另一个科学领域─物理学,今天演讲的目标不容我们再谈及。」

黎曼演说重新思考几何学的基本假设,触及很多面向,不但直接催生黎曼几何(空间+度量),也间接推动各种思维如流形论(空间本身)、具对称群作用之对称或齐性几何(如容许全等操作的常曲率流形)。将这篇讲稿译成英文的数学家Clifford,认为黎曼觉得空间必须结合物质才能真正解释物理空间(广义相对论),也有人将最后一段微观讨论连结到量子几何学。

模型和非欧几何

不知道是因为科学发展的时代氛围,高斯和黎曼对于几何学的创见更丰硕,理论本身的完善,或是欧氏几何在学习上最简单,曾经红极一时的非欧几何,在19世纪中开始失去吸引力,只留下一个重要的问题:「非欧几何真的一致吗?」其中是不是潜藏某个矛盾,以致于欧氏几何仍然是唯一的几何(老实说,欧氏几何也有一样的问题)。

这个问题,在19世纪下半叶,被Beltrami, Klein, Poincare「以子之矛,攻子之盾」很巧妙地解决了。他们在欧氏空间中提出一个能全然「体现」非欧几何公设的模型(model),因此如果非欧几何有矛盾,就会转化成欧氏几何的矛盾。

用模型来处理公设系统,后来发展成一个重要方法,用来解决许多牵涉公设系统的数学基础或数理逻辑问题。算是非欧几何对人类思想出乎意料的贡献。

谁发明了非欧几何学?

萨开里:如果非欧几何指的是一组包括非平行公设的公设系统所推导出来的结果,那麽,功劳最大的要属萨开里(Giovanni Girolamo Saccheri)。
克吕格和兰伯特:如果非欧几何的创立指的是认识到欧几里得几何之外另有其他的几何,那麽,功劳应该归于克吕格(Georg Kluger)和兰伯特(Johann H. Lambert)。
高斯:欧几里得几何并非物理空间所不可或缺的,没有任何先验的根据来确保它的物理真确性。这项领悟并不需要任何技术性的数学新发展,因为所有的技术性工作均已完成。第一个得到这项洞见的数学家是高斯!

康德的复仇

最后再回过头来谈谈康德在《纯粹理性批判》中证成欧氏几何的先验综合命题论。康德理论在认知科学时代捲土重来:人类的大脑模组是欧氏几何?
因为欧氏几何是最简单的几何系统,而且线性理论是数学家逼近问题的第一步。那麽我们不妨思考一下:「如果靠视觉观察世界的人类诞生在半径小的星球上(可以明显看到地表是圆的),那麽将会演化出什麽样的几何模组?」

本文来自 https://proscience2.wordpress.com/2019/09/25/

May 302019
 

“苟日新,日日新,又日新”

作者: 秋水无涯

博尔赫斯曾经(大逆不道地)怀疑过所有经典文学作品的“永恒性”。在我看来,在数学中实践这种怀疑主义所要冒的风险要小得多。这是一门研究客观对象的学问(我无意卷入哲学上的争论,例如“理念”是否真实存在,数学家“发现”还是“发明”定理等等:实践者或多或少总能达成共识,而与旁观者争论是没意义的),认识总在进步。如果说有人站在巨人的肩膀上以至于觉得巨人并不高大,他大可不必为此感到羞愧。何况据说小平先生还没有他的夫人高呢。

经典的复分析理论是由3位风格各异的大师奠定的:Cauchy的积分表示观点,Weierstrass的幂级数表示观点和Riemann的复几何观点。近代恰好也有3位大师写过复分析的入门书:Ahlfors、H.Cartan以及小平邦彦。诚然,一本近代教材不可能只局限于介绍某种观点,甚至3种经典观点本身也无法截然分开,然而我们还是不难发现某种对应:

Ahlfors《复分析》最精彩的部分在于提供了一个从拓扑角度看完全清晰而现代的Cauchy积分定理。他毫不掩饰自己的分析学家趣味,自得其乐地(当然同时也让读者受益无穷)讨论着函数的各种表示,函数空间内的收敛性,椭圆函数论以及超几何函数论。这些论题覆盖了经典函数论的绝大部分内容,又出之以现代观点,使得此书在数十年间一直保持着第一参考书的地位。这是3本书中我读得最早也最钟爱的一本,虽然我并不强求它是完美的:在不引入Riemann面的情况下引入层论是相当勉强的,除了让叙述稍显摩登之外没有什么意义。

Cartan的《解析函数论》则处于一种尴尬的境地。他试图把Weierstrass观点摆到图像的中心,但这里有一个天然的(?)的限制:从积分表示构造幂级数表示要比从幂级数表示构造积分表示自然得多。因而他不得不在两种观点间来回跳跃,远不如Ahlfors宏大而一致。当然他的牺牲也获得了某种回报:Weierstrass观点可以毫不费力地推广到多变元(Cauchy的大部分函数论定理也仍然正确;高维的困难之处本质上是几何的)。

小平讨论了Riemann面,讨论了调和函数和“臭名昭著”的Dirichlet原理,讨论了Abel积分,也讨论了Riemann-Roch定理——他的这本著作几乎可以用来为Riemann招魂。这个膜拜Riemann的教派大概是由Klein创始的,一传到Weyl,再传到小平。然而从Riemann到小平已将近一个世纪,这种“复古”的风气难免显得有些怪异:在讨论全纯/亚纯形式的时候,小平偏要说Abel微分并把它分为一二三类;椭圆算子的正则性以及Hodge理论原本是他的拿手好戏,他却宁愿踩着Weyl引理-Dirichlet原理这条窄道小心前行:多么讽刺啊,以Hodge理论名震天下的小平邦彦,在写书的时候竟然连Hodge的名字都不敢提!这种“爱护”对学生有何好处呢?如果小平自己都莫名其妙地不置一词,初学者又怎么知道引理8.1和定理8.1在高维妙用无穷呢?

当然,有人会说:这个特例已很有代表性(在证明了RR定理的情况下尤其如此),何必用一般性去困扰学生呢?但我意不在此。我所惋惜的是这个例子明明可以把学生引导到当时的前沿领域,引向一些激动人心的进展,作为向导的小平却宁愿带着一帮人回头走向Riemann:这是何必、何苦?

我知道一些数学家有所谓“经典情结”。Weil就是典型的例子。总有人以他读Gauss全集“读”出了Weil猜想为例宣传挖掘经典的必要性,伍鸿熙先生甚至在介绍现代Riemann几何的书里鼓励年轻人去念Gauss、Riemann和Poincare。在我看来这是一种纯粹的误导:一方面,重新拾起那些被现代数学消化了的概念毫无必要;另一方面,在经典作品里找到遗珠并非不可能,但因此鼓励初学者去撞运气则是荒唐的,我也绝不相信伍先生自己的论文是这样写出来的。

曾有人问丘成桐先生学微分几何要读什么书。丘先生明确地表示Spivak并不合适:“他自己不是搞几何的专家。”说得明白一些,“历史趣味”对于研究至多是锦上添花,读丘成桐比读Gauss要有效得多:至于那些喜欢拿“谁更伟大”说事的人,他们自己往往什么都搞不出来。

从这个意义上来说,小平的复分析是一本好书:它好在内核是新的,用现代的观点处理了Riemann留下的一些古典论题(而并不是好在“小平先生是人人景仰的大师”这些不着边际的话)。但它又是一本太过保守的书,并不能把没有经验的读者带到更远处——很可能要等到他们念Griffiths-Harris的时候才能明白:“哦,原来这里是重要的。哦,原来小平先生处理问题的手法是受这些现代观点影响。哦,原来小平先生并不是踏雪无痕,而是过分小心地把自己思想的脚印一一擦掉了。”

May 112018
 

Theorem. There does not exist a group whose commutator subgroup is isomorphic to \(S_4\).

The relevant facts are that \(S_4\) is a complete group(no outer automorphisms, trivial center) which is not perfect(that is, the commutator subgroup of \(S_4\) is not \(S_4\) itself). Any group which has these properties is never a commutator subgroup of anything. Here’s why.

Lemma. If \(K\) is a complete group and \(K\lhd G\), then \(G\) is the direct product \(K\times H\) of \(K\) by its centralizer \(H=C_G(K)\).

In other words, a complete group can be a normal subgroup only in the most trivial fashion: the large group is just a direct product of the normal group by something.

Proof of the lemma. Let \(H=C_G(K)\) be the centralizer of \(K\) in \(G\), namely the set of all elements which commute with all elements of \(K\). \(H\) is a normal subgroup of \(G\), and \(H\cap K=Z(K)=1\) since \(K\) has trivial center. Any element \(g\in G\) induces an automorphisms \(\phi_g\) of \(K\) by conjugation: \(\phi_g(k)=g^{-1}kg\). But \(K\) has no outer automorphisms, so \(\phi_g\) must equal some inner automorphism of \(K\), that is, for some \(k\in K\), \(\phi_g=\phi_k\). Now conjugation by \(gk^{-1}\) does nothing to \(K\), so \(gk^{-1}=h\in H\). In other words \(g=kh\): every element of \(G\) is expressible as product of an element of \(K\) and an element of \(H\). Since \(H\) and \(K\) commute, \(G\) is the direct product of \(H\) and \(K\).            \(\Box\)

Proof. Now suppose that \(G\) is some group such that \(K=G^\prime=[G,G]\), the commutator subgroup, is such that \(K\) is complete and non-perfect. By the lamma, \(G=K\times A\) where \(A\cong G/K\) is an abelian group. So any element of \(G\) can be writeen as \(ka\) with \(k\in K\) and \(a\in A\), and moreover, \(ka=ak\) for any \(k\in K\), \(a\in A\).

Consider a commutator \(c=xyx^{-1}y^{-1}\) in \(G\). Write \(x=ka\) and \(y=lb\). Since \(K\) and \(A\) commute, \(c=aba^{-1}b^{-1}xyx^{-1}y^{-1}\). Since \(A\) is abelian, the first part vanishes and \(c=xyx^{-1}y^{-1}\). So any commutator of \(G\) lies in the commutator sungroup of \(K\), and it follows that \(G^\prime=K^\prime\). Since \(K^\prime\ne K\), \(G^\prime\ne K\), as well.

It remains to show that \(S_4\) is complete and non-perfect.

(i) \(S_4\) has trivial center: this is obvious. No permutation commutes with all other permutations.

(ii) \(S_4\) has no outer automorphisms. This is true for all \(S_n\) except \(n=2\), \(6\). It’s a standard result.

(iii) \(S_4\) is not perfect. This is also ovious: for any two permutations \(\sigma\), \(\tau\in S_n\), the commutator \(\sigma^{-1}\tau^{-1}\sigma\tau\) is an even permutation, so the commutator subgroup is contained in the alternating group \(A_n\). In fact the commutator group eauals \(A_n\), but we don’t need that here.

This completes the proof the theorem.                                  \(\Box\)

Remark. a simple modification: \(K^\prime\subset G^\prime\) is clear, and the other direction follows since \(G/K^\prime=K/{K^\prime\times A}\) is abelian.

Here is a proof not using those well-known facts about \(S_4\). (though it’s easy to derive them with it)

Proof. \(S_4\) has exactly \(4\) Sylow  \(3\)-subgroups

\[P_1=\langle(234)\rangle, P_2=\langle(134)\rangle, P_3=\langle(124)\rangle, P_4=\langle(123)\rangle,\]

where \(P_i\) is the only Sylow \(3\)-subgroup of the stabilizer of \(i\) in \(S_4\) for \(i=1\), \(2\), \(3\), \(4\). So \(\sigma P_i\sigma^{-1}=P_{\sigma(i)}\) for all \(\sigma\in S_4\) and \(i=1\), \(2\), \(3\), \(4\).

Assume \(G^\prime=S_4\) and take \(g\in G\). The conjugation with \(g\) permutes \(P_1\), \(P_2\), \(P_3\), \(P_4\), so we find \(\rho\in G\) with \(g P_ig^{-1}=P_{\rho(i)}=\rho P_i\rho^{-1}\) for \(i=1\), \(2\), \(3\), \(4\). So \(h\colon \rho^{-1}g\in G\) satisfies \(h P_ih^{-1}=P_i\) for \(i=1\), \(2\), \(3\), \(4\).

Then for all \(\sigma\in S_4\) we have also \(h^{-1}\sigma h\in S_4\) and

\begin{equation} \begin{split}P_{h^{-1}\sigma h(i)}&=(h^{-1}\sigma h)P_i(h^{-1}\sigma h)^{-1}\\&=h^{-1}\sigma hP_ih^{-1}\sigma^{-1}h\\&=h^{-1}\sigma P_i\sigma^{-1}h\\&= h^{-1} P_{\sigma(i)}h=P_{\sigma(i)}.\end{split} \end{equation}

and therefore \(h^{-1}\sigma h(i)=\sigma(i)\) for \(i=1\), \(2\), \(3\), \(4\).

This gives \(h\in C_G(S_4)\) and \(g=\rho h\in S_4C_G(S_4)\) for all \(g\in G\). So \(G=S_4C_G(S_4)\) and \(|G\colon A_4C_G(S_4)|\leqslant2\). But then \(A_4C_G(S_4)\trianglelefteq G\) with abelian factor, so \(S_4=G^\prime\leq A_4C_G(S_4)\), and by Dedekind we get

\[S_4=A_4C_G(S_4)\cap S_4=A_4(C_G(S_4)\cap S_4)=A_4Z(S_4)=A_4\]

since \(Z(S_4)=1\), as \(\sigma\in Z(S_4)\) would give \(P_i=\sigma P_i\sigma^{-1}=P_{\sigma(i)}\) and \(i=\sigma(i)\) for \(i=1\), \(2\), \(3\), \(4\). Contradiction!

 Posted by at 11:43 am
Oct 062017
 

Darboux (14 August 1842-23 February 1917) 是法国数学家.

Darboux’s theorem 是单变量微分学的一个简单的定理, 但大学一年级的分析的教科书上通常却没有这个结果. 这里指的是分析(analysis)中的 Darboux’s theorem, 而不是微分几何(Differential geometry)中关于微分形式(Differential form)的那个Darboux’s theorem.

Darboux’s theorem  函数 \(f(x)\) 在区间 \(I\) 上可导, 则导数 \(f^\prime(x)\) 具有介值性质.

Sam B. Nadler, Jr 在 [1] 给出的一个证明揭示了一些 Darboux’s theorem 没能反映的性质. 为了突出函数的斜率, 我们把关于连续函数的斜率写成单独的引理:

Lemma 1 设 \(I\)  是一个区间, \(f\in C(I)\). 令 \(C\) 表示所有连接 \(f\) 的图像上(不同)点的弦的斜率的集合, 即

\begin{equation}C=\bigg\{\frac{f(s)-f(r)}{s-r}: s, r\in I\;\;\text{and}\;\; s\ne r\bigg\}.\end{equation}

那么, \(C\) 是一个区间.

Proof  固定 \(p\in C\),

\begin{equation}p=\frac{f(a)-f(b)}{a-b}, \; a\lt b, \; \;a, b\in I.\end{equation}

我们来指出, 有 \(C\) 中的区间连接 \(p\) 和 \(C\) 中异于 \(p\) 的任一点 \(q\). 无妨

\begin{equation}q=\frac{f(c)-f(d)}{c-d}, \; c\lt d, \;\;c, d\in I.\end{equation}

下面的公式定义了一个函数 \(\varphi\colon [0, 1]\to C\), 并且 \(\varphi(0)=p\), \(\varphi(1)=q\):

\begin{equation}\varphi(t)=\frac{f((1-t)a+tc)-f((1-t)b+td)}{((1-t)a+tc)-((1-t)b+td)},\;\;\; t\in[0, 1].\end{equation}

既然 \(a\lt b\), \(c\lt d\), 当 \(t\in[0, 1]\), 有 \((1-t)(a-b)+t(c-d)\ne0\); 写法稍加改变, 即对每一个\(t\in[0, 1]\), \(\big((1-t)a+tc\big)-\big((1-t)b+td\big)\ne0\). 故而, 上面的公式确实定出了一个函数 \(\varphi\).

\(\varphi\) 给出了将点 \((a, f(a))\) 和 \((b, f(b))\) 关于 \(x\) 轴”线性地”, 沿着 \(f\) 的图像滑动到点 \((c, f(c))\) 和 \((d, f(d))\) 而得到的弦的斜率; \(\varphi\) 是连续的. 由价值定理, \(\varphi([0, 1])\) 是一个区间. 从 \(\varphi(0)=p\), \(\varphi(1)=q\), 我们已经证明了 \(p\) 和 \(C\) 中的每一点 \(q\) 可被 \(C\) 中的一个区间连接. 至此, 可以判定 \(C\) 是一个区间.

现在来证明比 Darboux’s theorem 稍强一点的结论.

定理 2 令 \(D\) 表示 \(f^\prime\) 在 \(I\) 上所有取值的集合

\begin{equation}D=\big\{f^\prime(x): x\in I\big\}.\end{equation}

那么, \(D\) 是一个区间, 并且 \(C\subset D\subset\overline{C}\)(\(C\) 的闭包).

事实上, 中值定理指出 \(C\subset D\). 导数的定义给出 \(f^\prime\) 的每个取值是弦的斜率的极限; 此导致 \(D\subset\overline{C}\). 现在, 我们已经得出 \(C\) 是区间, 且 \(C\subset D\subset\overline{C}\). 我们立刻知道, \(D\) 是区间.

接下来的这个证明有异曲同工之妙, 在蛮多地方出现.

记 \(c=\frac{a+b}2\). 定义函数

\begin{equation}\alpha(t)=\begin{cases}a,&a\leqslant t \leqslant c\\2t-b,&c\leqslant t \leqslant b\end{cases}\end{equation}

\begin{equation}\beta(t)=\begin{cases}2t-a,&a\leqslant t \leqslant c\\b,&c\leqslant t \leqslant b\end{cases}\end{equation}

\(\alpha(t)\) 与 \(\beta(t)\) 都是区间 \([a, b]\) 上的连续函数; 当 \(a\lt t\lt b\), 有 \(a\leqslant\alpha(t)\lt\beta(t)\leqslant b\).

现在, 作

\begin{equation}g(t)=\begin{cases}f^\prime(a),&t=a\\ \dfrac{f(\beta(t))-f(\alpha(t))}{\beta(t)-\alpha(t)},&a\lt t\lt b\\ f^\prime(b),&t=b\end{cases}\end{equation}

于是, \(g(t)\) 在区间 \([a, b]\) 上连续.

设 \(\lambda\) 符合 \(g(a)\lt\lambda\lt g(b)\), 则存在 \(t_0\in(a, b)\), 使得 \(g(t_0)=\lambda\). 中值定理给出 \(x\in(\alpha(t_0), \beta(t_0) )\), 使得 \(f^\prime(x)=g(t_0)\), 此即 \(f^\prime(x)=\lambda\).   \(\Box\)

 References
  1. Sam B. Nadler, Jr. A proof of Darboux’s Theorem, The Amer Math Monthly, Vol 117(2010), No.2, 174-175
 Posted by at 4:59 am
Sep 152017
 

群通常是这么定义的: 如果在一个非空集合 \(G\) 上的一个二元运算(群运算), 记作 \(ab\), 满足下面的三个条件:

  •  结合律: 对于 \(G\) 中任意元素 \(a\), \(b\), \(c\), 有 \((ab)c=a(bc)\);
  • 存在(左)单位元: \(G\) 中有一个 \(e\), 使得对于 \(G\) 中任意元素 \(a\), 有 \(ea=a\);
  • 存在(左)逆元: 对 \(G\) 中任意元素 \(a\), 存在 \(G\) 中元素 \(b\), 使得有 \(ba=e\),

那么, \(G\) 称为一个群(Group).

当然, 我们可以把这个定义的后两个条件改为存在右单位元及存在右逆元. 事实上, 不难证明这两种定义是完全等价的.

那么, 能不能只改一个条件? 即, 能不能在群定义的”存在左单位元”改为”存在右单位元”或者”存在左逆元”改为”存在右逆元”? 答案是: 不能!

Colonel Johnson 在 A mixed non-group, The American Mathematical Monthly, Vol. 71, No. 7, pp. 785,  举了一个例子来说明, 非空集合 \(G\) 上的二元运算满足结合律, 并且每个元素有左单位元和右逆元, 然而 \(G\) 不一定是一个群.

记 \(G\) 是所有这样形式的 \(2\times2\) 的矩阵

\[M=\left(\begin{array}{cc}x&y\\x&y\end{array}\right),\]

这里 \(x\), \(y\) 是实数, 且 \(x+y\ne0\).

容易验证 \(G\) 关于矩阵乘法是封闭的, 当然也就满足结合律.

矩阵

\[J=\left(\begin{array}{cc}0&1\\0&1\end{array}\right)\]

属于 \(G\), 并且是左单位元, 即对 \(G\) 中每一个矩阵 \(M\), 有 \(JM=M\) 为真.

设 \(M\) 是 \(G\) 的任意一个矩阵, 则

\[\left(\begin{array}{cc}0&\frac1{x+y}\\0&\frac1{x+y}\end{array}\right)\]

属于 \(G\), 并且是 \(M\) 的右逆元.

然而, \(J\) 不是右单位元, 于是 \(G\) 对于矩阵乘法不成为一个群.

群的早期历史

群的概念的出现, 来源于数学的几个领域.

首先是多项式方程的求解.

第二个系统的用到群的领域是几何, 尤其是对称群在 Felix Klein 在 1872 年的 Erlangen program 中显示了重要性.

第三个推动群的进展的领域是数论.

 Posted by at 11:28 pm