外观
Chapter 6 微分学
约 7553 字大约 25 分钟
2025-09-16
Part 1 微分
在经典物理学中, 如果我们考察质点沿直线的运动, 则有速度和加速度的概念. 速度是反映位移随时间变化的量, 即速度是位移函数的变化率, 而加速度是反映速度随时间变化的量. 我们现在利用极限给出这些变化量的数学定义.
· 导数
定义1 (导数).
设函数 f 在 x0 附近有定义, 如果极限
x→x0limx−x0f(x)−f(x0)
存在且有限, 则称 f 在 x0 处可导, 此极限称为 f 在 x0 处的导数, 记为 f′(x0).
如果记 y=f(x), Δx=x−x0, Δy=f(x)−f(x0), 则导数也可表示为
f′(x0)=x→x0limx−x0f(x)−f(x0)=Δx→0limΔxΔy.
既然导数是用极限定义的, 我们当然也可以用 ε−δ 语言来描述它: 如果存在 A∈R, 使得任给 ε>0, 均存在 δ>0, 当 0<∣x−x0∣<δ 时
x−x0f(x)−f(x0)−A<ε,
则 f 在 x0 处可导, 导数为 A.
如果 f 在 x0 的左边邻域 (x0−δ,x0] 中有定义, 且当 x→x0− 时, x−x0f(x)−f(x0) 的极限存在且有限, 则称 f 在 x0 处左可导, 此极限称为 f 在 x0 处的左导数, 记为 f−′(x0), 即
f−′(x0)=x→x0−limx−x0f(x)−f(x0).
类似地, 如果 f 在 x0 的右边邻域 [x0,x0+δ) 中有定义, 且当 x→x0+ 时, x−x0f(x)−f(x0) 的极限存在且有限, 则称 f 在 x0 处右可导, 此极限称为 f 在 x0 处的右导数, 记为 f+′(x0), 即
f+′(x0)=x→x0+limx−x0f(x)−f(x0).
命题1. 设 f 在 x0 附近有定义, 则 f 在 x0 处可导当且仅当 f 在 x0 处的左导数和右导数存在且相等, 此时它们等于 f 在 x0 处的导数.
/example/
研究常值函数 f(x)=c 的导数.
任给 x0, 有
x→x0limx−x0f(x)−f(x0)=x→x0limx−x0c−c=0,
因此按照定义, 常值函数在 x0 处可导, 导数为零. 这和我们的直观是相吻合的, 因为导数反映函数的变化率, 而常值函数的变化率当然为零.
研究函数 f(x)=∣x∣ 在 x0=0 处的可导性.
当 x<0 时, 有
x→0−limx−0f(x)−f(0)=x→0−limx∣x∣=x→0−limx−x=−1.
这说明 f−′(0)=−1. 类似地, 当 x>0 时, 有
x→0+limx−0f(x)−f(0)=x→0+limx∣x∣=x→0+limxx=1.
因此 f+′(0)=1. 这说明 f 在 x0=0 处不可导.
提示
我们现在从几何的角度来解释导数的含义. 考虑函数 f 在 x0 附近的图像, 经过图像上两点 (x0,f(x0)) 和 (x,f(x)) 的直线的方程为
y(t)=x−x0f(x)−f(x0)(t−x0)+f(x0),∀ t∈R.
当 x→x0 时, 考察此直线的变化. 当 f 在 x0 处可导时, 直线的极限位置是一条经过 (x0,f(x0)) 且斜率为 f′(x0) 的直线, 称为 f 在 x0 处的切线, 其方程为
y(t)=f′(x0)(t−x0)+f(x0).
方程
(x−x0)+f′(x0)(y−f(x0))=0
所代表的直线则称为 f 在 x0 处的法线.
· 微分
根据切线的定义过程, 我们可以把切线看成函数 f 的图像在 x0 处的一个线性逼近. 即, 函数 f 在 x0 附近可以近似地看成线性函数, 这种线性逼近或线性化的方法是我们研究函数的一种基本手法.
定义2 (微分).
设 f 是在 x0 附近有定义的函数, 如果存在常数 A, 使得
f(x)=f(x0)+A(x−x0)+o(x−x0)(x→x0),
则称 f 在 x0 处可微, x0 处的线性映射 x↦Ax 称为 f 在 x0 处的微分, 记为 df(x0).
导数和微分之间的关系体现在下面的命题中.
命题2. 设 f 在 x0 附近有定义, 则
(1) f 在 x0 处可导当且仅当 f 在 x0 处可微, 且微分的斜率就是导数 f′(x0).
(2) 如果 f 在 x0 处可导, 则 f 在 x0 处连续.
/proof/
(1) 设 f 在 x0 处可导, 则
x→x0limx−x0f(x)−f(x0)−f′(x0)(x−x0)=x→x0limx−x0f(x)−f(x0)−f′(x0)=0,
因此
f(x)−f(x0)−f′(x0)(x−x0)=o(x−x0)(x→x0),
即
f(x)=f(x0)+f′(x0)(x−x0)+o(x−x0)(x→x0).
这说明 f 在 x0 处可微.
反之, 设 f 在 x0 处可微, f(x)=f(x0)+A(x−x0)+o(x−x0), 则
x→x0limx−x0f(x)−f(x0)=x→x0limx−x0A(x−x0)+o(x−x0)=A,
从而 f 在 x0 处可导, 且导数 f′(x0)=A.
(2) 如果 f 在 x0 处可导, 则 f 在 x0 处可微, 从而
x→x0limf(x)=x→x0lim[f(x0)+A(x−x0)+o(x−x0)]=f(x0),
因此 f 在 x0 处连续.
微分的几何意义在于它可以看成 f 的一个线性近似. 由于微分的斜率等于导数, 我们将 x0 处的微分 df(x0) 写为
df(x0)=f′(x0)dx(x0),
其中 dx(x0) 是函数 x 在 x0 的微分 (即恒同线性映射). 我们又将导数 f′(x0) 记为 dxdf(x0) 或 dxdfx0, 称为 f 在 x0 处的微商.
微商是一个历史遗留记号, 它并不是两个微分的商, 而仅仅表示函数 f 关于变量 x 在 x0 处的导数. 我们将在那些需要区分关于不同变量求导的时候使用微商的记号, 其余的时候一般用 f′ 表示导数.
· 运算法则
下面我们研究导数的运算法则.
命题3 (导数的运算法则). 设 f,g 在 x 处可导, 则 fg 在 x 处可导; 如果 α,β 为常数, 则 αf+βg 在 x 处可导. 且有
(1) (αf+βg)′=αf′+βg′ (线性性);
(2) (fg)′=f′g+fg′ (导性).
/proof/
(1) 如果 f,g 在 x 处可导, 则
f(x′)=f(x)+f′(x)(x−x′)+o(x−x′),
g(x′)=g(x)+g′(x)(x−x′)+o(x−x′).
从而
αf(x′)+βg(x′)=(αf(x)+βg(x))+(αf′(x)+βg′(x))(x−x′)+αo(x−x′)+βo(x−x′)
=(αf(x)+βg(x))+(αf′(x)+βg′(x))(x−x′)+o(x−x′).
这说明 αf+βg 在 x 处可导, 且导数等于 αf′+βg′.
(2) 如果 f,g 在 x 处可导, 则 f,g 在 x 处连续, 且
f(x′)g(x′)=[f(x′)−f(x)]g(x′)+f(x)[g(x′)−g(x)]+f(x)g(x),
于是
x′→xlimx−x′f(x′)g(x′)−f(x)g(x)=x′→xlimx′−xf(x′)−f(x)g(x′)+x′→x′limx′−xg(x′)−g(x)f(x)=f′(x)g(x)+g′(x)f(x).
这说明 fg 在 x 处可导, 且 (fg)′=f′g+fg′.
导数运算的线性性可以推广为对任意有限多个函数的线性组合成立. 从导性还得到
推论4. 设 f,g 在 x 处可导, g(x)=0. 则 gf 在 x 处可导, 且
(gf)′=g2f′g−fg′.
/proof/
先说明 g−1=g1 在 x 处可导:
x′→xlimx′−xg−1(x′)−g−1(x)=x′→xlimg(x)g(x′)−1⋅x′−xg(x′)−g(x)=−g2(x)g′(x).
因此 gf=f⋅g1 可导, 利用导数的导性, 有
(gf)′=f′⋅(g1)+f⋅(g1)′=g2f′g−fg′,
推论得证.
命题5 (链式法则). 设 g 在 x 处可导, f 在 g(x) 处可导, 则复合函数 f∘g=f(g) 在 x 处可导, 且
[f(g)]′=f′(g)g′.
/proof/
因为 g 在 x 处可导, 故当 x′ 在 x 附近时
g(x′)=g(x)+g′(x)(x′−x)+o(x′−x),
这说明 x′→x 时, 存在常数 C, 使得 ∣g(x′)−g(x)∣≤C∣x′−x∣. 因此
f(g(x′))=f(g(x))+f′(g(x))(g(x′)−g(x))+o(g(x′)−g(x))=f(g(x))+f′(g(x))g′(x)(x′−x)+f′(g(x))o(x′−x′)+o(x′−x)=f(g(x))+f′(g(x))g′(x)(x′−x)+o(x′−x).
这说明 f(g) 在 x 处可导, 导数为 f′(g(x))g′(x).
链式法则对于任意有限个函数的复合也适用, 比如
[f(g(h))]′=f′(g(h))g′(h)h′.
命题6 (反函数求导法则). 设 f 在 x0 附近连续且有逆函数 g. 如果 f 在 x0 处可导, 且导数 f′(x0)=0, 则 g 在 y0=f(x0) 处可导, 且
g′(y0)=f′(x0)1.
/proof/
因为 f 在 x0 处可导, 故
f(x)=f(x0)+f′(x0)(x−x0)+o(x−x0)(x→x0),
当 x→x0 时上式可改写为
f(x)−f(x0)=[f′(x0)+o(1)](x−x0).
当 f′(x0)=0 时, 上式表明, 当 x→x0 时, 存在常数 C>0 使得
∣f(x)−f(x0)∣≥C∣x−x0∣,or∣y−y0∣≥C∣g(y)−g(y0)∣.
特别地, 当 y→y0 时, x=g(y)→g(y0)=x0. 代入 x=g(y), x0=g(y0) 得
y=y0+f′(x0)(g(y)−g(y0))+o(g(y)−g(y0))(y→y0)=y0+f′(x0)(g(y)−g(y0))+o(y−y0)(y→y0),
或改写为
g(y)=g(y0)+f′(x0)1(y−y0)+o(y−y0)(y→y0).
这说明 g 在 y0=f(x0) 处可导, 且导数为 f′(x0)1.
有了上面这些求导运算法则, 我们就可以计算常见函数的导数了. 先看最基本的例子.
命题7. x′=1, (ex)′=ex.
/proof/
由定义,
x′=Δx→0limΔx(x+Δx)−x=1.
对于函数 ex, 我们先计算它在 x0=0 处的导数:
(ex)′(0)=x→0limx−0ex−1=y→0limln(1+y)y=y→0limln(1+y)1/y1=1.
对于一般的 x, 有
(ex)′=x′→xlimx′−xex′−ex=x′→xlimexx′−xex′−x−1=exy→0limyey−1=ex.
这样就得到了命题的证明.
命题8. 设 a>0 (a=1) 和 α=0 为常数. 在函数的定义域内, 我们有
(1) (ax)′=axlna, (logax)′=xlna1;
(2) (ln∣x∣)′=x1, (xα)′=αxα−1.
/proof/
(1) 利用复合求导计算如下:
(ax)′=(exlna)′=exlna(xlna)′=axlna.
利用反函数的导数公式, 有
(logax)′=(ay)′∣y=logax1=alogaxlna1=xlna1.
(2) 当 x>0 时, 由 (1) 知 (ln∣x∣)′=(lnx)′=x1; 当 x<0 时,
(ln∣x∣)′=[ln(−x)]′=−x1(−x)′=x1.
如果 α=0, x>0, 则
(xα)′=(eαlnx)′=eαlnx(αlnx)′=xααx1=αxα−1;
如果 α>1, 则 x=0 处的导数计算如下
(xα)′(0)=x→0limxxα=x→0limxα−1=0;
我们现在考虑 x<0 的情形. 此时, 要求 α=qp 为有理数, p,q 为互素的整数, 且 q 为奇数. 我们有
(xα)′=((−1)qpeαln∣x∣)′=(−1)qpeαln∣x∣(αln∣x∣)′=xααx1=αxα−1.
这样就得到了定义域内所有可导点处的导数.
命题9. 在函数的定义域内, 有
(1) (sinx)′=cosx, (cscx)′=−cscxcotx, (arcsinx)′=1−x21;
(2) (cosx)′=−sinx, (secx)′=secxtanx, (arccosx)′=−1−x21;
(3) (tanx)′=sec2x, (arctanx)′=1+x21;
(4) (cotx)′=−csc2x, (arccotx)′=−1+x21;
/proof/
(1) 根据导数的定义, 有
(sinx)′=x′→xlimx′−xsinx′−sinx=x′→xlim2x′−xsin2x′−xcos2x′+x=cosx.
由推论4或复合函数求导公式, 有
(cscx)′=(sinx1)′=−sin2x1(sinx)′=−sin2x1cosx=−cscxcotx.
由反函数求导公式, 有
(arcsinx)′=cosarcsinx1=1−sin2arcsinx1=1−x21.
(2) 我们可以象 sinx 那样利用三角函数和差公式去求 cosx 的导数, 也可以直接利用复合函数求导:
(cosx)′=(sin(2π−x))′=cos(2π−x)(2π−x)′=−sinx,
因此
(cscx)′=−cos2x1(−sinx)=secxtanx,
又因为 arcsinx+arccosx=2π, 故
(arccosx)′=(2π−arcsinx)′=−1−x21.
(3) 由推论4及上面的计算, 有
(tanx)′=cos2xcosxcosx−sinx(−sinx)=cos2x1=sec2x.
由反函数求导公式, 有
(arctanx)′=sec2arctanx1=1+tan2arctanx1=1+x21.
(4) 由推论4及上面的计算, 有
(cotx)′=sin2x(−sinx)sinx−cosxcosx=−csc2x,
由反函数求导公式, 有
(arccotx)′=−csc2arccotx1=−1+cot2arccotx1=−1+x21.
这就得到了三角函数的导数公式.
我们如下定义一类所谓的双曲函数, 首先是双曲正弦 sinhx 和双曲余弦 coshx:
sinhx=2ex−e−x,coshx=2ex+e−x;
然后是双曲正切 tanhx 和双曲余切 cothx:
tanhx=coshxsinhx,cothx=sinhxcoshx;
简单的计算表明, 双曲函数之间满足如下关系
sinh(x+y)=sinhx⋅coshy+coshx⋅sinhy,
sinh(x−y)=sinhx⋅coshy−coshx⋅sinhy,
cosh(x+y)=coshx⋅coshy+sinhx⋅sinhy,
cosh(x−y)=coshx⋅coshy−sinhx⋅sinhy,
以及
cosh2x−sinh2x=1,1−(tanhx)2=cosh2x1,(cothx)2−1=sinh2x1.
双曲函数的导数计算如下:
命题10. (sinhx)′=coshx, (coshx)′=sinhx, (tanhx)′=1−(tanhx)2, (cothx)′=1−(cothx)2.
/proof/ 利用 ex 的导数直接计算即可
Part 2 高阶导数
· 定义
要考察质点的运动, 除了考虑速度, 还要考虑加速度. 速度是位移函数的导数, 加速度则是速度的导数.
定义1 (高阶导数).
设 f 在 x0 附近可导, 如果导函数 f′ 在 x0 处仍可导, 则称 f 在 x0 处 2 阶可导. 记
f′′(x0)=(f′)′(x0),
称为 f 在 x0 处的 2 阶导数. 一般地, 如果 f 在 x0 附近 n (n≥1) 阶可导, 且 n 阶导函数 f(n) 在 x0 处可导, 则称 f 在 x0 处 n+1 阶可导, 记
f(n+1)(x0)=(f(n))′(x0),
称为 f 的 n+1 阶导数.
按照我们的记号, f(1)=f′, f(2)=f′′, f(3)=f′′′ 等等. 我们约定 f(0)=f. 有时也用下面的记号表示高阶导数:
f′′=dx2d2f,f(3)=f′′′=dx3d3f,⋯
定义2.
如果 f 在区间 I 的每一点处均 n 阶可导, 则称 f 在 I 中 n 阶可导; 如果 f 可导, 且导函数 f′ 连续, 则称 f (1 阶) 连续可导, 记为 f∈C1(I);
一般地, 如果 f 在 I 中 n 阶可导, 且 n 阶导函数 f(n) 连续, 则称 f n 阶连续可导, 记为 f∈Cn(I). 如果 f 在 I 中存在任意阶导数, 则称 f 是光滑的, 记为 f∈C∞(I).
/example/
可微函数的导函数不一定连续.
考虑下面的函数
f(x)={x23sinx1,0,x∈(0,1],x=0.
我们先计算 f 在 x=0 处的导数:
f′(0)=x→0+limxx23sinx1=x→0+limxsinx1=0,
这里我们用到了估计
xsinx1≤x→0(x→0+).
当 x>0 时, 由复合求导, 有
f′(x)=23x21sinx1−x23x21cosx1=23x21sinx1−x−21cosx1.
考察 f′ 在 xn=2nπ1 (n=1,2,⋯) 处的取值知 f′(xn)→−∞, 因此 f′ 不连续.
设 k=1,2,⋯, 则函数
f(x)={x2k+1sinx1,0,x=0x=0
是 Ck 函数, 但不是 Ck+1 的.
可以计算出 f′(0)=0, 且
f′(x)=⎩⎨⎧(2k+1)x2ksinx1−x2k−1cosx1,0,x=0,x=0.
同理,
f′′(x)=⎩⎨⎧2k(2k+1)x2k−1sinx1−4kx2k−2cosx1−x2k−3sinx1,0,x=0,x=0.
继续求导可得 f(k)(0)=0, 且当 x=0 时,
f(k)(x)=x2ϕ(x)±xsinx1orx2ϕ(x)±xcosx1,
其中 ϕ(x) 在 x=0 附近有界. 因此 f(k) 连续但在 x=0 处不可导.
· 计算
/Theorem/
设 f,g 均为 n 阶可导函数, 则
(1) (αf+βg)(n)=αf(n)+βg(n), ∀ α,β∈R;
(2) (Leibniz)
(fg)(n)=k=0∑nCnkf(n−k)g(k)
其中 Cnk=k!(n−k)!n! 为组合数.
/proof/
(1) 这可由求导运算的线性及归纳法直接得到.
(2) 对 n 用数学归纳法. n=1 的情形就是求导运算的导性. 设公式对 n=k 成立, 则 n=k+1 时
(fg)(k+1)=[(fg)(k)]′=l=0∑kCkl[f(k−l+1)g(l)+f(k−l)g(l+1)]=l=0∑kCklf(k−l+1)g(l)+l=0∑k−1Cklf(k−l)g(l+1)+Ckkfg(k+1)=f(k+1)g+l=1∑k[Ckl+Ckl−1]f(k−l+1)g(l)+fg(k+1)=l=0∑k+1Ck+1lf(k+1−l)g(l),
其中我们用到组合恒等式 Ckl+Ckl−1=Ck+1l.
现在我们再看几个高阶导数计算和应用的例子.
/example/
设多项式 pn(x)=anxn+an−1xn−1+⋯+a1x+a0 次数为 n, 则
(1) pn(n)(x)=n!an, 从而 pn(k)=0, ∀ k>n;
(2) ak=k!1pn(k)(0), k=0,1,⋯,n.
直接逐项求导, 利用归纳法可得
pn(k)(x)=n(n−1)⋯(n−k+1)anxn−k+(n−1)⋯(n−k)an−1xn−1−k+⋯+k!ak,
其中 1≤k≤n. 特别地, 取 k=n 就得到 (1), 而令 x=0 就得到 (2).
求函数 f(x)=sinx, cosx 的各阶导数.
我们已知
(sinx)′=cosx=sin(x+2π),(sinx)′′=−sinx=sin(x+π).
一般地, 如果
(sinx)(k)=sin(x+2kπ)
则
(sinx)(k+1)=cos(x+2kπ)=sin(x+2(k+1)π),
这说明
(sinx)(n)=sin(x+2nπ)
同理可得
(cosx)(n)=cos(x+2nπ)
Part 3 微分中值定理
要研究一个变化量, 可以考察其“最大”值和“最小”值.
· 极值
定义1 (极值点).
设 f 是定义在区间 I 中的函数, x0∈I. 如果存在 δ>0, 使得
f(x)≥f(x0) (f(x)≤f(x0)),∀ x∈(x0−δ,x0+δ)∩I,
则称 x0 为 f 在 I 中的一个极小(大)值点, f(x0) 称为极小(大)值.
如果 x0∈I, 且
f(x)≥f(x0) (f(x)≤f(x0)),∀ x∈I,
则称 x0 为 f 在 I 中的一个最小(大)值点, f(x0) 称为最小(大)值.
显然, 最小(大)值点是极小(大)值点. 我们把极小值点和极大值点统称为极值点, 极小值和极大值统称为极值, 最大值和最小值统称最值. 当定义中的不等号在 x0 的空心邻域中严格成立时, 相应的极值点称为严格极值点, 相应的极值称为严格极值.
定理1 (Fermat). 设 x0 是函数 f 在 I 中的极值点, 且 x0 为 I 的内点. 如果 f 在 x0 处可导, 则 f′(x0)=0.
/proof/
不妨设 x0 为 f 的极小值点 (不然可考虑 −f). 由于 x0 为 I 的内点, 故存在 δ>0, 使得 (x0−δ,x0+δ)⊂I. 当 x0 为 f 的极小值点时, 我们假设 δ 充分小, 使得
f(x)≥f(x0),∀ x∈(x0−δ,x0+δ).
特别地, 当 x∈(x0−δ,x0) 时,
f′(x0)=x→x0−limx−x0f(x)−f(x0)≤0,
而当 x∈(x0,x0+δ) 时,
f′(x0)=x→x0+limx−x0f(x)−f(x0)≥0,
这说明 f′(x0)=0.
(1) 如果 x0 不是 I 的内点, 则即使 f 在 x0 处可导 (存在左导数或右导数), 导数也不必为零. 如定义在 [0,1] 上的函数 f(x)=x 就是例子. 如果 x0 为 f 在 I 中的极值点, 但不是 I 的内点, 则根据定理的证明可以得到下面的结论:
设 x0 是 I 的左端点, 如果 x0 为 f 的极小(大)值点, 则 f+′(x0)≥0(≤0); 设 x0 是 I 的右端点, 如果 x0 为 f 的极小(大)值点, 则 f−′(x0)≤0(≥0);
(2) 函数可能在不可导点处取极值, 例如 f(x)=∣x∣, x∈[−1,1] 在 x0=0 处取到最小值, 但 f 在 x0=0 处不可导, 当然就谈不上导数为零了.
(3) 我们把满足条件 f′(x0)=0 的点称为 f 的驻点或临界点. 需要注意的是, 驻点不必为极值点, 例如 f(x)=x3, x0=0 为 f 的驻点, 但不是极值点.
定理2 (Darboux). (*) 设 f 为 [a,b] 上的可导函数, 则 f′ 可以取到 f+′(a) 与 f−′(b) 之间的任意值.
设 k 是介于 f+′(a) 和 f−′(b) 之间的数. 考虑函数 g(x)=f(x)−kx, 则
g+′(a)⋅g−′(b)=(f+′(a)−k)(f−′(b)−k)≤0,
如果上式为零, 则 k 等于 f 在 a 或 b 处的导数; 如果上式小于零, 不妨设 g+′(a)>0, g−′(b)<0, 则 g 在 a 或 b 处均取不到最大值, 从而 g 在 [a,b] 的内部某一点 ξ 处取到最大值. 由 Fermat 定理, g′(ξ)=0, 即 f′(ξ)=k.
这个定理说明, 如果 f 是区间 I 中的可导函数, 则其导函数 f′ 的值域仍为区间. 特别地, Dirichlet 函数没有任何原函数.
命题3. 设 f:R→R 为连续函数, 且
x→−∞limf(x)=x→+∞limf(x)=+∞(−∞),
则 f 在 R 上达到最小(大)值.
我们不妨设 x→−∞limf(x)=x→+∞limf(x)=+∞. 由极限的定义, 存在 M>0 使得当 ∣x∣≥M 时 f(x)>f(0)+1. 因为 f 为连续函数, 故在闭区间 [−M,M] 上取到最小值. 设 f 在 x0 处取到此最小值, 则 f(x0)≤f(0) (因为 0∈[−M,M]). 另一方面,
f(x0)≤f(0)<f(0)+1<f(x),∀ x∈(−∞,M)∪(M,+∞),
这说明 x0 也是 f 在 (−∞,+∞) 上的最小值点.
显然, 上述命题可以推广到其它非闭区间的情形, 以 (a,+∞) 为例, 我们有如下结论: 如果连续函数 f 满足
x→a+limf(x)=x→+∞limf(x)=+∞(−∞)
则 f 在 (a,+∞) 上达到最小(大)值.
/example/
设 ai, i=1,2,⋯,n 为 R 上的 n 个点. 在 R 上求一点, 使得它到 ai (1≤i≤n) 的距离的平方和最小.
设 x∈R, 考虑连续函数
f(x)=i=1∑n(x−ai)2,x∈R.
我们的问题就是求 f 的最小值点. 容易看出, 当 ∣x∣→+∞ 时, f(x)→+∞, 因此由上面的命题, f 的最小值点的确存在. 又因为 f 可微, 故最小值点必为驻点. 方程
f′(x)=2i=1∑n(x−ai)=0
的惟一解为
x=n1i=1∑nai,
因此它就是我们要求的点.设 x∈R, 考虑连续函数
f(x)=i=1∑n(x−ai)2,x∈R.
我们的问题就是求 f 的最小值点. 容易看出, 当 ∣x∣→+∞ 时, f(x)→+∞, 因此由上面的命题, f 的最小值点的确存在. 又因为 f 可微, 故最小值点必为驻点. 方程
f′(x)=2i=1∑n(x−ai)=0
的惟一解为
x=n1i=1∑nai,
因此它就是我们要求的点.
· 中值定理
定理1 (Rolle). 设函数 f 在 [a,b] 上连续, 在 (a,b) 中可微, 且 f(a)=f(b). 则存在 ξ∈(a,b), 使得 f′(ξ)=0.
连续函数 f 在闭区间 [a,b] 上可以取到最大值 M 和最小值 m. 如果 M=m, 则 f 恒为常数, 从而 f′=0; 如果 M>m, 则由 f(a)=f(b) 知 m 与 M 中至少有一个是被 f 在内点 ξ∈(a,b) 处所取得, 由 Fermat 定理, f′(ξ)=0.
定理2 (Lagrange). 设函数 f 在 [a,b] 上连续, 在 (a,b) 中可微, 则存在 ξ∈(a,b), 使得
f′(ξ)=b−af(b)−f(a),orf(b)−f(a)=f′(ξ)(b−a).
/proof/
令
F(x)=f(x)−[f(a)+b−af(b)−f(a)(x−a)],
则 F(a)=F(b)=0, F 满足 Rolle 定理的条件. 从而存在 ξ∈(a,b), 使得 F′(ξ)=0. 此 ξ 即为满足定理要求的 ξ.
Lagrange 定理的物理含义: 质点的平均速度等于某一点的瞬时速度. 令
l(x)=f(a)+b−af(b)−f(a)(x−a),
则 l(x) 是满足条件 l(a)=f(a), l(b)=f(b) 的唯一线性函数, 其图像是连接 (a,f(a)) 和 (b,f(b)) 的直线. Lagrange 定理的证明思想就是将这条直线看成是 X 轴, 从而将问题转化为已知情形.
定理3 (Cauchy). 设函数 f,g 在 [a,b] 上连续, 在 (a,b) 中可微, 且 g′(x)=0, ∀ x∈(a,b). 则存在 ξ∈(a,b), 使得
g(b)−g(a)f(b)−f(a)=g′(ξ)f′(ξ).
由 Rolle 定理和 g′=0 知 g(b)=g(a). 令
F(x)=f(x)−[f(a)+g(b)−g(a)f(b)−f(a)(g(x)−g(a))],
则 F(a)=F(b)=0, F 满足 Rolle 定理的条件, 从而存在 ξ∈(a,b), 使得 F′(ξ)=0. ξ 即为满足要求的点.
下面给出两个例子:
/example/ 设 f(x) 在 [a,b] 上连续, 在 (a,b) 中二阶可导. 如果 f(a)=f(b)=0, 则对任意 c∈[a,b], 存在 ξ∈(a,b), 使得
f(c)=2f′′(ξ)(c−a)(c−b).
不妨设 c∈(a,b), 令
F(x)=f(x)−(c−a)(c−b)f(c)(x−a)(x−b),x∈[a,b].
则 F(a)=F(c)=F(b)=0, 由 Rolle 定理, 存在 ξ1∈(a,c), ξ2∈(c,b), 使得
F′(ξ1)=0,F′(ξ2)=0.
因为 F′(x) 在 [ξ1,ξ2] 上可微, 再一次由 Rolle 定理知, 存在 ξ∈(ξ1,ξ2), 使得
F′′(ξ)=0.
简单的计算表明
F′′(x)=f′′(x)−(c−a)(c−b)2f(c),
在上式中代入 x=ξ 即得欲证结论.
这个例子可以推广到一般情形. 例如, 设 f 是 n 阶可导函数, 且 f(x)=0 有 n 个不同的解 {xi}i=1n, 则对任意 c∈[a,b], 存在 ξ∈(a,b), 使得
f(c)=n!1f(n)(ξ)i=1∏n(c−xi).(1)
证明的方法仍是构造适当的辅助函数并利用微分中值定理. 例如, 无妨设 c=xi (1≤i≤n), 令
F(x)=f(x)−∏i=1n(c−xi)f(c)i=1∏n(x−xi),x∈[a,b].
则 F(x) 有 n+1 个不同的零点 c,xi (1≤i≤n), 对 F 反复使用 Rolle 定理可知, 存在 ξ∈(a,b), 使得 F(n)(ξ)=0. 再利用 n 次多项式 ∏i=1n(x−xi) 的 n 阶导数为 n! 即可得到欲证等式.
如果 f 是任给的 n 阶可导函数, 设 {xi}i=1n 为 [a,b] 中 n 个不同的点, 令
pn−1(x)=i=1∑nj=i∏(xi−xj)(x−xj)f(xi),
则 pn−1 为次数不超过 n−1 的多项式, 它与函数 f 在 {xi}i=1n 处取相同的值, 称为 f 的 Lagrange 插值多项式. 由于 f−pn−1 有 n 个不同的零点, 由 (1) 可得 (注意 pn−1 的 n 阶导数为零)
f(x)−pn−1(x)=n!1f(n)(ξ)i=1∏n(x−xi),ξ∈(a,b).(2)
这个等式称为插值多项式的余项公式, 我们将利用它来估计近似积分的误差.
证明勒让德 (Legendre) 多项式 dxndn(x2−1)n 在 (−1,1) 中有 n 个不同的实根, 其中 n≥1.
首先, 多项式 (x2−1)n 有实根 −1 和 1, 根据 Rolle 定理, dxd(x2−1)n 在 (−1,1) 内有实根, 记为 ξ11.
当 n>1 时, −1 和 1 仍为 dxd(x2−1)n 的实根, 再次由 Rolle 定理即知 dx2d2(x2−1)n 在 (−1,ξ11) 和 (ξ11,1) 中分别有实根 ξ21 和 ξ22.
如果 n>2, 则 −1 和 1 仍为 dx2d2(x2−1)n 的实根, 即它有四个实根 −1,ξ21,ξ22 和 1.
继续使用 Rolle 定理, dx3d3(x2−1)n 在 (−1,1) 中就有三个不同的实根. 如此重复证明就知道欲证结论对任意正整数 n 都成立.
非常重要的一点就是微分中值定理中的 ξ 可以取在区间内部.
结束.
更新日志
2025/12/17 03:52
查看所有更新日志
43510-remake-integral-1217于bed0a-space于ce8eb-integral-11于752f1-integral于c9ee8-plume于a28aa-a于