第 4 章。特征值和特征形
推荐文章:【线性代数】【线性代数内容】(https://jb243.github.io/pages/1014)
1. 特征值和特征向量
2. 矩阵对角化
3. 二次形式
4. 微分方程和特征值
1.特征值和特征向量
⑴ 特征值和特征向量
①概述:用于对角化、谱聚类等。
② 定理1. A - λI 在 (A - λI)x = 0 中具有非零核的充要条件是 det(A - λI) = 0。
○ 证明:【秩无效定理】(https://jb243.github.io/pages/513)
③ 定理2. 当A ε ℝ2×2的特征值为λ1、λ2时,A2 - (λ1 + λ2)A + λ1λ2I = O成立。
○ 证明
根据特征值的定义,以下成立。
由此可知,λ1 + λ2 = a + d,λ1λ2 = ad - bc。
因此,根据凯利-汉密尔顿定理,上述命题成立。
应用此方法将 An 计算为 (A - λ1I)(A - λ2I) Q(A) + kA + sE,对于 An(n ≥ 2)。
④ 定理 3. 大小为 n × n 的实数矩阵 A 的行列式 det(A) 等于其特征值的乘积。
○ 例如,对于 3 × 3 矩阵,以下成立。
○ 如果 A 具有三个线性独立的特征向量,则 det(A) 可以表示为:
○ 如果特征值为 λ1、λ2,重数分别为 1 和 2,则 det(A) 可表示为:
○ 这里,w2是对应于λ2和v2的广义特征向量。
○ 这样,通过考虑每种情况,可以很容易地证明特征值的乘积等于 det(A)。
⑤ 定理4. 通过对矩阵进行对角化,A = PDP-1,我们可以得到 An = PDnP-1
⑥ 定理 5. 对于大小为 n × n 的实矩阵 A 和 B,矩阵 AB 的特征值与矩阵 BA 的特征值相同 (ref)
○ 证明:假设λ是AB的特征值
⇔ ABv = λv, v ≠ 0
⇔ BABv = BA (Bv) = B · λv = λ (Bv)
⇔ 考虑如下所有可能的情况,BA 的特征值与 AB 的特征值相同
○ 当 Bv ≠ 0 时: λ 是 BA 的特征值
○ 当 Bv = 0 时
⇔ ABv = A0 = 0 = λv
⇔ λ = 0 是 AB 的特征值
⇔ 0 = det(AB) = det(A) × det(B) = det(BA)
⇔ 因此,存在 v’ ≠ 0 使得 BAv’ = 0
⇔ λ = 0 是 BA 的特征值
⑦ 定理 6. 对于大小为 m × n 的实数矩阵 A,矩阵 AAT 和 ATA 的非零特征值是相同的。
○ 与定理 5 相关。
⑧ 定理 7. 克罗内克积» ○ 例如,给定矩阵 J ε ℝn×n,A ε ℝm×m,M = J ⊗ A ε ℝnm×nm 可以定义如下:
○ 定理7-1. 基本运算规则
○ 定理7-2. (A ⊗ B)T = AT ⊗ BT:这个可以直观地理解。
○ 定理 7-3. 克罗内克积的乘法规则:(A ⊗ B)(C ⊗ D) = (AC) ⊗ (BD)
○ 例如,令 J = u·vT 导致 (u ⊗ I)(vT ⊗ A) = (u·vT) ⊗ (I · A) = J ⊗ A = M。
○ 定理7-4. 等级(M) = 等级(J ⊗ A) = 等级(J) × 等级(A)
○ 记忆技巧。由于克罗内克积乘以分量,因此其属性也往往以乘法形式出现。
○ 证明。
○ 设 J ε ℝn×n,A ε ℝm×m,且 r =rank(J),s =rank(A)。然后我们得到以下结果(通过定理7-1和7-3)。
○ 由于M 可以写为r·s 秩一向量的和,因此rank(M) 的最大可能值为r·s。
○ 事实上,这些向量是线性无关的,因此(M) 的秩正是r·s。
○ 定理7-5. M = J ⊗ A 的特征值都是 J 特征值和 A 特征值的两两乘积。
○ 定理 7-6. 如果 x 是 J 的特征向量,y 是 A 的特征向量,则 x ⊗ y 是 M = J ⊗ A 的特征向量。
○ 证明。
⑨ 定理 8. 稳定
○ 如果方阵 A 的所有特征值的绝对值都小于 1,则方阵 A 被定义为稳定的,因为在这种情况下 A∞ = 0。
○ 在这种情况下,存在 K < ∞, 0 < α < 1 使得 (Aj)pq ≤ Kαj ∀p, q。
⑩ 应用1. 休克尔近似 和哈密顿量
⑪ Python 代码(参见WolframAlpha)
○ 使用 numpy
受保护_0
○ 使用 sympy
受保护_1
⑵ 广义特征向量
① 概述
○ 定义:当非对称矩阵的几何重数小于代数重数时,用向量代替缺失的特征向量
○ 阶为 m 的矩阵 A 的广义特征向量如下
○ (A - λI)mxm = 0 & (A - λI)m-1xm ≠ 0
○ 当m=1时,与特征向量的定义相同。
○ 用于约旦规范形式。
② 例1. 下面矩阵A的特征值为1,对应的特征向量为v1 = (1, 0)T
○ 特征值 1 的代数重数为 2,几何重数为 1。» ○ (A - λI)2 v2 = (A - λI) {(A - λI) v2} = 0 ⇔ (A - λI) v2 = v1
○ v2 = (*, 1)T (例如,(0, 1)T)满足 (A - I)v2 = (1, 0)T 称为广义特征向量。
③ 示例2. 参考
⑶ 特征函数
① Sturm-Liouville 定理:不同的本征函数彼此正交
2.矩阵的对角化
⑴ 对角矩阵
① n × n 矩阵,其中除对角线之外的所有元素均为零
② 性能
○ 性质1. 行列式是对角线元素的乘积
○ 性质2. 逆矩阵具有给定对角矩阵的每个对角元素的倒数
⑵ 分块对角矩阵
① 定义:当 Ai ∈ ℳni,ni (F) 且 n1 + ··· + nk = n 时,矩阵 A 为以下形式
② 性质:当 Ai, Bi ∈ ℳni,ni (F)时,
○ 属性 1. diag(A1, ···, Ak)·diag(B1, ···, Bk) = diag(A1B1, ···, AkBk)
○ 性质 2. 如果 Ai 可逆, (diag(A1, ···, Ak))-1 = diag(A1-1, ···, Ak-1)
⑶ 对角化性
① 定义:若存在对角矩阵 D 和可逆矩阵 P 且满足以下条件,则矩阵 A 是可对角化的
② 正交对角化:对于由正交基向量组成的矩阵P。
③ 定理1. n×n矩阵A可对角化的充要条件是A有n个线性无关的特征向量。
④ 定理2. 如果一个 n × n 矩阵 A 有 n 个不同的特征值 λ1, λ2, ···, λn,则可以对角化
○ 如果 P 是以 A 的线性无关特征向量为列的矩阵,则 D 如下
⑤ 定理3. 谱定理:n × n 矩阵 A 可以正交对角化当且仅当 A 是对称矩阵
⑥ 定理 4. n × n 矩阵 A 的广义特征向量总是跨越 ℝn,因此这样的矩阵 A 可以对角化
○ 示例:n × n 矩阵 An 满足 A2 = A,其特征值 λ = 0, 1,可以对角化。
⑦ 定理 5. 与具有三个不同对角元素的对角矩阵 D 交换的矩阵也是对角矩阵。
⑷ 乔丹规范形式
① 当矩阵无法对角化,但仍存在特征值对应的广义特征向量时,可以将其转化为Jordan规范形式> ② Jordan规范形式:A = PJP-1(其中J不是完全对角矩阵,而是由Jordan块组成的矩阵)
③ 定理1. 如果Ak = 0(幂零),考虑矩阵A的Jordan形式,A成为由合适的Ak矩阵组成的分块对角矩阵。
⑸ 示例
① 给定矩阵A
② 计算特征值和特征向量
③计算P和D
3。二次形式
⑴ 定义:4x12 + 2x1x2 + 3x22 是二次形式,但 4x12 + 2x1 不是二次形式。
⑵ 使用对称矩阵表示
⑶ 二次型符号定义:对于对称矩阵 A ∈ ℳn 且 ℝn 上任意向量 x ≠ 0
① 正定矩阵:A 的所有特征值均大于 0 ⇔ Q(x) > 0 ∀x ≠ 0 ⇔ xtAx = xt(λx) = λ x 2 > 0
② 半正定矩阵:A 的所有特征值均大于等于 0 ⇔ Q(x) ≥ 0 ∀x ≠ 0 ⇔ xtAx = xt(λx) = λ x 2 ≥ 0
③ 负定矩阵:A 的所有特征值均小于 0 ⇔ Q(x) < 0 ∀x ≠ 0 ⇔ xtAx = xt(λx) = λ x 2 < 0
④ 负半定矩阵:A 的所有特征值均小于等于 0 ⇔ Q(x) ≤ 0 ∀x ≠ 0 ⇔ xtAx = xt(λx) = λ x 2 ≤ 0
⑤ 不定矩阵
○ 与①~④不同,特征值的符号不统一时
⑥ 定理1.
○ 证明:由于对称矩阵 A 可以正交对角化(∵谱定理)
⑷ 二次型符号的确定:对于对称矩阵 A ε ℳn 和 {1, 2, ···, n} 的子集 S ={i1, i2, ···, ik}
① 主子矩阵:选择A对应S的行和列形成的k×k矩阵
② 前导主子矩阵:省略A的最后n-k行列向量得到的k×k矩阵
③ 定理1. 正定对称矩阵 A ∈ ℳn 等价于 sgn(det(Ak)) = 1, k = 1, 2, ···, n
④ 定理 2. 负定对称矩阵 A ∈ ℳn 等价于 sgn(det(Ak)) = (-1)k, k = 1, 2, ···, n
⑤ 定理 3. 对称矩阵 A ∈ ℳn 为半正定,等价于所有主子矩阵行列式均为非负
○ 如果在尝试 定理 1 或 2 时任何前导主子矩阵行列式为 0,请尝试 定理 3
○ 显然,如果任何主子矩阵行列式的符号发生变化,则无需尝试定理 3 或 4,因为它表示不定矩阵
⑥ 定理 4. 对称矩阵 A ∈ ℳn 为负半定等价于 -A 的所有主子矩阵行列式均为非负
○ 如果在尝试 定理 3 时任何主子矩阵行列式的符号不统一,请尝试 定理 4
⑦ 直接计算行列式时,sgn 表示正值为 1,负值为 -1
⑸ 对于定义在区域 Ω ⊂ ℝn 上的 C2 函数 f: Ω → ℝ,如果在点 p ∈ Ω,∇f(p) = 0,则以下成立
① 如果 Hf(p) 是正定矩阵,则 f 在 x = p 点有局部最小值
② 如果 Hf(p) 是负定矩阵,则 f 在 x = p 点有局部极大值
③ 如果Hf(p)是不定矩阵,则点x = p是f的鞍点
④ 如果 Hf(p) 是半正定矩阵,则 f 在 x = p 点有相对最小值
⑤ 若 Hf(p) 为负半定矩阵,则 f 在 x = p 点有相对最大值
| ⑹ 确定受约束二次型的符号:对于对称矩阵 A ε ℳn 和 B ε ℳm,n (其中 n > m),给定一个 n 维二次型 QA(x) = xtAx,线性约束为 {x ε ℝn | Bx = 0},当定义如下新的 (m+n) × (m+n) 矩阵 H 时,以下陈述成立。 |
① 定理1. 如果 sgn( Hm+i ) = (-1)m, i = m+1, m+2, ···, n,则 QA(x) > 0 成立
○ 请记住,这不是充分必要条件
② 定理2. 如果 sgn( Hm+i ) = (-1)i, i = m+1, m+2, ···, n,则 QA(x) < 0 成立
○ 请记住,这不是充分必要条件
③ 示例:下面的示例观察负定对称矩阵 A
> ④ 即使没有符号的二次型在一定的约束下也可能有符号
输入:2020.05.19 23:48
修改: 2024.11.12 09:45