Korean, Edit

图论

推荐阅读:【数学】【数学目录】(https://jb243.github.io/pages/764)


1. 基础知识

2. 应用程序



1.基础知识

⑴ 图的组成部分

① V:节点

② E:边缘

③ G:图表

④ V(G) = {v1,…,vn}

⑤ vi ~ vj:边eij连接顶点vi、vj时。

⑵ 图G的度:节点数,即 V(G)
⑶ 图G的大小:边的数量,即 E(G)

⑷ 节点v的度数:与节点v相连的边的条数,即deg(v)。

① deg(vi) = Σvi~vj 1

② δ(G)为G中节点的最小度,Δ(G)为G中节点的最大度。

③ Σ deg(vi) = 2 电子(G)

④ 若图的所有节点度数相同,则该图是正则图。

⑤ 欧拉图的节点度数为偶数。

⑸ 简单图和完整图

① 简单图:任意两个节点之间最多存在一条边的图,且不允许存在自环(连接节点到自身的边)。


스크린샷 2024-10-07 8 13 51

图 1. 简单图


② 完全图:所有节点都由唯一边连接的图。


스크린샷 2024-10-07 8 14 21

图 2. 完整图表


○ 强连接(= 不可约)

○ 图中任何节点 i 都可以到达任何其他节点 j 的状态。

○ 如果 j 从 j ∀i, j 可达,则马尔可夫链是不可约的。

○ 完整图中的边数为 NC2 = N(N-1) / 2。

⑹ 子图:若 V(H) ⊆ V(G) 且 E(H) ⊆ E(G),则 H 是 G 的子图。

① 如果 V(H) 的两个顶点相邻当且仅当它们在 G 中相邻,则子图 H 是 G 的诱导子图。

②派:图的完全子图。

③ 步行:类似 v0 → v1 → … → vm 的路径,由边 v0v1、v1v2、…、vm-1vm 连接。

○ v0 称为初始顶点,vm 称为最终顶点。

○ 步行的边数称为长度。

④ 路径:所有节点都不同的行走。

⑤ 循环:v0 = vm 的步行。

⑥ 森林:不包含环的图。

⑦ 树:相连的森林

⑧ 周期:节点i的周期是节点i到自身的所有路径的最大公约数。

○ 示例:如果两个节点 A 和 B 通过两条边连接,使得 A = B,则每个节点的周期为 2。

⑨ 非周期:所有节点的周期为1。

○ 对于不可约马尔可夫链,如果一个状态是非周期的,则所有状态都是非周期的。

○ 示例:每个节点都有一条返回自身的路径的步行是非周期性的。

⑩ 常规

○ 正则 ⊂ 不可约

○ 对于某个自然数 k,转移矩阵 M 的 k 次方的所有元素 Mk 均为正(即非零值)。

⑺ 图表类型

①无向图:有无向边的图

② 有向图:有向边的图

③ k 分图:如果其顶点集允许划分为 k 类,且同一类的顶点不相邻。

⑻ 网络的中心性

① 程度中心性表明人们拥有许多社会关系。

② 紧密中心性表明谁处于社交网络的核心。

③介数中心性描述的是连接社交圈的人。> ④ 网络中有影响力的人的特征向量中心性较高。

⑼ 邻接矩阵:表示为A

① 定义:当节点数为n时,n×n邻接矩阵定义为,Ai,j = 1(如果vi ~ vj),Ai,j = 0(否则)


스크린샷 2024-10-12 오후 3 12 00

图 3. 邻接矩阵示例


② 图的顶点集上的实值函数,f: V → ℝ


스크린샷 2024-10-12 3 13 40

图 4. 实值函数 f 的示例


③ 以下公式成立


스크린샷 2024-10-12 3 14 34


④ 对称归一化邻接矩阵: × = D-1/2AD-1/2 (参见 Dii = d(vi))

⑽ 关联矩阵:表示为∇。

① 无向图的关联矩阵定义为,Bi,j = 1(如果顶点 vi 与边 ej 关联),Bi,j = 0(否则)


스크린샷 2024-10-12 3 37 14

图 5. 关联矩阵示例


②有向图的关联矩阵


스크린샷 2024-10-12 오후 3 16 05


③ 节点为行、边为列(例如图 5)和边为行、节点为列(例如图 6)两种情况。

⑾ 拉普拉斯矩阵

① 概述

○ 定义: L = ∇T∇ = D - A (参见 Dii = d(vi))

○ 多重性:图中连通分量的数量


스크린샷 2024-10-12 오후 3 46 21

图 6. 拉普拉斯矩阵示例


○ 这里,∇如下:


受保护_0


② 拉普拉斯矩阵的修正

○ 归一化图拉普拉斯: Ln = D-1/2LD-1/2 = I - D-1/2AD-1/2。对称,半定正

○ 马尔可夫链转移矩阵: Lt = D-1A

○ 随机游走图拉普拉斯: Lr = D-1L = I - Lt = D-1/2LnD1/2

特征 1. L 的特征值为 0。 L1n = 0

○ 如果有 k 个不连通图,则有 k 个特征值为 0。

○ 特征值越接近0,图的连通性越强。

○ 费德勒向量:λ1 = 0之后第二小的特征值对应的特征向量,代表图的整体结构。

特征2. (Lf)(vi) = Σvj~vi (f(vi) - f(vj)):参见图。 4


스크린샷 2025-01-01 오후 3 53 03


特征 3. L 是对称且半正定的。

○ 二次形式:fTLf = Σei,j, i < j (f(vi) - f(vj))2 = (1/2) Σei,j (f(vi)) - f(vj))2 ≥ 0


스크린샷 2025-03-31 7 15 58


○ 在图4的例子中,fTLf = 9.27

○ 也就是说,L 有 n 个非负实值特征值。

○ 当使用矩阵 p 代替 f 时,表示为 tr(pᵀLp)。

特征 4. 给定 Y = [y1 y2ym] ∈ ℝk×m

○ tr(YTLY) = Σei,j   yi - yj   2

特性 5. 瑞利商


스크린샷 2025-03-31 오후 9 34 30


○ λ2,费德勒值(代数连通性),表示微分或分离值所需的能量。

○ 较大的 λ2 表明数据难以分离,表明整体结构连接良好。

○ 较小的 λ2 意味着数据很容易分离,表明存在弱连接结构或聚集成不同的组。

应用1. 无向加权图的拉普拉斯算子


스크린샷 2025-01-01 오후 3 55 27


应用 2. 谱聚类 (ref)

○ 原问题

○ 它试图在图中找到“最小切割”:在标准化簇体积的同时,具有最小簇间边权重的顶点划分。

○ 聚类(图划分)的关键思想是使不同簇之间的连接(即跨簇的边权重之和)变小,同时防止某些簇变得太小的不平衡分裂。

○ 如果我们只最小化集群间连接(最小切割),我们通常会得到一个简单的分区,只是剥离一些节点。因此,我们改为最小化归一化切割,即按簇大小(连接性/关联性)对切割进行归一化。

○ 切削的定义


스크린샷 2025-04-06 오후 11 01 30


○ 体积的定义


스크린샷 2025-04-06 오후 11 02 37


○ 2簇优化问题


스크린샷 2025-04-06 오후 11 03 03


○ 多集群优化问题


스크린샷 2025-04-06 오후 11 03 29


○ 相当于找到满足以下条件的簇标签 X ∈ {0,1}N×K 的 one-hot 编码


스크린샷 2025-04-06 오후 11 04 43


○ 使用拉普拉斯矩阵的解决方案

○ 问题定义


스크린샷 2025-04-06 11 37 06


○ 条件 yTDy=1 是必要的原因:如果没有这个条件,则存在一个平凡解 y=0,并且对于任何非零 y,存在一个 0≤c<1 的标量 c,使得 cy 使目标函数任意小。»» ○ 需要条件 yTD1=0 的原因:该条件对于 y1(正交性)是必要且充分的。如果没有它,目标函数的最小值始终为 0,并且始终在 y=1 处实现(通过拉格朗日乘子 的方法)。


스크린샷 2025-04-06 오후 11 36 44


○ 在原来的谱聚类问题中,放宽one-hot约束并添加条件XTDX = I使其等价于该解。

步骤1: 计算给定的n个数据点之间的距离,创建一个n × n的邻接矩阵A。经常使用高斯核。


스크린샷 2024-10-12 5 48 15


步骤2: 根据邻接矩阵,计算拉普拉斯矩阵: LnLr 也可以使用。

步骤3: 计算拉普拉斯矩阵的k个最小特征值对应的特征向量矩阵 W = [ω2, ···, ωk] ε ℝn×k 。排除 ω1 = 1,它对应于 λ1 = 0,因为它是微不足道的。

步骤 4: 将 n 个数据点自然嵌入到 k 个维度中: Y = WT = [y1, ⋯, yn],每个列向量代表嵌入的数据点。

步骤5:Y的列向量进行聚类,例如K-means聚类。

应用3. 拉普拉斯矩阵可以用作傅里叶变换算子(例如,G-FuNK

⑿ 度数分布:度数为k的节点占所有节点的比例,即P(k) = Nk / V(G)

⒀ 距离:两个节点之间最短路径的长度。如果不存在这样的路径,则距离定义为 ∞。

⒁ 聚类系数:若特定节点的度为 ki,且与该节点相连的周围节点之间的边数为 ei,则:


스크린샷 2024-10-07 8 16 27


① 例如,如果 A 与 B、C、D 连接,并且还有附加边 B-C 和 C-D,则对于 A,ei = 2,ki = 3,Ci = 2 / 3。

② ki (ki - 1) / 2:周围节点之间可以形成的最大边数。

③ Ci 的值在 0 到 1 之间,值接近 1 表明周围节点是全连接的。



2.应用

⑴ 鸽巢原理

唯一图的数量取决于节点数量:几乎完美遵循指数函数。

Dijkstra 和 Floyd 算法

⑷【子图数量统计算法】(https://jb243.github.io/pages/1892#:countingisland)

⑸ 【信仰的力量】(https://jb243.github.io/pages/869)

⑹ 社交网络理论或六度分离

① 地球上任意两个人之间通过不超过六个中介联系起来的理论。

② 证明:如果一个人平均认识100人,那么经过六步,1006 = 10亿,得出类似的结论。

⑺ 佩伦-弗罗贝尼乌斯定理

定理1. 如果一条带有转移矩阵P的有限马尔可夫链是强连通的,则恰好存在一个平稳分布q。» ○ 稳态分布满足 Pq = q

○ 示例:如果 P = I(单位矩阵) ε ℝ2×2,则它是可约的,因此对于所有 x ε [0, 1],存在无穷多个 (x, 1-x) 形式的平稳分布。


스크린샷 2026-01-17 오후 2 28 31


定理2. 如果一个具有转移矩阵P的有限马尔可夫链是强连通且非周期的,则称为遍历马尔可夫链并满足:

○ Pij:从节点 j 转移到节点 i 的概率。 Σi Pij = 1。

2-1. 当 k → ∞ 时,矩阵 Pk 收敛为列全部等于 q 的矩阵;即,Pij(k) 收敛于 qi (对于任何 i 和 j),因为 k → ∞

2-2. 对于任何初始状态 x0 来说,马尔可夫链 {xk} 收敛到 q,因为 k → ∞


스크린샷 2026-01-17 오후 2 37 55


○ 示例:如果 P=((0,1),(1,0)),则它是周期性的(周期=2)。因此,存在唯一的平稳分布 π=(0.5,0.5),但 $\lim_{k\to\infty} p(k)$ 不会收敛到单一极限,而是分裂成两个子序列(例如,$p^{\text{even }k}=(1,0)$ 和 $p^{\text{odd }k}=(0,1)$)。


스크린샷 2026-01-17 오후 2 43 53


⑻ Google 的 PageRank 算法

步骤1. 将网页表示为图,并将其表示为马尔可夫过程转移矩阵P。

步骤2. 瞬移:对于汇聚节点,强制分配到其他页面的转移概率为1/n:P → P’。

步骤 3. P’’ = (1 - α) P’ + (α / n) 1

○ 这里,1 是指用 1 填充的 n × n 矩阵。

○ 虽然 P’ 不保证是正则的,但 P’’ 始终保证是正则的。

○ P’’ 是由 Google 创始人谢尔盖·布林 (Sergey Brin) 和拉里·佩奇 (Larry Page) 定义的马尔可夫链。

步骤 4. 搜索稳态向量 x 使得 P’‘x = x

○ 由于 P’’ 是规则的,因此它是强连通的,这确保了唯一稳态的存在。

○ 此时的状态转换概率可以视为推荐页面的重要性。

⑤ 个性化PageRank:使用用户输入修改隐形传态分布(或图/候选集),产生用户特定的平稳分布。

⑼ 四色定理

① 任何地图最多可以用四种颜色着色,确保相邻的两个区域没有相同的颜色。

② 通过使用计算机验证四色定理在所有情况下都成立来证明该定理。

⑽ 欧拉路径问题或柯尼斯堡桥问题

① 当且仅当存在 0 或 2 个奇数度的节点时,图中才存在一条只经过每个节点一次的欧拉路径。

② 如果有 2 个节点的度数为奇数,则其中一个为起点,另一个为终点。

③ 没有一条路径能够恰好穿过柯尼斯堡的所有七座桥梁一次。

⑾ 拉姆齐理论

① 在任何足够大的图中,必须存在某种结构(例如熟人的完整图或陌生人的子图)。

② R(s, t):保证存在s个陌生人的子图或t个熟人的子图的最小节点数。

定理1. R(3, 3) = 6:任意6个人中,要么有3个共同的朋友,要么有3个共同的陌生人。这可以通过计算可能性来证明。

定理 2. R(3, 3, 3) = 17。> ⑤ 定理 3. R(3, 3, 4) = 30。

定理4. R(s, t)的递推关系:R(s, t) ≤ R(s-1, t) + R(s, t-1)。

定理 5. R(s, t) 上限的存在性:通过 R(s, t) 的递推关系和数学归纳法证明(ref)。


스크린샷 2024-10-07 8 17 54


定理 6. Rk(s1, s2, …, sk) ≤ Rk/2(R(s1, s2), R(s3, s4), …, R(sk-1, sk))。

⑿ 舒尔定理

① 对于任意 k ≥ 2,存在 n > 3,使得在 k 着色下,总存在满足 x + y = z 的 (x, y, z),在 {1, 2, …, n} 中以相同方式着色。通过拉姆齐理论证明。

② 这与费马大定理相关,揭示了 (x, y, z) 的存在性,其中 xm + ym = zm (mod p)。

⒀ Erdős–Rényi 随机图

① 即使有随机连接节点的简单规则,在一定阈值下也会出现非常大的图。



输入:2024.10.01 19:44

results matching ""

    No results matching ""