前言

通过简单形式解释为什么SVM中，高斯核可以把原始维度映射到无穷多维。

多项式核函数

简单情形多项式核比如：

$k (x, y) = (x^{T} y)^{2}$

首先考虑简单情形，原始维度只有2维，即 $x = [\begin{matrix} x_{1} \\ x_{2} \end{matrix}]$ ， $y = [\begin{matrix} y_{1} \\ y_{2} \end{matrix}]$ 。

则有： $k (x, y) = (x_{1} y_{1} + x_{2} y_{2})^{2} = x_{1}^{2} y_{1}^{2} + 2 x_{1} x_{2} y_{1} y_{2} + x_{2}^{2} y_{2}^{2} = {[\begin{matrix} x_{1}^{2} \\ \sqrt{2} x_{1} x_{2} \\ x_{2}^{2} \end{matrix}]}^{T} [\begin{matrix} y_{1}^{2} \\ \sqrt{2} y_{1} y_{2} \\ y_{2}^{2} \end{matrix}]$ .

可以看出，相当于找到一个映射 $Φ (z)$ ，把原来的 $z = [\begin{matrix} z_{1} \\ z_{2} \end{matrix}]$ 映射到了 $[\begin{matrix} z_{1}^{2} \\ \sqrt{2} z_{1} z_{2} \\ z_{2}^{2} \end{matrix}]$ 。这就是相当于把原来 $R^{2}$ 空间中的特征映射到了 $R^{3}$ 中。

紧接着，把原始维度泛化到 $n$ 维：

$\begin{aligned} (1) & k (x, y) & = (x_{1} y_{1} + x_{2} y_{2} + \dots + x_{n} y_{n})^{2} \\ (2) & = \sum_{i = 1}^{n} (x_{i}^{2} y_{i}^{2}) + 2 \cdot \sum_{i = 1}^{n - 1} \sum_{j = i + 1}^{n} x_{i} y_{i} x_{j} y_{j} \\ (3) & = {[\begin{array}{c} x_{1}^{2} \\ \sqrt{2} x_{1} x_{2} \\ \sqrt{2} x_{1} x_{3} \\ \dots \\ x_{2}^{2} \\ \sqrt{2} x_{2} x_{3} \\ \dots \\ x_{n}^{2} \end{array}]}^{T} [\begin{array}{c} y_{1}^{2} \\ \sqrt{2} y_{1} y_{2} \\ \sqrt{2} y_{1} y_{3} \\ \dots \\ y_{2}^{2} \\ \sqrt{2} y_{2} y_{3} \\ \dots \\ y_{n}^{2} \end{array}] \end{aligned}$ .

即找到一个映射 $Φ (\cdot)$ 将原来 $n$ 维的特征映射到了 $\frac{n (n + 1)}{2}$ 维。

高斯核

现在再看简单版的高斯核[1]：

$k (x, y) = \exp (- | | x - y | |^{2})$

先考虑2维情况：

$\begin{aligned} (4) & k (x, y) & = \exp (- | | x - y | |^{2}) \\ (5) & = \exp (- (x_{1}^{2} + x_{2}^{2} + y_{1}^{2} + y_{2}^{2} - 2 x_{1} y_{1} - 2 x_{2} y_{2})) \\ (6) & = \exp (- (x_{1}^{2} + x_{2}^{2})) \cdot \exp (- (y_{1}^{2} + y_{2}^{2})) \cdot \exp (2 (x_{1} y_{1} + x_{2} y_{2})) \\ (7) & = \exp (- | | x | |^{2}) \cdot \exp (- | | y | |^{2}) \cdot \exp (2 x^{T} y) \\ (8) & = \exp (- | | x | |^{2}) \cdot \exp (- | | y | |^{2}) \cdot \sum_{n = 0}^{\infty} \frac{(2 x^{T} y)^{n}}{n!} (泰勒展开式: e^{x} = \sum_{n = 0}^{\infty} \frac{x^{n}}{n!}) \end{aligned}$

根据前面的多项式核可知后面的 $\sum_{n = 0}^{\infty} \frac{(2 x^{T} y)^{n}}{n!}$ 中的每一 $n$ 阶项可以找到相应的映射 $ϕ_{n}$ ，

所以 $k (x, y) = (\exp (- | | x | |^{2}) \cdot [\begin{matrix} \frac{ϕ_{0} (x)}{\sqrt{0!}} \\ \frac{ϕ_{1} (x)}{\sqrt{1!}} \\ \frac{ϕ_{2} (x)}{\sqrt{2!}} \\ \dots \\ \frac{ϕ_{n} (x)}{\sqrt{n!}} \\ \dots \end{matrix}])^{T} \cdot (\exp (- | | y | |^{2}) \cdot [\begin{matrix} \frac{ϕ_{0} (y)}{\sqrt{0!}} \\ \frac{ϕ_{1} (y)}{\sqrt{1!}} \\ \frac{ϕ_{2} (y)}{\sqrt{2!}} \\ \dots \\ \frac{ϕ_{n} (y)}{\sqrt{n!}} \\ \dots \end{matrix}])$

可以看出可以找到映射 $Φ (x) = \exp (- | | x | |^{2}) \cdot [\begin{matrix} \frac{ϕ_{0} (x)}{\sqrt{0!}} \\ \frac{ϕ_{1} (x)}{\sqrt{1!}} \\ \frac{ϕ_{2} (x)}{\sqrt{2!}} \\ \dots \\ \frac{ϕ_{n} (x)}{\sqrt{n!}} \\ \dots \end{matrix}]$ ，该映射相当于把原来2维的特征映射到了无穷维。

#参考

[1] https://zh.wikipedia.org/wiki/%E5%BE%84%E5%90%91%E5%9F%BA%E5%87%BD%E6%95%B0%E6%A0%B8

[2] https://murongxixi.github.io/2018/04/23/%E5%A4%9A%E9%A1%B9%E5%BC%8F%E6%A0%B8vsrbf%E6%A0%B8/

[3] https://www.quora.com/Why-does-the-RBF-radial-basis-function-kernel-map-into-infinite-dimensional-space-mentioned-many-times-in-machine-learning-lectures

可惜流光

SVM中高斯核为什么可以映射到无穷多维

前言

多项式核函数

高斯核