0%

初探PySpark

将介绍PySpark的单机与集群配置方法,以及基本使用示例。

Apache Spark是一个闪电般快速的实时处理框架。它进行内存计算以实时分析数据。由于 Apache Hadoop MapReduce 仅执行批处理并且缺乏实时处理功能,因此它开始出现。因此,引入了Apache Spark,因为它可以实时执行流处理,也可以处理批处理。

Read more »

六、梯度分析与最优化问题

最优化问题是信息科学中经常遇到的一类问题,无约束最优化问题:

\[\min_{x \in R}f(x)\]

Read more »

五、投影分析

许多问题的最优都可归结为:提取某个所希望的信号,而抑制其他所有干扰、杂波或噪声。投影是解决这类问题的一个极为重要的数学工具。

Read more »

四、矩阵的奇异值分解

Singular Value decomposition是一种矩阵分解方法,它是科学工程计算和数值代数的最有用和最有效的工具之一。

Read more »