0%

Hadoop的安装与配置

介绍Hadoop的伪分布式和集群安装与配置。

前提

  1. JDK1.8
Read more »

初探PySpark

将介绍PySpark的单机与集群配置方法,以及基本使用示例。

Apache Spark是一个闪电般快速的实时处理框架。它进行内存计算以实时分析数据。由于 Apache Hadoop MapReduce 仅执行批处理并且缺乏实时处理功能,因此它开始出现。因此,引入了Apache Spark,因为它可以实时执行流处理,也可以处理批处理。

Read more »

六、梯度分析与最优化问题

最优化问题是信息科学中经常遇到的一类问题,无约束最优化问题:

\[\min_{x \in R}f(x)\]

Read more »

五、投影分析

许多问题的最优都可归结为:提取某个所希望的信号,而抑制其他所有干扰、杂波或噪声。投影是解决这类问题的一个极为重要的数学工具。

Read more »