思腾合力|云计算 AI服务器 AI工作站 系统集成 产品定制 软件开发 边缘计算
思腾合力|云计算 AI服务器 AI工作站 系统集成 产品定制 软件开发 边缘计算
使用方便
可用于Java、Scala、Python和R。
MLlib适合Sparke的API,并与Python (从 Spark 0.9开始)和R库(从Spark 1.5开始)中的NumPye互操作。您可以使用任何Hadoop数据源(例如 HDFS、HBase或本地文件),从而轻松插入Hadoop工作流。
表现
高质量算法,比 MapReduce 快100倍。
Spark擅长迭代计算,使MLlib能够快速运行。同时,我们关心算法性能:MLlib包含利用迭代的高质量算法,并且可以产生比有时在 MapReduce 上使用的单遍近似更好的结果。
│无处不在
Spark在Hadoop、Apache Mesos、Kubernetes上独立运行,或在云中针对不同的数据源运行。
您可以使用其独立集群模式在EC2e、Hadoop YARN@ 、Mesose或Kubernetes上运行Spark。访问HDFS?、Apache Cassandraz、 Apache HBasec、Apache Hive和数百个其他数据源中的数据。
MLlib是 Apache Spark的可扩展机器学习库