1、spark是什么
spark, 是一种通用的大数据计算框架, 正如传统大数据技术hadoop的mapreduce、 hive引擎, 以及storm流式实时计算引擎等。
spark包含了大数据领域常见的各种计算框架, 比如:
spark core用于离线计算
spark sql用于交互式查询
spark streaming用于实时流式计算
spark mllib用于机器学习
spark graphx用于图计算
spark主要用于大数据的计算, 而hadoop以后主要用于大数据的存储( 比如hdfs、 hive、 hbase等) , 以及资源调度( yarn)
spark+hadoop的组合, 是未来大数据领域最热门的组合, 也是最有前景的组合!
2、spark介绍
spark, 是一种one stack to rule them all的大数据计算框架, 期望使用一个技术堆栈就 完美地解决大数据领域的各种计算任务。 apache官方, 对spark的定义就是: 通用的大数据快 速处理引擎。
spark使用spark rdd、 spark sql、 spark streaming、 mllib、 graphx成功解决了大数 据领域中, 离线批处理、 交互式查询、 实时流计算、 机器学习与图计算等最重要的任务和问题。
spark除了一站式的特点之外, 另外一个最重要的特点, 就是基于内存进行计算, 从而让 它的速度可以达到mapreduce、 hive的数倍甚至数十倍!
现在已经有很多大公司正在生产环境下深度地使用spark作为大数据的计算框架, 包括 ebay、 yahoo!、 bat、 网易、 京东、 华为、 大众点评、 优酷土豆、 搜狗等等。
spark同时也获得了多个世界顶级it厂商的支持, 包括ibm、 intel等。
相关文章
西萨摩亚和中国时差(美属萨摩亚和西萨摩亚傻傻分不清楚吗)

西萨摩亚和中国时差(美属萨摩亚和西萨摩亚傻傻分不清楚吗)

美属萨摩亚和西萨摩亚是位于南太平洋中部地区萨摩亚群岛中的两个群岛。由于它们是岛屿,萨摩亚群岛并不靠近任何国家。汤加是最近的国家,两者之间的距离约为 330 英里。岛屿距离夏威夷2,500 英里。其他周边国家是新西兰(1,800 英里)和斐济(500 英里)。萨摩亚群岛占地约 1,170

查看详细
2024-11-19
fba shuffle

fba shuffle

一、什么是fba shuffle?fba shuffle是一个fba卖家的利器,它可以帮助卖家最大化利润和收益。它是一个自动化系统,可以优化你的销售,并帮助你获得更多的曝光。它的核心功能是自动重排列你的产品库存,以便让你的最佳销售产品始终处于高曝光位置,从而增加你的销售率。二、为

查看详细
2024-11-22
海运出口操作流程美国线(海运出口操作流程图)

海运出口操作流程美国线(海运出口操作流程图)

海运出口操作流程美国线详解随着国际贸易的日益发展,海运出口已经成为了一种重要的国际贸易方式。本文就以海运出口操作流程美国线为中心,为大家详细解析海运出口操作的具体流程。一、联系承运人并了解货物要求在出口前,首先要联系承运人,了解其运输要求,以便更好地决定出

查看详细
2024-11-02
各大跨境电商平台都有哪些优劣势?(跨境电商平台详解)

各大跨境电商平台都有哪些优劣势?(跨境电商平台详解)

近年来,跨境电商平台成为了全球商品流通的重要渠道,它们为消费者提供了更多样化的选择和更优惠的价格。这些平台不仅提供了消费者与商家之间的直接联系,还通过优化供应链和降低成本,使消费者能够获得更高质量的商品和服务。在这个全球化的时代,跨境电商平台的兴起不仅改变

查看详细
2024-11-21
海运拼箱技巧之洽谈与托运,国际海运拼箱整箱居然分不清

海运拼箱技巧之洽谈与托运,国际海运拼箱整箱居然分不清

海运拼箱技巧之洽谈与托运,国际海运拼箱整箱居然分不清谈判和托运海事lcl技能随着国际贸易的快速发展和运输服务的不断延伸,lcl集装箱运输得到了广泛的应用。然而,lcl运输不同于全集装箱运输,其运输要求有其特殊性和独立性。现将实际操作中遇到的一些问题提出来,供大家讨论

查看详细
2024-11-03
关闭
关闭
top
关闭
right