杭州大数据Spark基础课程(二)
关于这门课程
Spark基础课程二,是大数据学院Spark教程的第二部分,本课将对Spark基础部分的定义做进一步延伸。内容涵盖了Spark的基础构架;大数据分布的进一步探索;以及任务的并发执行。
通过学习本课,您可以进一步了解Spark在做连接时是如何优化数据的,Spark的内存缓存机制,以及如何使用Spark高级API。
前提条件
完成大数据学院的Hadoop基础课程-第三版
完成大数据学院的Spark基础课程
讲师介绍
James Priebe
James Priebe 是一位来自IBM的实习生,工作于加拿大多伦多安大略实验室。主要致力于为IBM合作伙伴建立概念性的创意应用,以及开发客户培训课程。他熟悉大数据家族的各种技术,包括 Streams, Hadoop, 和注释的查询语言 (AQL)。James 就读于加拿大麦克马斯特大学,已完成三年的软件工程师及管理程序计划。
Henry L. Quach
Henry L. Quach是一位资深软件工程师,已经在IBM工作7年。他曾经工作于信息管理系统多年,并参与开发过多个大型项目,包括内部教育跟踪评估系统,被广泛应用于很多企业。同时,他也是全球在线教育社区最早的开拓者。他是全球移动创新社区主要的成员,并主讲和开发了多门移动信息教育课程。Henry拥有加州圣何塞州立大学计算机科学本科和硕士学位。