<kbd id="r30u8dav"></kbd><address id="w3y3zxf2"><style id="osq1aa07"></style></address><button id="1istium9"></button>

          火花大数据的处理

          回到计划

          register-button24

           

          课程名称 火花大数据的处理
          课程号 900-091-EQ-01
          平台 Linux的
          持续时间 24小时
          总督殿魁北克费(含税费)。
          $ 48个
          广大市民费(含税费)。
          $ 400.39
          时间表 周六9:00 AM - 3:30 (30分钟午餐)
          日期 25年1月18日; 2月1日,8
          先决条件 管理和大数据I级和2 SQL基本的处理。任一下面的Python / JAVA / Linux的的阶shell命令的知识很好的理解。蜂房和HDFS
          目标观众 数据工程师/设计师;
          大数据开发;
          企业应用程序开发者
          讲师 娴kantesariya
          位置 BH-210

          注:这是一个非学分的课程。提供已完成课时的80%,所有参与者证书s

          推荐教材
          我们将不遵循任何特定的教科书

          课程介绍:

          Spark是一个开源的分布式处理引擎,内置左右的速度,易用性和分析。其独特的内存中数据处理技术,你缩短处理时间大大对象比较典型的MapReduce程序。它已经很好地融入了批,SQL,流媒体,机器学习和图形处理中流行的编程语言Java的对待,包括斯卡拉,蟒蛇和R杀伤人员地雷。这些优势在2014年使其顶级Apache项目。

          本课程将帮助你理解和实践进行数据处理管线改造各种火花和杀伤人员地雷的行动。您也将获得熟悉的数据持有人,包括杀伤人员地雷RDD,数据帧和数据集。

          本课程涵盖的主题:

          • 对于机器学习数据处理算法
          • 探索图处理graphx库
          • dataframes和火花SQL
          • 与各种火花配置参数部署应用
          • 随着各种其他大数据处理工具火花互操作性
          • 重启火花工作
          • 火花各种文件格式
          • 随着管线数据摄取火花流
          • 星火工作优化技术
          每周专题

          请注意,讲师保留修改本计划的权利

          1周
          • dataframes和火花SQL
          • 火花各种文件格式
          • 随着各种其他大数据处理工具火花互操作性
          第2周
          • 对于机器学习算法数据处理
          • 重启火花工作
          3周
          • 与各种火花配置参数部署应用
          • 星火工作优化技术
          第4周
          • 随着管线数据摄取火花流
          • 探索图处理graphx库
          最佳

              <kbd id="9lluyqjs"></kbd><address id="xbhx2r3o"><style id="ycoy4ysx"></style></address><button id="e4kvnij5"></button>