欢迎来到财会考试题库网 财会考试题库官网
logo
全部科目 > 大学试题 > 计算机科学 > Apache Spark

多项选择题

下列关于DStream转换描述正确的是()。

    A.无状态转化操作就是把简单的RDD转化操作应用到每个批次上,也就是转化DStream中的每一个RDD 。
    B.有状态转换操作就是将依赖之前的批次数据或者中间结果来计算当前批次的数据,不断的把当前的计算和历史时间切片的RDD进行累计。
    C.Transform允许DStream上执行任意的RDD-to-RDD函数。
    D.updateStateByKey操作使得我们可以在用新信息进行更新时保持任意的状态。

点击查看答案&解析

相关考题

  • 多项选择题
    下列关于RDD、DataFrame和DataSet描述正确的是()。

    A.RDD、DataFrame、DataSet全都是spark平台下的分布式弹性数据集,为处理超大型数据提供便利
    B.三者都有惰性机制,在进行创建、转换,如map方法时,不会立即执行,只有在遇到Action如foreach时,三者才会开始遍历运算
    C.在对DataFrame和Dataset进行操作许多操作都需要进行引入:import spark.implicits._
    D.DataFrame可以通过toDS转化为DataSet

  • 多项选择题
    下列关于SparkSQL描述正确的是()。

    A.提供了两个编程抽象:DataFrame和DataSet。
    B.底层将SQL转换成RDD ,然后提交到集群执行。
    C.DataFrame和DataSet可以进行相互转化。
    D.SparkSQL兼容HQL语法。

  • 多项选择题
    下列关于DAG描述正确的是()。

    A.RDD通过一系列的转换就就形成了DAG。
    B.根据RDD之间的依赖关系的不同将DAG划分成不同的Stage。
    C.对于窄依赖,partition的转换处理在Stage中完成计算。
    D.对于宽依赖,由于有Shuffle的存在,只能在parent RDD处理完成后,才能开始接下来的计算。

微信小程序免费搜题
微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题