单项选择题
在Spark中,假设lines是一个DStream对象,filter语句可以过滤掉80%的数据,针对以下两个语句说法正确的是:() X:lines.filter(...).groupByKey(...) Y:lines.groupByKey(...).filter(...)
A.X比Y的性能更高 B.X比Y的性能更低 C.X和Y和性能一样 D.无法确性X和丫的性能差异
判断题 Solr是一个高性能,基于Lucene的全文检索服务。Solr对Lucene进行了扩展,提供了比Lucene更为丰富的查询语言,并实现了强大的全文检索功能,具有高度的可扩展性。同时从Solr4.0版本开始,支持SolrCloud模式。()
单项选择题 存在如下场景:每天由线上系统产生新数据500G,需要对这些数据按天、周、月等维度做统计汇总。请问它适合用Hive哪种表来处理?()
多项选择题 在线日志查询方案中,采用了流处理来完成计算工作,整个计算过程中,需要将中间计算结果暂时存放,下列哪些组件适合存放中间计算结果?()