存在如下業(yè)務(wù)場景:用戶上網(wǎng)日志文件已經(jīng)存放在HDFS上,日志文件內(nèi)容格式是:每條上網(wǎng)記錄三個字段,分別是姓名,性別,上網(wǎng)時間,字段之間用“,”護(hù)分隔;要求打印輸出所有上網(wǎng)總時間大于兩小時的女性網(wǎng)友。請問如下哪些代碼片段能實(shí)現(xiàn)上述業(yè)務(wù)場景?()
A.A
B.B
C.C
D.D
您可能感興趣的試卷
你可能感興趣的試題
A.Producer負(fù)責(zé)生產(chǎn)數(shù)據(jù),Consumer負(fù)責(zé)消費(fèi)數(shù)據(jù),Producer和Consumer之間需要建立Socket鏈接
B.Producer既可以發(fā)送數(shù)據(jù)到Broker上,又可以發(fā)送數(shù)據(jù)到Consumer上
C.Producer作為消息生產(chǎn)者,可以直接將數(shù)據(jù)寫入Zookeeper
D.Producer連接任意一個正常的Broker實(shí)例就可以生產(chǎn)數(shù)據(jù)
A.必須對查詢字段進(jìn)行排序
B.必須對uniqueKey字段進(jìn)行排序
C.第一次查詢請求時,需指定查詢參數(shù),操作方法如下,solrQuery.set(CursorMarkParams.CURSOR_MARK_PARAMCursorMarkParams.CURSOR_MARK_START)
D.查詢時,請求中不能帶有start參數(shù),Solr的返回結(jié)果中會有nextCursorMark,在下次調(diào)動使用這個值為oursorMark
A.valcounts=textFile.map(line=>line.split(“”)).map(-rd=>(word,1)).reduceByKey(_+_)
B.valcounts=textFile.flatMap(line=>line.split(“”)).map(word=>(word,1)).reduceByKey(_+_)
C.valcounts=textFile.map(line=>line.split(“”)).map(word=>(word,1)).groupByKey(_+_)
D.valcounts=textFile.flatMap(line=>line.split(“”)).map(word=>(word,1)).groupByKey(_+_)
最新試題
Fusionlnsight HD中,Streaming的特點(diǎn)?()
Fiume支持實(shí)時采集數(shù)據(jù)的source類型是哪項(xiàng)?()
Spark Streaming可以從Kafka接收數(shù)據(jù)并進(jìn)行計(jì)算,計(jì)算結(jié)果只能存入HDFS,不能再寫回Kafka。()
Fusionlnsight HD中,Streaming打包工具用于將業(yè)務(wù)代碼jar包和其他所依賴的jar包等,打包成一個完整的Streaming應(yīng)用的jar包。()
在通過Fusionlnsight manager界面創(chuàng)建用戶時,想要該用戶對所有Topic具有讀寫權(quán)限,但不具有常見Topic的權(quán)限,應(yīng)該加入Kafka服務(wù)的那個組?()
Fusionlnsight HD關(guān)于Oozie的作業(yè)操作命令,下列哪幾項(xiàng)敘述是正確的?()
對于HBase rowkey的設(shè)計(jì)原則,如下敘述正確的是?()
在HBase表設(shè)計(jì)中,對于多項(xiàng)業(yè)務(wù)共用rowkey,導(dǎo)致數(shù)據(jù)訪問矛盾的情況,可以有哪些應(yīng)對策略?()
在Solr的應(yīng)用查詢場景中,當(dāng)對查詢結(jié)果深度翻頁時,需使用游標(biāo)進(jìn)行深度翻頁。下面對游標(biāo)說法正確的是?()
由于Spark是基于內(nèi)存的計(jì)算引擎,因此,一個Spark應(yīng)用可以處理的數(shù)據(jù)量不能超過分給這個Spark應(yīng)用的內(nèi)存總和。()