A.獲取數據,并將原始數據轉化成自己處理的數據對象
B.緩存數據,根據不同的可靠性策略,將數據保存在內存或文件上
C.輸出數據到目的地,支持多種輸出協(xié)議
D.拆分數據,根據數據的特性,將數據發(fā)送到不同的目的地
您可能感興趣的試卷
你可能感興趣的試題
A.分區(qū)字段要在創(chuàng)建表時定義
B.分區(qū)字段只能有一個,不可以創(chuàng)建多級分區(qū)
C.使用分區(qū),可以減少某些查詢的數據掃᧿范圍,進而ᨀ高查詢效率
D.分區(qū)字段可以作為where字句的條件
A.優(yōu)先從最近的DataNode下載數據
B.文件數據先從DataNode返回至NameNode,然后從NameNode下致到客戶端
C.如果客戶端和所連接的DataNode在讀取時出現(xiàn)故障,那么客戶端會放棄這其他副本所在的節(jié)點
D.支持多個客戶端同時從DataNode上讀取同一個文件數據
最新試題
由于Spark是基于內存的計算引擎,因此,一個Spark應用可以處理的數據量不能超過分給這個Spark應用的內存總和。()
FusionLnsigh HD,Oozie支持HDFS Action。()
Fusionlnsight HD中,一個部署在Tomcat上的應用,需訪問HBase服務,這種場景下推薦使用機機賬號。()
用戶要開發(fā)一個應用去訪問HBase服務,先申請了一個機機賬號teste1,并給它設置訪問HBase服務的權限:然后下載該賬戶的keytab文件,并使用該賬號運行應用。后續(xù)此應用增加業(yè)務需求,需訪問Hive服務,那么在給tested用戶補充授予了訪問Hive組件權限后,需重新下載該用戶的keytab文件。()
Fusionlnsight HD中,Streaming的特點?()
在Kafka中,關于Consumer說法正確的是()。
關于Kafka的特點如下᧿述正確的是?()
在MapReduce應用程序開發(fā)中,setMapOutputCompressorClass類的作用是什么?()
以下業(yè)務應用中,哪個不是Hive適用的場景?()
Fusionlnsight HD中,Streaming打包工具用于將業(yè)務代碼jar包和其他所依賴的jar包等,打包成一個完整的Streaming應用的jar包。()