問答題
假定用于分析的數據包含屬性age。數據元組的age值(以遞增序) 是:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。
(1)使用分箱均值光滑對以上數據進行光滑,箱的深度為3。解釋你的步驟。評述對于給定的數據,該技術的效果。
(2)如何確定數據中的離群點?
(3)對于數據光滑,還有哪些其他方法?
您可能感興趣的試卷
最新試題
數據挖掘系統可以根據什么標準進行分類()
題型:多項選擇題
基于數據挖掘分析,開展業(yè)務質量分析的分析與預判時,下列哪項說法是錯誤的()
題型:單項選擇題
互聯網本身具有()的特征,這種屬性特征給數據搜集、整理、研究帶來了革命性的突破。
題型:多項選擇題
樸素貝葉斯分類器對()數據具有較好的分類效果。
題型:多項選擇題
高鐵用戶識別基于以下哪些信息()
題型:多項選擇題
給定一個數值屬性,怎樣才能平滑數據,去掉噪聲?()
題型:多項選擇題
聚類分析中,通常使用()來衡量兩個對象之間的相異度。
題型:單項選擇題
關于ROC曲線和ROC統計量,正確的說法有()
題型:多項選擇題
AprioriAll算法存在的問題包括()。
題型:多項選擇題
GSP算法存在的問題包括()。
題型:多項選擇題