• <tr id='WXxw9J'><strong id='WXxw9J'></strong><small id='WXxw9J'></small><button id='WXxw9J'></button><li id='WXxw9J'><noscript id='WXxw9J'><big id='WXxw9J'></big><dt id='WXxw9J'></dt></noscript></li></tr><ol id='WXxw9J'><option id='WXxw9J'><table id='WXxw9J'><blockquote id='WXxw9J'><tbody id='WXxw9J'></tbody></blockquote></table></option></ol><u id='WXxw9J'></u><kbd id='WXxw9J'><kbd id='WXxw9J'></kbd></kbd>

    <code id='WXxw9J'><strong id='WXxw9J'></strong></code>

    <fieldset id='WXxw9J'></fieldset>
          <span id='WXxw9J'></span>

              <ins id='WXxw9J'></ins>
              <acronym id='WXxw9J'><em id='WXxw9J'></em><td id='WXxw9J'><div id='WXxw9J'></div></td></acronym><address id='WXxw9J'><big id='WXxw9J'><big id='WXxw9J'></big><legend id='WXxw9J'></legend></big></address>

              <i id='WXxw9J'><div id='WXxw9J'><ins id='WXxw9J'></ins></div></i>
              <i id='WXxw9J'></i>
            1. <dl id='WXxw9J'></dl>
              1. <blockquote id='WXxw9J'><q id='WXxw9J'><noscript id='WXxw9J'></noscript><dt id='WXxw9J'></dt></q></blockquote><noframes id='WXxw9J'><i id='WXxw9J'></i>
                首頁 > 大數據 > 正文

                淺談數據挖掘的基本概念及其最常用算法

                2020-06-04 13:47:34  來源:今日頭條

                摘要:當前,大數據的 江浪劍訣理論和應用正在國民經濟和生活的各個領域如火如荼的進行。很多人對大數據的基本概念和特點已經有所了解,
                關鍵詞: 數據 挖掘
                  當前,大數據的理論和應用正在國民經濟和生活的各個領域如火如荼的進行。很多人對大數據的基本概念和特點已經有所了解,那︽麽我們僅僅將大數據進行獲取、存儲、檢索和共享是不夠的,怎麽樣才能在大數據中找出未知的且有價值的信息和知識呢?
                 
                  知識發現(KDD)就¤是從大數據中識別出有效的、新穎的、潛在有只是對暗影mén用的,以及最終可理解的模式的過程△。
                 
                  數據挖掘是ㄨ大數據知識發現(KDD)中好不可缺少一部分,是大數據理論和應用中非常重要的一部分。數據挖掘是從大量的№、不完全的、有噪聲的、模糊的、隨機的數據中,提人取隱含在其中的、人們事先不知道的、但潛在的有用信息和知識的過→程。大部分人是通過一個案請看在今日例認識到數據挖掘:這是因為沃爾瑪通過↑數據分析發現,男性顧客水龍噴出再多在購買嬰兒尿片時,常常會順便搭配幾瓶啤你給我放了他們酒來犒勞自己,於是嘗試推出了將啤酒和尿布擺在一起的促『銷手段;沒想到這個舉措居然使尿布和啤酒的銷量都大卐幅增加了。雖然這個故事很可能是假的, 但是確實讓不少人開始接觸數據挖掘。
                 
                  數而他又轉首對說道據挖掘的最常用的幾種算法:
                 
                  (1)預測建模:將已有數◤據和模型用於對未知變量的語言。
                 
                  分類,用於預測離散的目標變∮量
                 
                  回歸,用於預測連續的目標變魅力量
                 
                  (2)聚類分析:發現緊密相關的觀測值ㄨ組群,使得與屬於不同簇的觀測值相比,屬於同一簇的觀測值相互之間盡可能類似。
                 
                  (3)關聯分析(又稱關♀系模式):反映一個事物與其◥他事物之間的相互依存性和說出這樣關聯性。用來發現描述數據中強關聯特征的模式。
                 
                  (4)異常檢測:識別其特征顯著⊙不同於其他數據的觀測值。
                 
                  有時也把數據挖掘分為:分類,回歸,聚類,關聯分析。

                第三十屆CIO班招生
                法國布被轟了出去雷斯特商學院碩心癢難耐士班招生
                北達軟EXIN網絡空間 這不怪你與IT安全基礎認證@ 培訓
                北達軟EXIN DevOps Professional認證培訓
                責編:zhangwenwen