數(shù)據(jù)挖掘技術在客戶管理中的應用研究

時間：2009-06-17 10:18:18

關鍵字：數(shù)據(jù)挖掘 BSP 模型聚類算法

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]數(shù)據(jù)挖掘技術，是從大量、無序、靜態(tài)的數(shù)據(jù)中發(fā)現(xiàn)有價值的規(guī)律和模式的過程。在分析了數(shù)據(jù)挖掘技術的應用特點的基礎上，討論了客戶管理的特殊性，并就算法選擇、模型構建、工具的應用等關鍵環(huán)節(jié)，給出了在客戶管理中應用數(shù)據(jù)挖掘技術的實用方案，最后進行了簡要的效果評價與分析，對于同類應用具有參考價值。

1 數(shù)據(jù)挖掘技術
數(shù)據(jù)挖掘的主要技術手段包括關聯(lián)規(guī)則挖掘、分類分析、聚類分析、估計、預測、時序模式和偏差分析等。支持上述技術的核心研究內容是相應的數(shù)據(jù)挖掘算法研究，包括貝葉斯算法、決策樹、時序算法、聚類算法、關聯(lián)算法、神經網(wǎng)絡算法和回歸算法。

2 數(shù)據(jù)挖掘的核心價值與應用分析
    在企業(yè)客戶管理中應用數(shù)據(jù)挖掘技術，不僅使客戶管理更高效、更實用，還能預測客戶將來的各種消費行為，為企業(yè)實施更精確的客戶管理和市場營銷提供決策依據(jù)?？蛻艄芾硎荂RM系統(tǒng)的一部分，但比CRM系統(tǒng)有關客戶部分的功能更詳細、更齊全、更完善、更符合企業(yè)的實際需要。
    客戶管理的目標非常明確，防范老客戶流失，從老客戶那里獲取更大的價值。
    目前企業(yè)客戶管理應用比較混亂，大致分為3種情況：①以業(yè)務系統(tǒng)為主，客戶管理為輔的信息系統(tǒng)，如進銷存系統(tǒng)、ERP系統(tǒng)等，以實現(xiàn)業(yè)務為核心內容，但往往會涉及到一部分客戶信息，嚴格來講，這部分軟件不屬于客戶管理范疇。②以銷售、市場營銷為核心內容的信息系統(tǒng)，如銷售管理系統(tǒng)等，以實現(xiàn)銷售計劃為核心，重點最大限度的促進銷售，更多的關注客戶的消費心理、消費行為，注重提升客戶的忠誠度，但這不是客戶系統(tǒng)的全部內容。③CRM系統(tǒng)，它是一個比較龐大的客戶關系管理信息系統(tǒng)，主要包括銷售、銷售過程、客戶管理、客戶分析等若干模塊，相對于大多數(shù)企業(yè)而言，成本較高。同時，操作型CRM較多，分析型CRM較少。
    客戶管理的混亂，為企業(yè)利用客戶關系帶來了不便，也為挖掘客戶關系中的有價值信息增加了難度。

3 挖掘算法的選擇與建模
    當企業(yè)建立起數(shù)據(jù)倉庫后?？刹捎貌煌臄?shù)據(jù)挖掘算法為客戶管理提供直接、有效的數(shù)據(jù)與參考。企業(yè)活動中，與客戶管理相關業(yè)務大多與銷售過程有關，包括客戶購物、企業(yè)營銷、客戶分類管理和銷售預測等。對客戶購物行為的分析，可以為個性化營銷提供客觀依據(jù)，最有效的營銷是針對有消費興趣潛力的客戶群，通過挖掘關聯(lián)關系，尋找有價值的客戶分類，能夠提高客戶管理的有效性。
    數(shù)據(jù)挖掘雖然是一個智能的數(shù)據(jù)分析工具，但其準確性會受到多個方面因素的影響，如數(shù)據(jù)的準確性、合法性、算法選擇的準確性、輸人選擇的正確性等，在實際應用中，不同的人、不同的挖掘策略與方案將會有不同的結果，應用業(yè)務人員和數(shù)據(jù)挖掘人員一起。共同探討正確性。下面針對上述具體應用，提出可行的挖掘方案，以供參考。
3．1 挖掘客戶購物行為信息的算法與模型
    用戶在挑選商品時，往往存在一個習慣：先挑選最需要的商品，然后根據(jù)商品推薦或興趣來挑選其他商品，市場營銷人員中可以分析每個用戶的購物行為和愛好，為將來的個性化營銷提供依據(jù)，并為每個客戶提供最具人性化的營銷方式，這要使用序列聚類算法。
    實現(xiàn)此功能需要兩個基本信息，一是訂單信息，關注客戶的一次購物行為；二是訂單產品明細，主要關注商品放入訂單的先后順序。
    在業(yè)務庫中，有客戶企業(yè)表、客戶訂單表、訂單產品明細表、產品信息表4個業(yè)務表，如圖1所示，在創(chuàng)建數(shù)據(jù)倉庫后，客戶企業(yè)表、產品信息表將變成維表。訂單表、訂單產品明細將變成事實表，把不需要的字段刪除，并把不合理的數(shù)據(jù)進行清理、轉換，采用微軟序列聚類算法即可實現(xiàn)此功能需求。

其數(shù)據(jù)挖掘模型如下：

    根據(jù)以往的銷售歷史，分析用戶的銷售行為，其重點在于歷史數(shù)據(jù)中每個訂單要有產品購買的先后順序，結合序列聚類算法即可完成，此模型的輸入列是訂單編號，預測列是一個嵌套表，包括產品序號和產品編號(或名稱)兩個可預測試列。
3．2 挖掘消費興趣實現(xiàn)有效營銷的算法與模型
    企業(yè)進行新產品宣傳或促銷時，有效做法是把信息發(fā)送給感興趣的客戶，而不是發(fā)給所有人，基于以前所做的客戶檔案和客戶對產品調查的反饋結果，采用數(shù)據(jù)挖掘算法可以找出那些感興趣的客戶，即節(jié)省成本，又提高效率。
    此功能的關鍵是根據(jù)以前所做的產品調查反饋信息，預測哪些因素影響客戶的購買，并分析愿意購買客戶的特征，基于這些特征，把客戶表里的所有信息重新篩選一遍，只向那些具有購買特征的客戶發(fā)送營銷信息。
    實現(xiàn)此功能的算法有4個：貝葉斯、決策樹、神經網(wǎng)絡、聚類，基于驗證考慮，盡可能采用每一種算法來測試，以獲得更準確的分析數(shù)據(jù)，如圖2所示，其數(shù)據(jù)模型如下：

    也可以采用決策樹、聚類、神經網(wǎng)絡算法，分別對應如下：
    (1)Microsoft_Decision_Trees：決策樹
    (2)Microsoft_Clustering：聚類
    (3)Microsoft_Neural_Network：神經網(wǎng)絡
    根據(jù)以往的調查數(shù)據(jù)，可以分析出這些輸入列與可預測列(是否購買)之間的關系，找那些已購買產品或愿意購買產品的客戶重要特征，然后把促銷信息、新產品信息發(fā)給具有這些重要特征的客戶。
3．3 挖掘有價值的客戶分類信息的算法與模型
    客戶分類比較復雜，不同企業(yè)采用不同的標準，按行業(yè)、地區(qū)、性質對客戶分類，是一種比較常見的簡單方法，但不能準確反映出其對客戶的影響，采用數(shù)據(jù)挖掘中的聚類算法，可以給出歷史客戶中最能影響客戶分類的關鍵因素，并把客戶細分成更多的組，以使每個組里的客戶具有更多的相似性和特征；微軟聚類算法可以解決此類問題。如圖3所示。

其數(shù)據(jù)模型如下：

    不需要指定輸出列，只需要定義輸入列即可，其余的都交給數(shù)據(jù)挖掘算法去完成。算法會自動依據(jù)歷史數(shù)據(jù)，找出不同輸人列分類之間的差異，從而給出最合適的分類依據(jù)，采用不同的算法，得出的結果可能會不同，這需要業(yè)務人員去驗證其正確性。
    影響數(shù)據(jù)挖掘結果主要有以下幾個因素：一是數(shù)據(jù)的準確性，二是合適的算法。數(shù)據(jù)的準確性必須在建立數(shù)據(jù)倉庫時，要保證數(shù)據(jù)的真實性和正確性，如果是碼表，則必須保證碼表的轉換是合法的數(shù)據(jù)。若結果與歷史情況不符，則必須驗證數(shù)據(jù)挖掘的每一個步驟都正確，包括數(shù)據(jù)的來源、ETL過程、數(shù)據(jù)倉庫的更新、挖掘算法、輸入列、輸出列、閾值及值的微調等。

4 評估與總結
研究的創(chuàng)新點在于以一套完整的、符合中國國情的企業(yè)客戶管理理論為基礎，結合先進的軟件技術、數(shù)據(jù)挖掘技術，為企業(yè)如何快速、高效的實施企業(yè)客戶管理提供有力的參考與借鑒。充分討論了數(shù)據(jù)挖掘技術所帶來的重大意義，以及在客戶管理中應用的步驟和方法，并給出具體的實例做為參考。
但是數(shù)據(jù)挖掘不是萬能的，得出的結論也不是一成不變的，隨著數(shù)據(jù)的變化、時間的推移，運行的結果也在變化。這需要技術人員、分析人員、業(yè)務人員、管理人員討論分析，并逐步修正數(shù)據(jù)挖掘的算法與閾值，以使數(shù)據(jù)挖掘應用在任一時刻與現(xiàn)實相接近，從而保證結論的成功率。