數(shù)據(jù)挖掘技術在客戶管理中的應用研究
數(shù)據(jù)挖掘的主要技術手段包括關聯(lián)規(guī)則挖掘、分類分析、聚類分析、估計、預測、時序模式和偏差分析等。支持上述技術的核心研究內容是相應的數(shù)據(jù)挖掘算法研究,包括貝葉斯算法、決策樹、時序算法、聚類算法、關聯(lián)算法、神經網(wǎng)絡算法和回歸算法。
2 數(shù)據(jù)挖掘的核心價值與應用分析
在企業(yè)客戶管理中應用數(shù)據(jù)挖掘技術,不僅使客戶管理更高效、更實用,還能預測客戶將來的各種消費行為,為企業(yè)實施更精確的客戶管理和市場營銷提供決策依據(jù)??蛻艄芾硎荂RM系統(tǒng)的一部分,但比CRM系統(tǒng)有關客戶部分的功能更詳細、更齊全、更完善、更符合企業(yè)的實際需要。
客戶管理的目標非常明確,防范老客戶流失,從老客戶那里獲取更大的價值。
目前企業(yè)客戶管理應用比較混亂,大致分為3種情況:①以業(yè)務系統(tǒng)為主,客戶管理為輔的信息系統(tǒng),如進銷存系統(tǒng)、ERP系統(tǒng)等,以實現(xiàn)業(yè)務為核心內容,但往往會涉及到一部分客戶信息,嚴格來講,這部分軟件不屬于客戶管理范疇。②以銷售、市場營銷為核心內容的信息系統(tǒng),如銷售管理系統(tǒng)等,以實現(xiàn)銷售計劃為核心,重點最大限度的促進銷售,更多的關注客戶的消費心理、消費行為,注重提升客戶的忠誠度,但這不是客戶系統(tǒng)的全部內容。③CRM系統(tǒng),它是一個比較龐大的客戶關系管理信息系統(tǒng),主要包括銷售、銷售過程、客戶管理、客戶分析等若干模塊,相對于大多數(shù)企業(yè)而言,成本較高。同時,操作型CRM較多,分析型CRM較少。
客戶管理的混亂,為企業(yè)利用客戶關系帶來了不便,也為挖掘客戶關系中的有價值信息增加了難度。
3 挖掘算法的選擇與建模
當企業(yè)建立起數(shù)據(jù)倉庫后??刹捎貌煌臄?shù)據(jù)挖掘算法為客戶管理提供直接、有效的數(shù)據(jù)與參考。企業(yè)活動中,與客戶管理相關業(yè)務大多與銷售過程有關,包括客戶購物、企業(yè)營銷、客戶分類管理和銷售預測等。對客戶購物行為的分析,可以為個性化營銷提供客觀依據(jù),最有效的營銷是針對有消費興趣潛力的客戶群,通過挖掘關聯(lián)關系,尋找有價值的客戶分類,能夠提高客戶管理的有效性。
數(shù)據(jù)挖掘雖然是一個智能的數(shù)據(jù)分析工具,但其準確性會受到多個方面因素的影響,如數(shù)據(jù)的準確性、合法性、算法選擇的準確性、輸人選擇的正確性等,在實際應用中,不同的人、不同的挖掘策略與方案將會有不同的結果,應用業(yè)務人員和數(shù)據(jù)挖掘人員一起。共同探討正確性。下面針對上述具體應用,提出可行的挖掘方案,以供參考。
3.1 挖掘客戶購物行為信息的算法與模型
用戶在挑選商品時,往往存在一個習慣:先挑選最需要的商品,然后根據(jù)商品推薦或興趣來挑選其他商品,市場營銷人員中可以分析每個用戶的購物行為和愛好,為將來的個性化營銷提供依據(jù),并為每個客戶提供最具人性化的營銷方式,這要使用序列聚類算法。
實現(xiàn)此功能需要兩個基本信息,一是訂單信息,關注客戶的一次購物行為;二是訂單產品明細,主要關注商品放入訂單的先后順序。
在業(yè)務庫中,有客戶企業(yè)表、客戶訂單表、訂單產品明細表、產品信息表4個業(yè)務表,如圖1所示,在創(chuàng)建數(shù)據(jù)倉庫后,客戶企業(yè)表、產品信息表將變成維表。訂單表、訂單產品明細將變成事實表,把不需要的字段刪除,并把不合理的數(shù)據(jù)進行清理、轉換,采用微軟序列聚類算法即可實現(xiàn)此功能需求。
其數(shù)據(jù)挖掘模型如下:
根據(jù)以往的銷售歷史,分析用戶的銷售行為,其重點在于歷史數(shù)據(jù)中每個訂單要有產品購買的先后順序,結合序列聚類算法即可完成,此模型的輸入列是訂單編號,預測列是一個嵌套表,包括產品序號和產品編號(或名稱)兩個可預測試列。
3.2 挖掘消費興趣實現(xiàn)有效營銷的算法與模型
企業(yè)進行新產品宣傳或促銷時,有效做法是把信息發(fā)送給感興趣的客戶,而不是發(fā)給所有人,基于以前所做的客戶檔案和客戶對產品調查的反饋結果,采用數(shù)據(jù)挖掘算法可以找出那些感興趣的客戶,即節(jié)省成本,又提高效率。
此功能的關鍵是根據(jù)以前所做的產品調查反饋信息,預測哪些因素影響客戶的購買,并分析愿意購買客戶的特征,基于這些特征,把客戶表里的所有信息重新篩選一遍,只向那些具有購買特征的客戶發(fā)送營銷信息。
實現(xiàn)此功能的算法有4個:貝葉斯、決策樹、神經網(wǎng)絡、聚類,基于驗證考慮,盡可能采用每一種算法來測試,以獲得更準確的分析數(shù)據(jù),如圖2所示,其數(shù)據(jù)模型如下:
也可以采用決策樹、聚類、神經網(wǎng)絡算法,分別對應如下:
(1)Microsoft_Decision_Trees:決策樹
(2)Microsoft_Clustering:聚類
(3)Microsoft_Neural_Network:神經網(wǎng)絡
根據(jù)以往的調查數(shù)據(jù),可以分析出這些輸入列與可預測列(是否購買)之間的關系,找那些已購買產品或愿意購買產品的客戶重要特征,然后把促銷信息、新產品信息發(fā)給具有這些重要特征的客戶。
3.3 挖掘有價值的客戶分類信息的算法與模型
客戶分類比較復雜,不同企業(yè)采用不同的標準,按行業(yè)、地區(qū)、性質對客戶分類,是一種比較常見的簡單方法,但不能準確反映出其對客戶的影響,采用數(shù)據(jù)挖掘中的聚類算法,可以給出歷史客戶中最能影響客戶分類的關鍵因素,并把客戶細分成更多的組,以使每個組里的客戶具有更多的相似性和特征;微軟聚類算法可以解決此類問題。如圖3所示。
其數(shù)據(jù)模型如下:
不需要指定輸出列,只需要定義輸入列即可,其余的都交給數(shù)據(jù)挖掘算法去完成。算法會自動依據(jù)歷史數(shù)據(jù),找出不同輸人列分類之間的差異,從而給出最合適的分類依據(jù),采用不同的算法,得出的結果可能會不同,這需要業(yè)務人員去驗證其正確性。
影響數(shù)據(jù)挖掘結果主要有以下幾個因素:一是數(shù)據(jù)的準確性,二是合適的算法。數(shù)據(jù)的準確性必須在建立數(shù)據(jù)倉庫時,要保證數(shù)據(jù)的真實性和正確性,如果是碼表,則必須保證碼表的轉換是合法的數(shù)據(jù)。若結果與歷史情況不符,則必須驗證數(shù)據(jù)挖掘的每一個步驟都正確,包括數(shù)據(jù)的來源、ETL過程、數(shù)據(jù)倉庫的更新、挖掘算法、輸入列、輸出列、閾值及值的微調等。
4 評估與總結
研究的創(chuàng)新點在于以一套完整的、符合中國國情的企業(yè)客戶管理理論為基礎,結合先進的軟件技術、數(shù)據(jù)挖掘技術,為企業(yè)如何快速、高效的實施企業(yè)客戶管理提供有力的參考與借鑒。充分討論了數(shù)據(jù)挖掘技術所帶來的重大意義,以及在客戶管理中應用的步驟和方法,并給出具體的實例做為參考。
但是數(shù)據(jù)挖掘不是萬能的,得出的結論也不是一成不變的,隨著數(shù)據(jù)的變化、時間的推移,運行的結果也在變化。這需要技術人員、分析人員、業(yè)務人員、管理人員討論分析,并逐步修正數(shù)據(jù)挖掘的算法與閾值,以使數(shù)據(jù)挖掘應用在任一時刻與現(xiàn)實相接近,從而保證結論的成功率。