人人都是數(shù)據(jù)分析師??愿韭菜的世界沒有鐮刀
有志于轉(zhuǎn)行數(shù)據(jù)分析的朋友們好~古牧君今天大膽開麥,針對近年來網(wǎng)上各路培訓(xùn)班營造出來的“人人都是數(shù)據(jù)分析師”熱潮,給出一些個人看法。希望能讓所有沖動轉(zhuǎn)行的小白們都先冷靜下,想清楚到底要不要做之后,再去行動
本文篇幅適中,內(nèi)容環(huán)環(huán)相扣:
1,目前市場上數(shù)據(jù)分析的熱度究竟高不高? 2,數(shù)據(jù)分析師的實際需求量到底大不大? 3,為什么會出現(xiàn)“人人都是數(shù)據(jù)分析師”的現(xiàn)象? 4,普通數(shù)據(jù)分析師日常工作內(nèi)容都是啥? 5,應(yīng)付日常工作都需要掌握哪些技能、又有什么門檻? 6,哪些人不建議零基礎(chǔ)轉(zhuǎn)行數(shù)據(jù)分析?
1,目前市場上數(shù)據(jù)分析的熱度究竟高不高?
除了體感上遍布各大平臺的培訓(xùn)機構(gòu)廣告,我們還可以查看產(chǎn)品經(jīng)理 v.s 數(shù)據(jù)分析師的百度指數(shù),在對比中量化解答這個問題:
可以發(fā)現(xiàn),這兩個崗位都是源遠(yuǎn)流長,從互聯(lián)網(wǎng)誕生伊始就存在了。但直到19年之前,產(chǎn)品經(jīng)理的熱度都是2倍于數(shù)據(jù)分析師的;而從19年開始,數(shù)據(jù)分析師的熱度奮起直追,加之產(chǎn)品經(jīng)理逐漸降溫,導(dǎo)致兩者差距已經(jīng)縮小到50%以內(nèi)了
2,數(shù)據(jù)分析師的實際需求量到底大不大?
既然是市場, 就要講供需關(guān)系,供給側(cè)那么火熱,需求側(cè)呢?我們直接從大型互聯(lián)網(wǎng)招聘網(wǎng)站的崗位搜索結(jié)果來看,在限制城市、崗位和工作年限的前提下,對比產(chǎn)品經(jīng)理、看下初級數(shù)據(jù)分析師在不同城市的實際需求量:
該網(wǎng)站不會直接顯示某個崗位在全國的實際招聘總量,比如超過500時就只會顯示500+,我們只能變通一下,收集全國6大互聯(lián)網(wǎng)重鎮(zhèn)初級產(chǎn)品經(jīng)理 v.s 初級數(shù)據(jù)分析師的招聘量,在對比中偏定性的了解后者的實際需求量到底有多大:
從上圖中我們能很清晰的得到2個結(jié)論:
任憑媒體近些年來怎么吹,論互聯(lián)網(wǎng)就業(yè)機會和豐富性,北京依然是毫無爭議的第一梯隊,上海、深圳、廣州是第二梯隊,杭州、成都妥妥的第三梯隊 相對初級產(chǎn)品經(jīng)理而言,初級數(shù)據(jù)分析師的需求量遠(yuǎn)遠(yuǎn)落后。無法像當(dāng)年人人都是產(chǎn)品熱潮一樣,承受人人都來做數(shù)據(jù)分析師
3,為什么會出現(xiàn)“人人都是數(shù)據(jù)分析師”的現(xiàn)象?
僅憑個人主觀感受,有如下兩個見解:
近年來所謂的流量紅利差不多見頂,需要做精細(xì)化運營了;再加上早年間幾位互聯(lián)網(wǎng)巨佬瘋狂輸出“數(shù)據(jù)公司”的概念,導(dǎo)致大環(huán)境對數(shù)據(jù)分析類崗位的需求和認(rèn)可都有了階段性的提升 近年來生意不好做、錢不好賺,大家普遍滋生焦慮心理。培訓(xùn)行業(yè)作為一門生意,因勢利導(dǎo)的利用焦慮。可產(chǎn)品經(jīng)理、運營、甚至交互設(shè)計、編程在前幾年就已經(jīng)喊過“人人都是”了,需要有新的水源涌入,目光自然就移到了數(shù)據(jù)分析上
4,普通數(shù)據(jù)分析師日常工作內(nèi)容都是啥?
古牧君人肉整理了招聘網(wǎng)站上1~3年數(shù)據(jù)分析師的崗位JD,抽取一些共性內(nèi)容列舉并解讀如下,首先是崗位職責(zé)部分:
常規(guī)監(jiān)控:日報周報月報這類的,主要是監(jiān)控下業(yè)務(wù)的核心指標(biāo)有沒有變動。如果有的話,就要解釋下原因。原始些的每天手工提取數(shù)據(jù)然后EXCEL加工制表呈現(xiàn),正常些的會有對應(yīng)的BI報表和郵件預(yù)警; 效果評估:“產(chǎn)品新功能上線后效果好不好?最近搞的一個運營活動效果好不好?”這些都需要數(shù)據(jù)事后諸葛亮一下,ABtest什么的會經(jīng)常使用。這部分其實不僅僅是事后的事兒,在開始之前就需要數(shù)據(jù)分析師來全盤的考慮,設(shè)計評估方案并依方案來布置需要監(jiān)控/收集數(shù)據(jù)的位置和字段,是一個系統(tǒng)工程; 業(yè)務(wù)決策:“怎樣才能提升用戶的活躍/留存?”這類問題會來自一線業(yè)務(wù)部門,我們的分析結(jié)論和建議會影響他們的決策和操作。這里最關(guān)鍵的是拆解業(yè)務(wù)方提出的問題,之后再給出一個系統(tǒng)性的方案; 研究分析:“現(xiàn)在的年輕人都喜歡什么啊?”這類問題往往不是那么功利,可能沒有任何一線業(yè)務(wù)部門有這類迫切的需求,但為了公司長遠(yuǎn)戰(zhàn)略發(fā)展和團隊自身影響力等,還是必須的。這里最關(guān)鍵的是如何提出有價值的問題,而不是張嘴等著喂飯
其次是崗位技能部分:
專業(yè)相關(guān):數(shù)學(xué)、統(tǒng)計、計算機相關(guān)專業(yè)優(yōu)先 數(shù)據(jù)思維:能夠量化衡量業(yè)務(wù)問題,并體系化評估業(yè)務(wù)發(fā)展 數(shù)據(jù)敏感:對指標(biāo)的波動和相互之間的關(guān)聯(lián)敏感,能及時發(fā)現(xiàn)潛在問題 理解溝通:能很好的理解業(yè)務(wù)問題,順暢的與業(yè)務(wù)團隊溝通協(xié)作 熟悉方法:掌握常見統(tǒng)計學(xué)方法,有ABtest、機器學(xué)習(xí)等經(jīng)驗優(yōu)先 掌握工具:熟練使用SQL/Excel/Python/R等數(shù)據(jù)處理工具 報告展示:可視化數(shù)據(jù)分析結(jié)果,降低理解成本、提升溝通效率
5,應(yīng)付日常工作都需要掌握哪些技能、又有什么門檻?
我們繼續(xù)把上述技能歸納總結(jié),看看為了應(yīng)付數(shù)據(jù)分析師的日常工作,到底都需要哪些核心技能:
工具型技能:這部分就是各類培訓(xùn)班和營銷文章的主打,因為它確實是最基礎(chǔ)、最需要的,但隨著工作的深入,也是最不那么重要的。羅列下數(shù)據(jù)分析師需要掌握的工具,不外乎下面這些:
SQL,提取數(shù)據(jù)必備技能,學(xué)起來也方便,隨便買本講SQL的書就能入門。后續(xù)隨著實際使用中遇到各種問題再網(wǎng)上搜復(fù)雜的代碼寫法就好,不必前期太磕死書本;不過這種程度只是入門級別,當(dāng)數(shù)據(jù)量較大的時候,還要考慮代碼的性能,這些就不強求
EXCEL,也是各種工具書鋪天蓋地。提取完數(shù)據(jù)后,簡單的數(shù)據(jù)處理啊、作圖啊制表啊都在這里搞定了,可以說數(shù)據(jù)分析師80%左右的工作,就靠SQL+EXCEL了。對EXCEL沒必要追求太多的奇技淫巧,工具而已,用到的時候查一查就好,說到底還是要服務(wù)應(yīng)用(對數(shù)據(jù)可視化感興趣想自學(xué)的,推薦下面這本)
Python或R或SPSS等,這些都是數(shù)據(jù)挖掘的工具,是日常工作中相對“高階”的那一小部分。雖然不鼓勵炫技式的工具使用,但知曉基本的數(shù)據(jù)挖掘,還是有利于拓寬分析師的思路。比如很多數(shù)據(jù)集,常規(guī)的統(tǒng)計分布可能看不出什么端倪,這時候就需要聚類試試;當(dāng)我們想要預(yù)測些事情的時候,回歸啊分類樹啊這些基礎(chǔ)的模型算法也會有用武之地。Python和R都需要寫代碼來操作,而SPSS則更像EXCEL、鼠標(biāo)點點點就OK了。重要的是,要理解這些工具背后模型和算法的原理,知道它們適用的場景和優(yōu)劣勢,才能真的駕馭工具
方法論型技能:掌握了基礎(chǔ)的工具后,還有很多人執(zhí)迷于數(shù)據(jù)分析方法論。講真,我問到周圍幾個同事(BAT且title為高級XXX),他們多少都有些為難。很多文章都會列舉各種各樣的方法和模型,但其實那些并不是數(shù)據(jù)分析獨有的,比如5W2H、MECE、SWOT等,都是通用的邏輯思維方式方法。但為了勸誡那些想要給培訓(xùn)班送錢的善男信女,我還是想簡要說說:
邏輯思維真是的一切的基礎(chǔ),有條理分主次的表達自己的觀點,同時也要能抽絲剝繭的分析問題解決問題,對數(shù)據(jù)分析師來講很關(guān)鍵;如果非要說有什么方法論,我覺得對比細(xì)分溯源就挺好的。舉個例子,今年騰訊的熱度是1000萬,這個數(shù)說明啥?首先要問清楚熱度是怎么定義的,然后要找個參照系,比如跟去年比,才能知道是高是低。進一步,如果比去年高了,那是為什么高的?可以從不同維度進行細(xì)分溯源,比如從時間維度上,看看是否僅僅是某個月暴增導(dǎo)致的?再比如從對象維度,看看針對騰訊的討論是說公司、還是說領(lǐng)導(dǎo)人、還是說產(chǎn)品?也可以從數(shù)據(jù)的來源渠道細(xì)分看,是新聞媒體的報道多了、還是網(wǎng)友在論壇貼吧的討論多了?
你說是先有方法論才能做成一件事情,還是先做成一件事情再有的方法論呢?很多時候,方法論已經(jīng)被我們這個時代過度消費了,它成了成功者的事后諸葛亮。就像歷史一樣,是被掌握話語權(quán)的人隨意粉飾打扮的小姑娘
業(yè)務(wù)型技能:還沒完,要想讓自己的分析結(jié)果切實可行,就要深入的了解所在的業(yè)務(wù),不能閉門造車天馬行空的搞純數(shù)據(jù)研究。舉個例子,豆瓣要提升商業(yè)收入,錢從哪些人那兒掙?這就需要首先對目前業(yè)務(wù)有一個了解,小組、書影音、廣播、FM的比例如何?豆瓣上不同人群的畫像如何?結(jié)合宏觀環(huán)境來看,哪些人消費意愿在增強? 做人型技能:最后,任何一項工作,都不可能是一座孤島。自稱“社交恐懼”“溝通障礙”的朋友,如果是真的話,甭管數(shù)據(jù)分析還是寫代碼,都不那么適合你?;蛘哒f的委婉一些,你可以做,但肯定很難做的好。我見過的工程師里能做上leader的,也都是相對他們?nèi)后w而言更懂溝通的藝術(shù)、更懂換位思考的那群人。畢竟工作中的事情,很多情況下分工合作資源互換,會比你單槍匹馬來的事半功倍;合格的社交合作外,也要有一定的“敏感性”,就是能洞察出領(lǐng)導(dǎo)們的心思。有一種說法是,工作就是讓領(lǐng)導(dǎo)開心。我雖然覺得這句話太功利,但也不是全無道理。不妨換個角度來看,自古成大事者,更多是心懷理想的現(xiàn)實主義者。我們需要了解這個環(huán)境,適應(yīng)這個環(huán)境。很多時候正確的事情也需要看時機,很多時候事情能不能做成,“人”的因素是很重要的。我們需要有能力判斷哪些事情的價值更高、更能做成,在自身利益與公司利益之間,找一個微妙的平衡
6,哪些人不建議零基礎(chǔ)轉(zhuǎn)行數(shù)據(jù)分析?
既然門檻都知道了,那么對應(yīng)哪些人不適合零基礎(chǔ)轉(zhuǎn)型,也就一目了然了:
工具型技能,算數(shù)過關(guān)就好:
SQL和EXCEL都很容易上手,高中數(shù)學(xué)OK就好;Python、R那些工具,其實更重要的是背后的原理,所以需要相對扎實的概率統(tǒng)計+高數(shù)底子。不過數(shù)據(jù)挖掘也不是所有數(shù)據(jù)分析師都需要會的,所以工具這部分,武斷一點給個標(biāo)準(zhǔn):高考數(shù)學(xué)150滿分的話有個100+就差不多了 方法論型技能,邏輯嚴(yán)謹(jǐn)條理清晰: 稍微武斷一些的說,國內(nèi)大部分純文科專業(yè)背景的同學(xué)(尤其是畢業(yè)后也一直從事創(chuàng)意類、職能類、銷售類等工作的朋友),零基礎(chǔ)轉(zhuǎn)型數(shù)據(jù)分析難度較大,不太建議。因為長時間的專業(yè)背景和工作環(huán)境,會重塑人的思維方式,如果已經(jīng)習(xí)慣了發(fā)散式、跳躍式思維,日常又更偏重感性而非理性,數(shù)據(jù)分析類工作就較難適應(yīng) 業(yè)務(wù)型技能,需要接地氣: 特別學(xué)術(shù)型的朋友,比如對學(xué)習(xí)研究以外都缺乏基本認(rèn)知和興趣的那種,不那么適合數(shù)據(jù)分析師這種崗位,因為這個崗位其實沒那么高深也沒那么科研,相反,非常需要接地氣。數(shù)據(jù)分析本質(zhì)上就是應(yīng)用學(xué)科,需要以應(yīng)用為導(dǎo)向,從問題出發(fā)去倒推解決方案,而非先研究一個東西再看看有什么可應(yīng)用的場景。是否愿意了解你所在的業(yè)務(wù)方向,能否理解一線實際工作環(huán)境都面臨著什么問題,真不是所有人都能搞定的 做人型技能,不能太自我: 過于固執(zhí)的朋友、缺乏同理心的朋友、不善于溝通的朋友,在數(shù)據(jù)分析師的崗位上注定不會走的很遠(yuǎn),在其他崗位也同樣。一方面我們需要通過換位思考,真正的理解對方的問題和困難,有時候更是用戶的需求;一方面我們也需要通過溝通,把我們的觀點和看法順滑的輸出出去,并最好能在聽眾的心里生根發(fā)芽,最終開花結(jié)果