大數(shù)據(jù)技術(shù)發(fā)展迅速,Python程序員現(xiàn)在轉(zhuǎn)向來的及嗎?
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。換而言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關(guān)鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。 從技術(shù)上看,大數(shù)據(jù)與云計算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無法用單臺的計算機進行處理,必須采用分布式架構(gòu)。它的特色在于對海量數(shù)據(jù)進行分布式數(shù)據(jù)挖掘。但它必須依托云計算的分布式處理、分布式數(shù)據(jù)庫和云存儲、虛擬化技術(shù)。
那么Python程序員能否容易轉(zhuǎn)向大數(shù)據(jù)領(lǐng)域呢?
這取決于自身的知識結(jié)構(gòu)和目標(biāo)崗位,如果希望從事大數(shù)據(jù)平臺開發(fā),那么需要具有較為豐富的開發(fā)經(jīng)驗積累,同時也要有一定的研發(fā)能力。目前大數(shù)據(jù)平臺開發(fā)崗位往往對于從業(yè)者的學(xué)歷有一定的要求,通常研究生更容易獲得大數(shù)據(jù)平臺開發(fā)相關(guān)崗位。
如果希望從事大數(shù)據(jù)應(yīng)用開發(fā),那么轉(zhuǎn)換會相對容易一些,但是也要從三個方面來豐富自身的知識結(jié)構(gòu),其一是掌握大數(shù)據(jù)平臺的相關(guān)知識,比如Hadoop、Spark等;其二是掌握云計算相關(guān)知識,因為大數(shù)據(jù)應(yīng)用開發(fā)往往離不開云計算平臺的支撐;其三是要掌握一定的行業(yè)知識,大數(shù)據(jù)應(yīng)用開發(fā)往往會針對于具體的行業(yè)場景給出具體的開發(fā)方案。
目前大數(shù)據(jù)分析的手段包括機器學(xué)習(xí)方式和統(tǒng)計學(xué)方式,不論采用哪種方式,算法的設(shè)計、實現(xiàn)和訓(xùn)練都是核心內(nèi)容。數(shù)據(jù)分析的算法迭代速度目前還是相對比較快的,這也與當(dāng)前大數(shù)據(jù)處在落地應(yīng)用的初期有一定的關(guān)系,當(dāng)然算法也需要根據(jù)應(yīng)用場景的變化而進行相應(yīng)的調(diào)整。對于從事Python Web開發(fā)程序員來說,從大數(shù)據(jù)應(yīng)用開發(fā)崗位開始做起,會更容易一些。從近兩年研究生的就業(yè)情況來看,目前大數(shù)據(jù)平臺開發(fā)和大數(shù)據(jù)應(yīng)用開發(fā)崗位的招聘數(shù)量相對較多,但是大數(shù)據(jù)分析崗位(算法崗位)的招聘數(shù)量相對較少,這一點對于Python程序員來說,也應(yīng)該引起注意。