北京數(shù)據(jù)分析師招聘要求一般有哪些?
北京數(shù)據(jù)分析師招聘要求一般有:
統(tǒng)計(jì)學(xué)、應(yīng)用數(shù)學(xué)、計(jì)算機(jī)等相關(guān)專業(yè),本科及以上學(xué)歷;
熟練掌握多種統(tǒng)計(jì)和挖掘方法,熟練使用SPSS、SAS等相關(guān)數(shù)據(jù)分析軟件;
較強(qiáng)的數(shù)據(jù)敏感度,邏輯分析能力和文檔寫作能力;
有責(zé)任心,良好的溝通能力和組織管理能力以及心理承受能力,勇于接受挑戰(zhàn);
有相關(guān)經(jīng)驗(yàn)優(yōu)先。
數(shù)據(jù)分析師工作內(nèi)容:
通過數(shù)據(jù)分析支持產(chǎn)品改進(jìn)及新模式的探索;
構(gòu)建用戶行為建模,支持個(gè)性化項(xiàng)目;
構(gòu)建數(shù)據(jù)評(píng)估體系;
構(gòu)建業(yè)務(wù)數(shù)據(jù)分析體系,幫助確定各項(xiàng)業(yè)務(wù)數(shù)據(jù)指標(biāo);
負(fù)責(zé)用戶行為數(shù)據(jù)分析,通過監(jiān)控及分析,推動(dòng)產(chǎn)品改進(jìn),運(yùn)營調(diào)整;
負(fù)責(zé)構(gòu)建用戶數(shù)據(jù)模型,挖掘用戶屬性及用戶喜好等需求,為個(gè)性化產(chǎn)品推薦提供支持;
負(fù)責(zé)構(gòu)建產(chǎn)品、運(yùn)營及活動(dòng)用戶行為評(píng)估體系,通過數(shù)據(jù)分析對(duì)產(chǎn)品、運(yùn)營、市場提出建議并推動(dòng)實(shí)施;
負(fù)責(zé)用戶行為調(diào)研,通過海量數(shù)據(jù)的挖掘和分析,形成報(bào)告,匯報(bào)給決策層,支持戰(zhàn)略規(guī)劃。
數(shù)據(jù)分析師都是干嘛的?薪資一般在什么水平?
數(shù)據(jù)分析師對(duì)現(xiàn)有的數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)分析師本質(zhì)是提煉數(shù)據(jù)規(guī)則 為數(shù)據(jù)增值 滿足客戶需求一個(gè)工作流程.
根據(jù)職友集網(wǎng)站統(tǒng)計(jì),取自19145份樣本,北京數(shù)據(jù)分析平均工資是15450元/月。選擇朝陽行業(yè)至關(guān)重要,先積累工作經(jīng)驗(yàn)。現(xiàn)在互聯(lián)網(wǎng)、 金融、通信、電子商務(wù)、數(shù)據(jù)服務(wù)等行業(yè),數(shù)據(jù)分析相關(guān)崗位占據(jù)重要地位,數(shù)據(jù)分析相關(guān)工作薪酬逐年走高。
數(shù)據(jù)分析師的前景如何?
數(shù)據(jù)分析師的就業(yè)前景是廣闊的。1、人才缺口大,IT時(shí)代逐漸被DT時(shí)代取代,用理性的數(shù)據(jù)分析代人工的經(jīng)驗(yàn)分析成為主流,數(shù)據(jù)分析人才的供給指數(shù)僅為0.05,屬于高度稀缺。
2、入門相對(duì)簡單數(shù)據(jù)分析是一門跨領(lǐng)域技術(shù),不需要很強(qiáng)的理工科背景,反而那些有市場銷售、金融、財(cái)務(wù)或零售業(yè)背景的人士,分析思路更加開闊。
3、薪資待遇高1-2年工作經(jīng)驗(yàn)的大數(shù)據(jù)分析崗位的平均月薪可達(dá)到13k左右的水平。崗位的薪酬和經(jīng)驗(yàn)正相關(guān),越老越值錢。
4、行業(yè)適應(yīng)性強(qiáng)幾乎所有的行業(yè)都會(huì)應(yīng)用到數(shù)據(jù),數(shù)據(jù)分析師不僅僅可以在互聯(lián)IT行業(yè)就業(yè),也可以在銀行、零售、醫(yī)藥業(yè)、制造業(yè)和交通傳輸?shù)阮I(lǐng)域服務(wù)。
5、職業(yè)壽命長數(shù)據(jù)分析職業(yè)一旦掌握,可以在職場上收益長久,掌握這門新興技術(shù)都會(huì)大有用武之地,受其他外部業(yè)務(wù)影響相對(duì)較小,職位相對(duì)穩(wěn)定。
大數(shù)據(jù)分析師待遇
北京】數(shù)據(jù)分析師應(yīng)屆生工資12K左右,1-3年數(shù)據(jù)分析師平均工資17K,3-5年數(shù)據(jù)師平均工資在23K;
【上?!繑?shù)據(jù)分析師應(yīng)屆生工資12K左右,1-3年數(shù)據(jù)分析師平均工資14K,3-5年數(shù)據(jù)師平均工資在21K;
【深圳】數(shù)據(jù)分析師應(yīng)屆生工資9K左右,1-3年數(shù)據(jù)分析師平均工資12K,3-5年數(shù)據(jù)師平均工資在22K;
【廣州】數(shù)據(jù)分析師應(yīng)屆生工資9K左右,1-3年數(shù)據(jù)分析師平均工資10K,3-5年數(shù)據(jù)師平
北京快手自建數(shù)據(jù)中心在哪
北京市海淀區(qū)上地西路6號(hào)。北京快手自建數(shù)據(jù)中心在快手總部內(nèi),地址是北京市海淀區(qū)上地西路6號(hào)。
快手是一款國民級(jí)短視頻App。在快手,了解真實(shí)的世界,認(rèn)識(shí)有趣的人,也可以記錄真實(shí)而有趣的自己。快手,擁抱每一種生活。
大數(shù)據(jù)分析師這個(gè)職業(yè)怎么樣?
近期成為月入兩萬的數(shù)據(jù)分析師的廣告遍地都是,可能會(huì)對(duì)一些未入行的同學(xué)造成錯(cuò)覺。我個(gè)人感覺數(shù)據(jù)分析師這個(gè)崗位,可能近幾年會(huì)消亡。
這不意味著這份工作本身不重要,而是說這份工作本身可能會(huì)轉(zhuǎn)化為產(chǎn)品運(yùn)營的一些必備技能,而不再需要單獨(dú)特設(shè)人力去做這件事?;蛘哒f,不是再需要你學(xué)習(xí)SQL或者學(xué)習(xí)python,只是為了成為一名數(shù)據(jù)分析師。作為一名數(shù)據(jù)分析師,職業(yè)自身的壁壘正在不斷消減,更加主動(dòng)的擁抱業(yè)務(wù),解決真正的產(chǎn)品和用戶需求,或?qū)⒊蔀槲磥淼陌l(fā)展趨勢。
數(shù)據(jù)分析師的日常工作
我們來看下預(yù)設(shè)中的分析師的一些工作場景,看看數(shù)據(jù)分析師核心的工作價(jià)值。
取數(shù)
數(shù)據(jù)清洗
數(shù)據(jù)可視化
統(tǒng)計(jì)分析
數(shù)據(jù)方向建設(shè)和規(guī)劃
數(shù)據(jù)報(bào)告
取數(shù) — SQL
很多人對(duì)數(shù)據(jù)分析師的預(yù)設(shè)是SQL達(dá)人,包括現(xiàn)在很多數(shù)據(jù)分析師的核心工作其實(shí)就是進(jìn)行SQL取數(shù)。
這項(xiàng)工作的痛點(diǎn)和難點(diǎn)在于,我們?yōu)榱说玫揭粋€(gè)結(jié)果,通常需要join很多的數(shù)據(jù)集,然后整個(gè)SQL語句就會(huì)寫的特別長,而且可能會(huì)出現(xiàn)一些問題:比如join的表可能會(huì)出現(xiàn)key是重復(fù)的情況,造成最終的SQL結(jié)果因?yàn)橹貜?fù)而變得不可用。所以我們需要專人去專門維護(hù)各種各樣的數(shù)據(jù)集,他們知道每張表應(yīng)該怎么用。
但這個(gè)其實(shí)是關(guān)系型數(shù)據(jù)庫遺留下來的產(chǎn)物——我們完全可以不需要join那么多的表。現(xiàn)在的分布式計(jì)算的框架,已經(jīng)完全可以支持我們只保留一張大寬表,有需要的所有字段,然后所有的操作都在這張大寬表上進(jìn)行,而且可以保證查詢速度。這樣數(shù)據(jù)分析最大的痛點(diǎn)已經(jīng)沒有了。至于你說大寬表里面存了很多重復(fù)的數(shù)據(jù),是不是很浪費(fèi)資源(關(guān)系型數(shù)據(jù)庫之所以不用大寬表就是從存儲(chǔ)空間和性能的trade-off角度考慮的):放心,分布式存儲(chǔ)本身是不貴的,而計(jì)算效率則是由分布式計(jì)算框架進(jìn)行專門優(yōu)化的?,F(xiàn)在的計(jì)算框架計(jì)算的響應(yīng)速度,已經(jīng)可以在大寬表上可以很快的得到結(jié)果了。相比之下,多次join操作反而可能會(huì)更慢一些。
同時(shí),現(xiàn)在很多公司的NB框架,其實(shí)都已經(jīng)支持拖拽取數(shù)了,也根本不需要寫SQL了。
此外,不得不說的一點(diǎn)是,SQL語句本身真的不難??赡苋绻阕约红o下心來想學(xué),一個(gè)周末的時(shí)間肯定能搞定。而資歷老的數(shù)據(jù)分析師,并不會(huì)比資歷輕的數(shù)據(jù)分析師,在SQL語句的寫作上有什么本質(zhì)的區(qū)別。以前可能還有一些小表join大表的trick,但現(xiàn)在計(jì)算框架大多都已經(jīng)優(yōu)化過這些了。所以即使是需要寫SQL的場景,本身也是沒有什么難度的。
所以,通過大寬表來解放數(shù)據(jù)分析工作的生產(chǎn)力。即使在一定要寫SQL做join操作的時(shí)候,本身也不是一件壁壘特別高的事情。取數(shù)這件事兒,對(duì)于其他崗位的同學(xué),就已經(jīng)沒那么復(fù)雜了。
數(shù)據(jù)清洗 — Python
數(shù)據(jù)清洗其實(shí)是很多強(qiáng)調(diào)python進(jìn)行數(shù)據(jù)分析課程中,python部分的主要賣點(diǎn)。包括但不限于,怎么處理異常值,怎么從一些原始的數(shù)據(jù)中,得到我們想要的數(shù)據(jù)。
在日常產(chǎn)品需求過程中,這種需求的場景其實(shí)很小。因?yàn)閿?shù)據(jù)大部分都是自己產(chǎn)生的,很少會(huì)出現(xiàn)沒有預(yù)設(shè)到的極端值或者異常情況。如果有的話,一般就是生產(chǎn)數(shù)據(jù)的同學(xué)代碼寫的有bug,這種發(fā)現(xiàn)了之后修復(fù)代碼bug就行。
數(shù)據(jù)清洗在工作場景的應(yīng)用在于落表——就是把原始數(shù)據(jù)變成上面提到的,可以通過SQL提取的hive表。這個(gè)工作是需要懂代碼的同學(xué)去支持的,他們負(fù)責(zé)數(shù)據(jù)的產(chǎn)出,包括數(shù)據(jù)的準(zhǔn)確性,數(shù)據(jù)的延時(shí)性(不能太晚產(chǎn)出)等等。前文提到的生成大寬表,其實(shí)也可以是他們的工作。這其中就涉及到一些代碼的效率優(yōu)化問題,這個(gè)就不是簡單懂一點(diǎn)python可以搞定的了,可能涉及到一些數(shù)據(jù)壓縮格式的轉(zhuǎn)化,比如Json/Proto buffer到hive表的轉(zhuǎn)化,還有一些計(jì)算框架層面的調(diào)優(yōu),比如spark設(shè)置什么樣的參數(shù),以及怎么樣存儲(chǔ)可以更好的提升查詢速度。
所以這部分工作一般是由懂代碼的同學(xué)完成的??赡軘?shù)據(jù)團(tuán)隊(duì)會(huì)有比較少數(shù)的同學(xué),管理支持全公司的基礎(chǔ)表的生成。
數(shù)據(jù)可視化 — Tableau
很多之前在數(shù)據(jù)分析做實(shí)習(xí)的同學(xué),主要的工作內(nèi)容就是在一個(gè)商業(yè)化的軟件(比如Tableau)上,做一些統(tǒng)計(jì)報(bào)表。這樣可以通過這些數(shù)據(jù)報(bào)表,可以很方便的查看到所屬業(yè)務(wù)的一些關(guān)鍵指標(biāo)。這些商業(yè)軟件通常都比較難用,比如可能需要先預(yù)計(jì)算一下才能輸出結(jié)果;而且不太好做自定義功能的開發(fā)。稍微復(fù)雜一點(diǎn)的需求場景,可能就需要一個(gè)專門的同學(xué)搗鼓一陣,才能輸出最終的統(tǒng)計(jì)報(bào)表。
現(xiàn)在有更先進(jìn)的套路了。
首先可視化。很多公司打通了前端和后端的數(shù)據(jù),這樣就可以通過網(wǎng)頁查詢?cè)嫉臄?shù)據(jù)庫得到數(shù)據(jù)結(jié)果。而現(xiàn)在很多優(yōu)秀的前端可視化插件,已經(jīng)可以提供非常豐富的統(tǒng)計(jì)圖形的支持。而且因?yàn)榇a是開源的,可以根據(jù)公司的需求場景進(jìn)行針對(duì)性的開發(fā),公司可以再輔以配置一些更加用戶友好的操作界面,這樣一些復(fù)雜需求也有了簡單拖拽實(shí)現(xiàn)的可能。而且這些前端js代碼都是免費(fèi)的!對(duì)于公司來說也能省去一筆商業(yè)公司的采買成本。
其次很多商業(yè)軟件,都是針對(duì)小數(shù)據(jù)集場景設(shè)計(jì)的。在一些大數(shù)據(jù)集的場景,一般需要先預(yù)計(jì)算一些中間表。而如果自己公司定制化開發(fā)的前端展示結(jié)果,就可以根據(jù)需要自主設(shè)置計(jì)算邏輯和配置計(jì)算資源,先在后端進(jìn)行預(yù)計(jì)算,前端最終只是作為一個(gè)結(jié)果展示模塊,把結(jié)果展示和需要的預(yù)計(jì)算進(jìn)行解耦。這樣就省去了很多中間表的產(chǎn)出,也會(huì)更加快速的得到想要的業(yè)務(wù)指標(biāo),快速迭代。
所以可視化數(shù)據(jù)的工作量也會(huì)大大減少。而且會(huì)變成一個(gè)人人都可以操作,快速得到結(jié)果的場景。
統(tǒng)計(jì)分析
對(duì)于一名數(shù)據(jù)分析師而言,統(tǒng)計(jì)學(xué)分析可能是一塊知識(shí)性的壁壘。尤其是在現(xiàn)在ab實(shí)驗(yàn)成為互聯(lián)網(wǎng)公司迭代標(biāo)配的今天。需要把實(shí)驗(yàn)設(shè)計(jì)的那套理論應(yīng)用起來:比如ab實(shí)驗(yàn)進(jìn)行后的顯著性檢驗(yàn),多少樣本量的數(shù)據(jù)才能讓這個(gè)結(jié)論有效可信呢。
但是,你我都知道,經(jīng)典的統(tǒng)計(jì)分析其實(shí)是一個(gè)非常套路性的工作。其實(shí)就是套公式,對(duì)應(yīng)到代碼層面,可能也就一兩行就搞定了。這個(gè)代碼的統(tǒng)計(jì)分析結(jié)果可以作為ab平臺(tái)的指標(biāo)展示在最終的ab結(jié)果上,大家看一眼就能明白。即使是對(duì)那些可能不知道顯著性是什么意思的人,你可以跟他簡單說,顯著了才有效,不顯著就別管。
這么一想是不是其實(shí)不怎么需要投入額外的人力進(jìn)行分析?
其他數(shù)據(jù)相關(guān)的工作
數(shù)據(jù)層面的規(guī)劃和設(shè)計(jì)。移動(dòng)互聯(lián)網(wǎng)剛剛興起的時(shí)候,可能那時(shí)候數(shù)據(jù)分析師需要對(duì)每一個(gè)數(shù)據(jù)怎么來設(shè)計(jì)一套方案,包括原始的埋點(diǎn)怎么樣,又要怎么統(tǒng)計(jì)出想要的結(jié)果。但現(xiàn)在大部分已經(jīng)過了快速迭代的時(shí)代了,新產(chǎn)品的埋點(diǎn)添加可以參考老產(chǎn)品,這就意味著形成套路了。而一旦形成套路,其實(shí)就意味著可以通過程序直接完成或者輔助完成。
數(shù)據(jù)報(bào)告。那就真的是一件人人都能做的事情了,試想誰沒在期間做過數(shù)據(jù)報(bào)告呢?以前只是因?yàn)閿?shù)據(jù)都是從分析師產(chǎn)出的,而如果人人都能取到數(shù)據(jù)的話,數(shù)據(jù)報(bào)告是不是也不是一個(gè)真需求呢?
在我看來,數(shù)據(jù)分析師這個(gè)崗位的天花板和其他崗位相比起來是比較低的??赡芄ぷ饕粌赡曛?,從崗位本身就已經(jīng)學(xué)不到什么額外的工作知識(shí)了。主要的工作內(nèi)容技術(shù)含量不是特別高,技能性的更多的是一些可以簡單上手的東西,而且做的時(shí)間長了,在這些技能性的事情上得到的積累并不是很多。
數(shù)據(jù)分析師更像是一個(gè)在時(shí)代變遷過程中的一個(gè)中間崗位:我們從一個(gè)基本沒有數(shù)據(jù)的時(shí)代,突然進(jìn)入了一個(gè)數(shù)據(jù)極大豐富的時(shí)代,在這個(gè)過程中,我們都知道重視數(shù)據(jù)。那怎么能夠利用這個(gè)數(shù)據(jù)呢?可能之前的那一幫人并沒有太多的經(jīng)驗(yàn),于是老板就招一些人專門來研究一下它,同時(shí)做一些底層數(shù)據(jù)的優(yōu)化。
經(jīng)過多年的迭代,現(xiàn)在互聯(lián)網(wǎng)行業(yè)的每個(gè)人都知道數(shù)據(jù)的價(jià)值,也大概知道了什么樣的數(shù)據(jù)是重要的,怎樣可以更好的挖掘數(shù)據(jù)背后的價(jià)值。同時(shí)底層的基礎(chǔ)設(shè)施也已經(jīng)支持可以讓一個(gè)之前沒有經(jīng)驗(yàn)的同學(xué)可以快速的上手得到自己想要的關(guān)鍵數(shù)據(jù)。這時(shí)候?qū)τ谝粋€(gè)職業(yè)數(shù)據(jù)分析師來說,他的任務(wù)就已經(jīng)完成了。就如同當(dāng)人人都會(huì)講英語的時(shí)候,翻譯其實(shí)也就沒有存在的價(jià)值了。
此后的數(shù)據(jù)分析工作,可能不再是一些單獨(dú)的人做的工作。它會(huì)變成一個(gè)產(chǎn)品和運(yùn)營的基礎(chǔ)工具,而且足夠簡單,沒有取數(shù)的門檻。只是產(chǎn)品運(yùn)營怎么樣可以更好的認(rèn)識(shí)數(shù)據(jù),通過數(shù)據(jù)本身更好的配合產(chǎn)品運(yùn)營的工作,這已經(jīng)超脫我們一般理解的數(shù)據(jù)分析師的工作了,而是一個(gè)產(chǎn)品運(yùn)營分內(nèi)的工作。
對(duì)于那些已經(jīng)在從事數(shù)據(jù)分析師崗位的同學(xué)來說,建議不要把心思全部投入到數(shù)據(jù)分析的本職工作上,以完成任務(wù)為核心KPI。而是不要給自己設(shè)置邊界,多從用戶的角度思考問題,不要因?yàn)槭钱a(chǎn)品運(yùn)營的工作就不去做了。數(shù)據(jù)分析師這個(gè)職業(yè)發(fā)展到這個(gè)階段,要么做更加底層的數(shù)據(jù)建設(shè),要么擁抱業(yè)務(wù),最大化的發(fā)掘數(shù)據(jù)背后背后的價(jià)值。不要再死守著數(shù)據(jù)分析的“固有技能”沾沾自喜了。
數(shù)據(jù)本身的價(jià)值是無窮的,作為數(shù)據(jù)分析師,你們已經(jīng)先人一步的掌握它了,要有先發(fā)優(yōu)勢。你們最接近數(shù)據(jù)的人,是最可能發(fā)現(xiàn)用戶的寶藏的人。
招聘網(wǎng)站數(shù)據(jù)分析師崗位分析
前言:對(duì)一個(gè)運(yùn)營人來說,數(shù)據(jù)可以監(jiān)測店鋪運(yùn)營狀態(tài),可以幫助制定經(jīng)營目標(biāo),數(shù)據(jù)分析是運(yùn)營工作的必須掌握的一項(xiàng)技能。
本文將對(duì)數(shù)據(jù)分析師這個(gè)行業(yè)的求職環(huán)境和薪資水平做一個(gè)簡單的分析,使用的工具是Excel,旨在對(duì)數(shù)據(jù)分析操作過程做一個(gè)梳理和記錄。
(1)各城市對(duì)數(shù)據(jù)分析師崗位需求情況?
(2)各城市各工作年限的招聘占比情況?
(3)各學(xué)歷的招聘占比情況?
(4)數(shù)據(jù)分析師在各城市的薪資水平情況?
?(5)工作經(jīng)驗(yàn)的不同,薪酬的變化情況
本次數(shù)據(jù)分析一共有6800+條數(shù)據(jù),在數(shù)據(jù)準(zhǔn)備階段我們要做的是理解每一列數(shù)據(jù)的意義和作用,以便于數(shù)據(jù)分析過程能夠準(zhǔn)確的調(diào)用。
城市:用于比較不同城市對(duì)數(shù)據(jù)分析師的需求如何
教育要求:用于比較各學(xué)歷的崗位占比
職位ID:表示職位的唯一表示,也就是每一行數(shù)據(jù)的唯一標(biāo)識(shí),用于去掉重復(fù)ID
薪水:比較不同城市、和所屬領(lǐng)域的薪水區(qū)別
工作年限:從時(shí)間軸上對(duì)比薪資漲幅
為了方便后續(xù)處理、分析、呈現(xiàn),要去掉重復(fù)無效的數(shù)據(jù),甚至改變表格結(jié)構(gòu),將數(shù)據(jù)變成干凈可直接使用的數(shù)據(jù)。
(1)刪除重復(fù)值。這里【職位ID】代表每行數(shù)據(jù)的唯一性。刪除重復(fù)數(shù)據(jù)后,保留了5031行唯一數(shù)據(jù)。
(2)缺失值處理
首先檢查數(shù)據(jù)是否存在缺失值,先查看完整數(shù)據(jù)列【職位ID】的計(jì)數(shù):5032行,再選擇其他列查看是否缺少數(shù)據(jù),對(duì)缺失數(shù)據(jù)的處理有多種方法,根據(jù)實(shí)際情況選擇最為合理的處理方式。
通過查看可以發(fā)現(xiàn)【城市】列缺失2條數(shù)據(jù),由于缺失數(shù)據(jù)較少,并且可以通過【公司所在商區(qū)】確定缺失數(shù)據(jù)都為“上海”,這里選用人工手動(dòng)補(bǔ)全。操作:選擇【城市】列--{開始-查找和選擇-定位條件-空值}-定位到所有空值-輸入“上?!?使用Ctrl+Eneter快捷鍵填寫所有空值。
(3)選擇子集
在表格中有些數(shù)據(jù)是我們分析過程中使用不到的,將其隱藏(盡量不刪,保證數(shù)據(jù)的完整性)。
這里隱藏的列有:【公司全名】、【公司ID】、【公司所在商區(qū)】、【職位福利】。
(4)列名重命名
將不合適的列名更改為我們?nèi)菀桌斫獾男问健?br>
(5)字段分列
①字段【公司所屬領(lǐng)域】中有跨領(lǐng)域的情況存在,所以要對(duì)該列數(shù)據(jù)進(jìn)行拆分。
操作:將【公司所屬領(lǐng)域】復(fù)制到最后一列(因?yàn)榉至泻蟮膯卧駮?huì)覆蓋右邊的單元格),重命名為【公司所屬領(lǐng)域1】,{數(shù)據(jù)--->分列--->選擇“分隔符號(hào)”--->下一步--->分隔符合選擇逗號(hào)--->勾選(連續(xù)分隔符視為單個(gè)處理)---完成}將分隔出來的列重命名為【公司所屬領(lǐng)域2】。
②將字段【薪水】處理為【最低薪水】、【最高薪水】、【平均薪水】,用于存放清洗后的薪水?dāng)?shù)據(jù)。
這里有兩種方法可以實(shí)現(xiàn):
第一種是上面提到的分列,用-作為分隔符再將k替換。再用函數(shù)AVERAGE求出平均薪水。
第二種是利用函數(shù)實(shí)現(xiàn):
LEFT函數(shù)與FIND函數(shù)結(jié)合求最低薪水:left(單元格位置,第一個(gè)k出現(xiàn)的位置-1)
=LEFT(T2,FIND("k",T2)-1)
篩選出上述步驟中出現(xiàn)的錯(cuò)誤值,可以發(fā)現(xiàn)是由于原數(shù)據(jù)【薪水】中的k為大寫K,將【薪水】中的所有K替換成k。
Mid函數(shù)、find函數(shù)、len函數(shù)結(jié)合求最高薪水:mid(單元格位置,-出現(xiàn)的位置+1,-與右邊的k之間的長度即總長度-“-”的位置-1個(gè)k的位置)
=MID(T2,FIND("-",T2)+1,LEN(T2)-FIND("-",T2)-1)
篩選出上述步驟中出現(xiàn)錯(cuò)誤的最高薪水,找到原因:原數(shù)據(jù)【薪水】列是**K以上,不是范圍。
選中最高薪水列,定位為錯(cuò)誤,delete刪除錯(cuò)誤值--再在單元格內(nèi)輸入=ctrl+方向鍵←(讓其等于最低薪水)--CTRL+enter(在不連續(xù)的單元格中同時(shí)輸入同一個(gè)數(shù)據(jù)或公式)
再把帶公式的最高/低薪水復(fù)制粘貼為數(shù)值。
在操作的時(shí)候會(huì)出現(xiàn)數(shù)字顯示為文本格式,可以選擇該列*1,使其轉(zhuǎn)換為數(shù)字格式?;蛘呷xctrl+SHIFT+↓點(diǎn)橙色感嘆號(hào)--->轉(zhuǎn)化為數(shù)字。
最后用函數(shù)AVERAGE求出平均薪水。
(6)異常值處理
在查看【職位名稱】時(shí)發(fā)現(xiàn),職位中有一些不屬于數(shù)據(jù)分析師的崗位,需要把這些職位篩選過濾掉。
操作:①在原表【職位名稱】列后插入新的列命名【是否為數(shù)據(jù)分析職位】;
②插入函數(shù)=IF(COUNT(FIND({"數(shù)據(jù)運(yùn)營","數(shù)據(jù)分析","分析師"},L2)),"是","否"),雙擊單元格由下方進(jìn)行自動(dòng)填充;
③篩選出“是”,過濾掉異常值。
通過以上數(shù)據(jù)清洗過程,數(shù)據(jù)已經(jīng)是可以直接使用的干凈數(shù)據(jù)了,現(xiàn)在開始真正進(jìn)入數(shù)據(jù)分析。數(shù)據(jù)分析通過數(shù)據(jù)透視表實(shí)現(xiàn),最終通過可視化圖表直觀明了的展現(xiàn)。
(1)各城市對(duì)數(shù)據(jù)分析師崗位需求情況
操作:行標(biāo)簽 :城市;值:計(jì)數(shù)項(xiàng) 城市。 值顯示方式-->總計(jì)的百分比
由數(shù)據(jù)可見,從杭州往下的占比都不足3%,為了更清晰的展示局部占整體的百分比情況,我們選擇通過字母餅圖,將占比較少的放到第二繪圖區(qū)。
操作:選中賦值的數(shù)據(jù)表-->插入選中子母餅圖。選中插入的餅圖-->右鍵選中數(shù)據(jù)系列格式,將系列分隔依據(jù)的值改成小于7%,調(diào)整餅圖樣式,使之美觀。
結(jié)論:從數(shù)據(jù)透視表可以看出,在北京數(shù)據(jù)分析的崗位最多,往后是上海、深圳、杭州、廣州。
(2)各城市各工作年限的招聘占比情況
行標(biāo)簽:城市; 列標(biāo)簽:工作年限 。值:城市 計(jì)數(shù)
將值顯示方式改為:總計(jì)百分比。
用百分比堆積柱狀圖來展示各城市各工作年限崗位需求情況。
結(jié)論:從數(shù)據(jù)透視表可以看出,按工作年限要求來看,1-3年的需求量最大,其次是3-5年,這說明數(shù)據(jù)分析對(duì)年輕人需求將更多。
(3)各學(xué)歷的招聘占比情況
行標(biāo)簽:教育要求;值:計(jì)數(shù)項(xiàng) 教育要求。值顯示方式:總計(jì)的百分比
結(jié)論:從數(shù)據(jù)透視表可以看出,從學(xué)歷要求上看,本科學(xué)歷的需求量最大,其次是???,博士占比非常少。
(4)數(shù)據(jù)分析師在各城市的薪資水平情況
行標(biāo)簽:城市,值:平均值項(xiàng) 平均薪水
結(jié)論:從數(shù)據(jù)透視表可以看出,深圳平均薪資最高,北京和深圳薪資相差不大,其次北京,上海,杭州。
(5)工作經(jīng)驗(yàn)的不同,薪酬的變化情況
行標(biāo)簽:工作年限 值:平均值項(xiàng) 平均薪水?
結(jié)論:從上面數(shù)據(jù)透視結(jié)果可以看出,隨著工作經(jīng)驗(yàn)的增長,數(shù)據(jù)分析師的薪酬也在不斷增加。
綜合以上數(shù)據(jù)透視分析結(jié)果,我們可以得出以下分析結(jié)論:
(1)北京、上海、廣州、深圳、杭州占據(jù)了數(shù)據(jù)分析崗位數(shù)量的90%以上,數(shù)據(jù)分析師的工作機(jī)會(huì)主要集中在一線城市,如果想從事數(shù)據(jù)分析師,最好去這些城市發(fā)展,其他城市可選擇性較低。
(2)從薪資水平來看,深圳和北京平均薪資較高,其次是上海、杭州,這也說明了,想要長期從事數(shù)據(jù)分析師崗位,首先應(yīng)選擇一線城市。從工作年限隨平均薪資的變化曲線可以看到,前期薪資增長較慢,后期增加較快,10年以上工作經(jīng)驗(yàn)的人,可以獲得相當(dāng)豐厚的薪酬。
(3)從學(xué)歷方面來看,本科學(xué)歷占比超過一半,可見本科成為數(shù)據(jù)分析崗位中最為常見的學(xué)歷門檻,其次是大專,碩士以上學(xué)歷與不限,占據(jù)較少部分,可見數(shù)據(jù)分析師崗位的性質(zhì),相比與學(xué)術(shù)型的研究工作,更偏向于結(jié)合業(yè)務(wù)分析。
(4)結(jié)合學(xué)歷和工作年限要求可以看出,數(shù)據(jù)分析師是個(gè)偏年輕化的崗位,大量的工作崗位集中在1-5年工作年限。結(jié)合薪酬隨工作年限變化曲線來看,數(shù)據(jù)分析師需要在3年內(nèi)提升自己的業(yè)務(wù)能力,3年后薪酬會(huì)有較大的增長,5年是個(gè)瓶頸期,如果5年內(nèi)沒有較大的能力提升,之后的競爭壓力會(huì)很大。
怎么面試大數(shù)據(jù)分析師
1、考察對(duì)數(shù)據(jù)的敏感度。
面試的時(shí)候,數(shù)據(jù)部門經(jīng)理問一些生活中的數(shù)據(jù)的問題,一個(gè)優(yōu)秀的數(shù)據(jù)分析師對(duì)數(shù)據(jù)有很強(qiáng)的敏感度,生活中常見的數(shù)據(jù),你直觀的感受往往能反應(yīng)出你的資質(zhì)。
2、數(shù)學(xué)基本概念和統(tǒng)計(jì)學(xué)方法。
遇到的有排列組合的問題的,還有指數(shù)衰減的定義等等?;蛘咧苯咏o一個(gè)問題或者數(shù)據(jù),問問你打算用什么樣的方法怎樣去分析。在給你數(shù)據(jù)的時(shí)候,一定要記得說數(shù)據(jù)預(yù)處理!這一點(diǎn)非常重要,這樣會(huì)讓人覺得你的回答邏輯清楚,有條有理。如果想從事與數(shù)據(jù)科學(xué)相關(guān)的崗位,需要學(xué)習(xí)的數(shù)據(jù)知識(shí)可以參考成都加米谷大數(shù)據(jù)培訓(xùn)機(jī)構(gòu)的:想從事數(shù)據(jù)科學(xué)相關(guān)崗位,這些數(shù)學(xué)基礎(chǔ)“必備”。
3、編程能力。
你一定要有自己熟練的軟件,常問的問題是,你一般用excel干什么,常用的函數(shù)有哪些,是否用過數(shù)據(jù)透視表,是夠用過宏,平時(shí)多久用一次R,是否用過或了解過并行,等等關(guān)于軟件的問題。在面試小公司時(shí),HR會(huì)可能直接給你一個(gè)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,題目一般給的都不太難。
想要了解更多關(guān)于數(shù)據(jù)挖掘和數(shù)據(jù)分析之間的區(qū)別可以到CDA認(rèn)證中心咨詢一下,CDA行業(yè)標(biāo)準(zhǔn)由國際范圍數(shù)據(jù)領(lǐng)域的行業(yè)專家、學(xué)者及知名企業(yè)共同制定并每年修訂更新,確保了標(biāo)準(zhǔn)的公立性、權(quán)威性、前沿性。通過CDA認(rèn)證考試者可獲得CDA中英文認(rèn)證證書。
數(shù)據(jù)分析師就業(yè)前景
數(shù)據(jù)分析師就業(yè)前景如下:
從20世紀(jì)90年代起,歐美開始大量培養(yǎng)數(shù)據(jù)分析師,直到現(xiàn)在,對(duì)數(shù)據(jù)分析師的需求仍然長盛不衰,而且還有擴(kuò)展之勢。
據(jù)數(shù)聯(lián)尋英發(fā)布《大數(shù)據(jù)人才報(bào)告》顯示,未來3-5年內(nèi)大數(shù)據(jù)人才的缺口將高達(dá)100萬。根據(jù)中國商業(yè)聯(lián)合會(huì)數(shù)據(jù)分析專業(yè)委員會(huì)統(tǒng)計(jì),未來中國基礎(chǔ)性數(shù)據(jù)分析人才缺口將達(dá)到1400萬,而在BAT等大型互聯(lián)網(wǎng)公司的招聘職位里,80%以上都在招大數(shù)據(jù)人才。進(jìn)入大數(shù)據(jù)行業(yè),也成了越來越多人實(shí)現(xiàn)職場高薪夢的路徑之一。
在美國,大數(shù)據(jù)分析師每年薪酬高達(dá)17.5萬美元。在國內(nèi)大數(shù)據(jù)分析師平均薪酬為:19970k。
數(shù)據(jù)分析師發(fā)展前景:
從城市崗位需求數(shù)量分布來看,關(guān)于數(shù)據(jù)分析師招聘區(qū)域主要集中在一線城市及新一線城市,需求量較大城市的依次是:北京、上海、深圳、廣州、西安。
從崗位薪資狀況來看,薪資水平較高省份分別為北京、上海、廣東、浙江、福建等區(qū)域。在數(shù)字經(jīng)濟(jì)向生產(chǎn)生活各個(gè)領(lǐng)域滲透的同時(shí),長三角和珠三角這兩個(gè)重要經(jīng)濟(jì)區(qū)走在了應(yīng)用前列。