欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

從拉勾網數據看深圳數據分析師的職業前景-36大數據

36大數據 ? 7年前掃碼分享

我是創始人李巖：很抱歉！給自己產品做個廣告，點擊進來看看。

作者：真依然很拉風

通過對局部地區某一崗位的總體分析，找出該地區該職位的職業發展前景規律。本文基于拉勾上2016年12月到2017年1月深圳地區數據分析師招聘數據，為這一行業的朋友作為參考；雖然數據略為過時，但變化也不大，規律依然適用。

在深圳，

1、數據分析師主要還是開發類職業。開發類的職位，無論是市場需求還是薪資都是無可撼動的最高。

2、地區方面：如果你要在深圳找數據分析師的崗位，請去南山區，優先去科技園附近。

3、薪資方面，20K是業內中等水平；

4、學歷方面，除非你直接攻讀相關專業的博士，否則本科足矣；

5、技能方面：Hadoop和Spark這類大數據基礎框架是市場最為重視的，因此Java是最為需要的語言。Python是首選的語言。

6、公司選擇方面：數據表明大公司的需求和薪資都顯著性強于小公司。

第一部分：Python拉勾爬蟲

拉勾因其結構化的數據比較多因此過去常常被爬，所以在其多次改版之下變得難爬。不過只要清楚它的原理，依然比較好爬。其機制主要就是AJAX異步加載JSON數據，所以至少在搜索頁面里翻頁url不會變化，而且數據也不會出現在源代碼里。

數據解析

這是深圳地區的數據分析師頁面，用Chrome檢查打開。在XHR中可以看到一個以postionAjax.json開頭的腳本，打開Preview看一下，可以看到：

從拉勾網數據看深圳數據分析師的職業前景-36大數據

可以發現這些數據與前端的數據一致，此時我們已經找到了數據入口，就可以開始爬了。

數據爬取

在Headers里可以查看請求方式：

Request Header:
Request URL: https://www.lagou.com/jobs/positionAjax.json?city=%E6%B7%B1%E5%9C%B3&needAddtionalResult=false
Request Method:POST
Status Code:200 OK
Remote Address:106.75.72.62:443

從Request Header中可以看到，是用POST提交表單方式查詢的（所以如果你直接點開Request URL你會發現數據不對，因為沒有提交表單數據）。

那么我們就可以在Python中構造請求頭以及提交表單數據來訪問：

						
							import
							requests
							import
							time
							from
							sqlalchemy
							import
							create_engine
							import
							pandas
							as
							pd
							from
							random
							import
							choice
							import
							json
							import
							numpy
							engine=create_engine(
							#這里填你自己數據庫的參數#) # 連接數據庫
							dl = pd.read_sql(
							"proxys"
							,engine)
							
								def
								get_proxy
								(dl)
								:
							
							n = choice(range(
							1
							, len(dl.index)))
							proxy = {
							"http"
							:
							"http://%s:%s"
							%(dl[
							"ip"
							][n],dl[
							"port"
							][n]),
							"https"
							:
							"http://%s:%s"
							% (dl[
							"ip"
							][n], dl[
							"port"
							][n])}
							return
							(proxy)
							
								def
								get_header
								()
								:
							
							headers = {
							"User-Agent"
							:
							""
							Mozilla/
							4.0
							(compatible; MSIE
							6.0
							; Windows NT
							5.1
							; SV1; AcooBrowser; .NET CLR
							1.1
							.4322
							; .NET CLR
							2.0
							.50727
							)
							""
							,
							"Accept"
							:
							"application/json, text/javascript, */*; q=0.01"
							,
							"Content-Type"
							:
							"application/x-www-form-urlencoded; charset=UTF-8"
							,
							"Referer"
							:
							"https://www.lagou.com/jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E5%B8%88?px=default&city=%E6%B7%B1%E5%9C%B3&district=%E5%8D%97%E5%B1%B1%E5%8C%BA"
							,
							"X-Requested-With"
							:
							"XMLHttpRequest"
							,
							"Host"
							:
							"www.lagou.com"
							,
							"Connection"
							:
							"keep-alive"
							,
							"Cookie"
							:
							"user_trace_token=20160214102121-0be42521e365477ba08bd330fd2c9c72; LGUID=20160214102122-a3b749ae-d2c1-11e5-8a48-525400f775ce; tencentSig=9579373568; pgv_pvi=3712577536; index_location_city=%E5%85%A8%E5%9B%BD; SEARCH_ID=c684c55390a84fe5bd7b62bf1754b900; JSESSIONID=8C779B1311176D4D6B74AF3CE40CE5F2; TG-TRACK-CODE=index_hotjob; Hm_lvt_4233e74dff0ae5bd0a3d81c6ccf756e6=1485318435,1485338972,1485393674,1485423558; Hm_lpvt_4233e74dff0ae5bd0a3d81c6ccf756e6=1485423598; _ga=GA1.2.1996921784.1455416480; LGRID=20170126174002-691cb0a5-e3ab-11e6-bdc0-525400f775ce"
							,
							"Origin"
							:
							"https://www.lagou.com"
							,
							"Upgrade-Insecure-Requests"
							:
							"1"
							,
							"X-Anit-Forge-Code"
							:
							"0"
							,
							"X-Anit-Forge-Token"
							:
							"None"
							,
							"Accept-Encoding"
							:
							"gzip, deflate, br"
							,
							"Accept-Language"
							:
							"zh-CN,zh;q=0.8"
							}
							return
							(headers)
							
								def
								get_form
								(i)
								:
							
							data={
							"first"
							:
							"false"
							,
							"pn"
							:i,
							"kd"
							:
							"數據分析師"
							}
							return
							(data)
							districts = [
							"南山區"
							,
							"福田區"
							,
							"寶安區"
							,
							"龍崗區"
							,
							"龍華新區"
							,
							"羅湖區"
							,
							"鹽田區"
							,
							"大鵬新區"
							]
							pagenos = [
							22
							,
							10
							,
							1
							,
							4
							,
							1
							,
							2
							,
							1
							,
							1
							]
							url_lists = [
							"https://www.lagou.com/jobs/positionAjax.json?px=default&city=深圳&district=%s&needAddtionalResult=false"
							%area
							for
							area
							in
							districts]
							s = requests.Session()
							s.keep_alive =
							False
							s.adapters.DEFAULT_RETRIES =
							10
							
								def
								get_jobinfo
								(i,j)
								:
							
							# i表區號，j表頁數
							if
							i >=
							8
							or
							j > pagenos[i]:
							return
							(
							"索引超標！"
							)
							resp=s.post(url_lists[i], data=get_form(j), headers=get_header())
							resp.encoding=
							"utf-8"
							max_num = len(json.loads(resp.text)[
							"content"
							][
							"positionResult"
							][
							"result"
							])
							for
							k
							in
							range(max_num):
							try
							:
							json_data=json.loads(resp.text)[
							"content"
							][
							"positionResult"
							][
							"result"
							][k]
							df = pd.DataFrame(dict(
							approve=json_data[
							"approve"
							],
							#        businessZones=json_data["businessZones"],
							companyId=json_data[
							"companyId"
							],
							#        companyLabelList=json_data["companyLabelList"],
							companyShortName=json_data[
							"companyShortName"
							],
							companySize=json_data[
							"companySize"
							],
							createTime=json_data[
							"createTime"
							],
							education=json_data[
							"education"
							],
							financeStage=json_data[
							"financeStage"
							],
							firstType=json_data[
							"firstType"
							],
							industryField=json_data[
							"industryField"
							],
							jobNature=json_data[
							"jobNature"
							],
							positionAdvantage=json_data[
							"positionAdvantage"
							],
							positionId=json_data[
							"positionId"
							],
							positionName=json_data[
							"positionName"
							],
							salary=json_data[
							"salary"
							],
							secondType=json_data[
							"secondType"
							],
							workYear=json_data[
							"workYear"
							],
							scrapy_time=time.strftime(
							'%Y-%m-%d %H:%M:%S'
							, time.localtime(time.time()))),index=[
							0
							])
							df.to_sql(con = engine, name =
							"job_info"
							, if_exists =
							'append'
							, flavor =
							"mysql"
							,index=
							False
							)
							except
							:
							print(
							"第%d區，第%d頁，第%d個出錯了！"
							%(i,j,k))

以上這個函數就可以通過提交區和頁數，返回當前頁的職位數。

其實AJAX返回JSON數據的方式也有好處，數據都是規整的，不必花太多時間精力在數據清洗上。

至于職位詳情的內容是寫在源代碼里的，這些用常規爬蟲方法即可。

不過注意要加延時，拉勾的反爬蟲措施還是比較嚴的，不加延時爬一小會兒就會被封IP。

第二部分：數據分析報告

區域分析

從拉勾網數據看深圳數據分析師的職業前景-36大數據

各區職位數

從拉勾爬取的數據拉勾，在深圳，對數據分析師需求量最大的地區為南山區，其次為福田區。這個當地的互聯網企業分布有很大的關系，眾所周知，深圳的互聯網企業集中在南山區和福田區；

從拉勾網數據看深圳數據分析師的職業前景-36大數據

空間分布

從拉勾網數據看深圳數據分析師的職業前景-36大數據

各區域板塊職位數

頻數分布

從拉勾網數據看深圳數據分析師的職業前景-36大數據

第一類別頻數

從拉勾網數據看深圳數據分析師的職業前景-36大數據

第二類別頻數

從拉勾網數據看深圳數據分析師的職業前景-36大數據

不同公司階段招聘數量

薪資分布

從拉勾網數據看深圳數據分析師的職業前景-36大數據 ?全部職位平均薪資總體分布

從拉勾網數據看深圳數據分析師的職業前景-36大數據

不同類別職位薪資分布

從拉勾網數據看深圳數據分析師的職業前景-36大數據

不同階段公司平均薪資

從拉勾網數據看深圳數據分析師的職業前景-36大數據

不同學歷對薪資的影響

從拉勾網數據看深圳數據分析師的職業前景-36大數據

公司規模對薪資的影響

技術要求

從拉勾網數據看深圳數據分析師的職業前景-36大數據

數據分析師的技術要求

公司排名

從拉勾網數據看深圳數據分析師的職業前景-36大數據

高薪崗位top20

從拉勾網數據看深圳數據分析師的職業前景-36大數據

綜合人氣排名

結論

在現今的市場認知中， 數據分析師主要還是開發類職業。開發類的職位，無論是市場需求還是薪資都是無可撼動的最高 。因此所以如果你不會編程，或者不想作一個程序員（比如我），那么應該重新思考一下職業規劃。

如果 你要在深圳找數據分析師的崗位，請去南山區，優先去科技園附近 。

如果你去找工作，HR問你期望薪資，你就說20K，因為這是業內的中等水平（這是考慮了最高薪資，不過考慮到大部分的最高薪資只是一個幌子，因此20K當然是虛高:)）。30K基本就到了數據分析師的天花板，而這個天花板一般要5年以上的時間達到。

當然要找一個20K的工作也不是那么輕松。你首先要自己具備實力。對于學歷，除非你直接攻讀相關專業的博士，否則本科足矣，讀個碩士作用并不大（尤其是國內的碩士），三年時間轉化成工作經驗價值更大。 至于技術方面，Hadoop和Spark這類大數據基礎框架是市場最為重視的，因此Java是最為需要的語言 （這主要還是因為大部分的公司不知道數據工程師和數據分析師的區別，或者大部分的公司仍處于基礎建設階段，離數據挖掘、分析和應用還有不少距離）。 對于懂行的數據分析師來說，Python是首選的語言，畢竟全能；當然R也是越來越流行和被重視；SAS也不錯，金融行業很需要。 無論是工程師還是分析師， 數據庫和SQL始終是重要的基礎技能。

當你足夠牛的時候，就是你來挑選市場了。去大公司還是小公司？去大公司。數據表明大公司的需求和薪資都顯著性強于小公司。在移動互聯網收尾，人工智能興起的大數據時代，沒有數據、沒有資金、沒有技術的小公司實在難有作為。

當然拉勾的數據既不全面，也不一定都靠譜（事實上許多HR的招聘需求都是抄來抄去）。因此，以上所有結論一定有某種程度的偏差，僅供參考。

End.

轉載請注明來自36大數據（36dsj.com)： 36大數據 ? 從拉勾網數據看深圳數據分析師的職業前景

隨意打賞

數據分析師的職業規劃數據分析師職業規劃大數據應用前景大數據發展前景數據分析方法大數據前景數據分析師拉勾大鯤網

我來數科：通過大數據與人工智能技術打造安全便捷的金融服務平臺

砍柴網 ? 6天前

在金融科技加速變革下，風控體系成為金融機構發展的關鍵支撐。隨著監管政策趨嚴，個人信息保護、數據安全、機構合規性等要求不斷提升，促使行業進一步加強風控體系的構建與升級。我來數科作為深耕金融科技領域的平臺，始終走在風控技術前沿，以大數據和人工智能為核心，打造全方位的風險管理體系，為用
市場監管總局回應大數據殺熟

i黑馬 ? 10天前

3月5日，國家市場監督管理總局局長羅文表示，今年將著力優化監管方式方法，大力促進平臺經濟健康發展。當前，外賣騎手等新就業群體和消費者都反映，平臺企業存在三個問題。一是算法不透明，二是大數據殺熟，三是刷單炒信。針對上述問題，市場監管部門將積極配合有關部門，加強綜合治理，督促平臺企業提高算法透明度，優化算法規則，切實有力地
貴陽市大數據局舉辦貴陽貴安DeepSeek大模型專題培訓

數據觀 ? 10天前

為全面提升貴陽貴安數治能力和水平，建設更高水平的數字貴陽貴安，推動人工智能賦能在全省走前列、作表率。3月4日，貴陽市大數據局舉辦貴陽貴安DeepSeek大模型專題培訓，邀請貴州大數據集團云智事業部副總經理陸嘉達博士作“大模型DeepSeek的技術與應用”專題培訓。貴陽市大數據局副局長徐先文主持會議，各區（市、縣、開發區
白鴿在線攜手鹽城大數據集團以科技守護百姓財產安全

砍柴網 ? 12天前

信息化時代,電信網絡詐騙案件持續多發高發,手段日益復雜、新騙術層出不窮,給人民群眾的財產安全帶來了巨大威脅,加強反詐宣傳工作亟不可待。為守護百姓的“錢袋子”,近日, 白鴿在線聯合鹽城市大數據集團、鹽城市公安局鹽南分局及華農財險,共同發起“數智反詐守護幸福”大型反詐公益項目 ,攜手構建“政企保
醫渡科技六度蟬聯醫療大數據企業榜首，以“YiduCore+DeepSeek”重構醫療智能生態

砍柴網 ? 12天前

近日,《2024醫療大數據企業排行榜》發布,醫渡科技連續第六年摘得行業榜首桂冠,再次證明了其在中國醫療人工智能和大數據領域的優勢地位。該榜單由中國科學院主管的權威媒體《互聯網周刊》聯合德本咨詢、中國社會科學院信息化研究中心每年評選,具有極高的權威性和
加和科技受邀出席中國信通院“卓信大數據計劃”2025年度會議

砍柴網 ? 17天前

2025年2月21日，中國信通院“卓信大數據計劃”2025年度會議在北京召開。加和科技作為特邀參展商參會，與行業精英共同聚焦大模型時代的數據安全挑戰與機遇。自2021年啟動以來，“卓信大數據計劃”致力于構建數據安全基礎設施，完善保障體系，匯聚產業力量，推動應用創新。此次大
2025中國國際大數據產業博覽會年度主題征集公告

數據觀 ? 17天前

中國國際大數據產業博覽會（以下簡稱數博會），是全球首個以大數據為主題的國際性博覽會，由國家數據局主辦，貴州省人民政府承辦，經過十年積累沉淀，已經成為數據領域引領創新趨勢、展示行業成果、促進開放合作的重要載體。2025數博會籌備工作已啟動，為全方位展現本屆數博會國際性、權威性平臺形象，提高大眾參與度，現面向全社會公開征集
“浪潮卓數大數據”完成B輪融資

i黑馬 ? 1月前

據浪潮卓數消息，“浪潮卓數大數據”宣布完成B輪融資。本輪融資由中泰創投領投，東營財金、浪潮產投等機構跟投，公司估值較上輪增長167%。本次融資將助力浪潮卓數大數據進一步加強研發投入、引進優秀人才、塑造產業優勢，加快科技創新成果轉化。文章評價匿名用戶發布發布
酷克數據榮膺多項行業大獎，引領大數據與計算產業創新發展

砍柴網 ? 1月前

新年伊始，酷克數據在大數據與計算產業領域捷報頻傳，榮譽入選第八屆大數據“星河(Galaxy)”數據庫潛力案例，更被權威收錄入《2024年度全球計算產業案例匯編(GMVPS)》，彰顯實力。同時，酷克數據還榮膺IT168頒發的2024年度技術卓越獎，以及InfoQ授予的2024年度技術生態構建品牌殊榮。這一系列輝煌榮譽，不
云知聲 Atlas 超算平臺入選《分布式統一大數據虛擬文件系統Alluxio原理、技術與實踐》

砍柴網 ? 2月前

在大數據與人工智能領域日新月異的今天，高效、可靠的分布式文件系統及其計算加速方案已成為眾多企業和科研機構關注的焦點。云知聲的Atlas超算平臺以其“基于Fluid + Alluxio的計算加速實踐”，榮耀入選《分布式統一大數據虛擬文件系統Alluxio原理、技術與實踐》。這一榮譽不僅彰顯了云知聲在技術創新方面的實力，也
拉勾網CEO稱互聯網高薪是因為有泡沫

i黑馬 ? 2年前

近日，拉勾網CEO許單單在個人社交媒體賬號評價互聯網高薪，稱大廠被裁員工找工作時要求漲薪30%，簡直是被行業慣壞了。互聯網工資已經到頂了，過去能在這個行業拿高薪并不是因為能力強，而是因為大量資本投進來，現在互聯網行業的泡沫就快要擠破了。?文章評價匿名用戶發布發布
因「秘密」跳槽字節跳動，百度一高級經理賠了107萬元；傳吉利已收購魅族；拉勾網CEO稱互聯網高薪是因為有泡沫｜雷峰早報

雷鋒網 ? 2年前

百度高級經理「秘密」跳槽字節跳動，違反競業限制一審被判賠107萬5月5日雷峰網消息，因認為離職員工潘xx違反競業限制義務，百度公司將其告上法庭。日前，北京市海淀區人民法院對該案進行了公開審理，該案現已審理終結。判決書顯示，潘xx于2011年4月8日入職百度擔任高級經理職務，后一份勞動合同為2017年6月30日簽訂的無固
競品分析 | 實習僧、應屆生求職、拉勾網（APP）

人人都是產品經理 ? 4年前

編輯導讀：2020屆畢業生堪稱史上最難，前后疫情的阻攔，后有同輩的競爭，讓今年的就業形勢顯得格外嚴峻。不少畢業生都在用招聘平臺找工作，本文選取了三個招聘平臺進行分析，希望對你有幫助。本文選取實習僧、應屆生求職、拉勾網三個產品（APP端）作為競品分析對象，旨在以直接競品和間接競品為調研對象，了解各產品功能現狀的同時，輸出
拉勾網：電商行業對直播運營相關崗位人才需求大幅增加

砍柴網 ? 4年前

拉勾網旗下的拉勾大數據研究院發布《電商行業人才報告》。報告顯示，春節假期后，電商行業招聘需求直線回升。其中，深圳、杭州以64%的增幅并列第一，廣州第二。相比于2019年，2020年上半年電商行業對“直播運營”相關崗位人才需求增幅達47%。2020年1月起，電商行業對“直播運營”崗位的人才需求逐月遞增，2-3月疫情期間，
甲骨文中國裁員拉勾網上線“甲骨文人才專場”

移動新媒體 ? 5年前

【TechWeb】 5 月 9 日，據媒體報道，近期甲骨文北京啟動裁員，人數涉及近 900人，裁員覆蓋甲骨文在中國有研發中心的城市均有涉及，包括北京、上海、蘇州、深圳、大連等。針對甲骨文中國裁員事情，國內招聘網站拉勾網創始人許單單昨晚在其微博公布拉勾上線了”甲骨文人才專場“，并表示：“甲骨文的程序員們，普遍名校畢業，年
拉勾網被傳裁員，網絡招聘行業究竟怎么啦？

藍鯨TMT ? 6年前

網絡文學領域的閱文、掌閱先后上市，互聯網家裝領域的齊家網已赴港上市，土巴兔亦提交了招股書，在 BAT 等互聯網巨頭紛紛收割頭部紅利之后，各個垂直細分領域的公司也在近期開始上市之路，曾經不被看好的垂直領域公司總算揚眉吐氣，開始逆襲之路。智聯招聘成立于 1997 年，前程無憂成立于
拉勾網許單單：創業5年，應該像一個生意人了

億歐網 ? 6年前

拉勾進入第五年，許單單已經變了一個人。拿天使投資的時候，拉勾的計劃是做職業社交的。但做了三四個月，效果很不好。許單單就想換個方向做招聘，但其他的創始人一開始并不愿意，覺得招聘網站多土，做社交多有前途。回頭看，這一定程度上和他們的出身有關。他們來自騰訊，在騰訊商業化和產品分的很開，除
拉勾網許單單：合縱連橫的時代，細分領域需要深挖創新

砍柴網 ? 6年前

拉勾進入第五年，許單單已經變了一個人。拿天使投資的時候，拉勾的計劃是做職業社交的。但做了三四個月，效果很不好。許單單就想換個方向做招聘，但其他的創始人一開始并不愿意，覺得招聘網站多土，做社交多有前途。回頭看，這一定程度上和他們的出身有關。他們來自騰訊，
拉勾網許單單：合縱連橫的時代，細分領域需要深挖創新

投資界 ? 6年前

拉勾進入第五年，許單單已經變了一個人。拿天使投資的時候，拉勾的計劃是做職業社交的。但做了三四個月，效果很不好。許單單就想換個方向做招聘，但其他的創始人一開始并不愿意，覺得招聘網站多土，做社交多有前途。　　回頭看，這一定程度上和他們的出身有關。他們來自騰訊，在騰訊商業化和產品分的很開，除了游戲、廣告等部門，其他
百度AI賦能互聯網招聘牽手拉勾網保障用戶安全

砍柴網 ? 7年前

前段時間，接連兩位大學畢業生通過網絡招聘被騙入傳銷組織導致不幸身亡，事件發生后引發社會對互聯網招聘行業的廣泛關注。近日，百度宣布與互聯網招聘平臺拉勾網達成合作協議，百度AI將與拉勾網的網絡招聘場景進行深度結合，以AI賦能互聯網招聘平臺，保障企業與求職用戶的安全。招聘平臺“水太深”

評論

提交建議