欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

如何成為一名數據科學家?(二)

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

聯合編譯:Blake、高斐

如何成為一名數據科學家?(二)

編者注:作者Alec Smith是數據科學領域中資深HR,之所以寫這篇文章是因為經常被問到一個問題:“如何才能獲得一份數據科學家的職位?” 不僅這個問題經常被問引起了注意,另外問這個問題的人不同的背景也非常很令人感興趣。作者曾經和以下這些職業的人有過類似對話:軟件工程師、數據庫開發者、數據架構師、保險精算師、數學家、學術界人士(不同領域)、生物學家、天文學家、理論物理學家—我還能接著往下數。通過和他們的這些談話,作者發現在這之中有很大的誤解存在,很多人都非常困惑——為了闖入這個領域的話,他們需要做些什么?

本文是 如何成為一名數據學家 的第二部分。

第二章:自我剖析

我們正在取得進步!成功地消化了第一章的內容之后,你現在要做好準備開始制定個人目標。但是,我們首先要回顧一下——不妨來杯咖啡,尋一隅安靜之所,深思下面的問題:

1.你為什么想要成為一名數據科學家?

2.對哪一類型的數據科學感興趣?

3.你已經具備了哪些天賦或相關技能?

為什么認真思考這些問題是重要的?

簡而言之:數據科學是一個專業的研究領域,因而,除非你已經掌握了我們在第一章中提到的知識與技能,否則從事該領域的研究并不是一種輕松的選擇。講到這里,有一點對合理解決前兩個問題尤為重要:你需要為從事數據科學領域的研究找到合理的理由,否則,當遇到困難時,很容易半途而廢。

為了詳細闡釋上面的觀點,我們來聽聽Dylan Hogg的見地。Dylan之前是一名軟件工程師,現在是數據科學研究協會的領導者,數據科學研究會為運用機器學習(NLP)為雇主和相關候選人員建立聯系搭建了一個平臺。Dylan是如何從軟件工程師成功地轉型為數據科學家的(他仍然處于轉型期),下面我們將討論轉型過程中應當具備的條件,他講到:

“不論學歷高低,經歷豐富與否,有一些內在的東西尤為重要,那就是一個人的求知欲、決心和毅力。你會遇到很多困難:也許是算法方面出錯,也許是遇到技術瓶頸。不論遇到什么樣的困難,你都能夠找到最優的方法來研究機器學習算法或軟件工程,但是,倘若你的信心不夠堅定,你將會放棄或無法克服遇到的困難。”

這下你會懂了:在學習過程中,你不僅僅會遇到困難;在工作生活中,你會接二連三地遇到難題,因而,你最好能夠保證有合理的理由來激勵自己,而不僅僅因為你覺得擁有“科學家”這一頭銜有多酷。

但是,我們應當如何應對第三個問題?為什么擁有相關技能是重要的?對,一個人的起點會對選擇最適合自己的數據科學類型及你應當從自己感興趣的領域學到的知識產生影響?為了能夠恰當地回答這個問題,有必要探尋通往數據科學領域的典型途徑,我們應當首先從更為廣闊的科學領域開始。

注:在許多定量學科中有許多人具備向數據科學轉型的素質。在這里我就不一一列舉了,但是,需要強調的重點是:如果你花費時間來真正理解每種類型數據科學之間存在的細微差異,不論你的知識背景如何,你都將會意識到自己所具備的相關技能的重要性。

其他科學學科

如何成為一名數據科學家?(二)

這不是通往數據科學領域最平凡的道路;我們接下來將要討論統計學與計算機科學在數據科學研究中的重要性。但是,許多領域的科學家都具有嫻熟的相關技能(特別是物理學領域),許多人在這一方面已經跳過了。

為了對此進行解釋,請允許我介紹Will Hanninger,澳洲聯邦銀行數據科學家。之前,Will是歐洲核子研究中心的粒子物理學家,發現了希格斯玻色子,下面是他的語錄:

“在物理學界,你能夠自然而然地學習到所需要的數據科學領域的知識:編程、操作數據,獲取原始數據并根據實用性對數據進行轉換。你能夠學習到統計學知識,重要的是:你將學到解決問題的能力。這些是作為一名數據科學家應當具備的基本技能。”

因此,技能組合具有高度可轉換性,最重要的是獲取解決問題的能力。工具與技術兩者之間將會產生差異,例如,盡管機器學習是數據科學的同義詞,但是,就更為寬泛的科學而言,這種同義關系是不常見的。在上述討論中,我們一直談及的是高智商人才,他們具有在短時間內學會使用工具與技術的能力。

下面我們以Sean Farrell的科研經歷為例。Sean所學專業是天體物理學,之后進入澳大利亞商業數據科學研究領域,在研究過程,他就“為什么科學家在數據科學領域的損失反而是收獲”這一題目寫了一篇著名的博文。下面這段話尤為中肯:

“至今為止,尚未發現一種能夠培養出一位數據科學家的正式訓練方法。多數數據科學家都來自統計學或計算機科學領域。然而,盡管其他研究領域也能夠培養上述列舉的技能,但是不能涵蓋所有的相關技能。統計學家非常擅長數學和統計,通常在編程這一塊兒的技能稍顯欠缺。計算機科學家非常擅長編程,但是,在理解統計學知識方面存在難度。兩個領域的科學家都具備高水平的(盡管不同的)數據分析技能,但是不擅長創新性地解決問題,這種技能也是難以教會的。”

????? 為了避免誤解,請記得我們今天討論的上下文語境。Sean的一席話并不意味著來自統計學或計算機科學領域的所有數據科學家都缺乏創新性解決問題的能力;他的觀點是:相比統計學和計算機科學,廣泛意義上的科學對解決問題的技能要求很高。

統計學

談及到科學,應當仔細研究統計學。近來,許多統計學中的分支學科被重新冠以數據科學之名,因此,在某種程度上,我們好像正在談論語義學知識。但是,正如我先前談到的,我認為科學方法應當被當作一門科學:難道提出假設,設計可行的實驗方案等研究步驟不能稱得上“方法論”嗎?倘若不是的話,也許像“統計學家”或“模型分析師”這樣的頭銜更為貼切。

暫且將這一問題放一放,倘若你是產業界的一名統計員或者剛剛從統計學專業畢業,那么你可能已經擁有成為一名數據科學家應當具備的知識與素養。相關知識素養的形成主要依靠以下因素:

  • 首先,你在機器學習技能方面有何經驗?正如我們在第一章提到的,統計建模與機器學習是相互關聯的,但是,在應用到大型數據集中,后者具有更多的優勢。當機器學習在產業界的應用越來越受到關注,實際上,機器學習已經成為各種類型的數據科學。

  • 其次,我們再重復一遍,你對數據科學的哪一領域感興趣?很明顯,擁有統計學背景更加有利于你勝任A類型職位,因而,如果你將目標設定為B類型職位,未來還需要學習很多知識。

  • 最后,你是否擁有處理數據的實際經驗?正如我們在第一章中提到的,手動轉換數據是商業數據科學的重要組成部分,而來自統計學領域的科學家手動轉換數據的能力相對薄弱。

計算機科學/軟件工程

如果你在人工智能或計算機科學領域的學習已經達到前沿水平,你極有可能已經能夠勝任B類型的數據科學研究工作。但是,我們這里將要考慮一條數據科學家常走的科研道路:一名經驗豐富的軟件工程師想要轉型進入數據科學領域。

一名軟件工程師在機器學習領域可能富有經驗,也可能經驗甚少。但是,B類型數據科學要求在軟件工程原則方面擁有扎實的基礎,因而,不論怎樣,擁有軟件工程方面的學術背景將使你更適合該領域的研究。我曾經與澳洲聯邦銀行高級數據科學家(先前是一名軟件工程師)就此問題交流過,以下是他的觀點:

“大量數據科學工作其實都涉及到軟件工程方面的知識,不僅僅包括設計健全的系統,而且包括簡單地編寫軟件。你可以通過自動化完成眾多任務,如果想要開展實驗,你需要編寫代碼,如果你能夠快速編碼,將對實驗進展產生重大影響。在攻讀博士學位過程中,我每天要做成千上萬項實驗,如此浩大的工程是不可能通過人工完成的。擁有軟件工程專業的學術背景意味著我能夠快速完成設定的實驗任務,然而,許多其他學術背景的學生需要費力處理基本的軟件問題:他們真的非常擅長數學,但是要切實證明他們的觀點還需要耗費大量時間。”

Dylan對于該問題補充道:

?“如果你想要在生產環境中高效運用機器學習算法,良好的軟件工程實踐能力是非常寶貴的。這其中涉及到各種各樣的軟件工程知識——如可維護的代碼,可供分享的代碼庫,以便于更多的人能夠投入到數據科學領域的研究中,如在計算機中記錄信息,排除生產過程中的故障,算法擴展,你應當認識到:一旦這些知識得到加強,你便能夠通過這樣的方式構建數據科學領域的知識框架。因此,如果你正在尋找一份能夠有效利用所掌握的知識的工作,這將使得軟件工程學術背景變得更為重要。”

我認為,上述兩名數據科學家已經對如何成功實現轉型這一問題做出了詳細闡釋,下面由我來總結如下:如果你是一名軟件工程師,而且很喜歡數學,這將有助于你成為一名(B類型)數據科學家,前提是你已經做好準備在工作中掌握統計學/機器學習領域的知識。

數學

很容易得出這樣一個結論: 數學知識為數據科學的所有研究領域打下堅實的基礎 。因而,期望許多數學家從事數據科學家的研究工作是合理的。但是,相對來講,少之又少的數學家成功轉型成為數據科學家,這一現象引發了我濃厚的興趣。

針對這一現象,有一種解釋:與其他研究領域相比,數學(純理論數學與應用數學)領域有相對較少的畢業生。但是,這種解釋未免顯得牽強。為了深究導致這種現象的原因,我曾經同Building IQ(一家新成立的運用先進的算法優化商業建筑中能源應用的公司)首席數據科學家Boris Sackovic交談過。Boris擁有電氣工程與應用數學雙重學術背景,與當時許多數學家合作過,以下是他對該現象的見解:

“許多數學家為理論層面的問題,美麗的方程著迷,能夠洞察眾多數學原理所蘊含的深層意義,當時商業數據科學研究講求實證性,涉及到的多種多樣的知識與能力。一些數學家喜歡這種實證性,而一些則表現出討厭的態度。真實的情況更為復雜,你不能兼顧所有的情況,因而得具備能夠靈活處理所遇到難題的能力。而這是商業數據科學的重點所在:找到更快更好、切實可行的掙錢方案。對于那些具有濃厚數學背景或理論背景的科學家而言,要理解商業數據科學領域的運行模式可能存在不少難題。我曾經遇到過很多數學專業的博士,他們在由學術界向商業數據科學領域過度期間可是吃了不少苦頭。”

需要注意的是,Boris在這里談及的是純理論數學家,當然,他也補充說,在自己的職業生涯中也曾與許多優秀的應用數學家打過交道。這樣一來上面的討論便講得通了,因為純理論數學家可能會吸引那些熱愛理論的人,而不會吸引那些熱愛解決實際問題的人。理論研究工作并未涉及到太多數據處理問題,但是,我們都知道數據對于數據科學領域的研究極為重要。

就工作類型匹配度問題,多數數學家可能更適合學習A類型數據科學領域的工具和理論。但是,也有一些學習計算機科學的(實質上,理論計算機科學屬于數學的一個分支)數學家,因此,具備這種學術背景的數學家可能更適合B類型數據科學領域的工作。

從上述討論結果中可以得出一條非常重要的觀點,即要理解商業數據科學真正要求數據科學家具備哪些知識和技能。倘若你能夠真正清楚地認識到面臨的挑戰,所需要做的便是為了自己的目標努力前行。但是,倘若相比實際應用,你更熱衷于理論研究,你可能要三思而后行。

一塊空白的畫布

如果你剛剛起步,也許你還是一名學生,喜歡數學、科學與計算,喜歡數據科學,這對你來講不失為一則好消息:你可以不受先前學術背景的限制,選擇屬于自己的科研道路。

現在有許多與數據科學相關的專業課程,涵蓋計算機科學和數學/統計學等。當然你不可能一夜之間成為一名數據科學家,現階段你需要樹立不斷學習的理念,利用各種數據科學領域的學習資源, 累積數據處理方面的實際經驗,具備與人交流溝通的能力,積極迎接商業數據科學領域未來的挑戰!

相關閱讀

如何成為一名數據科學家?

PS : 本文由雷鋒網 (搜索“雷鋒網”公眾號關注) 獨家編譯,未經許可拒絕轉載!

via?Alec Smith

本文被轉載1次

首發媒體 雷鋒網 | 轉發媒體

隨意打賞

如何成為一名數據科學家如何成為數據科學家如何成為一名科學家首席數據科學家如何成為科學家美國數據科學家大數據科學家數據科學家
提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 国产日韩一区二区 | 日韩免费观看 | 久99久热 | 亚洲黄色在线观看视频 | 天天干天天操天天透 | 免费又爽又黄禁片视频在线播放 | 免费a一级毛片在线播放 | 日韩男女视频 | 九九视频在线 | 免费看一级做a爰片久久 | 狠狠综合久久久久尤物丿 | 天天拍夜夜添久久精品中文 | 老子影院午夜理伦手机不卡 | 久久成人免费视频 | 狠狠婷| 日韩 欧美 中文字幕 不卡 | 99久久精品国产片久人 | 久久一区不卡中文字幕 | 成人a网 | 青草社区 | 久久综合网址 | 久久成 | 亚洲国产日韩在线一区 | 国产精品二区高清在线 | 日产一一到六区麻豆 | 一级黄色片网站 | 久久国产影视免费精品 | 四虎在线观看视频 | 四虎最新紧急入口4hu | 夜夜操天天干 | 国产成人一区二区视频在线观看 | 五月天中文字幕 | 福利影院第一页 | 亚洲欧美另类在线 | 狠狠大日本亚洲香蕉亚洲 | 天天操天天碰 | 中文字幕色婷婷在线精品中 | 国产成人lu在线视频 | 亚洲成人一区二区 | 久久精品高清 | 91久久国产 |