数据科学职业生涯路径:行业中的不同角色

Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发。

数据科学职业生涯:介绍

全世界,企业每天都在创造更多的数据,迄今为止大多数都在努力从中受益。根据麦肯锡的说法,仅美国就将面临150,000多名数据分析师的短缺另加150万个精通数据的管理者。

不过说真的,什么是精通数据的管理者?这个术语是什么意思?所有的数据科学家都是一样的吗?

数据科学团队面临很多问题。他们可能会被要求分析发送到公司的推文是积极的还是消极的,或者他们可能要追溯销售来自哪里。不同的组织将有不同的数据问题——每个问题都有它自身的复杂性。解决不同的数据科学问题可能需要不同的技能集

数据科学团队聚在一起解决组织可能面临的一些最困难的数据问题。每个人将有从头到尾完成一个数据科学项目所需要的技能集的不同部分。数据科学中的角色实际上是一组互补的角色,每个角色都有一个特定的词汇。有数据科学家—但也有数据工程师和数据分析师!

我们意识到这对于该领域的新成员可能是混乱的。我们想揭示数据科学的不同角色,这样你可以了解领域内的细微差别——马上开始:

1.jpeg

数据科学家

数据科学家微调应用于数据的统计和数学模型。当有人运用统计学和算法的理论知识找到解决数据科学问题的最佳方法时,他们扮演了数据科学家的角色。当有人建立一个模型来预测下个月信用卡违约的数量,他们充当数据科学家的角色。

数据科学家将能够处理商业问题并将其转换为数据问题,建立预测模型来回答问题。

专注于实施数据统计方法的统计学家,以及专注于运行数据科学团队的数据管理员往往是数据科学家角色。

数据科学家是数据科学的编程与实现,数据科学理论和数据的商业影响之间的桥梁

你需要的技能:了解算法、统计学、数学知识和广泛的编程语言知识如R和Python。如何构造数据问题,从构建正确的问题到提出问题,到有效地传达结果的广泛知识。

薪水:数据科学家需要一套涵盖数据科学的理论、实施和传播的广泛技能。他们也往往是高薪酬团体,平均工资超过115,000美元。

工作职位范本:发布于Apple数据科学职位正在寻找既热衷于创建数据驱动系统又有统计编程经验的科学家。你能真正看到数据科学家在这个描述中的作用的多功能性!相关数据科学家在为Safari的Spotlight上提供快速搜索方面发挥重要作用。

典型专业:数学,经济学,计算机科学,物理学

Indeed.com上的职位:~22,000 (估计18%超过115,000美元的工资)

招聘数据工程师的行业:软件,医药,音响公司

美国最热门的招聘地点:纽约市,旧金山,西雅图

你会吸引他们的点:“我的分类器在第一次尝试中给了我93%的准确率![停顿]数据肯定出问题了……”

数据工程师

数据工程师主要依靠他们的软件工程经验来处理大规模的大量数据。多才多艺的多面手使用计算机科学来帮助处理大型数据集。他们通常专注于编码,清理数据集,以及实施来自数据科学家的请求。他们通常知道从Python到Java的各种各样的编程语言。当有人从数据科学家那里获取预测模型并用代码实现它,他们通常扮演一个数据工程师的角色。

专注于构建管理数据模型的技术的数据架构师,以及专注于管理数据存储解决方案的数据库管理员往往是数据工程师分类的一部分。

你需要的技能:深入了解数据存储和仓储解决方案(SQL和NoSQL的基础),并且编程框架,如Hadoop和Spark,可以帮助你获得数据并处理它。

薪水:数据工程师通过确保代码是干净的经常来实现数据科学,并且技术系统非常适合于分析的数据传输量。当涉及到薪酬,他们往往是中等薪酬,平均工资约为10万美元。

工作职位范本:Shopify是一家加拿大的初创公司,它允许你无需在代码中建立任何东西开一家电子商务商店。他们的数据工程师职位要求你有丰富的软件开发经验和丰富的数据库经验。他们正在寻找精通Python和Scala的人。他们需要“对数据感兴趣的软件和操作工程师。”

典型专业:计算机科学,工程学。

Indeed.com上的职位:~98,000 (估计17%超过115,000美元的工资)

招聘数据工程师的行业:软件,航空航天学,信息技术

美国最热门的招聘地点:旧金山,纽约市,西雅图

你会吸引他们的点:“我的数据管道将是完美的,如果不是为人们使用他。”

数据分析师

最后,数据分析师仔细检查数据,并提供报告和可视化来解释数据隐藏的是什么见解。当有人帮助全公司的人使用图表了解特定查询时,他们扮演了数据分析师的角色。

业务分析师是数据分析师的一个子集,他们更关心的是数据的业务含义和应该导致操作。公司应该更多的投资项目X还是项目Y?业务分析师将利用数据科学团队的工作来表明答案。

你需要的技能:数据分析师需要扎实掌握数据操作(使用诸如Excel之类的程序)和数据通信。

薪水:数据分析师往往是数据科学角色中报酬最少的,平均薪水约为6万5美元。这主要是因为数据分析师更多的是一个入门级的角色,需要更少的数据科学所需的技能。

工作职位范本:Stripe在网络上帮助世界上一些最大的网络平台处理网络支付。他们的数据分析师职位要求应聘人员,热衷于运用他们的分析技能来了解用户行为——并且他们将与业务和产品团队紧密合作,回答重要数据问题。

典型专业:工商,经济学,统计学

Indeed.com上的职位:~95,000

招聘数据分析师的行业:咨询,医疗保健,银行

美国最热门的招聘地点:纽约市,华盛顿特区,芝加哥

你会吸引他们的点:“Microsoft Excel很慢!”

提要

你可以粗略地说,数据工程师更多地依赖工程技术,数据科学家更多地依赖他们在数学和统计方面的训练,而业务分析师更多地依赖于他们的沟通技巧和领域专业知识。你可以肯定,扮演这些角色的人除了他们的专长外还有各种其他的技能。

2.png

技能集

从广义上讲,在数据科学中必须调和三种不同的技能。

1.算法:你理解数据科学的理论、统计、建模规则和数学是任何数据问题的核心。你了解如何设计和测量实验。你理解数据科学背后的算法和理论

2.工程:你了解源代码、处理和存储数据所需的工程。你应该了解编程语言和分布式计算模式,这将有助于你大规模处理大量数据。你应该理解将你的理论应用到于大规模数据集的编程。(工程)

3.交流:你了解如何沟通你的解决方案,并且如何将这些解决方案与业务问题相关联。

数据科学角色在实践中怎么样

让我们通过一个示例项目来看。一个数据科学团队可能被分配使用深度学习来分类图像,像Yelp的团队一样。

每天都有数百万的照片上传到Yelp,但可能很难得到你想要的每个餐厅的图片。有时,上传的图片都属于同一类别——也许它们都是食物的照片,或者餐馆的外面。餐馆的整体评价需要很多不同种类的图像。

你可以使用机器学习自动分类哪些图片属于什么类别。计算机可以在训练集的帮助下,告诉你一个图像是否在餐馆或食物的外面。

数据科学家将创建,将帮助机器创建这些区别的模型。从手动标记的照片到图像标题的关键字,他们能够思考他们需要的数据类型。

数据工程师将对系统进行工程设计,以获取所有的图像数据并存储,并实施一些由有规模的数据科学决定的算法。

数据分析师将查询并呈现更改的业务影响。它取悦用户了吗?由于最近的变化,Yelp产生多少流量?这些都是数据分析人员会问的问题——然后,他们会交流他们发现的见解。

数据科学榜样简介

数据科学家

3.jpeg

DJ Patil,美国首席数据科学家,他是数据科学家的完美原型。他从应用数学博士那里学到了对数学深刻的理解。他创造了多个数据产品,并与各种数据科学角色的人合作。他有领导战略并带领团队建立了LinkedIn数据的全新扩展,从创建“你可能认识的人”到人才匹配,一个自动提供Linkedin上发布的任何工作的最佳人选的功能。

数据工程师

4.jpeg

Doug Cutting,Hadoop的创始人,也是Apache董事会的成员,他致力于创建技术解决方案来存储和处理大规模数据。Hadoop广泛用于在多个硬件服务器上分发数据,以便巨大的数据集可以变得可管理。Doug Cutting是数据工程师的典范,他现在是Cloudera的首席架构师,Cloudera是世界上最大的数据工程组织之一。

数据分析师

5.jpeg

笔者,虽然远不及上面提到的两个人有才华,在一个制药公司做了很短一段时间的数据分析员。他用Excel分析销售渠道,并与他的主管分享了Powerpoint中的数据,以确定预算选择。他是这种能力的数据分析师。

结论

数据科学是一个新的,令人兴奋的领域,它需要符合具体定数据科学角色的个人聚在一起,解决前沿问题。我们希望解密真正了解这些角色如何协同工作——在我们的职业生涯指南中有更多!

英文原文:https://www.springboard.com/blog/data-science-career-paths-different-roles-industry/
译者:小雨
 

2月15日11:00到13:00网站停机维护,13:00前恢复