掌握数据宇宙:打造蓬勃发展的数据科学职业的关键步骤

数据科学职业的蓬勃发展:掌握数据宇宙的关键步骤

要在数据科学领域取得成功的职业生涯,您需要加强我认为是该领域的六个主要支柱:技术技能、建立作品集、建立人际关系、软技能,并最后发展一种特定专长。一旦您具备了这些要素,还需要在面试阶段表现出色。

太多准数据科学家认为这一切都与技能有关,并忽略了人脉网络。或者您依靠人脉关系来获得工作面试机会,但承受不住压力,并不能充分展示您的技能。

1.教育和技能发展

这些部分没有真正的选择性,但这可能是其中最重要的一部分。如果您不认识合适的人,或者您的作品集不完美,您可能会意外获得一份工作,但如果您没有合适的技能,您将无法获得工作。或者更糟糕的是:您可能会获得工作,但您将遭受失败。并被解雇。

这是您应该关注的内容:

学习基础知识

每个数据科学工作都需要扎实的数学、统计和程序设计基础。熟练掌握像Python或R这样的语言是必不可少的。几乎每个数据科学职位的描述都会提到这两种语言之一。

我还建议您考虑学习SQL作为基本要求。 SQL数据库是数据科学家生活的现实。而且这是一种相对简单的语言。

机器学习和数据处理

这不仅仅是AI的最近崛起;数据科学家一直需要精通机器学习。您将需要熟练掌握机器学习算法、数据预处理、特征工程和模型评估。

数据可视化

数据科学家的发现如果无法传达给他人就是毫无价值的。这是通过图表和其他类型的数据可视化进行的。您需要掌握数据可视化工具和技术,以有效地向公司的关键利益相关者传达来自数据的洞察。

当我也谈到软技能时,我会再深入讨论这个问题 – 沟通是一项至关重要的技能。

大数据技术

那些曾处理过小数据的数据科学家的日子已经过去,如果它们曾经存在过。如今,您需要非常熟悉大数据和相关工具。即使您的公司没有处理真正的“大”数据,他们也会渴望处理。

熟悉处理大数据集的工具,如Hadoop、Spark和云平台。

2.构建强大的作品集

进行到第二支柱:您的作品集。

如您所知,合格的数据科学家很少。计算机编程班的毕业生登场填补了这一空缺。这引发了一个新问题:缺乏信任。事实上,公司知道并不是所有人必须拥有学位才能做好工作。然而,一些糟糕的编程班也给那些渴望成为数据科学家的人带来坏名声,因为许多编程班只培养出一些连联接和子查询都不懂的“毕业生”。因此,您的个人作品集是一个证明您知道自己在做什么的机会(而且值得注意的是,计算机编程班费用非常昂贵,尤其是与目前稍微不太乐观的就业前景相比)。

这是您需要的内容:

个人项目

进行有关您技能展示的个人项目。这些可以是Kaggle竞赛、开源贡献或您自己的数据分析项目。您可以维护一个组织良好的GitHub存储库,展示您的项目、代码示例和贡献。

博客或网站

考虑创建一个博客或个人网站,您可以在其中分享与数据科学相关的见解、教程和案例研究。虽然有可能作弊并雇佣某人为您做这个,但花费高昂且耗时,很少有人试图伪造它。博客可以作为您知识的精彩展示。

要准备好解释您的项目、方法和问题解决方法。复习常见的数据科学面试问题和编码挑战。

3. 社交网络

无论在哪个领域,要记住求职的黄金法则:多达70%的工作岗位从不公开招聘。这是一个旧的统计数据,但即使是20%到30%,也能证明您认识的人很重要。更不用说多达三分之一的工作职位实际上是假的,旨在让公司看起来比实际情况更成功。个人关系网络可以帮助您避免浪费时间。

以下是您应该做的事情:

加入专业网络

加入数据科学社区,并参加见面会、会议和网络研讨会,与该领域的其他专业人士建立联系。这种更正式的方法可以帮助您结识合适的人,产生影响并及时了解当前事件。

社交媒体

更不正式地说,您还应该在LinkedIn、Twitter和相关论坛上进行互动,分享您的工作和见解,并向他人学习。

4. 软技能

记住,硬技能只是战斗的一半。这就是为什么您需要确保不忽视软技能。我并不是说软技能更重要。硬技能与软技能是一种虚假的二元状态──它们都重要。但人们不雇佣数据科学机器,他们雇佣的是人。以下是我建议关注的领域:

沟通

还记得那个数据可视化技能吗?数据科学家需要有效地向非技术干系人员沟通复杂的技术发现。一个数据科学家的工作实际上很大一部分是解释为什么市场营销人员应该理解那个漂亮的图表。

解决问题

这个词汇在某种程度上已经变得毫无意义,所以确保您真正理解“解决问题”的含义。在数据科学的背景下,解决问题不仅仅是调试。它还包括了知道何时与不同部门合作,何时重新设计项目的技术栈以满足新的规格要求,或者在测试数据集上出现问题时重新检查模型。

批判思维

这个几乎成为时髦词汇,值得更深入地思考。批判思维意味着能够从多个角度分析数据,质疑假设,并以创造性的方式得出有意义的观点。

团队合作

数据科学家不是独自工作的。您将与网络开发人员、数据分析师、业务分析师、市场人员、销售人员和高管一起工作。与跨职能团队合作,了解业务需求,并对齐数据驱动的解决方案。

5. 行业专长

您没有听说吗?我们正处于招聘的技术冬天中。风险投资的资金不像以前一样流动,公司正在收紧腰带。这不是成为全才的好时机。您需要专攻才能生存。

选择一个领域

数据科学涵盖了医疗保健、金融、电子商务等多个行业。在特定领域专注可以让你对该领域的雇主更具吸引力。寻找你自然感兴趣的领域,或者你可能已经有额外知识的领域。

领域知识

获取与你想要从事的行业相关的领域特定知识。这有助于你理解数据的细微差别,并做出更明智的决策。例如,如果你想在谷歌工作,你就需要了解搜索算法和用户行为的复杂性。

6. 面试

最后,但绝对不是最不重要的:为面试做准备。你可以掌握前面五个要点,但在最后一刻跌倒。以下是我建议你做的准备:

解释

你可以了解一个概念,却不能够向他人解释清楚。在面试中,你必须准备好解释你的项目、方法论和解决问题的方法。

花些时间确保你不仅完全理解你所做的事情、为什么这么做,以及为什么对你所有的项目都有效,还要确保你能够解释得足够好,以至于一个外行人也能理解。(这也是练习”沟通”软技能的好方法。)

编码准备

白板是编码面试中著名的一个要点,但很多人面对那个空白的白板时会感到恐慌。你越早练习面试题,在面试当天承受的压力就会越小。

如何发展成功的数据科学职业

假装这里有一个单一正确答案,或者可以在一篇文章中解释清楚,这有点自不量力。希望本博客文章更像一张地图,而不是一个全面的解决方案。实践数据科学工作的这六个要点,你将成功走上自己想要的数据科学职业之路。

****[Nate Rosidi](https://twitter.com/StrataScratch)**** 是一名数据科学家和产品战略师。他还是一名兼职教授,教授分析学,并且是StrataScratch的创始人,该平台帮助数据科学家通过来自顶级公司的真实面试问题准备面试。你可以在Twitter: StrataScratchLinkedIn上与他联系。