成功应对初级数据科学求职面试的更多技巧

初级数据科学求职面试成功应对的更多技巧

 

之前的九个技巧涵盖了给初学者数据科学家的明显建议。

以下一轮面试技巧处理如何在求职中展现自己是最佳候选人的更微妙方面。

在我的上一篇文章基础上,这些建议将进一步提高您在初学者数据科学家面试中的成功率。

 

1. 准备一个作品集

 

创建一个数据科学项目作品集是展示您是一名优秀数据科学家的最佳途径之一。

初学者很难选择适合他们作品集的合适项目。您可以从这些一些数据科学项目创意开始。您还可以从Datacamp的建议StrataScratch上的数据项目中了解。

 

 

2. 使用领域知识进行编码实践

 

领域知识指的是您对特定行业、领域或主题领域的了解。这种知识包括特定领域的复杂性、挑战、术语、流程和细微之处。

这种知识应该在您的编码技能中得以反映,因为您将使用这些技能为特定行业内的特定公司解决问题。

当您进行编码练习时,最好选择来自您正在面试的公司的真实问题进行练习。我在第一篇文章中提到了StrataScratch和LeetCode

当然,您也可以练习其他不直接来自面试的挑战。但是,当您选择挑战时,尽量寻找相关行业的数据科学面试问题和数据集。比如您面试Meta(科技行业)和Pfizer(制药行业)。这些公司使用完全不同的数据,表现也不同,自然问题也会不同。因此,对于Meta使用技术/社交媒体数据,而对于Pfizer使用制药数据。

这样,您也可以确保自己在提高领域知识的同时进行编码实践。

 

3. 展示您的数据故事讲述技巧

 

数据故事讲述意味着您可以清晰、易懂地传达您的数据项目中的见解。想想您为什么开始某个项目以及您所取得的成就;其中总有一个故事。

通过从您的项目中创造一个故事,您将使数据对非技术人员更易于理解。反过来,您对决策过程将有更多影响力。

以下是一些展示此技巧的提示。

编写一个故事:任何好故事都有起伏:引子、问题、上升、高潮、下降和解决。在使用数据讲述您的故事时,请加入这些元素。

您可以从业务背景开始,例如:“公司在过去三年中推出了五个新产品。”然后是问题。您发现销售额正在增长,但客户保留率没有。现在,您将深入挖掘数据并尝试找出保留问题的原因。在此过程中,您的故事应深入探讨项目的技术细节:您做了什么以及原因。高潮是当您发现一个销售额高但退货率也高的产品。下降是当您讨论高退货率的潜在原因。在解析中,您可以就产品改进提出建议。解决方案中,直接描述您的项目实现了什么,并量化其成就。不要让您的故事在提出产品改进建议后结束,而是讲述该产品的销售增长,公司获得的收益等具体数据。

使用清晰的可视化: 使用支持您故事的可视化。

在您关于过去几年销售趋势的项目中,不要只显示一个包含月销售数据的表格。相反,使用折线图来直观地表示销售的起伏。这样,观众会掌握趋势。对于销售量显著增加的情况,使用条形图按产品或产品类别分解销售情况,突出显示推动增长的产品。

避免术语和简化复杂概念: 只在必要时使用技术术语。重点是向商业人士“销售”(甚至字面上)您的想法和项目,因此要为他们简化复杂的概念。不要说:“残差中的异方差性表明我们的线性回归模型可能不是最好的拟合。”而是说:“我们数据中的模式表明我们的初始模型可能没有有效地捕捉到所有信息。”好得多!

4. 讨论失败和学习

我们都会犯错误。在学习过程中它们是必不可少的。面试官不会寻找完美的候选人;他们正在寻找愿意并能够学习的人。

让面试官了解你这一面。如果你真诚地分享你的失败和你从中学到的东西,这将建立信任并展示你的挫折适应能力。

以下是有关如何谈论这一点的一些建议。

避免推卸责任: 避免责备每个人和每件事都造成你的错误。当然,提供与你无法控制的环境相关的背景,但不要扮演受害者。承担自己的责任,展示你从这些情况中学到了什么,并谈论你应该做出不同的事情。

强调学习,而不是失败部分: 谈论失败只应该用来展示你从中学到了什么,所以要着重这一点。

从经验中谈论: 找一个来自你以前的工作的真实例子。即使它与数据科学无关,如果它能展示你对学习和自我意识的关注,也许是适用的。如果你没有工作经验,谈谈你在数据项目中犯过的错误以及你学到了什么。

谈论你所采取的步骤: 这与你为纠正错误或减少影响所采取的行动有关,例如更改数据、调整算法,或者干脆放弃项目重新开始。

以下是你(Y)和面试官(I)之间可能会出现的对话。

I: “你能告诉我一个项目或任务计划中的事情未如预期,并说明你是如何处理的吗?”

Y: 当然!在我之前担任数据科学家的角色时,我负责一个旨在预测客户流失的项目。我根据我最初的理解选择了最近邻算法并进行了运行。然而,结果并不如我希望的那样准确。

I: 为什么会这样?你在意识到这一点时做了什么?

Y: 有一些数据不一致,而且截止日期非常紧迫,所以我的数据探索(EDA)不是非常彻底。尽管如此,我现在意识到我应该进行更详细的数据探索(EDA)。在发现不一致性后,我与数据质量团队合作更好地了解它们。我还探索了其他算法并进行了评估。最后,我切换到了XGBoost算法,这显著提高了模型的预测准确性。我学到了不要低估数据探索(EDA)的重要性。我也很高兴自己敢于承认错误并从零开始,因为我们将没有用处的模型是我们不能信任的。

结论

数据科学不仅仅是机械地处理数据和编写代码。它还涉及通过数据叙事和可视化将您的工作转化为普通人的语言能力。

通过在面试中谈论这一点,您将展示这一能力。您需要确保自己不仅能说会道,还能证明自己能实际做出成果。最好的方法是有一个坚实的数据项目组合,其中您的编码、叙事和可视化技能将变得明显。

在项目中工作时,您会犯错误。不要隐藏它们。公开谈论它们并寻求面试官的反馈。

归根结底,有两个简单的事情:要有能力,并坦诚地说明你是如何取得这些成就的。说起来容易做起来难!

但是通过这篇文章我给你的一些建议,我相信你在下一次数据科学面试中会做得很好!

****【Nate Rosidi】(https://twitter.com/StrataScratch)**** 是一位数据科学家和产品策略师。他还是一名教授分析学的兼职教师,并且是StrataScratch的创始人,这是一个帮助数据科学家准备来自顶级公司的真实面试问题的平台。与他在Twitter: StrataScratchLinkedIn上联系。