掌握数据叙事的艺术:数据科学家指南

如何通过掌握数据故事讲述的艺术来展现您酷炫的数据科学见解

如果你正在考虑成为一名数据科学家,或者已经是一名数据科学家,那么你一定已经了解了所需的技能。你需要掌握一门编程语言,了解数学统计学,能够创建数据可视化等。

如果你正在考虑成为一名数据科学职业人员并需要一些指导,请查看本文:五步成为数据科学职业人员。

虽然你的大部分时间将花费在数据准备阶段,试图找到和清理数据,但数据科学还有其他重要的要素。

一旦你找到了有价值的见解,如果它是趋势、模式,或通过可视化呈现,那么你就需要能够解释这些。作为一名数据专业人士,非技术人员很难理解技术语言。

如果你是一个技术人员,向非技术人员传达你的信息可能是具有挑战性的。你不仅会遇到非技术人员,还可能会和喜欢通过可视化或项目概述来解释的人打交道。

因此,一旦你找到了你的发现,你将需要迎合各种人的需求 – 如何掌握这些可以很困难,但是可以实现。

让我们开始吧……

非技术语言

作为一名数据科学家,我明白很多利益相关者或经理并没有技术背景。因此,你们团队中的一些术语对他们来说将是陌生的。例如,F1分数或交叉验证。

想象一下老师向学生解释一个主题的方式,并将其放在你解释给观众的前面。用每个人都能理解的语言翻译你的数据科学术语。如果你无法替换特定的数据科学术语,解释其含义也没有害处。用技术词汇失去观众的注意力会造成更大的伤害。

数据可视化

不同的人用不同的方式学习。有些人可以读一遍教科书就懂了。有些人需要颜色编码。有些人需要可视化。在展示你的发现时,不要局限自己,陷入困境,必须回答1000个问题。可视化可以为你回答问题。

数据可视化将使你的观众对你所采取的步骤和你的发现有一个视觉上的理解。当你在背景中谈论可视化时,他们的眼睛正在学习并理解你所说的话。

总结

在你的演示结束时,确保有一个总结页面,列出你的所有重要要点和数据可视化供观众查看。在这段时间里,你应该对观众提出的问题持开放态度,以便他们可以不断地查看总结板来提出新问题。

观众提问并不是一件坏事,它表明他们一直在听,他们感兴趣,他们想学习和了解更多。

三幕式叙事

以上是你的叙事中会使其有效的元素。然而,结构是使你的数据叙事成功的关键。

三幕式叙事是一种在叙述小说中广泛使用的流行模型,将故事分为三个部分:

设定

目标:以最清晰的方式陈述你试图解决的问题。

这包括项目介绍,说明项目的目的,你试图解决的问题等。在设定阶段,从数据科学的角度,你将更深入地研究问题或问题,为项目的目标提供背景。你的项目目标将等同于你的第一要点。

对抗

目标:向观众解释为什么解决这个问题很重要,以及你为解决这个问题所走的不同路径。

在对抗部分,你可以继续谈论手头的任务,以及为什么公司一开始会面临这个问题。你希望保持观众的兴趣和好奇心,因此谈论公司面临的问题总是会吸引利益相关者。

为了完成手头的任务,向读者逐步解释您经历的不同路径及每个路径的结果。数据科学项目中采取的不同步骤将反映不同的关键点,例如点2、点3等。

向受众提供您遇到的失败和障碍的背景和原因,有助于在您得出解决方案后建立受众之间的信任和理解。

解决方案

目标:解释您可以提供的解决方案,以解决问题并确保受众满意。

这是受众从关注到放心的地方。您的解决方案应说明如何克服以前的失败和障碍。在此部分中开放问题,因为您的受众将希望对您的数据洞察力充满信任,并相信这是正确的方法。

一旦受众感到放心,您可以开始总结并谈论需要采取的行动,以确保任务成功。

金字塔原则

另一种非常有效的结构是金字塔原则。这是一种有效的沟通工具,用于向繁忙的高管清晰地传达复杂问题。其目的是书写中的想法应始终形成一个单一思想下的金字塔。

所以让我再详细解释一下。当与想了解您的数据见解但时间紧或急于知道解决方案的繁忙高管打交道时,金字塔原则是正确的方式。

它分为3部分:

您的答案

在这种情况下,您的答案将是完成任务的解决方案。这是您希望受众了解的主要观点。这是关键信息,您希望重点围绕这个主要观点-解决方案。

支持论据

一旦您陈述了解决方案,下一步是说服受众这是正确的方法。为了做到这一点,您必须带领他们通过高水平的支持论据之旅。在此过程中,您的受众可能会心存疑问。

支持事实/数据

在此过程中,将回答您的受众可能有的所有可能问题。每个支持论据都需要有数据和事实来支持,以确保您的受众知道您已经做好了功课,而您的初始答案/解决方案不是凭空出现的。

总结

使用非技术语言和可视化技巧,在三幕故事或金字塔原则两种结构中,您可以掌握数据叙事的艺术。

您选择哪种结构取决于您对受众的了解程度。您可以尝试这两种结构,看看哪种最有效。衡量结构对您的受众的有效性的好方法是注意哪种结构有较少的问题。您的受众提出的问题越少,您的叙事就越成功。Nisha Arya是数据科学家,自由职业技术作家和小猪AI的社区经理。她特别感兴趣为数据科学提供职业建议或教程以及理论知识。她还希望探索人工智能以不同方式如何受益于人类寿命的不同方面。她是一位热心的学习者,希望扩大自己的技术知识和写作技能,同时帮助指导他人。