当人类需要回答关于数据的棘手问题时

当人类需要回答关于数据的棘手问题时,怎样才能做到游刃有余?

数据科学和机器学习专业人员知道如何从数据中寻求答案:这可能是他们工作的核心支柱。然而,当我们看一些围绕着数据的棘手问题时,情况就变得复杂了,从内置的偏见到它可以为可疑目的利用的方式。

随着年底临近,我们邀请读者探索近年来引发重要讨论并几乎肯定会继续塑造这个领域的一些大局观问题。

本周的重点关注多个主题,从数据支持的知识本身的性质到在特定领域(如医疗保健)中的应用;我们希望它们能激发进一步的思考,并吸引新的参与者加入这些重要的对话。

Bozhin Karaivanov在Unsplash上的照片
  • 人工智能在医疗保健中应扮演何种角色?到目前为止,我们已经提到的偏见可能对模型、企业和利润带来巨大破坏。正如Stephanie Kirmer所强调的那样,它们在像医疗保健这样的领域中变得更加严重,因为生死攸关的情况很常见,而“失败的风险是如此灾难性的。”
  • 变压器的挽歌?在一个快速变化的领域里,将一个6年前的概念视为重要和永恒的是很诱人的。变压器自2017年以来一直存在,并在人工智能工具的主流采用中发挥了重要作用;然而,正如Salvatore Raieli所指出的,它们也可能有一段寿命,并且现在是一个好时机来思考接下来会出现什么。

大问题很有价值,但中型和紧凑问题也是有用的!不要错过我们最近关于职业转变、数据工程和其他及时主题的一些亮点:

  • 我们如何让模型忘记我们不再希望它们保留的信息? Evgeniya Sukhodolskaya提出了一种基于数据驱动的方法,用于生成语言模型的“遗忘”过程。
  • 在新的一年中考虑角色转换?Thu Vu最近分享了一份详细的路线图,供所有有兴趣转向数据分析的人参考。
  • 对于图神经网络领域的尖端研究,请参阅Michael Bronstein最新文章(与共同作者Ben Finkelshtein、Ismail Ceylan和Xingyue Huang合作)。
  • 如果你是一名害怕补充的数据工程师,Xiaoxu Gao的指南将为你提供高效的实施方法,帮助你简化这个工作流程。
  • 对scikit-learn还不熟悉?最近,Yoann Mocquin推出了一系列面向初学者的sklearn指南,逐步介绍这个流行的机器学习库的不同模块和特性。
  • LLMs的SQL会是什么样子?Mariya Mansurova详细介绍了语言模型查询语言(LMQL),它允许用户在一个提示中组合多个调用、控制输出并降低成本。

非常感谢您对我们作者的支持!如果您喜欢在TDS上阅读的文章,请考虑成为VoAGI会员之友:这是一个全新的会员级别,为您最喜欢的作者提供更丰厚的奖励,以表彰他们的卓越写作。

感谢您一直以来的支持,

TDS编辑部