当人类需要回答关于数据的棘手问题时
当人类需要回答关于数据的棘手问题时,怎样才能做到游刃有余?
数据科学和机器学习专业人员知道如何从数据中寻求答案:这可能是他们工作的核心支柱。然而,当我们看一些围绕着数据的棘手问题时,情况就变得复杂了,从内置的偏见到它可以为可疑目的利用的方式。
随着年底临近,我们邀请读者探索近年来引发重要讨论并几乎肯定会继续塑造这个领域的一些大局观问题。
本周的重点关注多个主题,从数据支持的知识本身的性质到在特定领域(如医疗保健)中的应用;我们希望它们能激发进一步的思考,并吸引新的参与者加入这些重要的对话。
- 偏见、有毒性和越狱大型语言模型(LLMs)快速崛起和演变的LLMs使从业人员很难停下来审视它们固有的风险。 Rachel Draelos,MD,PhD对近期研究的详细概述提供了对它们在规模上延续、甚至加剧偏见和有毒性的能力的及时了解。
- 哲学与数据科学 – 深入思考数据认识论中的主要概念,如演绎和归纳推理、怀疑主义和实用主义,如何影响数据科学家的工作? Jarom Hulet最新的文章探讨了这两个领域之间(有时出乎意料的)交叉点。
- 数据科学中的认知偏见:类别大小偏见在关于认知偏见的新系列中,Maham Haroon解析了我们的大脑在分析和从数据中获得洞见时可能引起我们误入歧途的多种方式。该系列的第一篇聚焦于类别大小偏见,并解释了它如何渗入数据科学家在日常工作中做出的假设。
- 人工智能在医疗保健中应扮演何种角色?到目前为止,我们已经提到的偏见可能对模型、企业和利润带来巨大破坏。正如Stephanie Kirmer所强调的那样,它们在像医疗保健这样的领域中变得更加严重,因为生死攸关的情况很常见,而“失败的风险是如此灾难性的。”
- 变压器的挽歌?在一个快速变化的领域里,将一个6年前的概念视为重要和永恒的是很诱人的。变压器自2017年以来一直存在,并在人工智能工具的主流采用中发挥了重要作用;然而,正如Salvatore Raieli所指出的,它们也可能有一段寿命,并且现在是一个好时机来思考接下来会出现什么。
大问题很有价值,但中型和紧凑问题也是有用的!不要错过我们最近关于职业转变、数据工程和其他及时主题的一些亮点:
- 我们如何让模型忘记我们不再希望它们保留的信息? Evgeniya Sukhodolskaya提出了一种基于数据驱动的方法,用于生成语言模型的“遗忘”过程。
- 在新的一年中考虑角色转换?Thu Vu最近分享了一份详细的路线图,供所有有兴趣转向数据分析的人参考。
- 对于图神经网络领域的尖端研究,请参阅Michael Bronstein最新文章(与共同作者Ben Finkelshtein、Ismail Ceylan和Xingyue Huang合作)。
- 如果你是一名害怕补充的数据工程师,Xiaoxu Gao的指南将为你提供高效的实施方法,帮助你简化这个工作流程。
- 对scikit-learn还不熟悉?最近,Yoann Mocquin推出了一系列面向初学者的sklearn指南,逐步介绍这个流行的机器学习库的不同模块和特性。
- LLMs的SQL会是什么样子?Mariya Mansurova详细介绍了语言模型查询语言(LMQL),它允许用户在一个提示中组合多个调用、控制输出并降低成本。
非常感谢您对我们作者的支持!如果您喜欢在TDS上阅读的文章,请考虑成为VoAGI会员之友:这是一个全新的会员级别,为您最喜欢的作者提供更丰厚的奖励,以表彰他们的卓越写作。
感谢您一直以来的支持,
TDS编辑部