吃过你的零食了吗?是时候展示数据科学的诀窍了
展示数据科学的诀窍前,先品尝你的美食享受吗?
在TDS,我们对详细的指南有着特别的喜好,但我们也欣赏着瞄准数据科学家在日常工作中所面临的具体挑战和困扰的专注文章。
为了庆祝这些非常有用和实用的文章,本周的变量专栏把聚光灯投向了我们的技巧与窍门专栏的最新亮点:它们提供了可操作的、经得起时间和努力考验并能在您的项目中产生更好结果的建议和实用方法。不管您这周是否已经享受了您的固定待遇(对于那些庆祝万圣节的人来说已经是晚了),我们希望这些窍门将激发您找到新的方法或工具进行实验。
- 简化探索性数据分析中的重复任务探索性数据分析有时因为是你必须完成的单调阶段而声名狼藉,才能达到更有趣的建模和预测工作的阶段。Christabelle Pabalan最近分享了一种聪明的方法,为这个过程增加了一层自动化,但没有牺牲关心和精确性。
- 探索Pydantic V2增强的数据验证能力Pydantic是“最广泛使用的Python数据验证库”,是许多数据从业者的首选工具。Lynn Kwong对Pydantic V2进行了概述,提供了关于充分利用其最新改进的具体提示,其中包括支持严格模式和在没有模型的情况下验证数据的可能性。
- 6个与索引相关的常见操作,您应该了解Pandas考虑到Pandas在数据科学工作流程中的普及度,深入了解其功能并扩展数据框处理的有效方式永远不是一个坏主意。Yong Cui的新博文聚焦于与索引相关的操作,并使用简单的现实用例进行了解析。
- 如何在数据可视化中使用颜色如果您一直将图表和绘图中的颜色选择视为事后思考,Michal Szudejko关于正确使用颜色的提示手册肯定会让您重新考虑您的方法。从可访问性到调色板选项,您将了解如何进行微小的调整可以使您的可视化更清晰,并帮助它们成为更强大的叙事工具。
- 释放Julia超类型的威力对于越来越多的朱莉亚爱好者来说,Emma Boudreau关于抽象和如何有效地将其纳入您的代码的实践资源是一本必读书籍,它详细介绍了您可以以最小的工作开始创建自己的超类型的方式
我们希望您还有空间多享受一些额外的好书,因为我们不希望您错过这些关于其他主题的精彩文章:
- AI生成内容的普及将如何影响LLM培训的质量?Aicha Bokbot探讨了人们对可持续发展AI工具的新关注点。
- 在Emmanouil Karystinaios的迷人项目中,音乐与机器学习相结合,试图自动化和声分析。
- 想要构建和发布一个R数据包吗?Deepsha Menghani为实现这个目标提供了一份利用devtools的逐步指南。
- 使用混合搜索、层级排序和讲师嵌入式,Agustinus Nalwan试图解决在特定领域搜索中使用RAG的一个重大挑战。
- 对于对AI创业生态系统的现状的清晰反思,请不要错过Clemens Mewald最近的深度探索,它解释了为什么LLMs已经成功走向主流,而MLOps工具却没有。
- 对于可悲地存在的质疑数据黑客行为,Hennie de Harder提供了一个有关统计概念背后的有益观察。
感谢您对我们作者的支持!如果您喜欢在TDS上阅读的文章,请考虑成为VoAGI会员 — 这将解锁我们整个档案库(以及VoAGI上的其他所有文章)。
在下一位编者发表之前,
TDS编辑们





