回到基础 第二周:数据库,SQL,数据管理和统计概念

探索基础:数据库、SQL、数据管理和统计概念 - 第二周

 

加入VoAGI的归于基础途径,帮助你开始新的职业或者刷新你的数据科学技巧。归于基础的途径分为4周,还有一个额外的周。我们希望你能把这些博客当作课程指南。

如果你还没有看,可以看一下第一周: 归于基础第一周:Python编程和数据科学基础知识

进入第二周,我们将学习数据库、SQL、数据管理和统计概念。

  • 第1天:数据科学中的数据库介绍
  • 第2天:用5个步骤开始学习SQL
  • 第3天:数据科学中的数据管理原则
  • 第4天:处理大数据的工具和技术
  • 第5天:数据科学中的统计学理论和概述
  • 第6天:在Python中应用描述性统计和推论统计
  • 第7天:假设检验和A/B测试

 

数据科学中的数据库介绍

 

第2周 – 第1部分: 数据科学中的数据库介绍

了解数据库在数据科学中的重要性。还学习关系数据库的基础知识、NoSQL数据库的分类等。

数据科学涉及从大量数据中提取价值和见解,以推动业务决策。它还涉及使用历史数据构建预测模型。数据库能够有效地存储、管理、检索和分析此类大量复杂的数据。

因此,作为数据科学家,你应该了解数据库的基础知识。因为它们能够存储和管理大而复杂的数据集,实现高效的数据探索、建模和洞察。

 

用5个步骤开始学习SQL

 

第2周 – 第2部分: 用5个步骤开始学习SQL

在关系型数据库中管理和操作数据时,结构化查询语言(SQL)是重要的技术。SQL是一种主要的领域特定语言,是数据库管理的基石,提供了一种标准化的与数据库交互的方式。

由于数据驱动决策和创新,SQL仍然是数据分析师、开发人员和数据科学家需要高度关注的重要技术。

这份全面的SQL教程涵盖了从设置SQL环境到掌握连接、子查询和优化查询性能等高级概念的全部内容。通过逐步示例,本指南非常适合初学者提升其数据管理技能。

 

数据科学中的数据管理原则

 

第2周 – 第3部分: 数据科学中的数据管理原则

了解数据科学家应该了解的关键数据管理原则。

在作为数据科学家的旅程中,你会遇到各种挑战,并克服它们。你将学习一种过程比另一种过程更好的方法,以及根据手头的任务使用不同的过程。

这些过程将紧密合作,确保你的数据科学项目尽可能有效,并在你的决策过程中发挥重要作用。

 

处理大数据的工具和技术

 

第2周 – 第4部分: 处理大数据的工具和技术

在如大数据这样广阔的领域中,你该从哪里开始?使用哪些工具和技术?我们对此进行了探讨,并谈论了大数据中最常见的工具。

已经过去了商业世界只需要在“小黑本”中找到所需数据的时代。在这个数字革命的时代,甚至传统数据库也不够用。

处理大数据已成为企业和数据科学家的关键技能。大数据以其数量、速度和多样性而闻名,可以提供前所未有的模式和趋势见解。

要有效处理这样的数据,需要使用专门的工具和技术。

 

数据科学中的统计学:理论和概述

 

第2周 – 第5部分:数据科学中的统计学:理论和概述

高级探索统计学在数据科学中的作用。

你是否有兴趣掌握统计学,以在数据科学面试中脱颖而出?如果是的话,你不应该只是为了面试而这样做。了解统计学可以帮助你从数据中获得更深入和更细致的见解。

在本文中,我将展示最关键的统计学概念,以便更好地解决数据科学问题。

 

应用描述性统计和推论统计于Python

 

第2周 – 第6部分:应用描述性统计和推论统计于Python

在你的数据科学之旅中不断进步时,你应该知道以下基本统计学知识。

统计学是一个涵盖从收集数据和数据分析到数据解释的领域。它是一门帮助相关方在面临不确定性时做出决策的研究领域。

统计学领域的两个主要分支是描述性和推论性。描述性统计学是一门与使用各种方式进行数据总结(如摘要统计、可视化和表格)相关的学科。而推论统计学更多地是基于数据样本进行种群概括。

 

假设检验和A/B测试

 

第2周 – 第7部分:假设检验和A/B测试

数据驱动决策的基石。

在数据统治的时代,企业和组织不断寻求利用数据的方法。

从你在亚马逊上推荐的产品到你在社交媒体上看到的内容,背后都有一种精细的方法。

而这些决策的核心是A/B测试和假设检验。

但它们究竟是什么,为什么它们在我们以数据为中心的世界中如此关键?让我们一起来探索吧!

 

总结

 

祝贺你完成第2周的学习!

VoAGI团队希望《回归基础路径》为读者提供了全面且结构化的方法,帮助他们掌握数据科学的基本原理。

第3周的内容将在下周一发布,请继续关注!

****[Nisha Arya](https://www.linkedin.com/in/nisha-arya-ahmed/)****是一名数据科学家和自由技术作家。她特别喜欢提供数据科学职业建议或教程,并提供围绕数据科学的理论知识。她也希望探索人工智能对人类寿命增长的不同方式。作为一个渴望拓宽自己技术知识和写作能力,并帮助指导他人的热心学习者。