线性代数1:线性方程和方程组

线性代数入门:线性方程与方程组

来自Städel博物馆的图片

线性方程组

前言

这是关于机器学习背后的基础数学——线性代数的连续系列文章中的第一篇。与David C. Lay、Steven R. Lay和Judi J. McDonald合著的《线性代数及其应用》一书一同阅读,可以让读者更好地理解本文。可以将这个系列看作是一个外部的辅助资源。

通过这些文章,我希望巩固自己对这些基础概念的理解,并以一种直观的学习数学的方法为他人提供更清晰的解释。如果有任何错误或我需要进一步展开的地方,请分享给我,我会进行必要的修改。

背景

线性方程和线性方程组在金融、工程、化学、计算机科学、统计学、物理学等领域具有多种实际应用。在化学中,线性方程用于平衡化学反应和计算反应物和产物的数量。线性代数的这个基石还出现在物理学中,线性方程用于描述物体的运动,帮助计算距离、速度和加速度,并在热力学中模拟热量传递和能量流动。金融领域依赖线性方程和方程组进行预算和投资组合分析,而工程师可能使用相同的工具进行结构分析,模拟建筑物中的力和应力。线性代数是无处不在的;每个人都能在某种程度上欣赏它。

线性方程

一个线性方程是一个包含一个或多个变量的方程,对于每个变量,变量的指数必须为1。它可以写成这样的形式:a₁x₁ + a₂x₂ + … + 2ᵣxᵣ = b。值[a₁,a₁,…,aᵣ]和b被称为线性方程的系数

线性方程的例子包括:2x + 5y = 10,6x = 18,7v + 8w + 0x + 2y + 3z = 15,以及3x₁ + 4x₂ + 5x₃+9x₄ + 10x₇ = 3。

非线性方程的例子是2x² + 6x + 5 = 2;这是一个二次方程的示例。另一个非线性方程的例子是7x₁ + 3x₂ = x₁* y₁;当你绘制这个方程时,其中的原因变得明显,它可以重排成形成有曲线的有理函数y = 7x / x – 3。

考虑线性方程2x + 5y = 10。下面的图示展示了线性方程的图形表示,你会注意到它是一条直线。当你回忆线的方程:y = mx + b,其中m是斜率,b是y轴截距时,这一点变得更明显。线性方程可以按照下面所示的方式重新排列,以符合这个形式。

可以得出以下结论:所有落在这条直线上的(x,y)点都是方程2x + 5y = 10的解。例如,假设我们选择x轴截距点(5,0),并将x和y的值代入方程中的相应位置,2(5) + 5(0) = 10。线上的任何(x,y)点都可以代入方程中,等式仍然成立。我们可以将这一发现泛化为一个规则:

对于一个带有两个变量的线性方程ax + by = c,在ℝ²中,解集可以表示为一条直线。

注意,这个等式有无穷多个解,涵盖了整个 ℝ² 空间;我们稍后将仔细研究解的数量。

这个同样的概念也适用于更高维度的坐标空间,如 ℝⁿ,例如 ℝ³,因为增加了第三个变量,所以线变成了平面。

线性方程组

线性方程组是由一或多个线性方程组成的集合,这些方程共享相似的变量。一个例子:

6x + 2y = 4

2x + 4y = 8

线性方程组的解被定义为使每个方程在对应的变量上代入后成立的值 (s₁, s₂, …, sᵣ)。对于上述方程组,解是 (0, 2),因为当 (0, 2) 代入方程组时,两个方程都成立。

线性系统的解

线性系统的解有哪些图形上的意义?线性系统的解的数量有哪些情况?本节将详细探讨这三种可能性,它们如下:

  1. 唯一解
  2. 无解
  3. 无穷解

唯一解:对于具有两个变量的线性系统,解是交点。为什么?解是有序对,两个方程都必须被满足;如果不存在这样的有序对,这意味着这些线永远不相交。这是唯一解的例子。只有一个解满足线性系统中的所有方程。

无解:考虑没有解的情况。在具有两个变量的线性系统的背景下,这可能意味着什么?在哪种情况下,一组直线永远不会相交?一个情况可能是它们是平行的。对于线性系统中所有直线都平行的情况,线性系统将没有解。另一种情况可能是某些直线与其他直线相交,但没有一个共同的交点。

无穷解:线性系统的最后一种情况是存在无穷解。在哪种情况下,具有两个变量的线性系统可能有无穷多个解?如果这些线是相同的,那么由于它们重叠,就存在无穷多个交点和解。考虑以下线性系统:

6x + 3y = 18

2x + y = 6

虽然系数可能不同,但这些线实际上是相同的!如果将第一个方程的每个系数除以 3,得到的等式为 2x + y = 6。

线性系统的解的数量随着变量数量的增加而改变。下面是具有三个变量的线性系统的三种解情况的可能图示。对于超过三个维度的情况,人脑很难进行可视化,但相同的规则适用!无论有多少个变量,所有线性系统都只会有无解、一个解或无穷多个解。

此图示来自 src。

矩阵表示法

随着线性方程变得更加复杂,表示法可能变得笨拙。为了使线性系统的信息被压缩为便于操作和处理的形式,通常使用矩阵表示法代替一组方程。一个系数矩阵是一种矩阵,它去除了每个方程的 b 系数。一个增广矩阵包括了 b 系数,因此比系数矩阵多一个列。

矩阵的大小,也称为 序列,告诉我们矩阵有多少行和列。一个 m x n 矩阵是一个有 m 行和 n 列的矩阵。行的数量对应着一个系统有多少个线性方程,而列的数量告诉我们有多少个变量。请确保行的数量在列的数量之前,因为次序是不能互换的。

解线性系统

确定线性系统是否有解以及如果有解的话是否有唯一解或无穷多解,并从中得出解的方法有系统的方式。解线性系统可以使用线性方程的初始形式或矩阵来进行,尽管推荐使用矩阵,因为符号更清晰更紧凑。不过,熟悉两种方法都是好的,因为它们能够互相补充对另一种方法的机制提供额外的洞察。

以下是逐步解决一个不使用矩阵的方程组的过程。基本想法是通过乘以已存在的方程,创建新的方程,得到相同的方程,然后将其添加或相减到另一个方程中以消除一个变量。然后重复此过程,直到我们从系统中消除了足够多的未知量,能够解出一个变量,然后通过回带求解其余变量。最后,需要检查解是否实际满足方程组。

行操作

先前概述的步骤可以转移到以矩阵为中心的解线性系统的过程中。注意在每次转换后,消除的变量在矩阵中如何被标记。但在进一步讨论之前,让我们先定义一些行操作。实际上有两个行操作与之前应用的操作是平行的。

  1. 替换:“将一行替换为自身和另一行的和。”*
  2. 交换:“交换两行。”*
  3. 缩放:“将一行中的所有元素乘以非零常数。”*

让我们再次使用相同的线性系统,但这次使用矩阵并应用行操作。

请注意,我使用了与线性方程方法中完全相同的操作和缩放因子。毫不奇怪,我们得到了之前相同的方程。需要注意的另一件事是最终矩阵左下角的三角形形状。这种模式出现是有道理的,因为0代表了一个消除的变量的标记,每个消除的变量都使我们更接近确定我们可以轻松解决的方程,从而在整个系统的解决中取得进展。我们将在下一章重新讨论这种情况,并为其提供更正式的定义。

总结

在本章中,我们了解到:

  • 线性方程:一个具有一个或多个变量的方程,其中方程的次数必须等于1。
  • 线性方程组:一组线性方程。
  • 一个或多个线性方程组的解:线性系统既可能无解,也可能有唯一解或无穷多解。
  • 矩阵表示法:用作以紧凑方式表示线性系统的矩形数组。
  • 行操作:替换、交换和缩放操作使我们能够将矩阵转化为已消除足够未知变量以解决系统的形式。
  • 解线性系统:一种系统的方式,可以找到 a) 给定线性系统是否存在解以及 b) 如果存在解,则解的准确值是什么。

注释

*除非另有说明,所有图像均为本文作者所创作。

*还有一点要注意:二次方程一词来自quadratus,它是拉丁语quadrare的过去分词,意思是“使方形”;这是对其次数的致敬![资源]

*ℝ²是实数线上全部可能的有序对(x, y)所构成的空间,它以二维平面表示。ℝ²包含了全部实数集,而实数集是不可数无穷的,这意味着ℝ²空间也是无限的。

*关于行操作的引用 [src]