Keyboard shortcuts

Press or to navigate between chapters

Press ? to show this help

Press Esc to hide this help

问题 1

线性变化和线性组合有什么区别?

线性变换和线性组合是线性代数中两个核心且紧密相关的概念,但它们描述的是不同的操作。简单来说,线性组合是构建向量的一种方法,而线性变换是一种作用于向量的函数。


线性组合 (Linear Combination)

线性组合是将一组向量通过缩放相加来创建一个新向量的过程。

想象你有一组向量 。它们的线性组合就是将每个向量乘以一个标量(数字),然后把结果加起来,得到一个新的向量

公式形式为:

这里的 标量(实数)。

举个例子: 在二维平面上,如果你有两个向量 。 它们的线性组合可以是 。 这里,我们通过线性组合的方式,用 构造出了一个新的向量


线性变换 (Linear Transformation)

线性变换是一种特殊的函数,它将一个向量空间中的向量映射到另一个(或同一个)向量空间中的向量。它本质上是一种对向量进行操作的“规则”或“过程”。

一个变换 如果满足以下两个条件,就被称为线性变换:

  1. 加法可分配性 (Additivity): 对任意向量 都成立。这意味着先将两个向量相加再进行变换,与先分别变换再相加,结果是一样的。

  2. 齐次性 (Homogeneity): 对任意向量 和任意标量 都成立。这意味着先对向量进行缩放再变换,与先变换再缩放,结果是一样的。

举个例子: 一个二维向量的旋转操作就是一个线性变换。 假设有一个变换 将一个向量 旋转90度。 你可以验证它是否满足上述两个条件。 如果你有一个向量 ,对其进行线性变换 ,得到的结果是


核心区别总结

特性线性组合 (Linear Combination)线性变换 (Linear Transformation)
作用将一组向量通过缩放和相加构造成一个新的向量。将一个向量映射转换成一个新的向量。
主体多个向量(以及一些标量)。一个函数或操作(通常用矩阵表示)。
输入/输出输入是一组向量一组标量,输出是一个向量输入是一个向量,输出是一个向量
目的描述如何用基本向量构建出所有其他向量。描述如何改变移动向量空间中的向量。

简单类比:

  • 线性组合就像是“配方”:用不同的基本“原料”(向量)和“用量”(标量)来制作一道新“菜”(新向量)。
  • 线性变换就像是“工具”:一个能对任何“菜”(向量)进行特殊处理(比如切片、搅拌、旋转)的机器。

问题 2

Let be differentiation: .

为微分:

Since derivatives respect addition and scalar multiples, differentiation is a linear transformation.

由于导数尊重加法和标量倍数,因此微分是一种线性变换。

这是一段非常经典的线性代数例子,它用一个你熟悉的微积分概念——求导,来解释线性变换

我们来一步步拆解这句话:

1. 什么是

  • :这是所有实系数多项式组成的集合。例如, 都是这个集合里的元素。
  • :这是一个函数变换,它的名字叫
  • :这句话的意思是,这个函数 输入是一个实系数多项式,输出也是一个实系数多项式。

2. 什么是

  • 里的一个多项式。
  • 导数
  • 这句话定义了 的具体操作:输入一个多项式 ,输出它的导数
    • 例如,如果 ,那么

3. 如何理解“Since derivatives respect addition and scalar multiples, differentiation is a linear transformation.”?

“respect addition and scalar multiples” 是理解核心。这句话翻译过来就是“导数运算遵守加法和标量乘法”。

这正是线性变换的两个核心条件:

  1. 尊重加法 (Respects Addition)

    • 在微积分中,我们知道两个函数的和的导数,等于它们各自导数的和。用公式表示就是:
    • 如果我们将求导操作看作是 ,那么这个性质可以写成:
    • 这完全符合线性变换的第一个条件:
  2. 尊重标量乘法 (Respects Scalar Multiples)

    • 在微积分中,一个函数乘以常数的导数,等于这个常数乘以函数的导数。用公式表示就是:
    • 来表示,这个性质就是:
    • 这完全符合线性变换的第二个条件:

因为求导操作 同时满足这两个条件,所以它是一个线性变换

总而言之,这段话巧妙地将你熟悉的求导规则(和的导数是导数的和,常数倍的导数是常数倍的导数)提升到了线性代数的抽象层面,告诉你求导本身就是一个线性变换

问题 3

Linear transformations are exactly those that preserve the origin, lines through the origin, and proportions along those lines. They include familiar operations: scaling, rotations, reflections, shears, and projections. Nonlinear transformations bend or curve space, breaking these properties.

线性变换正是那些保留原点、过原点的直线以及沿这些直线的比例的变换。它们包括我们熟悉的操作:缩放、旋转、反射、剪切和投影。非线性变换会弯曲空间,从而破坏这些属性。

这句话非常精辟,它用直观的几何概念描述了线性变换的核心特征,并将其与非线性变换做了对比。我们可以从几个关键点来理解它。


1. 核心特征:保留原点、过原点的直线和沿直线的比例

a) 保留原点 (Preserves the Origin) 线性变换 必须满足

  • 几何意义:空间中的原点 经过线性变换后,位置不会改变
  • 为什么?:因为线性变换的齐次性 。如果让 ,我们得到 ,即
  • 类比:一个线性变换就像是在一张纸上拉伸、旋转、倾斜,但纸上的“钉子”——原点——始终固定不动。

b) 保留过原点的直线 (Preserves Lines Through the Origin)

  • 几何意义:如果空间中有一条穿过原点的直线,经过线性变换后,这条线依然是直线,并且仍然穿过原点。它可能被旋转或拉伸,但不会变成曲线。
  • 为什么?:一条过原点的直线可以表示为所有向量 的集合,其中 是直线上的一个方向向量, 是任意标量。因为线性变换满足 ,变换后的所有点 依然在同一条由 定义的直线上。

c) 保留沿直线的比例 (Preserves Proportions Along These Lines)

  • 几何意义:想象一条直线上的三个点 。如果 位于 的中点,那么经过线性变换后,变换后的点 仍然位于 的中点
  • 为什么?:这再次源于齐次性。如果向量 是向量 的两倍长(),那么经过线性变换后,变换后的向量 仍然是 的两倍长()。变换不会改变向量之间的相对长度关系

2. 具体的线性变换操作

这句话列举了几个我们熟悉的线性变换例子:

  • 缩放 (Scaling):将所有向量按比例拉长或缩短。
  • 旋转 (Rotation):围绕原点旋转向量。
  • 反射 (Reflection):将向量像照镜子一样翻转。
  • 剪切 (Shear):将一个方向上的所有点沿另一个方向移动,就像把一本厚书的封面推向一边,书页向外倾斜一样。
  • 投影 (Projection):将所有向量投影到一个子空间(例如,将三维空间中的所有点都压平到二维平面上)。

这些操作的共同点是它们都符合上面提到的三条核心性质。


3. 非线性变换的对比

非线性变换会“弯曲空间”。这意味着:

  • 不保留直线:一条直线经过非线性变换后可能会变成一条曲线
  • 不保留比例:变换后,向量的相对长度关系会被扭曲
  • 不保留原点:非线性变换可以把原点移动到其他位置。

例如

  • 平移 (Translation):将所有点移动一段固定的距离。这不是线性变换,因为它不保留原点
  • sin(x) 函数:这是一个典型的非线性函数,它会把一条直线“弯曲”成波浪线。

总结:这句话提供了一个强大的几何直觉:线性变换就是那些“硬邦邦”的变换,它们不会弯曲、扭曲或撕裂空间。它们只对空间进行拉伸、旋转和倾斜,但始终保持其基础的网格结构。相比之下,非线性变换则更具“柔性”,可以随意弯曲和变形空间。

问题 4

Verify that is a linear transformation on .

验证 是否是 的线性变换。

要验证一个变换是否是线性变换,需要检查它是否满足两个核心条件:加法可分配性齐次性

这个变换 中的向量 映射到另一个向量

让我们来验证这两个条件。


条件一:加法可分配性 (Additivity)

这个条件要求,对于任意两个向量 ,都满足

设两个向量为

  1. 计算 : 首先,将两个向量相加: 然后,对这个新向量进行变换

  2. 计算 : 首先,分别对 进行变换: 然后,将变换后的向量相加:

由于 ,第一个条件成立


条件二:齐次性 (Homogeneity)

这个条件要求,对于任意向量 和任意标量 ,都满足

设向量为

  1. 计算 : 首先,对向量进行标量乘法: 然后,对这个新向量进行变换

  2. 计算 : 首先,对 进行变换: 然后,用标量 乘以变换后的向量:

由于 ,第二个条件也成立


结论: 因为变换 同时满足加法可分配性和齐次性这两个条件,所以它是一个线性变换

问题 5

证明 不是线性的。哪条公理不成立?

Prove that if and are linear transformations, then so is .

要证明一个变换不是线性的,我们只需要找到一个反例,证明它不满足线性变换的两个核心公理中的任意一个即可。这两个公理是:

  1. 加法可分配性
  2. 齐次性

我们来验证变换 。这是一个平移变换,将所有点向右平移一个单位。

验证不成立的公理

最简单的方法是检查线性变换的隐藏公理: 一个线性变换必须将原点 映射到它自身。 对于 ,我们计算

由于 ,变换不保留原点。因此,它不是一个线性变换。


详细验证:加法可分配性

即使不使用上面这个简单的验证方法,我们也可以直接使用加法公理来证明。 设两个向量

  1. 计算 首先将两个向量相加: 然后进行变换:

  2. 计算 首先分别进行变换: 然后将变换后的向量相加:

由于 (因为 ),加法可分配性不成立


详细验证:齐次性

我们也可以用齐次性来证明。 设向量 ,取一个标量

  1. 计算 首先进行标量乘法: 然后进行变换:

  2. 计算 首先进行变换: 然后进行标量乘法:

由于 (因为 ),齐次性也不成立

结论

不满足线性变换的任一公理,所以它不是一个线性变换。

在几何上,这个变换是平移,它将所有点移动了一个单位。正如我们之前所讨论的,线性变换必须保留原点和过原点的直线,但平移变换会移动原点,因此从直觉上就知道它不是线性的。

问题 6

Give an example of a linear transformation from to .

给出一个从 的线性变换的例子。

为了给出一个从 的线性变换的例子,我们可以使用一个 矩阵来定义这个变换。

一个从 的线性变换 可以用一个 矩阵 来表示。如果一个向量 属于 ,那么它经过变换后的向量 可以通过矩阵乘法 来得到。

例子:

让我们选择一个简单的 矩阵

这个矩阵代表了一个投影变换。它将三维空间中的一个点 投影到二维平面上的点

这个线性变换 可以定义为:

或者用函数形式表示为:

为什么它是一个线性变换?

我们可以快速验证它是否满足线性变换的两个条件:

  1. 加法可分配性: 设 由于两者相等,条件成立。

  2. 齐次性: 设 和标量 由于两者相等,条件成立。

因此, 是一个从 的线性变换。在几何上,这个变换将三维空间中的每个点垂直投影 平面上。

问题 7

Let be integration:

为积分:

Prove that is a linear transformation.

证明 是线性变换。

要证明变换 是一个线性变换,我们必须验证它是否满足线性变换的两个核心公理:加法可分配性齐次性

这个变换 的定义是将一个多项式 积分,得到一个新的多项式。这个积分的下限是固定的 ,所以它总是返回一个多项式,而不是一个常数。

让我们来验证这两个公理。


条件一:加法可分配性 (Additivity)

这个条件要求,对于任意两个多项式 ,都满足

根据定积分的性质,两个函数和的积分等于它们各自积分的和。我们可以用这个性质来验证:

利用积分的加法性质,可以将右边的积分拆开:

根据 的定义,右边的两项正好是

因此,加法可分配性成立


条件二:齐次性 (Homogeneity)

这个条件要求,对于任意多项式 和任意标量 ,都满足

根据定积分的性质,一个常数乘以函数的积分,等于这个常数乘以函数的积分。

利用积分的齐次性,可以将常数 提到积分号外面:

根据 的定义,右边的积分项正好是

因此,齐次性成立


结论

因为变换 同时满足加法可分配性(尊重加法)和齐次性(尊重标量乘法)这两个条件,所以它是一个线性变换。这个例子和微分是线性变换的例子相辅相成,共同说明了微积分中的核心运算本身就是线性代数中的线性变换。

问题 8

Find the matrix representation of , .

找到 , 的矩阵表示。

要找到一个线性变换的矩阵表示,你需要确定变换对标准基向量的作用。在 中,标准基向量是:

这个矩阵的就是变换后的基向量。


1. 变换第一个基向量

代入变换 这就是矩阵的第一列。

2. 变换第二个基向量

代入变换 这就是矩阵的第二列。


3. 构建矩阵

将变换后的向量作为矩阵的列,我们得到变换的矩阵表示

4. 验证

我们可以用这个矩阵来验证它是否能得到原始的变换。对于任意向量 ,我们应该有 这与变换 的定义完全一致。

因此,这个变换的矩阵表示就是

问题 9

Determine the matrix of the linear transformation , .

确定线性变换矩阵

要确定这个从 的线性变换的矩阵,我们需要找出变换作用在 的标准基向量上会得到什么结果。

的标准基向量是:

这个线性变换的矩阵的就是变换后的基向量。

1. 变换第一个基向量

代入变换 这构成了矩阵的第一列。

2. 变换第二个基向量

代入变换 这构成了矩阵的第二列。

3. 变换第三个基向量

代入变换 这构成了矩阵的第三列。


4. 构建矩阵

将这三个变换后的向量作为矩阵的列,我们得到变换的矩阵表示

5. 验证

我们可以用这个矩阵来验证它是否能得到原始的变换。对于任意向量 ,我们应该有 这与变换 的定义完全一致。

因此,该线性变换的矩阵表示是

问题 10

What matrix represents reflection across the line in ?

哪个矩阵表示 中沿线 的反射?

这个线性变换的矩阵可以通过作用在 的标准基向量上来确定。

的标准基向量是:

1. 变换第一个基向量

线上方的右侧。当它关于 反射时,它的新位置是

2. 变换第二个基向量

线上方的左侧。当它关于 反射时,它的新位置是

3. 构建矩阵

将变换后的向量作为矩阵的列,我们得到变换的矩阵表示

4. 验证

我们可以用这个矩阵来验证。对于任意向量 ,我们应该有 变换后的向量是 ,这正是点 关于直线 反射后的坐标。

因此,矩阵 表示 中沿直线 的反射。

问题 11

学不懂线性代数?用动画来拯救(一):线性变换 https://zhuanlan.zhihu.com/p/1896368529332237603

问题 12

For the differentiation map , where is the space of polynomials of degree at most , find the matrix of relative to the bases and .

对于微分映射 ,其中 是次数最多为 的多项式空间,求出 相对于基数 的矩阵。

对于微分映射 ,我们需要找到它相对于给定基的矩阵表示。


1. 确定基

  • 输入空间 的基为 。 这个基中的任何多项式 都可以表示为向量
  • 输出空间 的基为 。 这个基中的任何多项式 都可以表示为向量

2. 对输入基向量进行微分

微分映射 的作用是 。我们将对输入空间 的每个基向量进行微分:

  • 进行微分: 在输出基 中,这个结果可以表示为 。 它的坐标向量是

  • 进行微分: 在输出基 中,这个结果可以表示为 。 它的坐标向量是

  • 进行微分: 在输出基 中,这个结果可以表示为 。 它的坐标向量是


3. 构建矩阵

线性变换的矩阵表示是将变换后基向量的坐标向量作为矩阵的列

将上面得到的三个坐标向量作为矩阵的列,我们得到矩阵

4. 验证

我们可以用这个矩阵来验证。例如,多项式 在基 下的坐标向量为

用矩阵 乘以这个向量:

这个结果 是微分后多项式在基 下的坐标向量。 它表示的多项式是

直接对 进行微分,得到 ,结果完全一致。

因此,矩阵 正确地表示了微分映射 相对于给定基的矩阵。

问题 13

Find the kernel and image of , .

查找 的核和图像。

该线性变换的**核(Kernel)是只包含零向量的集合 ,而像(Image)**是整个 空间。


1. 找到核(Kernel)

一个线性变换的是输入空间中所有被映射到零向量的向量的集合。对于给定的变换 ,我们需要找到所有满足 的向量

这相当于求解以下线性方程组:

  • 将两个方程相加:

  • 代入第一个方程:

唯一的解是 。这意味着只有零向量 被映射到零向量 。 所以,


2. 找到像(Image)

一个线性变换的是输入空间中所有向量经过变换后所能生成的输出向量的集合。为了找到像,我们可以考察变换矩阵的列空间。

首先,找到变换 的矩阵表示。我们考察标准基向量 的变换结果:

因此,变换的矩阵为: 等于这个矩阵的列空间,它由矩阵的列向量 的所有线性组合组成。

这两个列向量是线性无关的,因为它们不是彼此的常数倍。两个线性无关的向量在 空间中能张成整个空间。 所以,


补充:秩-零化度定理

这个结果与秩-零化度定理相符。该定理指出,对于一个线性变换 ,有: 在本例中:

  • (因为核中只有一个零向量)
  • 因此: 所以 ,这再次确认了像的维度为 2,即整个 空间。

问题 14

Matrix representations depend on the chosen basis. If and are bases of and , then the matrix of with respect to these bases is obtained by expressing in terms of for each . Changing bases corresponds to conjugating the matrix by the appropriate change-of-basis matrices.

矩阵表示取决于所选的基。如果 的基 ,则 关于这些基的矩阵,可以通过将 表示为 来获得,其中 表示为 。改变基相当于将矩阵与适当的基变换矩阵共轭。

这句话阐述了线性变换的矩阵表示与基选择之间的关系。我们可以分三部分来理解它:


1. 矩阵表示的依赖性

"Matrix representations depend on the chosen basis."

这句话是核心思想。一个线性变换本身是一个抽象的操作,比如旋转或投影,它不依赖于任何坐标系。但当我们想用矩阵来描述这个操作时,我们必须先选择一个坐标系(即一组)。不同的基会产生不同的矩阵来表示同一个线性变换。

例如,在 中,旋转 的变换是固定的。如果我们用标准基 ,矩阵是 。但如果我们选择另一组基,比如 ,这个旋转变换的矩阵会是不同的。

2. 构建矩阵的方法

"...the matrix of with respect to these bases is obtained by expressing in terms of for each ."

这部分解释了如何具体构建矩阵。假设你有:

  • 输入空间 的基
  • 输出空间 的基

矩阵构建的步骤是:

  1. 输入基中的每一个向量 应用线性变换 ,得到新向量
  2. 这个新向量 属于输出空间 。你需要将它表示成输出基 的线性组合。
  3. 将这个线性组合的坐标系数写成一列,这就是变换矩阵的第 列。

重复这个过程,直到你处理完输入基中的所有向量,你就得到了完整的变换矩阵。

3. 改变基底与矩阵共轭

"Changing bases corresponds to conjugating the matrix by the appropriate change-of-basis matrices."

这部分解释了当基发生变化时,矩阵如何变化。它给出了一个重要的关系式: 其中:

  • 是变换 在旧基下的矩阵。
  • 是变换 在新基下的矩阵。
  • 从新基到旧基的过渡矩阵(change-of-basis matrix)。

这个关系称为矩阵的相似变换(similarity transformation)或共轭(conjugation)。它的几何意义是:

  1. 将新基下的向量转换到旧基下的坐标( 的列是新基向量在旧基下的表示)。
  2. 用旧矩阵 执行线性变换。
  3. 将结果转换回新基下的坐标。

通过这个公式,我们可以方便地在不同基下的矩阵表示之间进行转换,而无需重新计算每个基向量的变换。这个特性是特征值和特征向量理论的基础,因为特征向量所组成的基可以使线性变换的矩阵表示成为最简单的形式——对角矩阵。

问题 15

Let

Find bases for and .

找到 的基。

首先,矩阵 描述了一个从 的线性变换。我们需要找到这个变换的**零空间(核)列空间(像)**的基。


1. 找到零空间(核) 的基

零空间是所有被 映射为零向量的向量 的集合。这等价于求解方程

这对应于以下方程组:

从第二个方程,我们可以用 来表示

将这个结果代入第一个方程:

我们可以用自由变量 来表示所有解。设 ,其中 是任意实数。那么:

因此,零空间是由向量 张成的。这个向量构成了零空间的一个基。

的基是:


2. 找到列空间(像) 的基

列空间是矩阵 的列向量的所有线性组合的集合。矩阵 的列向量是:

为了找到列空间的基,我们需要找到这些列向量中的线性无关的向量。因为矩阵 已经是行阶梯形式,我们可以很容易地识别出主元(pivot)列。主元是行阶梯形式中每行第一个非零元素。

  • 第一行的主元是 (在第一列)。
  • 第二行的主元是 (在第二列)。

矩阵 的主元位于第一列第二列。这些列向量构成了列空间的一组基。

因此, 的基是:

注意,虽然 也是列向量,但它是前两个向量的线性组合,因此不是基的一部分。

我们可以验证:

实际上 吗?

让我们重新看一下方程:

是自由变量。

,

是的,没错。

根据秩-零化度定理(Rank-Nullity Theorem),我们有:

这与我们找到的结果一致,进一步验证了答案的正确性。

Chatgpt

我们解线性方程 。设 ,由

,代入第一式得 。于是

因此

再看像空间。取矩阵的列向量

容易看出 线性无关(因此秩为 2),所以像空间是整个 ,且例如

总结:

  • .

。要证明 的线性组合,只需找出常数 使得

写成分量方程:

由第二式得到 ,代入第一式得 。于是

并且验算:。因此 确实是 的线性组合。

问题 16

For the projection map , describe the kernel and image.

对于投影图 ,描述其核和图像。

这个投影映射的是 z 轴,而是 xy 平面。


1. 核 (Kernel)

是所有被映射到零向量的向量的集合。对于给定的投影映射 ,我们需要找到所有满足 的向量

这相当于求解以下方程:

这意味着:

  • 可以是任何实数。

因此,所有满足条件的向量都形如 ,它们构成了三维空间中的 z 轴。

所以,。它的维度是1。


2. 像 (Image)

是输入空间中所有向量经过变换后所能生成的输出向量的集合。对于 ,输出向量总是形如

这意味着,无论你选择哪个三维向量,它的投影结果都将是第三个分量为零的向量。所有这些向量的集合构成了三维空间中的 xy 平面。

所以,。它的维度是2。


几何直觉

  • 投影将所有点压平到 xy 平面
  • 包含了所有“消失”的点,即那些被压平后变成原点的点。在三维空间中,只有位于 z 轴上的点才能满足这个条件。
  • 是所有投影结果的集合,也就是 xy 平面本身。

问题 17

Prove that and are always subspaces.

证明 始终是子空间。

要证明核 (kernel)像 (image) 始终是子空间 (subspace),我们需要验证它们是否满足子空间定义中的三个条件。

一个集合 是向量空间 的子空间,如果它满足:

  1. 零向量闭合:零向量 属于
  2. 加法闭合:如果向量 属于 ,那么它们的和 也属于
  3. 标量乘法闭合:如果向量 属于 ,那么对于任意标量 ,向量 也属于

我们用这些条件来分别证明


证明 是子空间

假设 是一个线性变换。 中所有被 映射到 中零向量的向量的集合。即

  1. 零向量闭合 我们需要证明 的零向量 属于 。 根据线性变换的性质,我们知道 。 因此, 满足核的定义,它属于

  2. 加法闭合 中的任意两个向量。 根据定义,我们有 。 因为 是一个线性变换,它满足加法可分配性: 因此,向量 也被映射到零向量,所以它属于

  3. 标量乘法闭合 中的一个向量,而 是任意标量。 根据定义,我们有 。 因为 是一个线性变换,它满足齐次性: 因此,向量 也被映射到零向量,所以它属于

所有三个条件都满足,因此 的一个子空间。


证明 是子空间

中所有由 变换而来的向量的集合。即

  1. 零向量闭合 我们需要证明 的零向量 属于 。 我们知道 。这意味着存在一个向量(即 ),它经过 的变换后得到了 。 因此, 属于

  2. 加法闭合 中的任意两个向量。 根据定义,存在向量 ,使得 。 我们想证明 属于 。 利用 的加法可分配性: 因为 属于 ,所以 中某个向量经过 变换后的结果。 因此, 属于

  3. 标量乘法闭合 中的一个向量,而 是任意标量。 根据定义,存在向量 ,使得 。 我们想证明 属于 。 利用 的齐次性: 因为 属于 ,所以 中某个向量经过 变换后的结果。 因此, 属于

所有三个条件都满足,因此 的一个子空间。

问题 18

Linear transformations can look very different depending on the coordinate system we use. The process of rewriting vectors and transformations relative to a new basis is called a change of basis. This concept lies at the heart of diagonalization, orthogonalization, and many computational techniques.

根据我们使用的坐标系,线性变换看起来可能非常不同。相对于新的基重写向量和变换的过程称为基变换。这个概念是对角化、正交化以及许多计算技术的核心。

这段话的核心思想是:线性变换的矩阵表示不是唯一的,它取决于我们选择的坐标系(基)。理解基的变换,能帮助我们简化复杂的数学问题。


1. 线性变换的“变脸”

“Linear transformations can look very different depending on the coordinate system we use.”

一个线性变换本身是一个几何操作,比如旋转或拉伸,它在空间中是固定的。但当我们用矩阵来描述它时,这个矩阵的形式会随着我们选择的基不同而改变。这就像一个物体在不同的光照下,看起来颜色深浅不一,但物体本身没有变。矩阵就是这个“光照”,它提供了我们观察线性变换的视角。

2. 什么是基变换?

“The process of rewriting vectors and transformations relative to a new basis is called a change of basis.”

基变换就是将一个向量或一个线性变换的矩阵,从一个旧的坐标系(旧基)转换到另一个新的坐标系(新基)的过程。这个过程通常通过一个过渡矩阵(change-of-basis matrix)来实现。

  • 向量的基变换:一个向量在旧基下的坐标,可以通过乘以过渡矩阵来得到在新基下的坐标。
  • 矩阵的基变换:一个线性变换在旧基下的矩阵,可以通过一个称为“相似变换”或“共轭”的操作,来得到在新基下的矩阵。它的形式是 ,其中 是旧矩阵, 是新矩阵, 是过渡矩阵。

3. 基变换的重要性

“This concept lies at the heart of diagonalization, orthogonalization, and many computational techniques.”

这段话指出了基变换的实际应用价值。我们之所以要做基变换,不是为了好玩,而是为了简化问题

  • 对角化 (Diagonalization):这是一种特殊的基变换。如果一个线性变换可以用对角矩阵表示,那么它的计算会变得极其简单。对角矩阵只在主对角线上有非零元素,这使得求幂、求逆等操作变得轻而易举。对角化的关键是找到一组特征向量作为新的基。在这个新的坐标系中,变换只是简单的拉伸或压缩,没有旋转或剪切。
  • 正交化 (Orthogonalization):这是另一种重要的基变换。通过将一组向量转换为正交基(向量两两垂直),我们可以简化投影、最小二乘法等计算。
  • 计算技术:在机器学习、信号处理、计算机图形学等领域,基变换被广泛应用。例如,主成分分析 (PCA) 就是通过基变换找到数据的主要变化方向,从而实现降维和数据压缩。

总而言之,这段话告诉我们,矩阵的表示是相对的,而基变换是寻找最优矩阵表示的方法。这个最优的矩阵(例如对角矩阵)能让我们更容易地理解和操作线性变换。

问题 19

基变换矩阵必须是可逆的吗?

是的,这里的矩阵 必须是可逆的。

是从基 到标准基的基变换矩阵。根据定义,它的列就是基向量

一个矩阵可逆的充分必要条件是其列向量是线性无关的。由于 是一个,其定义本身就保证了集合中的所有向量是线性无关的。因此,矩阵 的列向量 必定是线性无关的。

因为 的列是线性无关的,所以 是可逆的。这确保了从一个坐标系到另一个坐标系的转换是一对一的,并且是可逆的。如果 不可逆,那么不同的向量在 下可能有相同的坐标,这与基的唯一性定义相矛盾。

问题 20

让我们来详细解释这个等式的含义。

等式左侧:

这里的 是向量本身。它是在标准基下的坐标向量。例如,在 中,向量 就表示“从原点开始,向右走 3 个单位,向上走 4 个单位”。这里的 3 和 4 就是它在标准基 下的坐标。

等式右侧:

  • :这是一个过渡矩阵(change-of-basis matrix),它的列是新基 的向量。这个矩阵的作用是把新基下的坐标转换回标准基下的坐标。
  • :这是向量 新基 下的坐标向量

总结

所以,等式 的真正含义是:

一个向量在标准基下的坐标,等于它的新基坐标向量乘以一个过渡矩阵。

这个等式描述了从一个坐标系(新基 )转换到另一个坐标系(标准基)的过程。它告诉我们,要找到一个向量在标准基下的坐标,我们只需知道它在新基下的坐标,然后用矩阵 转换即可。

这个等式描述了将一个向量的标准基坐标转换成新基坐标的过程。


等式各部分的含义

  • :向量 标准基下的坐标向量。例如,在 中,它就是向量本身。
  • :向量 新基 下的坐标向量。
  • :这是一个过渡矩阵(change-of-basis matrix),它的列是新基 的向量。它将新基坐标转换回标准基坐标,即
  • :矩阵 的逆矩阵。它的作用正好相反,它将标准基坐标转换成新基坐标。

转换过程的逻辑

理解这个等式,可以从矩阵 的作用来思考:

  • 是一个“新到旧”的转换器。它把新基下的坐标()转换成旧基(标准基)下的坐标()。
  • 因此,它的逆矩阵 自然就是一个“旧到新”的转换器。它把旧基(标准基)下的坐标()转换成新基下的坐标()。

类比

想象你有两个坐标系:一个是我们熟悉的南北-东西坐标系(标准基),另一个是东北-西北-西南-东南坐标系(新基)。

  • 就像一个“翻译”工具,它能把东北-西北坐标系下的指示(例如,向东北方向走 5 步)转换成南北-东西坐标系下的指示(向东 3.5 步,向北 3.5 步)。
  • 就是这个工具的“逆向翻译”版本,它能把南北-东西坐标系下的指示(例如,向东 5 步)转换成东北-西北坐标系下的指示(向东南方向走 3.5 步,向东北方向走 3.5 步)。

等式 描述的就是这个从旧坐标系到新坐标系的转换过程。

问题 21

Transformation of Matrices

矩阵变换

Let be a linear transformation. Suppose its matrix in the standard basis is . In the basis , the representing matrix becomes

为线性变换。假设其在标准基中的矩阵为 。在基 中,表示矩阵变为

Thus, changing basis corresponds to a similarity transformation of the matrix.

因此,改变基对应于矩阵的相似变换。

这段话的核心是解释线性变换的矩阵表示如何随着基的变化而改变。它指出了一个关键的公式:

我们可以分三部分来理解这个概念。


1. 不同的基,不同的矩阵

“Let be a linear transformation. Suppose its matrix in the standard basis is . In the basis , the representing matrix becomes .”

  • 线性变换 是一个抽象的几何操作(如旋转、缩放),它本身不依赖于任何坐标系。
  • 矩阵表示是这个操作在特定坐标系中的“坐标”。例如,矩阵 在标准基(我们最熟悉的直角坐标系)下的表示。
  • 是一个新的坐标系。在新的坐标系下,同一个变换 会有一个新的矩阵表示,我们称之为

想象一下你站在不同的角度看一个物体,物体本身没变,但它在你的视野中的样子变了。矩阵就是这个“视野中的样子”。


2. 基变换的公式

这个公式是连接新旧矩阵的关键。它描述了如何用旧矩阵 来计算新矩阵 。这里的核心是过渡矩阵

  • 是从新基 到**旧基(标准基)**的过渡矩阵。它的列是新基向量在旧基下的坐标。
  • 的逆矩阵,它将旧基下的坐标转换回新基下的坐标。

理解公式的几何意义 描述了一个三步走的“绕道”操作:

  1. :将一个向量从新基坐标系转换到旧基坐标系。
  2. :在旧基坐标系下执行线性变换
  3. :将变换后的结果转换回新基坐标系。

这三个步骤合起来,就相当于直接在新基坐标系中执行了变换 。因此,矩阵 实现了直接的转换。

3. 相似变换

“Thus, changing basis corresponds to a similarity transformation of the matrix.”

矩阵 相似的(similar)。相似矩阵代表同一个线性变换,只是在不同的基下。

相似变换 在线性代数中至关重要。它的主要目的就是寻找一个最简单的矩阵表示,通常是对角矩阵。如果一个矩阵可以被对角化(即可找到一个可逆矩阵 使得 是对角矩阵),那么在这个对角矩阵所对应的基下,线性变换就是简单的拉伸或压缩,没有旋转或剪切。这极大地简化了矩阵运算,也是特征值和特征向量理论的核心。

问题 22

Let

Compute its representation in the basis .

计算其在基 中的表示。

该问题的目标是找到一个线性变换在新基下的矩阵表示。这个线性变换由矩阵 标准基下定义。

我们可以使用相似变换公式来解决这个问题: 其中:

  • 是在标准基下的旧矩阵。
  • 是在新基下的新矩阵。
  • 是从新基到标准基的过渡矩阵。

1. 找到过渡矩阵

过渡矩阵 的列是新基向量在标准基下的坐标。 新基为 , 其中 。 所以,

2. 计算 的逆矩阵

对于一个 矩阵 ,其逆矩阵为 。 对于矩阵 ,行列式为

3. 计算新矩阵

现在,我们将所有矩阵相乘:

结论

因此,在基 中,矩阵 的表示仍然是它本身,即

这有点出人意料,因为通常基变换会改变矩阵。 让我们验证一下。

我们也可以用另一种方法验证。我们需要找出变换作用在新基向量上的结果,并用新基来表示这些结果。

  • 对新基向量 进行变换

    我们需要用新基 来表示结果

    解得 。所以,结果在新基下的坐标是 。这是新矩阵的第一列。

  • 对新基向量 进行变换

    我们需要用新基 来表示结果

    解得 。所以,结果在新基下的坐标是 。这是新矩阵的第二列。

将这两列组合起来,得到新矩阵: 这与我们使用相似变换公式得到的结果完全一致。

问题 23

Find the change-of-basis matrix from the standard basis of to .

求出从 的标准基变换矩阵。

好的,我们来求从 的标准基到新基 的变换矩阵。


1. 理解基变换

首先,我们需要明确两种基变换矩阵:

  1. 从新基到标准基的矩阵(我们称之为 )。
  2. 从标准基到新基的矩阵(我们称之为 )。

问题要求的是从标准基到新基的变换矩阵。这个矩阵的作用是,如果你有一个向量在标准基下的坐标,用它乘以这个矩阵,就能得到它在新基下的坐标。

2. 构建从新基到标准基的矩阵

根据定义,从新基到标准基的过渡矩阵 的列就是新基的向量。 新基为 , 其中 。 所以,

3. 求 的逆矩阵

我们要求的是从标准基到新基的变换矩阵,这正是 的逆矩阵

对于一个 矩阵 ,其逆矩阵为

对于矩阵 ,行列式为

因此,

4. 结论

这个矩阵 就是从标准基到新基 的基变换矩阵

验证 让我们用一个向量来验证。例如,标准基下的向量

变换它: 这意味着向量 在新基下的坐标是 。我们可以用新基来检验这个结果:

结果正确。

问题 24

Prove that similar matrices (related by ) represent the same linear transformation under different bases.

证明相似的矩阵(由 关联)在不同基下表示相同的线性变换。

我们来证明这个核心概念:相似矩阵表示相同的线性变换

为了证明这一点,我们不需要使用任何特定的矩阵或基,只需要使用基变换的定义矩阵乘法的性质。

1. 设定情境

假设我们有一个线性变换

  • 在标准基 下,这个变换由矩阵 表示。也就是说,对于任意向量 ,我们有 。这里的 都是在标准基下的坐标。
  • 我们有一个新的基
  • 是从新基 到标准基 的过渡矩阵。
  • 我们想证明,在新基 下,这个变换由矩阵 表示。

2. 证明过程

要证明 在新基 下的矩阵,我们必须证明对于任何在新基 下表示为 的向量,应用 得到的向量就是 在新基 下的表示。

即,我们必须证明:

现在,我们用基变换的公式来逐步推导:

  1. 转换到标准基 向量 在新基下的坐标是 。要将它转换到标准基,我们使用过渡矩阵

  2. 在标准基下应用线性变换 现在,向量 在标准基下。我们可以使用标准基下的矩阵 来进行变换: 将上一步的结果代入,我们得到: 这个结果 仍然在标准基下。

  3. 将结果转换回新基 我们想要的是变换结果在新基下的坐标,也就是 。要做到这一点,我们使用 的逆矩阵 将上一步的结果代入,我们得到:

4. 结论

我们最终推导出了:

这证明了矩阵 确实将新基下的向量 转换成了变换后的向量在新基下的坐标

因此,矩阵 就是线性变换 在新基 下的矩阵表示。这证明了相似矩阵在不同基下表示相同的线性变换

问题 25

Diagonalize the matrix

对角化矩阵

in the basis .

在基 中。

为了找到矩阵 在新基 中的表示,我们可以使用相似变换公式: 其中:

  • 是在标准基下的旧矩阵。
  • 是在新基 下的新矩阵。
  • 是从新基 到标准基的过渡矩阵。

1. 找到过渡矩阵

过渡矩阵 的列就是新基向量在标准基下的坐标。 新基为 。 所以,


2. 找到 的逆矩阵

对于一个 矩阵 ,其逆矩阵为 。 对于矩阵 ,行列式为


3. 计算新矩阵

现在,我们将所有矩阵相乘:


结论

在基 中,矩阵 的表示是

思考一下这个结果的几何意义。(TODO:没看懂)

  • 矩阵 在标准基下表示的是沿 y 轴的反射
  • 矩阵 是一种基变换后的表示。它表示在新基 下的同样一个变换。
  • 矩阵 恰好是沿线 的反射矩阵。这表明,在某种意义上,沿 y 轴的反射和沿线 的反射是“等价”的,它们通过基变换相互关联。
  • 更有趣的是,如果我们将新基中的向量看作特征向量,那么 ,这表明这两个向量是特征向量,而新基下的矩阵 应该是一个对角矩阵。但这里的结果不是对角矩阵。这说明,虽然这两个基向量是特征向量,但它们与特征值不是简单的对应关系,我们需要重新审视。
  • 让我们再看一下:。 那么在基 下,
    • 的坐标是 (因为 )。这是新矩阵的第一列。
    • 的坐标是 (因为 )。这是新矩阵的第二列。 所以,新矩阵是 。这与我们的计算结果完全一致。这个矩阵确实表示了沿 的反射。

因此,矩阵 在基 中的表示是

问题 26

In , let . Construct the change-of-basis matrix and compute .

中,令 。构造基变换矩阵 并计算

首先,我们需要确定基变换矩阵 和它的逆矩阵

1. 构造基变换矩阵

根据定义,从新基 到标准基的过渡矩阵 的列就是新基的向量。 这里,新基向量是 , , 和 。 因此,矩阵 为:

2. 计算 的逆矩阵

我们可以使用增广矩阵 并通过行简化来求出 步骤 1: 将第一行与第二行相减,并将第一行与第三行相减。

  • 步骤 2: 将第二行与第三行相减。

左侧的矩阵现在是单位矩阵,所以右侧的矩阵就是

验证

我们可以通过计算 来验证结果是否正确。 结果是单位矩阵,所以 计算正确。

Chatgpt

先把基向量按列写成矩阵(这是从 -坐标到标准坐标的变换矩阵):

因为 分别为 的第1、2、3 列。

计算逆矩阵(也可以通过解线性方程或分块/回代法得到):

检验:(可逐项乘开验证),因此以上 正确。

说明:若 为任意标准坐标下的列向量,则 给出 在基 下的坐标。