跳转至

第五章 线性测量的参数最小二乘法处理⚓︎

约 1539 个字 预计阅读时间 8 分钟


5.1 最小二乘法原理⚓︎

1. 基本思路⚓︎

最小二乘法 (Least Squares Method, LSM):通过最小化误差的平方和寻找数据的最佳函数匹配。

对于测量方程,由于误差的存在,等式两边不会精确相等。设残差为 \(V\),则:

\[ v_i = l_i - f(x_1, x_2, \dots, x_t) \]

按照最小二乘法原理,待测量的最佳估计值应使 残差平方和 最小:

\[ \sum_{i = 1}^{n} v_i^2 = \min \]

2. 原理推导(矩阵形式)⚓︎

\[ \begin{aligned} & \text{对照残余误差方程:} \\ & \begin{cases} v_1 = l_1-(a_{11}x_1+a_{12}x_2+\cdots+a_{1t}x_t) \\ v_2 = l_2-(a_{21}x_1+a_{22}x_2+\cdots+a_{2t}x_t) \\ \cdots \\ v_n = l_n-(a_{n1}x_1+a_{n2}x_2+\cdots+a_{nt}x_t) & \end{cases} \\ & \text{令}\boldsymbol{L}= \begin{bmatrix} l_1 \\ l_2 \\ \vdots \\ l_n \end{bmatrix}\widehat{X}= \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_t \end{bmatrix}\boldsymbol{V}= \begin{bmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{bmatrix}\quad\boldsymbol{A}= \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1t} \\ a_{21} & a_{22} & \cdots & a_{2t} \\ & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nt} \end{bmatrix} \end{aligned} \]

X 是自变量 / 目标参数、A 是自变量的系数、V 是残差、L 测得的值。

  • 测量方程\(L = AX\)
  • 误差方程\(V = L - A\hat{X}\)
    • \(t\) 个参数,\(n\) 个式子
    • \(L\):观测值向量(\(n \times 1\)
    • \(\hat{X}\):未知参数估计向量(\(t \times 1\)
    • \(A\):系数矩阵(\(n \times t\)
    • \(V\):残差向量

等精度测量 的最小二乘原理矩阵形式:

\[ V^T V = (L - A\hat{X})^T (L - A\hat{X}) = \min \]

不等精度测量 的最小二乘原理(引入权矩阵 \(P\)):

\[ P_{n\times n}= \begin{bmatrix} p_1 & 0 & \cdots & 0 \\ 0 & p_2 & \cdots & 0 \\ & & \vdots \\ 0 & 0 & \cdots & p_n \end{bmatrix}= \begin{bmatrix} \sigma^2/{\sigma_1}^2 & 0 & \cdots & 0 \\ 0 & \sigma^2/{\sigma_2}^2 & \cdots & 0 \\ & \vdots \\ 0 & 0 & \cdots & \sigma^2/{\sigma_n}^2 \end{bmatrix} \]
\[ V^T P V = \min \]

5.2 正规方程⚓︎

0. 正规方程的定义⚓︎

\[ \begin{aligned} & \text{正规方程:}\text{将误差方程按最小二乘法原理转化得到的} \\ & \text{有确定解的代数方程组。} \\ & \begin{aligned} & \begin{cases} \boldsymbol{v}_1 =\boldsymbol{l}_1-(\boldsymbol{a}_{11}\boldsymbol{x}_1+\boldsymbol{a}_{12}\boldsymbol{x}_2+\cdots+\boldsymbol{a}_{1t}\boldsymbol{x}_t) \\ \boldsymbol{v}_2 =\boldsymbol{l}_2-(\boldsymbol{a}_{21}\boldsymbol{x}_1+\boldsymbol{a}_{22}\boldsymbol{x}_2+\cdots+\boldsymbol{a}_{2t}\boldsymbol{x}_t) \\ \vdots & \\ \boldsymbol{v}_n =\boldsymbol{l}_n-(\boldsymbol{a}_{n1}\boldsymbol{x}_1+\boldsymbol{a}_{n2}\boldsymbol{x}_2+\cdots+\boldsymbol{a}_{nt}\boldsymbol{x}_t) \\ \end{cases} \\ \end{aligned} & \end{aligned} \]
\[ \boldsymbol{v}_1^2+\boldsymbol{v}_2^2+\cdots+\boldsymbol{v}_n^2 =\boldsymbol{m}\boldsymbol{i}\boldsymbol{n} \]

\[ \begin{cases} \frac{\displaystyle \partial(\sum_{i = 1}^n{v_i}^2)}{\displaystyle \partial x_1}= 0 \\ \vdots \\ \frac{\displaystyle \partial(\sum_{i = 1}^n{v_i}^2)}{\displaystyle \partial x_t}= 0 & & \end{cases} \]

经过一系列化简后,得到

\[ \begin{aligned} \text{正规方程} & \begin{cases} \displaystyle\sum_{i=1}^na_{i1}l_i=\displaystyle\sum_{i=1}^na_{i1}a_{i1}x_1+\displaystyle\sum_{i=1}^na_{i1}a_{i2}x_2+\cdots+\displaystyle\sum_{i=1}^na_{i1}a_{it}x_t \\ \displaystyle\sum_{i=1}^na_{i2}l_i=\displaystyle\sum_{i=1}^na_{i2}a_{i1}x_1+\displaystyle\sum_{i=1}^na_{i2}a_{i2}x_2+\cdots+\displaystyle\sum_{i=1}^na_{i2}a_{it}x_t \\ \displaystyle\sum_{i=1}^na_{it}l_i=\displaystyle\sum_{i=1}^na_{it}a_{i1}x_1+\displaystyle\sum_{i=1}^na_{it}a_{i2}x_2+\cdots+\displaystyle\sum_{i=1}^na_{it}a_{it}x_t & & \end{cases} \end{aligned} \]

\[ A^{T}V =0 \]

1. 等精度测量线性参数⚓︎

通过对 \(\sum v_i^2\) 求偏导并令其为 0,可得正规方程牢记正规方程,他排除了 V 的存在

\[ A^T A \hat{X} = A^T L \]

\(C = A^T A\),则待测量 \(\hat{X}\) 的唯一解为:

\[ \hat{X} = (A^T A)^{-1} A^T L = C^{-1} A^T L \]

2. 不等精度测量线性参数⚓︎

引入权矩阵 \(P\)(对角阵,对角元为 \(p_i = \sigma^2 / \sigma_i^2\)),正规方程为:

\[ A^T P A \hat{X} = A^T P L \]

待测量 \(\hat{X}\) 的解为:

\[ \hat{X} = (A^T P A)^{-1} A^T P L \]

3. 非线性参数的处理⚓︎

对于非线性函数 \(y = f(x)\),采用 线性化 方法处理:

  1. 确定近似值 \(x_{i0}\)
  2. 利用泰勒级数 \(f(x) = f(x_0)+f'(x_0)(x-x_0) = f(x_0)+f'(x_0)\delta\) 展开,忽略高次项,转化为线性方程组。
  3. 求解修正量 \(\delta\),则 \(x = x_0 + \delta\)

5.3 精度估计⚓︎

最小二乘法处理的最终结果包含两方面:待求量(\(x_1,x_2,...,x_t\))的最佳估计值直接测量结果(\(l_1,l_2,...,l_n\))精度估计

1. 测量数据(\(l_1,l_2,...,l_n\))的精度估计(单位权中误差)⚓︎

如果 \(v_i\) 服从正态分布,标准差 \(\sigma\)。那么 \((\sum v_i^2)/\sigma^2\) 服从 \(\chi^2\) 分布,其自由度 n-t, 有 \(\chi^2\) 变量的数学期望

\[ E\left [\frac{\left(\sum{v_i}^2\right)}{\sigma^2}\right] = n-t \]

根据残差 \(V\) 计算直接测量数据的标准差 \(\sigma\)(又称单位权中误差):

等精度测量:

数学期望表达了对一个变量的最佳估计量

\[ E =\left\{\frac{\sum_{i = 1}^n{v_i}^2}{n-t}\right\}=\sigma^2 \]

所以,误差估计为

\[ \widehat{\sigma}=\sigma =\sqrt{\displaystyle \frac{\sum (v_{i}^2)}{n-t}} \]

令 t = 1, 由上式又可导出 Bessel 公式。

不等精度测量:

\[ \hat{\sigma} = \sqrt{\frac{\sum p_i \cdot v_i^2}{n - t}} \]
  • \(n\):测量次数
  • \(t\):未知数个数
  • \(n-t\):自由度

2. 最小二乘估计量(\(x_1,x_2,...,x_t\))的精度估计(待求参数精度)⚓︎

利用协方差矩阵进行传播。

等精度情况: 参数估计量的协方差矩阵为:

\[ D(\hat{X}) = \sigma^2 (A^T A)^{-1} \]

设逆矩阵 \((A^T A)^{-1}\) 的对角线元素为 \(d_{ii}\),则各待求参数 \(x_i\) 的标准差为:

\[ \sigma_{x_i} = \hat{\sigma} \sqrt{d_{ii}} \]

不等精度情况: 利用 \((A^T P A)^{-1}\) 的对角线元素 \(d_{ii}\)

\[ \sigma_{x_i} = \hat{\sigma} \sqrt{d_{ii}} \]

5.4 小结⚓︎

1. 矩阵最小二乘法解题步骤总结⚓︎

  1. 列出测量残差方程

    \[ V = L - A\hat{X} \]
  2. 构造矩阵

    • 确定系数矩阵 \(A\)
    • 确定观测向量 \(L\)
    • 若是加权测量,确定权矩阵 \(P\)
  3. 求解参数: 计算正规方程的解:

    \[ \hat{X} = C^{-1} A^T L \quad \text{或} \quad \hat{X} = (A^T P A)^{-1} A^T P L \]

    同时求出逆矩阵 \(C^{-1}\)(用于后续精度计算)。

  4. 精度估计

    • 回代求残差向量 \(V\)
    • 计算单位权标准差 \(\hat{\sigma}\)
    • 利用逆矩阵对角元素 \(d_{ii}\) 计算参数标准差 \(\sigma_{x_i}\)
  5. 结果表达

    \[ x_i = (\hat{x}_i \pm U_{95}) \]

2. 公式总结⚓︎