数学-方差标准差均方根均方

统计/估计概念(方差、标准差、均方误差、均方根误差、平均绝对误差、协方差等等)

说明:

  • 均值\(\mu = E(X)\)
  • 样本均值\(\bar{\mu} = \frac{1}{N}\sum^N_{n=1}{x_n}(N个样本的均值)\)
  • 有偏估计:由样本值求得的估计值与待估参数的真值之间有系统误差,其期望值不是待估参数的真值。
  • 无偏估计:估计量的数学期望等于被估计参数的真实值。
  • 补充:范数是一种定义在向量或矩阵上的“距离”,表格中所列的是向量范式定义。
名称 英文名 公式 意义 注释
方差 VAR \(D(x)=E\{\sum[X-E(X)]^2\}\) 随机变量或统计数据与均值的偏离程度 描述数据集本身性质
样本方差 Sample VAR \(s^2=\frac{1}{N-1}\sum^N_{n=1}{(x_n-\bar{x})^2}\),其中\(\bar{x}\)为样本均值 依据所给样本对随机变量的方差做出的一个估计 底数\(N-1\),无偏估计,统计性质,大于总体方差
总体方差 Population VAR \(s^2_p=\frac{1}{N}\sum^N_{n=1}{(x_n-\mu)^2}\),其中\(\mu\)为总体均值 依据所给样本对随机变量的方差做出的一个估计 底数\(N\)有偏估计,统计性质,小于样本方差
标准差 SD \(\sigma=\sqrt{D(X)}\) 反映组内个体间的离散程度,量纲与统计对象相同 数据集本身性质
均方差 SD \(\sigma=\sqrt{D(X)}\) 反映组内个体间的离散程度,量纲与统计对象相同 就是标准差,数据集本身性质
均方误差 MSE \(MSE(\hat{x})=\frac{1}{N}\sum^N_{n=1}{(x_n-\mu)^2}\) 它是“误差”的平方的期望值。误差就是估计值与被估计量的差。 估计(预测)的性质
均方根误差 RMSE \(RMSE(\hat{x})=\sqrt{MSE(\hat{x}_n})\) 代表预测的值和观察到的值之差的样本标准差 估计(预测)的性质
均方根值 RMS \(RMS=\sqrt{\frac{\sum^N_{n=1}x^2_n}{N}}\) 在数据统计分析中,将所有值平方求和,求其均值,再开平方 又称有效值,防止正负数平均后减小,例如计算交流电功率,统计性质
平均绝对误差 MAE \(MAE(\hat{x})=\frac{1}{N}\sum^N_{n=1}{\vert x_n-\mu \vert}\) 所有单个观测值与算术平均值的偏差的绝对值的平均 防止正负值抵消,估计(预测)性质
平均绝对百分比误差 MAPE \(MAPE(\hat{x})=\frac{100\%}{N}\sum^N_{n=1}{\vert \frac{x_n-\mu}{x_n}\vert}\) MAE指标的百分比化。MAPE为0%表示完美模型,MAPE大于100 %则表示劣质模型。当真实值有数据等于0时,存在分母0除问题,该公式不可用! 平均绝对值误差的相对化,剔除数值范围影响,估计(预测)性质
协方差 Covariance \(cov(X,Y)=E\{{[X-E(X)][Y-E(Y)]\}}\) 协方差表示的是两个变量的总体的误差。如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。如果X 与Y 是统计独立的,那么二者之间的协方差就是0(反之不成立) 衡量两个变量之间的线性关系,同增同减正相关,一增一减负相关,0是不相关
\(L1\)范数 L1 Norm \(\|x\|_1=\sum^N_{n=1}\vert x_n \vert\) 向量或矩阵元素的绝对值之和 用于向量或矩阵,曼哈顿距离、最小绝对误差等,属于L-P范数
\(L2\)范数 L2 Norm \(\|x\|_2=\sqrt{\sum^N_{n=1}x^2_n}\) 向量或矩阵元素的平方和再开平方 用于向量或矩阵,欧氏距离,属于L-P范数
\(L\infty\)范数 \(L\infty\) Norm \(\|x\|_\infty=\sqrt[\infty]{\sum^N_{n=1}x^\infty_n}=max(X)\) 主要被用来度量所有元素的最大值 用于向量或矩阵,属于L-P范数