2.7. 经验协方差

已知数据集的协方差矩阵与经典 maximum likelihood estimator(最大似然估计) (或 “经验协方差”) 很好地近似,条件是与特征数量(描述观测值的变量)相比,观测数量足够大。 更准确地说,样本的最大似然估计是相应的总体协方差矩阵的无偏估计。

样本的经验协方差矩阵可以使用 empirical_covariance 包的函数计算 , 或者通过 EmpiricalCovariance 使用 EmpiricalCovariance.fit 方法将对象与数据样本拟合 。 要注意,取决于数据是否居中,结果会有所不同,所以可能需要准确使用参数 assume_centered。 如果使用 assume_centered=False ,则结果更准确。且测试集应该具有与训练集相同的均值向量。 如果不是这样,两者都应该使用中心值, assume_centered=True 应该使用。

例子:


书籍推荐