LatentFactorModelsLatent Factor ModelsLatentFactorModels 使用最小化误差平方和来求解因子载荷矩阵和潜在因子矩阵。在因子载荷矩阵的转置乘以因子载荷矩阵是单位阵的约束下,同时潜在因子矩阵的转置乘以潜在因子矩阵是对角阵的约束下,我们可以将LatentFactorModelsLatent Factor ModelsLatentFactorModels 的数学表达式转化为以下形式:
X=LF+εX = LF + εX=LF+ε
其中,XXX 是观测数据矩阵,LLL 是因子载荷矩阵,FFF 是潜在因子矩阵,εεε 是误差项或者噪声。
我们需要最小化误差平方和,即:
min(∣∣X−LF∣∣2)min(||X - LF||^2)min(∣∣X−LF∣∣2)
使用最小二乘法来求解上述问题时,我们需要将目标函数对 LLL 和 FFF 分别求导,然后令导数等于 0,从而得到 LLL 和 FFF 的解析解。具体而言,我们可以先将误差平方和展开,并将其关于 LLL 和 FFF 分别求导:
(∣∣X−LF∣∣2)/L=−2X′F+2LFF′(||X - LF||^2) / L = -2X'F + 2LFF'(∣∣X−LF∣∣2)/L=−2X′F+2LFF′
(∣∣X−LF∣∣2)/F=−2L′X+2L′LFF′(||X - LF||^2) / F = -2L'X + 2L'LFF'(∣∣X−LF∣∣2)/F=−2L′X+2L′LFF′
令导数等于 0,我们得到了以下的解析解:
L=XVV′L = XVV'L=XVV′
F=(VV′)(−1)V′XF = (VV')^{(-1)}V'XF=(VV′)(−1)V′X
其中,VVV 是X′XX'XX′X 的特征向量,且满足 V′V=IV'V = IV′V=I,III 是单位矩阵。注意到 LLL 的形式与特征向量的形式非常相似,因此我们可以将 LLL 表示为 VVV 的前 kkk 列(kkk是因子的数量),即:
L=[v1,v2,...,vk]L = [v1, v2, ..., vk]L=[v1,v2,...,vk]
同时,我们可以将 F 表示为样本矩阵 XXX 乘以 LLL 的估计值,即:
F=X[v1,v2,...,vk]([v1,v2,...,vk])′X′F = X[v1, v2, ..., vk]([v1, v2, ..., vk])'X'F=X[v1,v2,...,vk]([v1,v2,...,vk])′X′
这里的 ([v1,v2,...,vk])′([v1, v2, ..., vk])'([v1,v2,...,vk])′ 表示 VVV 的前 kkk 列组成的矩阵的转置。
综上所述,由于因子载荷矩阵的转置乘以因子载荷矩阵是单位阵的约束下,以及潜在因子矩阵的转置乘以潜在因子矩阵是对角阵的约束下,因子载荷矩阵估计量由特征向量组成,潜在因子矩阵是由样本矩阵乘以因子载荷矩阵估计量。