Drug Detector

拉曼应用中PCA主成分分析原理

Author:管理员

主成分分析 (PCA, principal component analysis)是一种数学降维方法, 利用正交变换 (orthogonal transformation)把一系列可能线性相关的变量转换为一组线性不相关的新变量,也称为主成分,从而利用新变量在更小的维度下展示数据的特征。

主成分是原有变量的线性组合,其数目不多于原始变量。组合之后,相当于我们获得了一批新的观测数据,这些数据的含义不同于原有数据,但包含了之前数据的大部分特征,并且有着较低的维度,便于进一步的分析。

在空间上,PCA可以理解为把原始数据投射到一个新的坐标系统,第一主成分为第一坐标轴,它的含义代表了原始数据中多个变量经过某种变换得到的新变量的变化区间;第二成分为第二坐标轴,代表了原始数据中多个变量经过某种变换得到的第二个新变量的变化区间。这样我们把利用原始数据解释样品的差异转变为利用新变量解释样品的差异。

这种投射方式会有很多,为了最大限度保留对原始数据的解释,一般会用最大方差理论或最小损失理论,使得第一主成分有着最大的方差或变异数 (就是说其能尽量多的解释原始数据的差异);随后的每一个主成分都与前面的主成分正交,且有着仅次于前一主成分的最大方差 (正交简单的理解就是两个主成分空间夹角为90°,两者之间无线性关联,从而完成去冗余操作)。

01gsgsg-700x500.png

下面是导入的两种元素拉曼谱图,每组各是5组数据,共10个数据

image.png

经过PCA处理后,可以明显的看到两组数据,一组位于第一象限,一组位于第二象限。第一组在第一象限,自相关性很好,说明样本基本相似,但是第二组的自相关性不是很好,说明测试中可能存在误差,需要进一步修正测试的样本。


image.png

PCA的分组可以初步测试拉曼样本是否符合测试一致性的条件,只有在样本一致性的前提下,进行进一步分析才有实际意义。


Recommend
Related Product
Online Service
Contact

Hotline

+86-138 0199 7980

Office hour

Monday to Saturday

Company Phone

13801997980

QR Code
OnlineService