Estoy usando la técnica PCA de Sklearn. Necesito resolver:
pca1 = beta1. c1 + beta2. c2 + beta3. c3 + beta4. c4 + beta5. c5
Leí en la documentación que los componentes están ordenados por expli- cación_varianza_. ¿Cómo sé quiénes son los valores beta?
d = {"c1": [3, 7 ,1 ,4], "c2": [8, 2 ,9 ,5], "c3": [0, 7 ,9 ,2], "c4": [3, 5 ,9 ,1], "c5": [4, 6 ,8 ,3]}
data= pd.DataFrame(data=d)
print("data:n",data,"n")
x = StandardScaler().fit_transform(data)
pca = PCA(n_components=1)
principalComponents = pca.fit_transform(x)
principalDf = pd.DataFrame(data = principalComponents, columns = ["principal
component 1"])
print("ncomponents: n",pca.components_,"n")
print("nexplained_variance_n",pca.explained_variance_,"n")
Resultado:
datos:
+--+----+----+----+-----+----+
| | c1 | c2 | c3 | c4 | c5 |
|0 | 3 | 8 | 0 | 3 | 4 |
|1 | 7 | 2 | 7 | 5 | 6 |
|2 | 1 | 9 | 9 | 9 | 8 |
|3 | 4 | 5 | 2 | 1 | 3 |
+--+----+----+----+-----+----+
componentes:
[[-0.32703417 0.29320425 0.45731291 0.55565347 0.53776765]]
explicación_varianza_:
[ 3.10207373]
Respuestas
0 para la respuesta № 1¡Los beta son componentes!
beta1 = -0.32703417
beta2 = 0.29320425
beta3 = 0.45731291
beta4 = 0.55565347
beta5 = 0.53776765