Pomoc w programowaniu, odpowiedzi na pytania / Pyton / Dlaczego wyniki różnią się między Matlab a nauką scikit podczas korzystania z regresji PLS? - python, matlab, scikit-learn, regression

Dlaczego wyniki różnią się między programem Matlab a nauką scikit podczas korzystania z regresji PLS? - python, matlab, scikit-learn, regression

Używam PLSRegression.predict formie sklearn.cross_decomposition i plsregress z MATLAB (2014a), a wynik jest trochę inny. Jestem pewien, że użyłem tych samych komponentów i danych, ponieważ Matlab zawsze działa lepiej niż uczenie się scikit.

Pyton:

from sklearn.cross_decomposition import PLSRegression
pls = PLSRegression(n_components=8)
pls.fit(X_train, Y_train)
Y_pred = pls.predict(X_train)

Matlab:

[XL,YL,XS,YS,BETA,PCTVAR,MSE]=plsregress(X_train , Y_train ,8);
Yfit = [ones(size(X_train,1),1) X_train]*BETA;

Odpowiedzi:

1 dla odpowiedzi № 1

Wierzę, że scikit-learn używa algorytmu NIPALS dla PLS, podczas gdy MATLAB używa algorytmu SIMPLS. Prawdopodobnie dają nieco różniące się wyniki.

Zobacz stronę dokumentacji dla plsregress w MATLAB, z odniesieniem do algorytmu na dole. Nie mam wygodnego łącza do NIPALS, ale jest to algorytm Svante Wolda i dość szeroko opisany w Internecie.

Powiązane pytania

Klasyfikacja scikit-learn na miękkich etykietach - nauka scikit

wartość ujemna dla "mean_squared_error" - regresja, nauka scikit, regresja liniowa, lasso

sklearn LogisticRegression bez regularyzacji - python, nauka-scikit, regresja

asymetryczna regularyzacja w bibliotekach uczenia maszynowego (np. scikit) w python - python, machine-learning, scikit-learn, asymetryczny, regularyzowany

Szkolenie Zestaw danych o wymiarze N w regresji logistycznej z wykorzystaniem modelu scikit - python, nauka scikit, regresja logistyczna

Jak zbudować model regresji w python? - python, python-3.x, regresja, dopasowywanie danych

Uzyskanie podsumowania z regresji logistycznej (Python) - python, scikit-learn, regresja logistyczna

Regresja liniowa za pomocą Scikit-learn vs Statsmodels - python, uczenie maszynowe, nauka scikit-learning, regresja liniowa, statmodele

Jak zastosować LogisticRegression Scikit-learn dla niektórych danych dziesiętnych? - python, uczenie maszynowe, nauka naukowa, regresja liniowa, logistyka

Python SKLearn: Logistic Regression Probabilities - python, uczenie maszynowe, nauka scikit, regresja logistyczna

nauka klasyczna scikit, która potrafi obsłużyć NaN w danych? - Python, uczenie maszynowe, nauka scikit, nan

Cross Validation, nauka scikit, równoległe działanie jest wolniejsze - python, pydev, scikit-learn

Python SK Learn: Czy możliwe jest podawanie kilku zestawów danych do "SGDClassifier" od sk learn do aktualizacji parametrów - python, uczenie maszynowe, nauka scikit-learning, regresja logistyczna

Jak wyodrębnić predyktor regresji Scikita - nauczyć się implementować w C ++? - python, c ++, scikit-learn, regression, random-forest

Problemy z pamięcią za pomocą ARDRegression w nauce scikit - python, statystyki, nauka scikit

Regresja liniowa z dodatnimi współczynnikami w języku Python - python, uczenie maszynowe, nauka scikitowa, regresja liniowa

Przewidywanie następnego celu w sekwencji. Jakiego rodzaju jest to klasyfikacja? - uczenie maszynowe, przewidywanie, silnik rekomendacji, sekwencje, klasyfikacja wieloklasowa

jak przewidzieć zapotrzebowanie na elektryka, hydraulika itp. [zamknięty] - uczenie maszynowe, głębokie uczenie się

Próbkowanie warstwowe do regresji - uczenie maszynowe, svm, ekstrakcja cech, pobieranie próbek, bigdata

Wybór algorytmów uczenia maszynowego dla danych [zamknięty] - algorytm, uczenie maszynowe, regresja