Ayuda en la programación, respuestas a preguntas / Aprendizaje automático / La validación cruzada es la selección de características en la clasificación: aprendizaje automático, validación cruzada, selección de características

La validación cruzada es la selección de características en la clasificación: aprendizaje automático, validación cruzada, selección de características

Estaba viendo esto vídeo desde el famoso curso Intro to Stat Learning sobre validación cruzada en la selección de funciones.

Los profesores dijeron que deberíamos formar los pliegues antes de realizar cualquier ajuste de modelo y selección de características. También dijeron que en cada división, podemos terminar con un conjunto diferente de "mejores predictores"

Mi pregunta es, si ese es el caso, ¿cómo podemos determinar los mejores predictores generales para el uso futuro? En otras palabras, si tengo un nuevo conjunto de datos, ¿cómo puedo saber qué predictores debo usar?

Respuestas

0 para la respuesta № 1

Buena pregunta para un principiante. La respuesta a su pregunta es que use el mismo conjunto de características para uso futuro. Sí, hay un compromiso que las características seleccionadas pueden cambiar con el tiempo. Pero por lo general unos van con las características seleccionadas antes. Pero lo importante es que los datos iniciales utilizados para la selección de características deberían ser lo suficientemente buenos con un número suficiente de muestras para que reflejen casi todos los casos del problema. Si este es el caso, por lo general, las características seleccionadas no cambiarían mucho también para los nuevos datos de prueba.

preguntas relacionadas

¿Es bueno realizar la validación cruzada con el mismo conjunto de datos que se utiliza en la fase de entrenamiento? - validación, aprendizaje automático, weka, validación cruzada, aprendizaje supervisado

¿Debo dividir mis datos en conjuntos de entrenamiento / prueba / validación con la validación de K-fold-cross? - validación, aprendizaje automático

Selección de muestras en Scikit-Learn - scikit-learn

¿Se puede usar el modelo validado para hacer un conjunto de datos de predicción? - r, validación, aprendizaje automático, validación cruzada, gbm

Realización de selección de funciones con XGBoost R - r, caret, selección de características, xgboost

Cómo considerar diferentes costos para diferentes tipos de errores en SVM usando R - r, svm

Selección de funciones del conjunto de conjuntos de funciones: python, aprendizaje automático, scikit-learn, selección de funciones

¿Debo hacer una selección de características antes de aplicar mi algoritmo de aprendizaje automático? - python, algoritmo, clasificación, knn, aprendizaje supervisado

Cross Validation y perfcurv en Matlab - matlab, machine-learning, cross-validation, auc

Selección de funciones avanzadas de matlab - matlab, aprendizaje automático, selección de funciones

cómo dividir el conjunto de datos en conjunto de entrenamiento y conjunto de validación [cerrado] - aprendizaje automático, aprendizaje de scikit, extracción de datos, aprendizaje profundo, análisis de datos

cómo generar un algoritmo de clasificación de aprendizaje automático de vectores de características - machine-learning, classification

Weka machine learning: ¿cómo interpretar el clasificador Naive Bayes? - machine-learning, weka, clasificación

las redes neuronales son demasiado sensibles para la entrada - machine-learning, artificial-intelligence, neural-network

Aclaración de validación cruzada - aprendizaje automático, validación cruzada

¿SVM tiene una selección interna de características? - Aprendizaje automático, clasificación, svm.

Cómo obtener precisión de entrenamiento en svmlight con validación cruzada - aprendizaje automático, svm, validación cruzada, svmlight

Al realizar la validación cruzada, ¿qué cambia si se asegura de que la distribución de clases en el conjunto de entrenamiento y prueba sea igual a todo el conjunto? - Aprendizaje automático, minería de datos, validación cruzada

Método sugerido de selección / extracción de funciones no supervisadas para la clasificación de 2 clases - clasificación, extracción de características, selección de características

¿Cómo utilizar la validación cruzada de k-fold en un clasificador bayes naive? - clasificación, validación cruzada