Классификатор SVM с ядром RBF хорошо работает с перекрестной проверкой данных обучения, но не дает результатов испытаний. В чем дело? - DataScientist
0 голосов
/ 11 февраля 2019

Согласно Практическому руководству :

Мы предлагаем, чтобы новички сначала попробовали следующую процедуру:

  • Преобразование данных в формат пакета SVM
  • Провести простое масштабирование данных
  • Рассмотрим ядро ​​RBF K (x, y) = ...
  • Используйте перекрестную проверку, чтобы найти лучший параметр C и γ
  • Используйте лучшие параметры C и γ для тренировки всего тренировочного набора5
  • Тест

Я нашел оптимальный C и & gamma; используя перекрестную проверку данных обучения. Точность составляет около 60% и около 4000 примеров для обучения.

По данным испытаний все прогнозы относятся к одному классу. Изменение C или & gamma; может переключать все прогнозы на другой класс.

  1. Значит ли это, что данные испытаний значительно отличаются от данных обучения, и модель ничего не обобщала?
  2. Если я в конечном итоге собираюсь проверить модель по данным испытаний, то зачем использовать CV на данных обучения? Лучше найти оптимальный C и & gamma; используя тестовые данные?
  3. Имеет ли смысл делать CV для всех данных?
...