линейное против нелинейного ядра SVM - DataScientist
4 голосов
/ 06 августа 2018

Набор данных содержит 213 примеров из 7 классов. Каждый пример 25000 функций. Я хочу изучить модель с SVM (тестовый сценарий используется для 10-кратной перекрестной проверки). Я новичок в машинном обучении, я хочу знать, какой тип ядра использовать в случае моих данных: линейный или нелинейный (как ядро ​​RBF) Кроме того, я хочу несколько советов, чтобы выбрать значение параметра C. Спасибо!

1 Ответ

4 голосов
/ 07 августа 2018

Под элементами вы подразумеваете образцы / примеры, верно?

Если ваш набор данных состоит из 213 выборок по 25000 объектов каждый, у вас есть намного более серьезная проблема, которую необходимо решить, чем выбор гиперпараметров SVM.

Короче говоря, 213 образцов очень мало для размерности вашей задачи. В многомерных пространствах обычно требуется, чтобы много данных имели достаточное представление пространства (а это всего лишь один из проблем , связанных с многомерными данными). Проблема main , с которой вам приходится иметь дело, это выбор функции , чтобы уменьшить количество функций.

Теперь, чтобы ответить на ваш вопрос:
Если бы мне пришлось выбирать, я бы взял линейное ядро ​​ в такой задаче. Последнее, что вам нужно, это проецировать данные в еще более высокое пространство измерений.

...