Связь между выбором ядра для r аффинной матрицы в спектральной кластеризации и внедрением в более высокое r мерное пространство с использованием карт характеристик - DataScientist
0 голосов
/ 09 января

Итак, я изучал спектральную кластеризацию, где они используют некоторую аффинную функцию, связанную с предварительно построенным графиком точек выборки o r data $\{x_1,...x_n\}$. Если мы вызываем функцию сродства $W$, то матрица сродства становится $W_{ij}:=W(x_i,x_j)$. Часто они используют ядро ​​(например, ядро ​​Гаусса $k$ |||, заданное $k(x,y)=exp(-||x_i-x_j||^2/\sigma)$), чтобы построить матрицу $W$, то есть матрица сродства $W$ определяется как: $W_{ij}=k(x_i,x_j)$.

Мой вопрос: Существует ли интерпретация этой основанной на ядре аффинной матрицы $W$, которая использует карты признаков o r вложения, которое отображает исходные данные в более высокое значение r измерение (возможно, даже бесконечномерное гильбертово пространство $H$ с внутренним r продуктом $<,>$), где новые данные легче поддаются обработке? Fo r эти семьи r с этим видом идей, я говорю о возможной интерпретации, где $k(x_i,x_j)= <\phi(x_i), \phi(x_j)>_H$. Мы уже видели мотивацию в ядре SVM, где отображение данных $\{x_1,...x_n\}$ в более высокое r измерение $H$ делает данные линейно разделимыми, но нам не нужно знать карту $\phi$ в явном виде (трюк ядра ), o r, в случае ядра PCA, где базовая структура коллектора обнаруживается через ядро ​​PCA. Но какова мотивация для r использования функций ядра для r построения матриц сродства в спектральной кластеризации?

NB, поскольку $k$ является симметричным c и может быть записано как inne r product $k(x_i,x_j)= <\phi(x_i), \phi(x_j)>_H$ fo r немного $H$ (см. Первый ответ r на этот вопрос ), я понимаю, что такая карта возможностей $\phi$ существует. Но есть ли реальная необходимость использовать основанную на ядре аффинную матрицу с точки зрения встраивания в более высокое r мерное пространство?

...