FrançaisEnglish

Érudit | Dépôt de documents >
CIRANO - Centre interuniversitaire de recherche en analyse des organisations >
Cahiers scientifiques >

Veuillez utiliser cette adresse pour citer ce document :

https://depot.erudit.org//id/000074dd

Titre: Spectral Clustering and Kernel PCA are Learning Eigenfunctions
Auteur(s): Bengio, Yoshua
Vincent, Pascal
Paiement, Jean-François
Date de publication: 2003-05
Editeur: Centre interuniversitaire de recherche en analyse des organisations (CIRANO)
Collection/Numéro: Série scientifique (CIRANO);2003s-19
Scientific series (CIRANO);2003s-19
Résumé: Dans cet article, on montre une équivalence directe entre la classification spectrale et l'ACP à noyau, et on montre que les deux sont des cas particuliers d'un problème plus général, celui d'apprendre les fonctions propres d'un noyau. Ces fonctions fournissent une base pour un espace de Hilbert dont le produit scalaire est défini par rapport à la densité des données. Les fonctions propres définissent une transformation de coordonnées naturelles pour de nouveaux points, alors que des méthodes comme la classification spectrale et les 'Laplacian eigenmaps' ne fournissaient un système de coordonnées que pour les exemples d'apprentissage. Cette analyse suggère aussi de nouvelles approches à l'apprentissage non-supervisé dans lesquelles on extrait des abstractions qui résument la densité des données, telles que des variétés et des classes naturelles.

In this paper, we show a direct equivalence between spectral clustering and kernel PCA, and how both are special cases of a more general learning problem, that of learning the principal eigenfunctions of a kernel, when the functions are from a Hilbert space whose inner product is defined with respect to a density model. This defines a natural mapping for new data points, for methods that only provided an embedding, such as spectral clustering and Laplacian eigenmaps. The analysis also suggests new approaches to unsupervised learning in which abstractions such as manifolds and clusters that represent the main features of the data density are extracted.
URI/URL: http://www.cirano.qc.ca/pdf/publication/2003s-19.pdf
https://depot.erudit.org/id/000074dd
ISSN: 1198-8177
Collection(s) :Cahiers scientifiques

Fichier(s) constituant ce document :

2003s-19.pdf (Adobe PDF ; 329.18 kB)

Tous les documents du dépôt d’Érudit sont protégés par droit d'auteur, avec tous droits réservés.

 

À propos d’Érudit | Abonnements | RSS | Conditions d’utilisation | Pour nous joindre |

Consortium Érudit ©  2016