Abstract
Starting with Tukey's pioneering work in the 1970s, the notion of depth in statistics has been widely extended, especially in the last decade. Such extensions include those to high-dimensional data, functional data, and manifold-valued data. In particular, in the learning paradigm, the depth-depth method has become a useful technique. In this article, we extend the lens depth to the case of data in metric spaces and study its main properties. We also introduce, for Riemannian manifolds, the weighted lens depth. The weighted lens depth is nothing more than a lens depth for a weighted version of the Riemannian distance. To build it, we replace the geodesic distance on the manifold with the Fermat distance, which has the important property of taking into account the density of the data together with the geodesic distance. Next, we illustrate our results with some simulations and also in some interesting real datasets, including pattern recognition in phylogenetic trees, using the depth-depth approach. La notion de profondeur statistique a émergé dans les années 70 dans un travail pionnier de Tukey. Cette notion a très largement été étudiée et étendue dans la dernière décennie. Certaines de ces extensions concernent les données en grande dimension, les données fonctionnelles ou à valeurs sur une variété. En apprentissage machine, la méthode de classification utilisant le vote par profondeur (depth-depth), est très utilisée. Dans cet article, nous étendons la notion de profondeur lentille (lens depth) pour des données à valeurs dans un espace métrique et nous étudions les principales propriétés de cette extension. Nous introduisons également, dans le cas d'une variété riemannienne, la profondeur de lentille pondérée. Cette profondeur est aussi une profondeur de lentille pour une version pondérée de la distance riemannienne. Dans cette seconde extension, on remplace la distance géodésique sur la variété par la distance de Fermat. Cela permet ainsi de prendre en compte la densité de probabilité des observations. Nous illustrons nos résultats sur des données synthétiques et réelles. En particulier, nous appliquons les outils développés sur un problème de reconnaissance de formes d'arbres phylogéniques. Please note: The publisher is not responsible for the content or functionality of any supporting information supplied by the authors. Any queries (other than missing content) should be directed to the corresponding author for the article.
Published Version (Free)
Talk to us
Join us for a 30 min session where you can share your feedback and ask us any queries you have