D’après les propos de Théodore Papadopulo
cet article est la suite de la première partie Invariance et similitude en vision par ordinateur (1) : aller simple et … retour
Mais… d’où sort ce résultat ? Comment peut-on affirmer que ce sont les birapports entre des distances prises sur des points alignés qui sont invariants dans le cas précédent ? C’est la géométrie mathématiques qui nous apprend tout cela.
Voici comment : dans le cas d’un zoom parfait, on parlera d’homothétie, la transformation est un simple changement de taille. Les rapports entre les tailles, les angles, la forme des objets sont invariants. Les deux objets sont « égaux à un zoom prêt ». On peut donc les rendre égaux en les « normalisant », c’est à dire en faisant en sorte que leur taille globale soit « 1 » pour les deux.
Cependant, ce n’est qu’un exemple introductif. Pour capturer la notion « avoir la même forme » pour deux objets 2D qui auraient pu être déplacés, tournés et zoomés, la transformation est alors une «similitude géométrique» (attention ! voilà un mot qui a un sens multiple… wikipedia est là pour nous permettre de pas se mélanger, de même que pour la notion d’invariance). Les rapports entre les tailles, les angles, la forme des objets sont encore des invariants dans ce cas. Pour rendre deux objets de même forme égaux, il faut centrer (ramener le centre de l’objet à l’origine), redresser (ramener l’orientation principale de l’objet à la verticale), et normaliser la taille de l’image transformée.
Le fait que cette démarche s’applique à toutes les transformations géométriques est un résultat très profond. Une «théorie des invariants» [lien en anglais car le texte français est très imparfait] permet d’étudier toutes les transformations de cette façon. Voici trois exemples :
- Une transformation rigide c’est à dire une translation combinée avec une rotation, préserve les distances (tailles) et les angles, et elle correspond à la géométrie euclidienne: un carré reste toujours un carré de même taille, on le bouge mais on ne le déforme pas.
- Une transformation dite affine, va déformer les tailles et les angles, mais préserve le parallélisme: les droites parallèles resteront parallèles, un carré deviendra un parallélogramme, mais ces côtés garderont la même direction, cela correspond à la géométrie affine. Dans ce cas, les rapports de distances entre points alignés est aussi invariante. Même s’il est similaire, c’est un invariant un peu plus restrictif que pour l’homothétie. La restriction aux points alignés est due au fait que les transformations affines sont plus générales que les homothéties (mais toute homothétie est un cas particulier de transformation affine).
- Quant à la projection d’un objet plan sur une image, il est facile d’établir (pour une optique idéale) que c’est une transformation dite projective, qui déforme tailles, angles, orientations, et ne préserve pas le parallélisme (dans une image de route ou de rails de chemin de fer — sur une portion droite — les bords de la route ou les rails semblent se rejoindre au loin, la transformation liée à l’image a donc transformé un paire de droites parallèles en droites sécantes). Par contre, les transformations projectives préservent le fait que les droites restent droites (rectilignes) au cours de la transformation. On parle de colinéarité. Et c’est un joli exercice que de démontrer que si quatre points sont sur une même droite leur birapport http://fr.wikipedia.org/wiki/Birapport ne change pas même si cette droite passe à travers votre caméra, c’est à dire subit une transformation projective.
Il est aussi important de remarquer que les invariants projectifs sont aussi des invariants affine ou euclidiens car les transformations projectives généralisent ces deux types de transformations.
De la même manière, les invariants affines sont aussi des invariants euclidiens.
Dans ce contexte, cette notion d’invariance est un levier pour mettre en correspondance un ou des objets dont on mesure différentes vues.