=
où (l s) est une branche de feuille l (le littéral à effacer), B un arbre et p la clause en
production, alors l’étape suivante a l’une des forme C1 ou C2.
C1. On met en production le littéral l si l’étape suivante est :
C2. On effectue une résolution si l’étape suivante est :
où les littéraux l’i
sont tels que les conditions de C2a et de C2b sont vérifiées.
C2a. Il existe une clause c’ de C, la clause appelée à cette étape,
- qui contient l’opposé de l,
- dont aucun littéral n’est dans la branche (l s) (les littéraux de cette branche sont
les ascendants ou a-ancêtres)
- dont aucun littéral n’a pour opposé une feuille de l’arbre B (les frères de l)
- dont aucun littéral n’a pour opposé un littéral de la clause en production p (les
littéraux de cette clause sont les littéraux en production).
Les trois dernières conditions sont les conditions de non répétition.
C2b. Les l’i sont alors les littéraux de cette clause c’, qui ne sont pas
immédiatement effaçables, c’est à dire ceux :
- dont l’opposé n’est pas dans la branche (l s),
- qui ne sont pas égaux à une feuille de l’arbre B,
- qui ne sont pas égaux à un littéral de la clause en production.
2.2.2. Exemple d’utilisation
Soit l’ensemble C de cinq clauses : 42 Conclusion conséquente et la production
¬a b c
¬b d e
f e ¬a ¬d c
¬c e f
¬e f g
L’ensemble C ⋃ {a f} implique la clause f g et C ne l’implique pas. Il existe donc au
moins une production d’origine a f qui produit f g. C’est par exemple le cas de :
1. <0 ,(a) (f)>
2. ¬a b c <0 ,(ba) (ca) (f)>
3. ¬b d e <0 ,(dba) (eba) (ca) (f)>
4. f e ¬a ¬d c <0 ,(eba) (ca) (f)>
5. ¬e f g <0 ,(geba) (ca) (f)>
6.
7. ¬c e f
8. ¬e f g
9.
Pour visualiser globalement toutes les étapes d’une production, il est possible de faire un
dessin du type :
Figure 2.3. Les étapes d’une production
2.3. Champ de production
La notion de champ de production dépassant le cadre restreint du calcul propositionnel,
cette partie en donnera la définition dans le cadre général du calcul des prédicats. Une
« formule » sera donc ici une formule de la logique du premier ordre et, bien entendu, une
« formule propositionnelle » une formule du calcul propositionnel.
2.3.1. DéfinitionConclusion conséquente et la production 43
Définition 2.10:
Un champ de production P est un ensemble de formules dont chacune est un résultat
possible dont on a besoin de savoir s’il est vrai ou non dans un certain état de connaissance.
Le but du jeu est de trouver les formules de cet ensemble vraies pour une connaissance
donnée. Il s’agit donc d’une notion assez naturelle qui pourra se définir, correctement d’un
point de vue logique, de manière simple.
De manière très générale, deux problèmes se posent :
Problème 2.1:
Soit :
- L un langage du premier ordre,
- P un ensemble de formules de L, le champ de production,
- C un ensemble de formules de L, la connaissance,
Trouver l’ensemble, produites(C, P), des formules sémantiquement impliquées par C et
appartenant à P.
Si th(C) représente toutes les formules sémantiquement impliquées par C, on a donc :
produites(C, P) = th(C) ∩ P
Problème 2.2:
Soit :
- L, P, C définis comme précédemment,
- C’ un nouvel ensemble de formules de L, la nouvelle connaissance,
Trouver toutes les formules de P impliquées par C ⋃ C’, qui appartiennent à P et qui ne
sont pas impliquées par C.
Cet ensemble des formules se notera nouv-prod(C’, C, P) :
nouv-prod(C’, C, P) = produites(C ⋃ C’, P) – produites(C, P).
Définition 2.11:
Si c1 et c2 sont des clauses, on dira que c1 est une sous clause de c2, ou que c1 subsume c2
si tout littéral de c1 est un littéral de c2. On dira également que c1 subsume strictement de c2
(est une sous clause stricte) si c1 subsume c2 et c2 ne subsume pas c1.
Si F est un ensemble de formules qui ne sont pas des tautologies, et G un sous ensemble
de F, on dit que :
- G est un précurseur de F si toute formule de F est impliquée par une formule de G.
« Pour toute f dans F il existe g dans G telle que g ⊨ f » 44 Conclusion conséquente et la production
- G est un plus petit précurseur de F (ou précurseur minimal de F), si de plus aucune
formule de G n’implique une autre formule de G. « Si G est un précurseur de F, et si g1 et g2
sont dans G et g1 ⊨ g2 alors g1 = g2 ».
Propriété 2.1:
Si G1 et G2 sont deux précurseurs minimaux de F, il existe une bijection bij de G1 dans G2
telle que, pour toute formule g1 de G1, il existe un unique g2 de G2 tel que g1 et bij(g2) sont
logiquement équivalentes.
Définition 2.12:
Un champ de production P est stable pour l’implication sémantique si toute formule qui
implique sémantiquement une formule de P est dans P.
Propriété 2.2:
Si P est un ensemble de clauses propositionnelles, alors P est stable si et seulement si
toute sous clause d’une clause de P est dans P.
2.3.2. Exemple d’utilisation
Si L est un langage propositionnel contenant une infinité de propositions p1, p2, ..., et si la
connaissance est un ensemble de deux clauses :
C = ¬p1⋁p2⋁p3 ‘si p1, alors p2 ou p3 est vrai’
p1 ‘p1 est vrai’
Si le champ de production est l’ensemble des clauses de L ne contenant que des littéraux
positifs (clauses positives), on a :
produites(C, P) = p1 ‘p1 est vrai’
p2⋁p3 ‘p2 ou p3 est vrai’
Si maintenant la nouvelle connaissance se compose des deux unaires :
C’ = p4 ‘p4 est vrai’
¬p3 ‘p3 est faux’
alors on obtient :
nouv-prod(C’, C, P) = p4 ‘p4 est vrai’
p2 ‘p2 est vrai’Conclusion conséquente et la production 45
2.4. Algorithmes de calcul de production
2.4.1. Description simplifiée
Notre problème pratique est dont de calculer toutes les clauses impliquées par un
ensemble fini C de clauses et appartenant à un champ de production P. Comme P est en
général très grand, il est évident que la technique consistant à vérifier, pour toute clause de P,
si elle est impliquée par C ou non, est totalement inapplicable. Cette partie va étudier un
algorithme basé sur la SOL résolution qui essaie de résoudre partiellement ce problème.
Pour bien faire son travail, il doit s’arrêter, ne donner que des résultats corrects et donner
tous les résultats. On s’assure de ceci en démontrant trois propriétés.
Propriété 2.3:
Un ensemble fini de clauses a un ensemble fini de productions (l’algorithme s’arrête).
Propriété 2.4:
Toute clause produite par une production de C est impliquée par C (les résultats sont
valides).
En particulier, si une production de C produit la clause vide, alors C est inconsistant.
Propriété 2.5:
Si une clause d est impliquée par C, il existe une production de C dont la clause produite
subsume d (les résultats sont tous trouvés).
En particulier, si C est inconsistant, il existe une production de C qui produit la clause
vide.
Propriété 2.6:
Si C n’implique pas d et C ⋃ {c} implique d, il existe une production de C ⋃ {c},
d’origine c dont la clause produite subsume d.
En particulier, si C ⋃ {c} est inconsistant, et C ne l’est pas, il existe une production de C
d’origine c qui produit la clause vide.
Il faut maintenant décrire l’algorithme qui génère toutes les clauses impliquées par un
ensemble C de clauses et appartenant à un champ de production P. Cet algorithme a été
implanté en SWI Prolog. Les clauses, branches et arbres sont représentés classiquement :
- un littéral x s’écrira plus(x) s’il est positif et moins(x) s’il est négatif.
- une liste de littéraux (clause ou branche) se notera de la manière habituelle l1. l2... ln.
nil où nil représentant la liste vide.
- un arbre est une liste s1. s2... sm. nil de branches. Les si sont donc des listes non vides
de littéraux (donc différentes de nil).
- un ensemble de clauses est identifié à une liste c1. c2... cp. nil de clauses.46 Conclusion conséquente et la production
Description simplifiée :
Pour produire les clauses impliquées par une liste C = c. C’ (c est une clause et C’ une
liste de clauses éventuellement vide) appartenant à un champ de production P, il faut produire
les clauses impliquées par C’ puis produire les clauses impliquées par c.C’ et non par C’. Pour
ce faire on utilise le prédicat grande-production :
grande-production(nil, P) → ;
grande-production(c.C, P) →
grande-production(C, P)
construire-arbre(c, nil, nil, nil, A)
production(nil, A, C, P) ;
Le cœur de l’algorithme est la définition d’un prédicat à quatre arguments production(p,
A, C, P), où p est la clause en production, A un arbre, C l’ensemble de clauses et P le champ
de production. L’arbre A origine est donné par le prédicat construire-arbre, qui transforme la
clause origine
c = l1. l2... ln. nil
en un arbre dont les branches sont composées d’un littéral de cette clause :
A = (l1.nil).(l2.nil) .... (ln. nil).nil
On définit production par trois clauses Prolog :
(1) production(p, nil, C, P) →
utiliser(p) ;
(2) production(p, (l.s).B, C, P) → /* Forme C2*/
dans(c’, C) /* Prendre une clause c’ de C */
bonne-clause(c’, p, (l.s).B) /* Conditions C2a */
construire-arbre(c’, p, (l.s).B, B’) /* Construire l’arbre B’ à partir de la
clause c’, conditions C2b*/
production(p, B’, C, P) ;
(3) production(p, (l.s).B, C, P) → /* Forme C1*/
bon-debut-de-clause(l.p, P) /* l .p satisfaisante le champ de
production P*/
production(l.p, B, C, P) ;
dans(x, x.r) → ;
dans(x, y.r) → dans(x,r) ;
La clause (1) est le cas terminal d’une production. Ici, on l’ajoutera sous de forme d’une
clause Prolog : clause-produite(p) → ;
utiliser(p) → assert(clause-produite(p), nil) ;Conclusion conséquente et la production 47
Pour être en accord avec la définition, bonne-clause doit vérifier les conditions de non
répétition. Il faut donc :
1- S’assurer que l’opposé de la feuille de la première branche de l’arbre est bien dans la
clause candidate.
2- Vérifier que tous les littéraux de cette clause :
- ne sont pas dans la première l.s de l’arbre,
- n’ont pas leur opposé dans la clause en production p,
- n’ont pas leur opposé égal à une feuille de l’arbre B.
Ceci s’effectue de manière naturelle :
bonne-clause(c’, p, (l.s).B) →
oppose(l, l’)
dans(l’, c’)
bons-littéraux(c’, p, (l.s), B)
bons-littéraux(nil, p, A) → ;
bons-littéraux(l.r, p, s.B) →
bons-littéraux(r, p, s.B)
pas-dans(l, s)
oppose(l, l’)
pas-dans(l’, p)
pas-dans-feuilles(l’, B) ;
oppose(plus(x), moins(x)) → ;
oppose(moins(x), plus(x)) → ;
pas-dans(x, nil) → ;
pas-dans(x, y.r) →
dif(x, y)
pas-dans(x, r) ;
pas-dans-feuilles(x, nil) → ;
pas-dans-feuilles(x, (l.s).B) →
pas-dans(x, l.s)
pas-dans-feuilles(x, B) ; 48 Conclusion conséquente et la production
Il faut maintenant définir construire-arbre qui, à partir de la clause
c’ = l1. l2... ln. nil
de la clause en production p et de l’arbre (l.s).B va construire l’arbre
A’ = (l’1.l.s) ... (l’p.l.s).B
les l’i étant les littéraux de c’ non immédiatement effaçables.
construire-arbre(nil, p, s.B, B) → ;
construire-arbre(l.r, p, s.B, (l.s).B’) → /* Conditions C2a sont vérifiées*/
oppose(l, l’)
pas-dans(l’, s)
pas-dans(l, p)
pas-dans-feuilles(l, B)
/
construire-arbre(r, p, s.B, B’) ;
construire-arbre(l.r, p, A, A’) → /* Conditions C2a ne sont pas vérifiées*/
construire-arbre(r, p, A, A’) ;
Pour vérifier qu’une clause est dans un champ de production défini par une quadruplé de
bases quelconque, on peut écrire :
bon-debut-de-clause(c, P.l-iste-P) →
dans-le-champ(c, P)
/ ;
bon-debut-de-clause(c, P.l-iste-P) →
bon-debut-de-clause(c, l-iste-P) ;
dans-le-champ(l.c, ) →
eq(l, s-igne)
dans(l, a-lpha)
longueur-inferieure(l.c, l-ong)
dans(c’, s-ous-cl)
subsume(c, c’)Conclusion conséquente et la production 49
/ ;
subsume(nil, c) →
/ ;
subsume(l.c’, c) →
subsume(c’, c)
dans(l, c) ;
longueur-inferieure(c, infini) →
/ ;
longueur-inferieure(nil, l) → ;
longueur-inferieure(a.c, l) →
/
impasse ;
longueur-inferieure(a.c, l) →
val(sub(l, l), l’)
longueur-inferieure(c, l’) ;
2.4.2. Algorithme avec coupure
A toute étape de production, on essaie d’effacer le premier littéral de la première branche
d’arbre (le littéral à effacer). Pour ce faire, il faut choisir une clause candidate contenant
l’opposé de ce littéral et satisfaisant aux conditions de non répétition, en ôter tous les littéraux
immédiatement effaçables (qui ne satisfont pas aux conditions C2b), puis essayer d’effacer la
clause restante. Quand tous ces choix ont été effectués et résolus, il reste un choix
supplémentaire qui est de mettre en production le littéral à effacer.
Or, si le littéral à effacer a été, pour un certain choix, complètement effacé sans avoir eu
besoin d’installer des littéraux en productions supplémentaires, il est inutile d’effectuer les
choix restants. On peut formaliser ceci par une définition et une propriété.
Définition 2.13:
S’il existe un début de production, D, de dernière étape (j) :
..............................
(i)
.............................. 50 Conclusion conséquente et la production
(j)
telle que B1 = B2 et p1 = p2, on dira que le littéral l a été complètement effacé.
Propriété 2.7:
Dans ce cas toute production égale à D jusqu’à l’étape (i) incluse, ne pourra produire que
des clauses subsumées par d’autres clauses produites par les productions de début D.
Donc, d’après la structure de l’algorithme, qui à partir de l’étage (i+1), calcule toutes les
productions ayant ces (i) premières étapes avant de faire les autres choix pour l à l’étape
(i+1), il sera inutile si ce littéral est complètement effacé de faire ces autres choix. C’est
principalement pour cette raison que l’on essaie d’abord d’effectuer toutes les résolutions
possibles sur un littéral avant de mettre ce littéral en production (avant d’essayer d’effacer de
manière classique un littéral, on regarde s’il n’existe pas une clause contenant son opposé et
dont tous les littéraux sont immédiatement effaçables). Le choix inverse est possible mais
donne de moins bons résultats.
Démonstration :
Soit PR1 une production égale à D jusqu’à (i). Cette production aura une étape (j’) dont
l’arbre est B1, et peut donc s’écrire :
..............................
(i)
..............................
(j’)
..............................
(n’)
PR1 produit la clause p = r q p1 dans laquelle q et r sont des clauses éventuellement vides
(la notation inclut le cas où j’ = n’). Pour prouver le théorème, il faut construire à partir de
PR1 une production, PR2, dont le début est D et dont la clause produite subsume p.
Le début de PR2 est donc :
..............................
(i)
..............................
(j) Conclusion conséquente et la production 51
L’important est que, à l’étape (j’) de PR1 et à l’étape (j) de PR2, les arbres sont égaux. À
l’étape (j), la clause en production, p1, de PR2 est une sous clause de la clause en production à
l’étape (j’), q p1, de PR1.
Les étapes de PR2 qui suivent (j) sont construites à partir des étapes de PR1 qui suivent
(j’) telles que, si la clause appelée contient un littéral de r q alors ce littéral n’est pas
immédiatement effacé mais inséré dans l’arbre. Il sera mis en production à l’étape où il sera
littéral à effacer de l’arbre courant. Plus précisément :
1. L’étape (j+1) de PR2 est construite à partir de l’étape (j’+1) de PR1 telle que :
- si (j’+1) met en production le littéral à effacer, alors (j+1) mettra également en
production ce même littéral à effacer.
- si (j’+1) effectue une résolution sur une clause c, alors (j+1) effectuera également
une résolution sur cette même clause c. Les branches ajoutées à l’arbre B1 (dans
PR2) sont obtenues à partir des littéraux de c non immédiatement effaçables (dans
PR1). Mais les littéraux de c immédiatement effaçables dans PR2, sont les
littéraux de c immédiatement effaçables dans PR1, plus les littéraux de c, égaux à
un des littéraux de q (les ascendants et frères sont les mêmes dans PR1 et PR2 car
les arbres sont égaux à l’étape (i)). Donc les branches à ajouter dans PR2 sont les
branches à ajouter dans PR1, plus éventuellement un certain nombre de branches
dont les racines sont les littéraux de c qui ne sont pas dans q.
2. On répète l’opération pour les étapes suivantes de PR2, qui sont construites à partir
des étapes de PR1. Les clauses appelées sont les mêmes dans PR1 et PR2. La seule
différence est que dans les arbres correspondants (dans PR2) sont insérées un certain
nombre de branches supplémentaires, branches dont les racines seront toujours des
éléments de q. Quand le littéral à effacer (dans PR2) portera sur une de ces branches
supplémentaires, ce littéral sera mis en production. On insère donc un certain nombre
d’étapes qui sont toutes des mises en production de littéraux de q.
La suite de couples ainsi formée est bien une production, car comme PR1 en est une, on
en déduit que pour toutes les étapes de résolution de PR2 les clauses appelées satisfont aux
conditions de non répétition. En effet, ces étapes sont telles que :
- l’étape associée dans PR1 satisfait aux conditions de non répétition
- les ascendants sont les mêmes dans PR1 et PR2 car ces étapes sont des étapes de
résolution et ne portent donc pas sur les branches supplémentaires (on a dit que les
étapes portant sur les branches supplémentaires mettent en production un littéral).
- l’union des frères et littéraux en production de PR2 est incluse dans l’union des frères et
littéraux en production de PR2.
PR2 est donc bien une production et la clause produite par PR2 subsume bien celle
produite par PR1 car les littéraux mis en production dans PR1 et non dans PR2 sont tous dans
q.
Exemple 2.2:
Soit un ensemble de clause : 52 Conclusion conséquente et la production
C = {a b c, ¬a b, ¬a u, ¬u v, ¬v w}
On veut calculer toutes les productions d’origine a b c. L’algorithme construira, par ses
appels récursifs, la première production qui produit la clause c b :
1. <0 ,(a) (b) (c)>
2. ¬a b <0 ,(b) (c)>
3.
4.
Cette production est donnée par le choix de ¬a b à la deuxième étape. Il reste deux choix
à cette étape : soit appeler la clause ¬a u, soit mettre a en production. En fait ces choix sont
inutiles car ils ne pourront générer que des clauses subsumées par d’autres clauses produites
par la production effectuée auparavant. Le premier choix donne trois productions dont la
première est :
1. <0 ,(a) (b) (c)>
2. ¬a u <0 ,(ua) (b) (c)>
3. ¬u v <0 ,(vua) (b) (c)>
4. ¬v w <0 ,(wvua) (b) (c)>
5.
6.
7.
En fait, c b w est subsumée par c b.
2.4.3. Algorithme en Prolog
Pour produire les clauses d’un champ de production P impliquées par un ensemble C on
appellera comme auparavant grande-production(C, P) :
grande-production(nil, P) → ;
grande-production(c.C, P) →
grande-production(C, P)
production(c, nil, nil, nil, p, C, P)
utiliser(p) ;
production(nil, A, B, p, p, C, P) → ; //le cas terminal
production(l.c, A, B, p1, p3, C, P) →
conc(c, B, B1) // B1=c.B, construire la liste des frères
oppose(l, l’)
dans(c1, C)
dans(l’, c1)
bonne-clause(c1, l.A, B1, p1) // Conditions C2a Conclusion conséquente et la production 53
simplifier-clause(c1, l.A, B1, p1, c2) // Conditions C2b, enlever les littéraux
production(c2, l.A, B1, p1, p2, C, P) //Concaténant aux ascendants le littéral
(p1 == p2 *→ !; true) //couper(p1, p2)
production(c, A, B, p2, p3, C, P) ; //si p1 = p2 ou p1≠ p2
production(l.c, A, B, p1, p3, C, P) → //mettre en production si p1≠ p2
bon-debut-de-clause(l.p1, P)
production(c, A, B, l.p1, p3, C, P) ;
bonne-clause(nil, A, B, p) → ;
bonne-clause(l.c, A, B, p) →
pas-dans(l , A)
oppose(l, l’)
pas-dans(l’, B)
pas-dans(l’, p)
bonne-clause(c, A, B, p) ;
simplifier-clause(nil, A, B, p, nil) → ;
simplifier-clause(l.c, A, B, p, l.c’) →
oppose(l, l’)
pas-dans(l’, A)
pas-dans(l, B)
pas-dans(l, p)
/
simplifier-clause(c, A, B, p, c’) ;
simplifier-clause(l.c, A, B, p, c’) →
simplifier-clause(c, A, B, p, c’) ;
conc(nil, y, y) → ;
conc(a.x, y, a.z) →
conc(x, y, z) ;
Où :
production(clause, ascendants, frères, produit-initiale, produit-finale, ensemble, champ) 54 Conclusion conséquente et la production
- La clause à effacer, clause, est un bout d’une clause de c ∪ C qui contient le premier
littéral (littéral à effacer).
- ascendants est la liste des ascendants de ce premier littéral.
- frères est la liste des frères de ce premier littéral, autres que les littéraux de clause.
- A l’appel de production, produit-initiale donne la clause en production à ce moment.
L’argument produit-finale donne alors la clause en production résultante.
Pour que ces algorithmes travaillent avec les variables, il faut les améliorer. Par exemple,
pour représenter l’idée : a est une protéine et b un substrat ; tous les substrats sont activés par
les protéines, ceci doit être écrit dans la basée de données comme ci-dessous :
proteine(a).
substrat(b).
ecrit :-
proteine(X),
substrat(Y),
assert(clause(active(X,Y))). La logique des défauts 55
Chapitre 3. La logique des défauts
3.1. Introduction
Quand un algorithme d’Intelligence Artificielle doit résoudre un problème, il peut être en
mesure de s'appuyer sur des informations complètes. Sa tâche principale est alors de donner
de bonnes conclusions par un raisonnement classique. Dans ce cas, la logique des prédicats
peut être suffisante.
Cependant, souvent l’information est incomplète, car certaines informations ne sont pas
disponibles. Parfois, il peut aussi être nécessaire de répondre rapidement et il est alors
impossible de recueillir toutes les données pertinentes en un temps raisonnable. Dans ce cas,
le système doit faire des conjectures plausibles, c’est la problématique des logiques nonmonotones
[7,9]. Pour la logique des défauts ces conjectures sont basées sur des règles
empiriques, appelées défauts. Par exemple, un médecin d’urgence doit faire des conjectures
sur les causes les plus probables des symptômes observés et il est impossible d'attendre le
résultat de tests éventuellement étendus et chronophages avant le début du traitement.
Lorsque les décisions sont fondées sur des hypothèses, elles peuvent se révéler fausses
face à de nouvelles informations qui seront disponibles [13]. Par exemple les examens
médicaux peuvent conduire à un diagnostic modifié. Il faut alors ajouter de nouvelles
informations qui peuvent être contradictoires, avec les conclusions (le diagnostic) précédent.
Cet ajout est impossible en logique classique, qui a la propriété de monotonie. Intuitivement
cette propriété dit que si une conclusion C est déductible d’un ensemble de prémices P1, et
que l’on ajoute des informations P2 à P1, alors C est démontrable de P1 et P2. Dans le cas de la
logique du premier ordre P1, P2 et C sont des ensembles de formule et la propriété de
monotonie s’écrit :
P1 ⊢ C ⇒ P1 ⋃ P2 ⊢ C
Si cette propriété n’est pas vérifiée, alors on a une logique non-monotone. La logique des
défauts présentée par Reiter en 1980 est une des premières logiques non-monotones. Elle est
très intéressante, car simple à comprendre et à utiliser.
3.2. Notion de défaut
La logique des défauts définie par Reiter formalise le raisonnement par défaut. Elle
permet de traiter les règles admettant des exceptions sans être obligé de remettre en cause les
règles précédemment établies à chaque fois qu'une nouvelle exception apparaît. Une théorie
des défauts est un couple {W, D} où W est un ensemble de formules classiques de la logique
du premier ordre et D un ensemble de défauts, qui sont des règles d'inférence spécifiques. Les
défauts permettent de gérer les informations incomplètes [8].
Par exemple, en hiver, une règle générale utilisée par les arbitres de football pourrait être :
«Un match de football doit avoir lieu, à moins qu’il n’y ait de la neige sur le stade ». Cette
règle de base est représentée par un défaut : 56 La logique des défauts
��������: ¬�����
�����_����
L’interprétation du défaut est la suivante : si on n’a pas l’information explicite qu'il y aura
de la neige dans le stade, il est raisonnable de supposer qu’il n’y aura pas de neige (¬neige) et
de conclure que le match aura lieu. On peut donc préparer le match. Mais s’il y a une forte
chute de neige pendant la nuit avant le match, cette hypothèse n’est plus valide. On sait qu'il y
a de la neige, et il est donc impossible d’assumer ¬neige, donc le défaut ne peut pas être
appliqué. Dans ce cas, il faut renoncer à la conclusion précédente (le match aura lieu). Le
raisonnement est donc non-monotone.
La logique classique n’est pas appropriée pour modéliser cette situation. En effet, on
pourrait tenter d’utiliser la formule
football ∧ ¬neige → avoir_lieu
Le problème avec cette règle, c'est qu’il faut établir de façon définitive qu'il n'y aura pas
de neige dans le stade avant d'appliquer la règle.
Pour résoudre ce problème, le même exemple aurait pu être représenté par le défaut
��������: �����_����
�����_����
avec la règle de logique classique
neige → ¬avoir_lieu.
Si la neige est certaine alors on déduit ¬avoir_lieu par la logique classique, donc on ne
peut pas inférer avoir_lieu par le défaut. Dans cette représentation, le défaut est une règle qui
dit que les matchs se déroulent généralement et les exceptions de cette règle sont représentées
par les règles classiques telles que celle ci-dessus.
Les défauts peuvent être utilisés pour modéliser le raisonnement prototypique, ce qui
signifie que la plupart des instances d’un concept ont une certaine propriété. Un exemple est
l’énoncé « Typiquement, l’enfant a des parents (vivants) », qui peut être exprimé par le
défaut :
������(�): �����_�������(�)
�����_�������(�)
Une autre forme de raisonnement par défaut est le raisonnement sans-risque. Il s'agit de
situations où une conclusion peut être tirée, même si ce n'est pas le plus probable, car une
autre décision peut conduire à une catastrophe. Par exemple « En l'absence de preuve
contraire présumer que l'accusé est innocent, s’exprime par :
�����é(�): ��������(�)
��������(�)La logique des défauts 57
On donne aussi des hiérarchies avec des exceptions qui sont en biologie. L’exemple
classique est « En règle générale, les oiseaux volent », « les manchots sont les oiseaux », « les
manchots ne volent pas ». On a alors le défaut:
������(�): ����(�)
����(�)
avec la règle de logique classique :
manchot(X) → oiseau(X)∧¬vole(X)
Les défauts peuvent être aussi utilisés pour modéliser l’hypothèse du monde clos de
Reiter, utilisée pour les bases de données et pour la programmation logique. Selon cette
hypothèse, un domaine d’application est décrit par un ensemble de formules logiques F. En
simplifiant, l’hypothèse du monde clos dit qu’une information élémentaire positive (un
atome) ϕ est considéré comme faux si F n’implique pas logiquement ϕ. Ceci peut se
représenter par un défaut normal sans prérequis :
����: ¬ϕ
¬ϕ
On encore, s’il est consistant d’assumer ¬ϕ (ce qui est équivalent à ne pas avoir de preuve
pour ϕ), on conclue ¬ϕ
3.3. Syntaxe de la logique des défauts.
Une théorie des défauts ∆ = (D, W) est une paire (D, W), contenant un ensemble W de
formules de la logique des prédicats (appelées faits ou axiomes) et un ensemble dénombrable
D de défauts. Dans sa forme la plus générale, un défaut d s’écrit :
� =
�:�1,�2, … ��
�
où A, B1,…, Bn et C sont des formules logiques bien formées du premier ordre. La formule A
est le prérequis, les formules B1,…, Bn sont les justifications et C est le conséquent.
Un défaut signifie informellement : si A est vérifié, et s’il est possible que B1,…, Bn soient
vrais alors C est inféré.
Un défaut d est appelé normal si et seulement si sa justification est égale à son prérequis,
donc s’il est de la forme :
� =
�: �
�
Un défaut peut contenir des variables libres, par exemple :
������(�): ����(�)
����(�)58 La logique des défauts
Ces défauts sont appelés défauts ouverts. Dans ce cas le défaut ouvert est considéré
comme l’ensemble des défauts où X a été remplacée par tous les termes terminaux (sans
variables) du langage. Un défaut ouvert représente donc un ensemble de défauts fermés qui
peut éventuellement être infini.
3.4. Extensions.
L'utilisation des défauts augmente le nombre de formules déduites de la base de
connaissance W : nous obtenons alors des extensions qui sont des ensembles de théorèmes
dérivables de façon monotone. Intuitivement une extension est obtenue en utilisant un
ensemble maximal consistant de défauts possibles. Cette définition va entrainer qu’il pourra
exister plusieurs extensions éventuellement contradictoires.
3.4.1. Extensions - définition formelle.
Une extension de la théorie des défauts ∆ = (D,W) est un ensemble E de formules, clos
pour la déduction, contenant W et vérifiant la propriété suivante : si d est un défaut de D dont
le prérequis est dans E, sans que la négation de sa justification soit dans E, alors le conséquent
de d est dans E. Plus formellement, les extensions sont définies de la façon suivante.
Définition 3.1: E est une extension de ∆ si et seulement si � = ⋃�=0,∞ ��
, avec :
1) E0
= W
2) Pour tout i, ��+1 = �ℎ(�� ∪ {�/� = (�:�
�
) ∈ �, � ∈ ��
, ¬�∉�})
où Th(F) désigne l'ensemble des théorèmes obtenus en logique classique à partir de F,
c’est à dire Th(F) = {w/F ⊢ w}.
Remarque : Il est important de noter que E apparaît dans la définition de Ei+1. Donc dans
le cas général il peut ne pas être possible de construire E car à cause de la condition ¬B ∉ E,
il faut déjà connaître E pour construire E. La définition n’est donc pas constructive. Ceci peut
être très gênant mais si l’on utilise uniquement des défauts normaux, la condition ¬B ∉ E se
transforme en ¬B ∉ Ei
. Cette fois, il suffit de vérifier que la négation de la justification
n'appartient pas à Ei
. Un algorithme récursif peut donc être utilisé pour calculer E. De plus
lorsque tous les défauts sont normaux et que W est satisfaisable, l'existence d'au moins une
extension est assurée.
Exemple 3.1: Soit ∆ = (D, W), où W = {a}, et D contient les défauts normaux
suivants :
�1 =
�:¬�
¬�
�2 =
�: �
�La logique des défauts 59
On obtient avec la définition des extensions une extension E = Th({a, ¬b}) en utilisant le
défaut d1. Dans ce cas d2 ne pas être utilisé car comme ¬b ∈ E, la justification de d2 n’est pas
vérifiée.
Exemple 3.2: C’est l’exemple classique. On sait que Les manchots sont des oiseaux
et que Titi est un manchot. Ceci va s’exprimer par W composé de deux formules de la logique
des prédicats :
W = {∀x, Manchot(x) → Oiseau(x), Manchot(Titi)}
On sait aussi que Sauf exception, les oiseaux volent et que Sauf exception, les manchots ne
volent pas. On exprime ceci par un ensemble de deux défauts normaux D = {d1, d2} :
d1 = Oiseau(x):Vole(x)/Vole(x)
d2 = Manchot(x):¬Vole(x)/ ¬Vole(x)
Le défaut d1 peut aussi s’exprimer par : Si x est un oiseau et qu'il est consistant de
supposer que x peut voler, alors on conclue que x peut voler. On voit que si l’on utilisait les
deux défauts en même temps on obtiendrait que Vole(Titi) et ¬Vole(Titi) ce qui est
insatisfaisable. Pour cet exemple, on aura deux extensions. On a deux cas :
Cas 1: Dans ce cas on va commencer à construite l’extension en utilisant le défaut d1
- On part de E0
= W = Th({Manchot(Titi) → Oiseau(Titi), Manchot(Titi), Oiseau(Titi)})
- On utilise alors d1. Le prérequis de d1, Oiseau(Titi) est dans E0. La négation de la
justification de d1, ¬vole(Titi), n’est pas dans E0. Donc avec la définition d’une extension, on
peut ajouter Vole(Titi) à E0 pour obtenir E1.
E1
= Th({E0) ∪ Vole(Titi)})
- Ensuite on essaie d’utiliser d2 pour compléter E1. Le prérequis Manchot(Titi) est bien dans
E1. Mais Vole(Titi) qui est la négation de la justification de d2, est dans E1. Il est impossible
d’utiliser d2. Le calcul s’arrête et la première extension est E1. Dans cette extension, Titi vole.
Cas 2: On va maintenant commencer la construction de l’extension en utilisant d2
- On part de E0
= W = Th({Manchot(Titi) → Oiseau(Titi), Manchot(Titi), Oiseau(Titi)})
- On utilise alors d2. Le prérequis de d2, Manchot(Titi) est dans E0. La négation de la
justification de d2, Vole(Titi) n’est pas dans E0. Donc avec la définition d’une extension, on
peut ajouter ¬Vole(Titi) à E0 pour obtenir E1.
E1
= Th({E0) ∪ ¬Vole(Titi)})
- Ensuite on essaie d’utiliser d1 pour compléter E1. Le prérequis Manchot(Titi) est bien dans
E1. Mais Vole(Titi) qui est la négation de la justification de d2, est dans E1. Il est impossible 60 La logique des défauts
d’utiliser d2. Le calcul s’arrête et on a une deuxième extension dans laquelle Titi ne vole pas.
Figure 3.1. Arbre de recherche des solutions pour le calcul d'extensions
On obtient donc deux extensions qui sont contradictoires. Si nous cherchons à répondre à
la question : "Est-ce que Titi vole ?", il faut pouvoir choisir entre ces deux extensions. On
peut par exemple préférer les défauts les plus particuliers, ou encore établir des préférences
entre les défauts.
Comme nous venons de voir dans cet exemple, les théories des défauts peuvent avoir
plusieurs extensions. Il y a également des cas où elles n’ont pas d’extension. Dans certains
cas, ces défauts classiques peuvent donc poser des problèmes. Mais il est démontré qu’il
existe toujours une extension si W est satisfaisable et tous les défauts sont normaux [23].
3.6 Algorithme de calcul d’extensions.
Avant de décrire l’algorithme, on généralise la définition d’une extension en considérant
qu’un défaut peu avoir plusieurs prérequis. Pour que la logique des défauts travaille dans le
domaine de temps discret, il faut ajouter un argument temporal ti
. L’ensemble de faits W =
{w1, w2, …} est représenté avec l’argument comme W = {(w1,t0), (w2,t0), …}. Une extension de
la théorie des défauts ∆ = (D, W) est un ensemble E de formules, clos pour la déduction,
contenant W et vérifiant la propriété suivante : si d est un défaut de D dont les prérequis A(X)
(avec tk) sont dans E, sans que la négation des justifications Bi(X) ne soient dans E, alors le
conséquent C(X) (avec tk+1) de d est dans E. Formellement, les extensions sont définies de la
façon suivante :
E est une extension de ∆ si et seulement si � = ⋃�=0,∞ ��
, avec
E0 = W (avec t0) et pour i >0,
�� = �ℎ(��−1) ∪ {(�(�), t�+1)/(
�(�):��
(X)
�(�)
) ∈ �, (�(�), t�
), ∈ ��−1, ¬��(X)∉��−1}
où Th(Ei-1) désigne l'ensemble des théorèmes obtenus de façon monotone à partir de
��−1: �ℎ(��−1) = {�/��−1├�}. La logique des défauts 61
Pour une théorie des défauts ∆ = (D, W), avec D l'ensemble des défauts et W la base de
connaissance, le calcul d'extension se fait par l'algorithme :
Entrée :
D ; (ensemble des défauts).
� = ∅; (ensemble d'extension).
Sortie : � =∪�=0,� ��
.
calcul_extension(Ei) :{
Ei := W (en moment t0);
tantque il y a un défaut � =
�(�):��
(�)
�(�)
qui n'a pas encore été inspecté faire
- Sélectionner ce défaut d,
- Vérifier que les prérequis A(X) sont vrais avec Ei
(en moment tk),
- Vérifier que les justifications Bj(X) sont consistantes avec Ei (utiliser la négation
par échec en cas d'inconsistance),
- Ajouter (C(X), tk+1)) à Ei
fin tantque
Fin du calcul pour une extension.
Backtracking (Suppression des (C(X), tk+1) ajoutés à Ei).
calcul_extension(Ei).
} Approche proposée et résultats 63
Chapitre 4. Approche proposée et résultats
4.1. Utilisation de l’algorithme de production de clauses.
On revient à la carte d’interactions de Pommier. Pour passer du modèle biologique au
modèle logique, il faut considérer plusieurs contraintes : comment modéliser les interactions,
bien faire attention aux sens des implications logiques, respecter l'ordre chronologique
préalablement défini et vérifier la cohérence des informations [15]. L'étape initiale est de
définir correctement les prédicats. Ici les prédicats ont été calqués sur ceux de la carte de
Pommier, à savoir stimulation, phosphorylation, autophosphorylation, inhibition, nécessité,
liaison, activation de transcription, dégradation et déphosphorylation.
Au départ, les prédicats ont été conceptualisés, pour la majorité d'entre eux, de la façon
suivante : produit ⃪ réaction(enzyme, substrat). La réaction peut être stimulation,
phosphorylation, déphosphorylation, liaison, activation ou dégradation. Par exemple, p*-Y ⃪
phosphorylation(X, Y). Les autres prédicats qui ne sont pas de type produit ⃪
réaction(enzyme, substrat) sont modélisés séparément :
p*-Y ⃪ autophosphorylation(Y)
¬Y ⃪ inhibition(X, Y) : si X est vrai, alors Y ne peut pas l’être
Y ⃪ nécessité(X, Y) : pour que Y soit vrai, X doit être vrai
En effet, certains prédicats ont été modifiés, ou bien supprimés, au cours de
l’implémentation, tandis que d’autres ont été rajoutés grâce aux mises à jours effectuées dans
le modèle biologique et avec l’avancement de son implémentation dans Prolog. Par exemple,
les prédicats ajoutés sont ubiquitination, méthylation et dissociation.
Dans ce programme, cnf(nom_de_clause, type_de_clause, [littéraux]) indique une clause.
Pour la partie contenant des littéraux, chaque disjonction doit être indiquée par une virgule,
une négation par un signe moins, le signe plus peut être « oublié ». Voici un exemple qu’on
souhaite mettre au format de Prolog :
• D’abord, γH2AX se lie avec Mdc1.
• Ensuite, ATM peut phosphoryler Mdc1 liée à γH2AX.
• Mdc1, une fois phosphorylée, va se lier avec Rnf8.
• Enfin, Rnf8 va se lier avec Ubc13.
C’est modélisé par les équations logiques suivant les prédicats :
• Produit(γH2AX) → liaison(γH2AX, MDC1).
• Liaison(γH2AX, MDC1) → produit(γH2AX/MDC1).
• Produit(γH2AX/MDC1) → phosphorylation(ATM, γH2AX/MDC1).
• Phosphorylation(ATM, γH2AX/MDC1) → produit(p*-MDC1).
• Produit(p*-MDC1) → liaison(p*-MDC1, MRF8).64 Approche proposée et résultats
• Liaison(p*-MDC1, MRF8) → produit(MRF8_liée).
• Produit(MRF8_liée) → liaison(MRF8_liée, UBC13).
• Liaison(MRF8_liée, UBC13) → produit(MRF8/UBC13)
De façon plus intuitive, ceci peut être présenté par l’image ci – dessous :
Dans la Figure 4.1, une flèche à deux têtes présente une liaison, une flèche à une tête
présente une production, et une flèche brisée est une phosphorylation.
Suite, on replace les implications en utilisant les équivalences (A → B ≡ ¬A ⋁ B) :
• ¬Produit(γH2AX) ⋁ liaison(γH2AX, MDC1).
• ¬Liaison(γH2AX, MDC1) ⋁ produit(γH2AX/MDC1).
• ¬Produit(γH2AX/MDC1) ⋁ phosphorylation(ATM, γH2AX/MDC1).
• ¬Phosphorylation(ATM, γH2AX/MDC1) ⋁ produit(p*-MDC1).
• ¬Produit(p*-MDC1) ⋁ liaison(p*-MDC1, MRF8).
• ¬Liaison(p*-MDC1, MRF8) ⋁ produit(MRF8_liée).
• ¬Produit(MRF8_liée) ⋁ liaison(MRF8_liée, UBC13).
• ¬Liaison(MRF8_liée, UBC13) ⋁ produit(MRF8/UBC13)
Enfin, on adapte les équations au format de Prolog :
• cnf(mdc1_1, axiom, [-product(gamma_h2ax),binding(gamma_h2ax,mdc1)]).
• cnf(mdc1_2, axiom, [-binding(gamma_h2ax,mdc1),product(h2ax_mdc1)]).
• cnf(mdc1_3,axiom,[product(h2ax_mdc1),
phosphorylation(p_atm_bound,h2ax_mdc1)]).
• cnf(mdc1_4, axiom, [-phosphorylation(p_atm_bound,h2ax_mdc1),product(p_mdc1)]).
• cnf(rnf_01, axiom, [-product(p_mdc1),binding(p_mdc1,rnf8)]).
• cnf(rnf_02, axiom, [-binding(p_mdc1,rnf8),product(rnf8_bound)]).
• cnf(rnf_03, axiom, [-product(rnf8_bound),binding(rnf8_bound,ubc13)]).
• cnf(rnf_04, axiom, [-binding(rnf8_bound,ubc13),product(rnf8_ubc13)]).
ATM γH2AX/MDC1
γH2AX MDC1
P*-MDC1 MRF8
MRF8_liée UBC13
MRF8/UBC13
Figure 4.1. Interactions de la carte de PommierApproche proposée et résultats 65
À partir de la carte, avec la modélisation, on a adapté la base de données au format de
Prolog. Les lignes ci-dessous sont celles utilisées dans le modèle et qui relatent les
événements biologiques précédemment indiques :
/****************************************/
cnf(mrn_0, axiom, [-product(dsb),stimulation(dsb,dna)]).
cnf(mrn_1, axiom, [-stimulation(dsb,dna),product(altered_dna)]).
cnf(mrn_2, axiom, [-product(altered_dna),binding(mre11,rad50)]).
cnf(mrn_3, axiom, [-binding(mre11,rad50),product(mre11_rad50)]).
cnf(mrn_4, axiom, [-product(mre11_rad50),binding(mre11_rad50,nbs1)]).
cnf(mrn_5, axiom, [-binding(mre11_rad50,nbs1),product(mrn)]).
cnf(mrn_6, axiom, [-product(mrn),binding(mrn,altered_dna)]).
cnf(mrn_7, axiom, [-binding(mrn,altered_dna),product(mrn_bound_to_dna)]).
cnf(atm_1, axiom, [-product(mrn_bound_to_dna),binding(mrn_bound_to_dna,atm_atm)]).
cnf(atm_2, axiom, [-binding(mrn_bound_to_dna,atm_atm),product(atm_bound_to_mrn)]).
cnf(atm_3, axiom, [-product(atm_bound_to_mrn),-product(atm_atm)]).
cnf(atm_4, axiom, [-product(atm_bound_to_mrn),autophosphorylation(atm_bound_to_mrn)]).
cnf(atm_5, axiom, [-autophosphorylation(atm_bound_to_mrn),product(p_atm_atm_bound)]).
cnf(atm_6, axiom, [-product(p_atm_atm_bound),-product(atm_atm)]).
cnf(atm_7, axiom, [-product(p_atm_atm_bound),dissociation(p_atm_atm_bound)]).
cnf(atm_8, axiom, [-dissociation(p_atm_atm_bound),product(p_atm_bound)]).
cnf(atm_9, axiom, [-dissociation(p_atm_atm_bound),product(p_atm_free)]).
%Chk1 Phosphorylation
cnf(chk1_1, axiom, [-product(p_atm_free),phosphorylation(p_atm_free,chk1)]).
cnf(chk1_2, axiom, [-phosphorylation(p_atm_free,chk1),product(p_chk1)]).
cnf(chk1_3, axiom, [phosphorylation(atr,chk1)]).
cnf(chk1_4, axiom, [-phosphorylation(atr,chk1),product(p_chk1)]).
%Other MRN needs
cnf(mrn_add_1, axiom, [-product(mrn_bound_to_dna),product(p_smc1)]).
cnf(mrn_add_2, axiom, [-product(mrn_bound_to_dna),product(p_mre11)]).
%gamma-H2AX
cnf(h2ax_1, axiom, [-phosphorylation(atr,h2ax),product(gamma_h2ax)]).
cnf(h2ax_2, axiom, [-phosphorylation(p_atm_bound,h2ax),product(gamma_h2ax)]).
%MDC1, Ubiquitination and BRCA1
cnf(mdc1_1, axiom, [-product(gamma_h2ax),binding(gamma_h2ax,mdc1)]).
cnf(mdc1_2, axiom, [-binding(gamma_h2ax,mdc1),product(h2ax_mdc1)]).
cnf(mdc1_3, axiom, [-product(h2ax_mdc1),phosphorylation(p_atm_bound,h2ax_mdc1)]).
cnf(mdc1_4, axiom, [-phosphorylation(p_atm_bound,h2ax_mdc1),product(p_mdc1)]).
cnf(rnf_01, axiom, [-product(p_mdc1),binding(p_mdc1,rnf8)]).
cnf(rnf_02, axiom, [-binding(p_mdc1,rnf8),product(rnf8_bound)]).
cnf(rnf_03, axiom, [-product(rnf8_bound),binding(rnf8_bound,ubc13)]).
cnf(rnf_04, axiom, [-binding(rnf8_bound,ubc13),product(rnf8_ubc13)]).
cnf(rnf_05, axiom, [-product(rnf8_ubc13),ubiquitination(rnf8_ubc13,h2a)]).
cnf(rnf_06, axiom, [-ubiquitination(rnf8_ubc13,h2a),product(ub_h2a)]).
cnf(rnf_07, axiom, [-product(ub_h2a),binding(ub_h2a,rnf168)]).
cnf(rnf_08, axiom, [-binding(ub_h2a,rnf168),product(rnf168_bound)]).
cnf(rnf_09, axiom, [-product(rnf168_bound),binding(rnf168_bound,ubc13)]). 66 Approche proposée et résultats
cnf(rnf_10, axiom, [-binding(rnf168_bound,ubc13),product(rnf168_ubc13)]).
cnf(rnf_11, axiom, [-product(rnf168_ubc13),ubiquitination(rnf168_ubc13,h2a)]).
cnf(rnf_12, axiom, [-ubiquitination(rnf168_ubc13,h2a),product(poly_ub_h2a)]).
cnf(rnf_13, axiom, [-product(poly_ub_h2a),stimulation(poly_ub_h2a,dna)]).
cnf(rnf_14, axiom, [-stimulation(poly_ub_h2a,dna),product(changed_struct_dna)]).
cnf(rap_01, axiom, [-product(poly_ub_h2a),binding(poly_ub_h2a,rap80)]).
cnf(rap_02, axiom, [-binding(poly_ub_h2a,rap80),product(rap80_bound)]).
cnf(rap_03, axiom, [-product(rap80_bound),binding(rap80_bound,abraxas)]).
cnf(rap_04, axiom, [-binding(rap80_bound,abraxas),product(abraxas_bound)]).
cnf(rap_05, axiom, [-product(abraxas_bound),binding(abraxas_bound,bre)]).
cnf(rap_06, axiom, [-binding(abraxas_bound,bre),product(bre_bound)]).
cnf(rap_07, axiom, [-product(abraxas_bound),binding(abraxas_bound,brcc36)]).
cnf(rap_08, axiom, [-binding(abraxas_bound,brcc36),product(brcc36_bound)]).
cnf(rap_09, axiom, [-product(brcc36_bound),binding(brcc36_bound,merit40)]).
cnf(rap_10, axiom, [-binding(brcc36_bound,merit40),product(merit40_bound)]).
cnf(rap_10, axiom, [-product(merit40_bound),binding(merit40_bound,brcc36_bound)]).
cnf(rap_11, axiom, [-binding(merit40_bound,brcc36_bound),product(brcc36_merit40)]).
cnf(rap_12, axiom, [-product(brcc36_merit40),binding(brcc36_merit40,brca1)]).
cnf(rap_13, axiom, [-binding(brcc36_merit40,brca1),product(brca1_bound_to_rap80_complex)]).
%53BP1 binding
cnf(mmset_1, axiom, [-product(changed_struct_dna),phosphorylation(p_atm_bound,mmset)]).
cnf(mmset_2, axiom, [-phosphorylation(p_atm_bound,mmset),product(p_mmset)]).
cnf(mmset_3, axiom, [-product(h2ax_mdc1),binding(h2ax_mdc1,mdc1)]).
cnf(mmset_4, axiom, [-binding(h2ax_mdc1,mdc1),product(mdc1_multi)]).
cnf(mmset_5, axiom, [-product(mdc1_multi),-product(p_mmset),binding(mdc1_multi,p_mmset)]).
cnf(mmset_6, axiom, [-binding(mdc1_multi,p_mmset),product(mmset_mdc1)]).
cnf(mmset_7, axiom, [-product(mmset_mdc1),methylation(mmset_mdc1,h4)]).
cnf(mmset_8, axiom, [-methylation(mmset_mdc1,h4),product(h4k20me2)]).
cnf(p53bp1_1,axiom,[-product(h4k20me2),-product(brca1_bound_to_rap80_complex),
binding(h4k20me2,p53bp1)]).
cnf(p53bp1_2, axiom, [-binding(h4k20me2,p53bp1),product(p53bp1_bound)]).
cnf(p53bp1_3, axiom, [-product(p53bp1_bound),phosphorylation(p_atm_bound,p53bp1_bound)]).
cnf(p53bp1_4, axiom, [-phosphorylation(p_atm_bound,p53bp1_bound),product(p_53bp1)]).
%Chk2 formation with Plk3 action (and binding with 53bp1)
cnf(plk3_1, axiom, [-product(p_atm_free),phosphorylation(p_atm_free,plk3)]).
cnf(plk3_2, axiom, [-phosphorylation(p_atm_free,plk3),product(p_plk3)]).
cnf(chk2_01, axiom, [-product(p_atm_free),phosphorylation(p_atm_free,chk2)]).
cnf(chk2_02, axiom, [-phosphorylation(p_atm_free,chk2),product(p_s33_35_chk2)]).
cnf(chk2_03, axiom, [-product(p_s33_35_chk2),phosphorylation(p_plk3,p_s33_35_chk2)]).
cnf(chk2_04, axiom, [-phosphorylation(p_plk3,p_s33_35_chk2),product(p_s33_35_s62_73_chk2)]).
cnf(chk2_05,axiom,[-product(p_s33_35_s62_73_chk2),
phosphorylation(p_atm_free,p_s33_35_s62_73_chk2)]).
cnf(chk2_06, axiom, [-phosphorylation(p_atm_free,p_s33_35_s62_73_chk2),product(p_t68_chk2)]).
cnf(chk2_07,axiom,[-product(p_s33_35_s62_73_chk2),
phosphorylation(atr,p_s33_35_s62_73_chk2)]).
cnf(chk2_08, axiom, [-phosphorylation(atr,p_s33_35_s62_73_chk2),product(p_t68_chk2)]).
cnf(chk2_09, axiom, [-product(p_t68_chk2),binding(p_t68_chk2,p_t68_chk2)]).
cnf(chk2_10, axiom, [-binding(p_t68_chk2,p_t68_chk2),product(chk2_chk2)]).
cnf(chk2_11, axiom, [-product(chk2_chk2),autophosphorylation(chk2_chk2)]).
cnf(chk2_12, axiom, [-autophosphorylation(chk2_chk2),product(p_active_chk2_chk2)]).
cnf(chk2_13,axiom,[-product(p_active_chk2_chk2),-product(p_53bp1),
binding(p_active_chk2_chk2,p_53bp1)]). Approche proposée et résultats 67
cnf(chk2_13, axiom, [-binding(p_active_chk2_chk2,p_53bp1),product(chk2_53bp1)]).
%BRCA1 regulation by CtIP and Chk2
cnf(ctip_1, axiom, [binding(brca1,ctip)]).
cnf(ctip_2, axiom, [-binding(brca1,ctip),product(brca1_ctip)]).
cnf(ctip_3, axiom, [-product(brca1_ctip),-product(chk2_53bp1),binding(brca1_ctip,chk2_53bp1)]).
cnf(ctip_4, axiom, [-binding(brca1_ctip,chk2_53bp1),product(chk2_53bp1_bound_to_brca1)]).
cnf(ctip_5, axiom, [-binding(brca1_ctip,chk2_53bp1),product(brca1_ctip_bound_to_chk2)]).
cnf(ctip_6,axiom,[-product(chk2_53bp1_bound_to_brca1),-product(brca1_ctip_bound_to_chk2),
phosphorylation(chk2_53bp1_bound_to_brca1,brca1_ctip_bound_to_chk2)]).
cnf(ctip_7,axiom,[-phosphorylation(chk2_53bp1_bound_to_brca1,brca1_ctip_bound_to_chk2),
product(p_brca1_ctip_bound_to_chk2)]).
cnf(ctip_8, axiom, [-product(p_brca1_ctip_bound_to_chk2),product(p_s988_brca_ctip)]).
cnf(ctip_9, axiom, [-product(chk2_53bp1_bound_to_brca1),product(chk2_53bp1)]).
cnf(brca1_0,axiom,[-product(p_s988_brca_ctip), phosphorylation(p_atm_bound,p_s988_brca_ctip)]).
cnf(brca1_1, axiom, [-phosphorylation(p_atm_bound,p_s988_brca_ctip),product(brca_p_ctip)]).
cnf(brca1_2, axiom, [-product(brca_p_ctip),-product(brca1_ctip)]).
cnf(brca1_3, axiom, [-product(brca_p_ctip),dissociation(brca_p_ctip)]).
cnf(brca1_4, axiom, [-dissociation(brca_p_ctip),product(brca1)]).
cnf(brca1_5, axiom, [-dissociation(brca_p_ctip),product(p_ctip)]).
cnf(brca1_6, axiom, [-product(brca1),phosphorylation(p_atm_bound,brca1)]).
cnf(brca1_7, axiom, [-phosphorylation(p_atm_bound,brca1),product(p_brca1)]).
cnf(brca1_8, axiom, [-product(brca1),phosphorylation(atr,brca1)]).
cnf(brca1_9, axiom, [-phosphorylation(atr,brca1),product(p_brca1)]).
%DNA repair proposed mecasism
cnf(repa_1, axiom, [-product(p_brca1),-product(p_53bp1),binding(mrn_bound_to_dna,p_brca1)]).
cnf(repa_2, axiom, [-binding(mrn_bound_to_dna,p_brca1),product(brca1_bound_to_mrn)]).
%p53 pathway and regulation including PML
cnf(pml_1, axiom, [-product(chk2_53bp1),phosphorylation(chk2_53bp1,pml)]).
cnf(pml_2, axiom, [-phosphorylation(chk2_53bp1,pml),product(p_pml)]).
cnf(pml_3, axiom, [-product(p_pml),stimulation(p_pml,cell)]).
cnf(pml_4, axiom, [-stimulation(p_pml,cell),product(apoptosis)]).
cnf(pml_5, axiom, [-product(p_pml),binding(p_pml,mdm2)]).
cnf(pml_6, axiom, [-binding(p_pml,mdm2),product(pml_mdm2)]).
cnf(pml_7, axiom, [-product(pml_mdm2),-binding(mdm2,p53)]).
cnf(mdm2_1, axiom, [product(p53)]).
cnf(mdm2_2, axiom, [-product(mdm2),-product(p53),binding(mdm2,p53)]).
cnf(mdm2_3, axiom, [-binding(mdm2,p53),product(mdm2_p53)]).
cnf(mdm2_4, axiom, [-product(mdm2_p53),stimulation(p53_degradation_effectors,mdm2_p53)]).
cnf(mdm2_5,axiom,[-stimulation(p53_degradation_effectors,mdm2_p53),
product(p53_degradation)]).
cnf(p53_01,axiom,[-product(p_atm_free),-product(mdm2_p53),
phosphorylation(p_atm_free,mdm2_p53)]).
cnf(p53_02, axiom, [-phosphorylation(p_atm_free,mdm2_p53),product(p_s15_p53_mdm2)]).
cnf(p53_03, axiom, [-product(mdm2_p53),phosphorylation(atr,mdm2_p53)]).
cnf(p53_04, axiom, [-phosphorylation(atr,mdm2_p53),product(p_s15_p53_mdm2)]).
cnf(p53_05,axiom,[-product(p_s15_p53_mdm2),-product(chk2_53bp1),
phosphorylation(chk2_53bp1,p_s15_p53_mdm2)]).
cnf(p53_06, axiom, [-phosphorylation(chk2_53bp1,p_s15_p53_mdm2),product(p_p_p53_mdm2)]).
cnf(p53_07,axiom,[-product(p_s15_p53_mdm2),-product(p_chk1),
phosphorylation(p_chk1,p_s15_p53_mdm2)]). 68 Approche proposée et résultats
cnf(p53_08, axiom, [-phosphorylation(p_chk1,p_s15_p53_mdm2),product(p_p_p53_mdm2)]).
cnf(p53_09, axiom, [-product(p_s15_p53_mdm2),-product(p53_degradation)]).
cnf(p53_10, axiom, [-product(p_p_p53_mdm2),-product(p53_degradation)]).
cnf(p53_11, axiom, [-product(p_p_p53_mdm2),dissociation(p_p_p53_mdm2)]).
cnf(p53_12, axiom, [-dissociation(p_p_p53_mdm2),product(p_p_p53)]).
cnf(p53_13, axiom, [-dissociation(p_p_p53_mdm2),product(mdm2)]).
cnf(p53_14, axiom, [-product(p_atm_free),-product(mdm2),phosphorylation(p_atm_free,mdm2)]).
cnf(p53_15, axiom, [-phosphorylation(p_atm_free,mdm2),product(p_mdm2)]).
cnf(p53_16, axiom, [-product(p_p_p53),binding(p300,p_p_p53)]).
cnf(p53_17, axiom, [-product(p_pml),-binding(p300,p_p_p53),product(active_p53)]).
cnf(p53_18,axiom,[-product(active_p53), transcription_activation(active_p53,prom_p21_gadd45)]).
cnf(p53_19,axiom,[-transcription_activation(active_p53,prom_p21_gadd45),
product(p21_and_gadd45)]).
cnf(p53_19a, axiom, [-product(p21_and_gadd45),stimulation(p21_and_gadd45,cell_cycle)]).
cnf(p53_20, axiom, [-stimulation(p21_and_gadd45,cell_cycle),product(cell_cycle_arrest)]).
cnf(p53_21, axiom, [-product(active_p53),transcription_activation(active_p53,prom_bnpf)]).
cnf(p53_22,axiom,[-transcription_activation(active_p53,prom_bnpf), product(box_nas_puma_fas)]).
cnf(p53_23, axiom, [-product(box_nas_puma_fas),stimulation(box_nas_puma_fas,cell)]).
cnf(p53_24, axiom, [-stimulation(box_nas_puma_fas,cell),product(apoptosis)]).
cnf(p53_21, axiom, [-product(active_p53),transcription_activation(active_p53,prom_mdm2)]).
cnf(p53_22, axiom, [-transcription_activation(active_p53,prom_mdm2),product(mdm2)]).
%E2F1 action
cnf(e2f1_00, axiom, [product(e2f1)]).
cnf(e2f1_01, axiom, [-product(e2f1),-product(chk2_53bp1),phosphorylation(chk2_53bp1,e2f1)]).
cnf(e2f1_02, axiom, [-phosphorylation(chk2_53bp1,e2f1),product(p_e2f1)]).
cnf(e2f1_03, axiom, [-product(e2f1),stimulation(e2f1_degradation_effectors,e2f1)]).
cnf(e2f1_04, axiom, [-stimulation(e2f1_degradation_effectors,e2f1),product(e2f1_degradation)]).
cnf(e2f1_05, axiom, [-product(p_e2f1),-product(e2f1_degradation)]).
cnf(e2f1_06, axiom, [-product(p_e2f1),phosphorylation(p_atm_free,p_e2f1)]).
cnf(e2f1_07, axiom, [-phosphorylation(p_atm_free,p_e2f1),product(p_p_e2f1)]).
cnf(e2f1_08, axiom, [-product(p_e2f1),phosphorylation(atr,p_e2f1)]).
cnf(e2f1_09, axiom, [-phosphorylation(atr,p_e2f1),product(p_p_e2f1)]).
cnf(e2f1_10, axiom, [-product(p_p_e2f1),transcription_activation(p_p_e2f1,prom_chk2)]).
cnf(e2f1_11, axiom, [-transcription_activation(p_p_e2f1,prom_chk2),product(chk2)]).
cnf(e2f1_12, axiom, [-product(p_p_e2f1),transcription_activation(p_p_e2f1,prom_arf)]).
cnf(e2f1_13, axiom, [-transcription_activation(p_p_e2f1,prom_arf),product(arf)]).
cnf(e2f1_14, axiom, [-product(p_p_e2f1),transcription_activation(p_p_e2f1,prom_p73_apaf1)]).
cnf(e2f1_15, axiom, [-transcription_activation(p_p_e2f1,prom_p73_apaf1),product(p73_apaf1)]).
cnf(e2f1_16, axiom, [-product(p73_apaf1),stimulation(p73_apaf1,cell)]).
cnf(e2f1_17, axiom, [-stimulation(p73_apaf1,cell),product(apoptosis)]).
cnf(e2f1_18, axiom, [-product(arf),binding(arf,mdm2)]).
cnf(e2f1_19, axiom, [-binding(arf,mdm2),product(arf_mdm2)]).
cnf(e2f1_20, axiom, [-product(arf_mdm2),-product(mdm2_p53)]).
cnf(e2f1_21, axiom, [-product(p_p_e2f1),stimulation(p_p_e2f1,unknown_atm_way)]).
cnf(e2f1_22, axiom, [-stimulation(p_p_e2f1,unknown_atm_way),product(p_atm_free)]).
%p38 phosphorylation (usefull for cdc25c and cdc25b)
cnf(p38_1, axiom, [-product(p_atm_free),phosphorylation(p_atm_free,p38)]).
cnf(p38_2, axiom, [-phosphorylation(p_atm_free,p38),product(p_p38)]).
%Cdc25 regulation
cnf(cdc25a_0, axiom, [-stimulation(cdc25a,cell),-product(cell_cycle_arrest)]).Approche proposée et résultats 69
cnf(cdc25a_1, axiom, [-product(chk2_53bp1),phosphorylation(chk2_53bp1,cdc25a)]).
cnf(cdc25a_2, axiom, [-phosphorylation(chk2_53bp1,cdc25a),product(p_cdc25a)]).
cnf(cdc25a_3, axiom, [-product(p_chk1),phosphorylation(p_chk1,cdc25a)]).
cnf(cdc25a_4, axiom, [-phosphorylation(p_chk1,cdc25a),product(p_cdc25a)]).
cnf(cdc25a_5, axiom, [-product(p_cdc25a),stimulation(p_cdc25a,cdc25a_degradation_effectors)]).
cnf(cdc25a_6,axiom,[-stimulation(p_cdc25a,cdc25a_degradation_effectors),
product(cdc25a_degradation)]).
cnf(cdc25a_7, axiom, [-product(cdc25a_degradation),-stimulation(cdc25a,cell)]).
cnf(cdc25c_00, axiom, [-stimulation(cdc25c,cell),-product(cell_cycle_arrest)]).
cnf(cdc25c_01, axiom, [-product(chk2_53bp1),phosphorylation(chk2_53bp1,cdc25c)]).
cnf(cdc25c_02, axiom, [-phosphorylation(chk2_53bp1,cdc25c),product(p_cdc25c)]).
cnf(cdc25c_03, axiom, [-product(p_plk3),phosphorylation(p_plk3,cdc25c)]).
cnf(cdc25c_04, axiom, [-phosphorylation(p_plk3,cdc25c),product(p_cdc25c)]).
cnf(cdc25c_05, axiom, [-product(p_chk1),phosphorylation(p_chk1,cdc25c)]).
cnf(cdc25c_06, axiom, [-phosphorylation(p_chk1,cdc25c),product(p_cdc25c)]).
cnf(cdc25c_07, axiom, [-product(p_p38),phosphorylation(p_p38,cdc25c)]).
cnf(cdc25c_08, axiom, [-phosphorylation(p_p38,cdc25c),product(p_cdc25c)]).
cnf(cdc25c_09, axiom, [-product(p_cdc25c),stimulation(p_cdc25c,cdc25c_degradation_effectors)]).
cnf(cdc25c_10,axiom,[-stimulation(p_cdc25c,cdc25c_degradation_effectors),
product(cdc25c_degradation)]).
cnf(cdc25c_11, axiom, [-product(cdc25c_degradation),-stimulation(cdc25c,cell)]).
cnf(cdc25b_1, axiom, [-stimulation(cdc25b,cell),-product(cell_cycle_arrest)]).
cnf(cdc25b_2, axiom, [-product(p_p38),phosphorylation(p_p38,cdc25b)]).
cnf(cdc25b_3, axiom, [-phosphorylation(p_p38,cdc25b),product(p_cdc25b)]).
cnf(cdc25b_4, axiom, [-product(p_cdc25b),-stimulation(cdc25b,cell)]).
%JNK actions (mechanisms quite unclear)
cnf(jnk_1, axiom, [-stimulation(jnk,cdc25c),product(p_cdc25c)]).
cnf(jnk_2, axiom, [-phosphorylation(jnk,p_s15_p53_mdm2),product(p_p_p53_mdm2)]).
%FANCD2 first steps
cnf(fancd2_1, axiom, [-product(p_atm_bound),phosphorylation(p_atm_bound,nbs1)]).
cnf(fancd2_2, axiom, [-phosphorylation(p_atm_bound,nbs1),product(p_nbs1)]).
cnf(fancd2_3, axiom, [-product(p_nbs1),phosphorylation(p_atm_bound,fancd2)]).
cnf(fancd2_4, axiom, [-phosphorylation(p_atm_bound,fancd2),product(p_fancd2)]).
cnf(fancd2_5, axiom, [-product(p_fancd2),stimulation(p_fancd2,cell)]).
cnf(fancd2_6, axiom, [-stimulation(p_fancd2,cell),-product(cell_cycle_arrest)]).
%Mus81 actions on DNA Repair
cnf(mus81_1, axiom, [-product(chk2_53bp1),binding(chk2_53bp1,mus81)]).
cnf(mus81_2, axiom, [-binding(chk2_53bp1,mus81),product(mus81_chk2)]).
cnf(mus81_3, axiom, [-product(mus81_chk2),binding(mus81_chk2,altered_dna)]).
cnf(mus81_4, axiom, [-binding(mus81_chk2,altered_dna),product(mus81_bound_to_dna)]).
%cnf(mus81_5, axiom, [-binding(mus81_chk2,altered_dna),product(mus81_bound_to_dna)]).
/****************************************/
Le résultat : Avec le champ de production champ([_,1,[stimulation(_,_)],_]), après l’exécution de
programme, le résultat est donné
Pour activer product(cell_cycle_arrest):
-stimulation(p21_and_gadd45,cell_cycle) 70 Approche proposée et résultats
% 261,290 inferences, 0.156 CPU in 20.794 seconds (1% CPU, 1674925 Lips)
Pour bloquer product(cell_cycle_arrest) :
-stimulation(cdc25a,cell)
-stimulation(cdc25c,cell)
-stimulation(cdc25b,cell)
-stimulation(dsb,dna)
-stimulation(p_fancd2,cell)
% 18,008 inferences, 0.047 CPU in 7.993 seconds (1% CPU, 384784 Lips)
Pour activer product(apoptosis) :
-stimulation(p_pml,cell)
-stimulation(box_nas_puma_fas,cell)
-stimulation(p73_apaf1,cell)
% 154,139 inferences, 0.094 CPU in 20.310 seconds (0% CPU, 1646774 Lips)
Pour bloquer product(apoptosis), le résultat est un ensemble vide de clauses.
4.2. Utilisation de la logique des défauts
4.2.1. Dans le cas général
La Figure 4.2 représente un exemple très simplifié d'interactions dans une cellule.
Figure 4.2. Un exemple d’interactions dans une celluleApproche proposée et résultats 71
Par des mécanismes divers non indiqués ici, les ultraviolets (UV) mettent la cellule en
apostase (elle devient de fait immortelle) d'où le cancer. Ceci est représenté par une flèche.
D'un autre coté les UV activent la production de la protéine p53. Cette protéine va activer une
protéine A qui va bloquer le cancer. Mais p53 liée à la protéine Mdm2 va produire B, qui va
bloquer A. Pour un biologiste, la question est donc de bloquer le cancer en bloquant B. Les
expériences biologiques ont montré que le X pourrait être un candidat pour ce blocage. Les
figures (b) et (c) donnent deux types d'interactions possibles avec X pour expliquer ce blocage
de B. Le problème est d'utiliser l'informatique pour compléter le graphe [3].
Pour décrire les interactions entre les gênes dans la figure, on part d’un langage L de
logique classique (propositionnel ou du premier ordre). Dans L, la proposition A (resp ¬A)
signifie que A est vrai (faux). Les interactions entres les gênes sont une forme très simple de
causalité. Pour exprimer ces interactions il est courant d'aller à l'essentiel en donnant deux
relations binaires cause(A, B) et bloque(A, B). La première relation veut dire, par exemple,
qu'une protéine A déclenche la production d'une protéine B, la deuxième est l’inhibition. De
manière classique, ces relations sont représentées dans le réseau de gênes, par A → B et A ⊣
B. Bien entendu, ces causalités sont élémentaires et de nombreux travaux très savants ont été
écrits pour les représenter.
Pour représenter les liens entre les relations, dans le langage L, il faut faire deux choses :
décrire les propriétés internes aux relations cause et bloque ; décrire les liens entre ces
relations.
Les premières propriétés que l’on a envie de donner peuvent s’exprimer naturellement,
par des règles du type :
(1) Si A cause B et si A est vrai, alors B est vrai.
(2) Si A bloque B et si A est vrai, alors B est faux.
La solution élémentaire est alors de donner explicitement les deux schémas d'axiomes :
(C1) cause(A,B) ∧ cause(B, C) → cause(A, C)
(C2) cause(A, B) ∧ bloque (B, C) → bloque(A, C)
La première idée est d'exprimer ces lois en logique classique par les axiomes :
cause(A, B) ∧ A → B
bloque(A, B) ∧ A → ¬B
On peut aussi les exprimer plus faiblement par des règles d'inférences proches du modus
ponens :
cause(A, B) ∧ A / B
bloque(A, B) ∧ A / ¬B72 Approche proposée et résultats
Mais ces deux formulations posent problème dès qu'il y a conflit. Si par exemple on a un
ensemble F de quatre formules F = {A, B, cause(A, C), bloque(B, C)}, alors on va dans les
deux approches données ci-dessus inférer de F, C et ¬C ce qui est inconsistant. Pour résoudre
ce conflit, on peut utiliser la logique des défauts.
Pour résoudre les conflits vus ci-dessus, l'idée intuitive est d'affaiblir la formulation des règles
de causalité en :
(1') Si A cause B, et si A est vrai, et s'il est possible que B est vrai, alors B est vrai.
(2') Si A bloque B, et si A est vrai, et s'il est possible que B est faux, alors B est faux.
Dans la logique des défauts, les règles (1') et (2') vont s'exprimer intuitivement.
(1") Si A cause B, et si A est vrai, et si B n'est pas contradictoire, alors B est vrai.
(2") Si A bloque B, et si A est vrai, et si ¬B n'est pas contradictoire, alors ¬B est vrai.
Ces règles vont se représenter par des défauts normaux et s'écrire :
d1 : cause(A, B) ∧ A : B / B
d2 : bloque(A, B) ∧ A : ¬B / ¬B
Pour le cas élémentaire qui précède, si A et B sont vrais, on a :
W = {A, B, cause(A,C), bloque(B,C)}
D = {d1, d2}
et on obtient deux extensions :
E1 contient C (en appliquant d1)
E2 contient ¬C (en appliquant d2)
Le conflit est donc résolu, mais se pose le problème des extensions à préférer ; est-ce que
C est induit ou bloqué? En fait ceci va vraiment dépendre du contexte. On peut par exemple
préférer les interactions positives par rapport aux négatives ; ou bien utiliser des méthodes
statistiques ou probabilistes.
Plus en détail, pour l’application, on a [28]:
W = {UV, Mdm2}
D = { d1 = UV : cancer / cancer
d2 = UV : p53 / p53
d3 = p53 : A / A
d4 = p53 ∧ Mdm2: B / BApproche proposée et résultats 73
d5 = B : ¬A / ¬A
d6 = A : ¬cancer / ¬cancer
d7 = C : ¬B / ¬B
}
On a encore deux défauts généraux :
d8 = Y : x /x ; où Y ∈ {UV, Mdm2}
et d9 = Z ∧ x: C / C; où Z ∈ {UV, Mdm2, p53, A, B}
Comme on a dit précédemment, pour que l’algorithme travaille avec des variables, il faut
l’améliorer. Dans ce cas, les défauts d8 et d9 peuvent être écrits :
source(uv). % UV est une source
source(mdm2).
substance(uv). % UV est une substance
substance(mdm2).
substance(p53).
substance(a).
substance(b).
ecrit:
source(Y), % « ordre 1 »
assert(cl(def(Y,x))), % « ordre 2 »
substance(Z), % « ordre 3 »
assert(cl(def(joint(Z,x),c))). % « ordre 4 »
où « ordre 1 » et « ordre 2 » peuvent dire : pour toutes les sources Y, ajouter les défauts
Y:x/x à la base de données ; « ordre 3 » et « ordre 4 » peuvent dire : pour toutes les substances
Z, ajouter les défauts Z∧ x:C/C à la base de données.
En utilisant l’algorithme de calculer des extensions, on a 18 extensions cidessous
(l’extension 12 correspond à la Figure 4.2-b, et l’extension 13 correspond à la Figure
4.2-c) :
EXTENSION 1:
uv -> p53
p53 -> a74 Approche proposée et résultats
joint(p53,mdm2) -> b
uv -> x
joint(uv,x) -> c
a -> -cancer
EXTENSION 2:
uv -> p53
p53 -> a
joint(p53,mdm2) -> b
uv -> x
joint(mdm2,x) -> c
a -> -cancer
EXTENSION 3:
uv -> p53
p53 -> a
joint(p53,mdm2) -> b
uv -> x
joint(p53,x) -> c
a -> -cancer
EXTENSION 4:
uv -> p53
p53 -> a
joint(p53,mdm2) -> b
uv -> x
joint(a,x) -> c
a -> -cancer
EXTENSION 5:
uv -> p53
p53 -> a
joint(p53,mdm2) -> b
uv -> x
joint(b,x) -> c
a -> -cancer
EXTENSION 6:
uv -> p53
p53 -> a
joint(p53,mdm2) -> b
mdm2 -> x
joint(uv,x) -> c
a -> -cancerApproche proposée et résultats 75
EXTENSION 7:
uv -> p53
p53 -> a
joint(p53,mdm2) -> b
mdm2
-> x
joint(mdm2,x) -> c
a ->
-cancer
EXTENSION 8:
uv -> p53
p53 -> a
joint(p53,mdm2) -> b
mdm2
-> x
joint(p53,x) -> c
a ->
-cancer
EXTENSION 9:
uv -> p53
p53 -> a
joint(p53,mdm2) -> b
mdm2
-> x
joint(a,x) -> c
a ->
-cancer
EXTENSION 10:
uv -> p53
p53 -> a
joint(p53,mdm2) -> b
mdm2
-> x
joint(b,x) -> c
a ->
-cancer
EXTENSION 11:
uv -> p53
p53 -> a
uv
-> x
joint(uv,x) -> c
c
-> -b
a ->
-cancer
EXTENSION 12:
uv -> p53
p53 -> a
uv
-> x
joint(mdm2,x) -> c76 Approche proposée et résultats
c -> -b
a -> -cancer
EXTENSION 13:
uv -> p53
p53 -> a
uv -> x
joint(p53,x) -> c
c -> -b
a -> -cancer
EXTENSION 14:
uv -> p53
p53 -> a
uv -> x
joint(a,x) -> c
c -> -b
a -> -cancer
EXTENSION 15:
uv -> p53
p53 -> a
mdm2 -> x
joint(uv,x) -> c
c -> -b
a -> -cancer
EXTENSION 16:
uv -> p53
p53 -> a
mdm2 -> x
joint(mdm2,x) -> c
c -> -b
a -> -cancer
EXTENSION 17:
uv -> p53
p53 -> a
mdm2 -> x
joint(p53,x) -> c
c -> -b
a -> -cancer
EXTENSION 18:
uv -> p53 Approche proposée et résultats 77
p53 -> a
mdm2 -> x
joint(a,x) -> c
c -> -b
a -> -cancer
% 599,907 inferences, 1.700 CPU in 2.402 seconds (71% CPU, 352801 Lips)
4.2.2. Utilisation dans le domaine temporel discret
Bien que les cellules aient des morphologies et des structures différentes et que leurs
rôles dans les organismes différents soient variés, leurs fonctionnalités de base sont les mêmes
[1,4]. Une de ces fonctionnalités est d'assurer la survie de la cellule. Cette activité dans son
ensemble peut être résumée en deux points [21]. Premièrement, une cellule a besoin de
trouver l'énergie nécessaire pour son activité. Cette énergie est principalement obtenue par la
dégradation des ressources minérales ou organiques, c’est le catabolisme. Deuxièmement, les
cellules doivent fabriquer les molécules simples nécessaires à leur survie, c’est l’anabolisme.
Ces deux grandes activités sont regroupées sous le nom de métabolisme, et résultent d'un
grand nombre de mécanismes et de réactions biochimiques. La plupart des réactions, qui se
déroulent dans une cellule, sont catalysées par des molécules spéciales appelées enzymes.
Tout ceci est représenté comme un réseau, appelé voie métabolique [20].
Figure 4.3. Système équilibré de masse
La Figure 4.3 représente la topologie simple d'une voie métabolique dans une cellule, qui
se compose de cinq métabolites A, B, C, D et E et six réactions, dont chacune relie deux
métabolites. Chaque flux est placé sur la réaction correspondante. Bien que les concentrations
de A, C, D et E soient expérimentalement mesurables, la concentration de B ne peut pas être
mesurée. Par conséquent, B est le métabolite intracellulaire. Sur la base de la cinétique
enzymatique, le comportement dynamique du flux d'une réaction enzymatique peut être
représenté comme l'équation différentielle suivante:
���
��
= ��� − ���� − ��� (4.2)
où Cx est la concentration d'un métabolite X, vin (resp. vout) est la somme des flux de réactions
pour la production (resp. consommation) de X, et μCX représente le taux de croissance de la
biomasse dans une cellule. Si tous les métabolites sont à l'état stationnaire, le terme de gauche
de l'équation (4.2) doit être nul car il n'y a pas de changements de séries chronologiques des
concentrations, et aussi, on peut supposer que la dilution des éléments à cause de la croissance 78 Approche proposée et résultats
de la biomasse (correspondant à la durée de la dernière équation (4.2)) est négligée. Ce fait
signifie que pour chaque métabolite X, les flux de consommation de X sont équilibrés avec les
flux de production de X à l'état stationnaire. L’équilibrage de flux métabolique est basé sur
cette notion simple. Par exemple, son équilibrage dans la Figure 4.3 peut être représenté
comme les équations linéaires suivantes:
�1 = ��, �2 + �3
+ = �3
− + �1, �5 = �2 + ��, �4 + �� = �5, �3
− + �� = �3
+ + �4 (4.3)
Ensuite, nous pouvons analyser la distribution du flux sur la base des équations (4.3) avec
les flux mesurables rA, rC, rD et rE. En général, ces équations ne peuvent pas être résolues de
façon déterministe parce que le nombre de valeurs inconnues comme v1,. . . , v5 correspondant
aux flux de réactions enzymatiques intracellulaires devient plus grand que le nombre de
valeurs connues correspondant aux flux mesurables. Des méthodes ont été proposées
précédemment telles que l'analyse en mode primaire et extrêmes de la voie, des fonctions
d'analyse d'utilisation d'optimisation afin de résoudre les équations. Ces fonctions introduites
sont généralement construites en supposant que la maximisation de la croissance cellulaire ou
la minimisation de la consommation d'énergie. Toutefois, dans le cas d'une grande échelle de
la voie métabolique, nous ne pouvons pas résoudre la distribution de flux avec ces méthodes
d'approximation en raison du coût de calcul énorme.
Le système métabolique cellulaire dispose d'un mécanisme sophistiqué pour contrôler
dynamiquement les activités des enzymes pour répondre aux besoins d'une cellule. Ce
mécanisme de régulation peut être représenté comme des relations causales entre les activités
enzymatiques et la concentration de métabolites changeants. Ici, nous considérons trois voies
métaboliques simples: la première se compose de deux réactions avec trois métabolites, la
seconde se compose de deux réactions avec trois métabolites aussi, et la troisième se compose
d'une réaction avec deux métabolites. Noter que dans les figures suivantes, nous décrivons
activé et non-activé par des réactions comme les cercles et barres obliques plus flèches
correspondant aux réactions, respectivement. Et aussi, une hausse (resp. baisse) flèche
représente l'augmentation (resp. la diminution) à une concentration de métabolites.
La figure 4.4 correspond à la voie métabolique composée de trois métabolites X, Y et Z, et
deux réactions. La figure dit que si la concentration de Y tend à augmenter à un certain
moment, et si la réaction enzymatique Y→X (resp. X→Z) est activée (resp. non-activée) dans
un état, alors la concentration de X va aussi augmenter. Cette relation causale est prise en
compte par l'équation (4.2). Supposons que l'augmentation de la concentration de X est
observée, ce qui est représentée par une flèche en pointillés dans les figures. Un cas possible
est que la concentration de Y augmente, la réaction de Y→X est activée et la réaction X→Z
n'est pas activée. Ceci parce que la production de X à partir de Y ne peut pas être consommée
pour générer le Z. Approche proposée et résultats 79
Figure 4.4. La première relation entre les états de réaction et les changements de concentration de
métabolites
La Figure 4.5 correspond à la voie métabolique composée de trois métabolites X, Y et Z,
et deux réactions. La figure montre que si la concentration de Y tend à augmenter à un certain
moment, et si la réaction enzymatique Y→X (resp. X→Z) est non-activée (resp. activée) dans
un l'état, alors la concentration de X va diminuer. Cette relation causale est prise en compte
par l'équation (4.2). Supposons que la diminution de la concentration de X est observée, ce qui
est désignée par une flèche en pointillés dans les figures. Un cas possible est que la
concentration de Y augmente, la réaction de Y→X n’est pas activée et la réaction X→Z est
activée. C'est parce que la production de Z à partir de X peut être consommée.
Figure 4.5. La deuxième relation entre les états de réaction et les changements de concentration de
métabolites
Ensuite, nous considérons la Figure 4.6 qui représente une voie métabolique composée de
deux métabolites X et Y, et une réaction. La figure montre que, même si la réaction Y→X est
activée, la concentration de X doit diminuer en ce que la concentration de Y diminue. Par
conséquent, si nous observons que la concentration de X diminue, on peut supposer une
diminution de la concentration de Y et la réaction Y→X est activée comme un cas possible.
Figure 4.6. La troisième relation entre les états de réaction et les changements de concentration de
métabolites
Les métabolites et les protéines sont considérés comme un même objet. On va souvent se
restreindre ici à une représentation propositionnelle. Dans la pratique l'étude fine des
interactions va demander de représenter des augmentations ou des diminutions de
concentration de protéines. On sort donc du cadre propositionnel mais les problèmes de base
sont les mêmes. Pour représenter une variation de concentration il est par exemple possible
d'utiliser des prédicats de type "augmente" ou "diminue" et de limiter l'utilisation de ces
prédicats.
Pour décrire les interactions entre les métabolites dans la cellule, on part d’un langage L
de logique classique (propositionnel ou du premier ordre). Dans L, la proposition A (resp ¬A)
signifie que A est vrai (faux). On pourra utiliser par exemple con(A, up, ti) pour dire que la
Y X Z
Y X Z
Y X80 Approche proposée et résultats
concentration de A est augmentée au moment ti
, ou encore, con(A, down, tj) pour dire que la
concentration de A est diminuée au moment tj
. On est dans un cadre logique, donc il est
possible de représenter à peu près tout ce que l'on veut de manière naturelle. Le prix à payer,
si l’on utilise la totalité du langage peut être l'explosion combinatoire des algorithmes.
Les réactions entres métabolites sont une forme très simple de causalité. Pour exprimer
ces réactions, il est courant d'aller à l'essentiel en donnant deux relations binaires act(A, B) et
¬act(A, B). La première relation veut dire, par exemple, qu’un métabolite A est consommé
pour la production d'un métabolite B, la deuxième n’est pas consommé. De manière classique
ces relations sont représentées dans le réseau de gênes, par A → B et A ⊣ B. Bien entendu
cette causalité est élémentaire et de nombreux travaux très savants ont été écrits pour
représenter les causalités.
(C1) con(A,up,ti)∧react(A,B)∧active(A,B)∧react(B,C)∧non_active(B,C) → con(B,up,ti+1)
(C2) con(A,up,tj)∧react(A,B)∧non_active(A,B)∧react(B,C)∧active(B,C) → con(B,down,tj+1)
(C3) con(A,down,tk)∧ react(A,B)∧ active(A,B) → con(B,down,tk+1)
L’expression (C1) veut dire que si la concentration de A est augmentée au moment ti
, s’il
y a une réaction entre A et B dans laquelle le métabolite A est consumée pour la production du
métabolite B, et si pour toutes les réactions entre B et C le métabolite B n’est pas consommé
pour la production du métabolite C, alors la concentration de B est augmentée au moment ti+1.
L’expression (C2) veut dire que si la concentration de A est augmentée au moment tj
, s’il
y a une réaction entre A et B dans laquelle le métabolite A n’est pas consommé pour la
production du métabolite B, et si pour une réaction entre B et C le métabolite B est consommé
pour la production du métabolite C, alors la concentration de B est diminuée au moment tj+1.
L’expression (C3) veut dire que si la concentration de A est diminuée au moment tk, s’il y
a une réaction entre A et B dans laquelle le métabolite A est consommé pour la production du
métabolite B, alors la concentration de B est diminuée au moment tk+1.
Mais ces deux formulations posent problème dès qu'il y a un paradoxe. Si par exemple on
a un ensemble F de sept formules F = {con(A, up, ti), react(A, B), react(B, C), active(A, B),
non_active(B, C), non_active(A, B), active(B, C)}, alors on va dans les deux approches
données ci-dessus inféré de F, con(B, up, ti+1) et con(B, down, ti+1) ce qui est paradoxe, parce
que la concentration de B est augmentée et diminuée au même moment ti+1. Pour résoudre ce
conflit, on peut utiliser la logique des défauts.
Dans notre exemple, pour fournir des liens entre ces relations actives et non actives, l'idée
intuitive est donc d'affaiblir la formulation de règles de causalité:
(1) Si con(A,up,ti) , react(A,B), react(B,C), active(A,B), et non_active(B,C) sont vrais, et
s’il est possible que con(B,up,ti+1), alors con(B,up,ti+1) est conclu
(2) Si con(A,up,tj), react(A,B), react(B,C), non_active(A,B), et active(B,C) sont vrais, et
s’il est possible que con(B,down,tj+1), alors con(B,down,tj+1) est concluApproche proposée et résultats 81
(3) Si con(A,down,tk), react(A,B), et active(A,B) sont vrais, et s’il est possible que
con(B,down,tk+1), alors con(B,down,tk+1) est conclu
La question est alors de formellement décrire le possible. Dans la logique des défauts, les
règles (1), (2) et (3) seront exprimées de manière intuitive.
�1:
���(�, ��,��
) ∧ �����(�, �) ∧ �����(�, �) ∧ ������(�, �) ∧ ���_������(�, �): ���(�, ��,��+1)
���(�, ��,��+1)
�2:
�����, ��,��� ∧ �����(�, �) ∧ �����(�, �) ∧ ���_������(�, �) ∧ ������(�, �): ���(�, ����,��+1)
���(�, ����,��+1)
�3:
���(�, ����,��
) ∧ �����(�, �) ∧ ������(�, �): ���(�, ����,��+1)
���(�, ����,��+1)
Le paradoxe a été résolu.
Pour une théorie des défauts ∆ = (D, W), où D l'ensemble des défauts et W = {con(A, up,
t0)}, en utilisant l’algorithme de calcul des extensions, on a 12 extensions ci-dessous [27]:
EXTENSION 1:
joint(con(a,up, t0), act(a,b), non_act(b,c)) → con(b,up, t1)
joint(con(b,up, t1), act(b,d), non_act(d,e)) → con(d,up, t2)
joint(con(d,up, t2), act(d,e), non_act(e,c)) → con(e,up, t3)
joint(con(e,up, t3), act(e,c), non_act(c,b)) → con(c,up, t4)
EXTENSION 2:
joint(con(a,up, t0), act(a,b), non_act(b,c)) → con(b,up, t1)
joint(con(b,up, t1), act(b,d), non_act(d,e)) → con(d,up, t2)
joint(con(d,up, t2), act(d,e), non_act(e,c)) → con(e,up, t3)
joint(con(e,up, t3), non_act(e,c), act(c,b)) → con(c,down, t4)
EXTENSION 3:
joint(con(a,up, t0), act(a,b), non_act(b,c)) → con(b,up, t1)
joint(con(b,up, t1), act(b,d), non_act(d,e)) → con(d,up, t2)
joint(con(d,up, t2), non_act(d,e), act(e,c)) → con(e,down, t3)
joint(con(e,down, t3), act(e,c)) → con(c,down, t4)
EXTENSION 4:
joint(con(a,up, t0), act(a,b), non_act(b,c)) → con(b,up, t1)82 Approche proposée et résultats
joint(con(b,up, t1), non_act(b,d), act(d,e)) → con(d,down, t2)
joint(con(d,down, t2), act(d,e)) → con(e,down, t3)
joint(con(e,down, t3), act(e,c)) → con(c,down, t4)
EXTENSION 5:
joint(con(a,up, t0), non_act(a,b), act(b,c)) → con(b,down, t1)
joint(con(b,down, t1), act(b,c)) → con(c,down, t2)
joint(con(b,down, t1), act(b,d)) → con(d,down, t2)
joint(con(d,down, t2), act(d,e)) → con(e,down, t3)
EXTENSION 6:
joint(con(a,up, t0), non_act(a,b), act(b,c)) → con(b,down, t1)
joint(con(b,down, t1), act(b,d)) → con(d,down, t2)
joint(con(d,down, t2), act(d,e)) → con(e,down, t3)
joint(con(e,down, t3), act(e,c)) → con(c,down, t4)
EXTENSION 7:
joint(con(a,up, t0), act(a,b), non_act(b,d)) → con(b,up, t1)
joint(con(b,up, t1), act(b,d), non_act(d,e)) → con(d,up, t2)
joint(con(d,up, t2), act(d,e), non_act(e,c)) → con(e,up, t3)
joint(con(e,up, t3), act(e,c), non_act(c,b)) → con(c,up, t4)
EXTENSION 8:
joint(con(a,up, t0), act(a,b), non_act(b,d)) → con(b,up, t1)
joint(con(b,up, t1), act(b,d), non_act(d,e)) → con(d,up, t2)
joint(con(d,up, t2), act(d,e), non_act(e,c)) → con(e,up, t3)
joint(con(e,up, t3), non_act(e,c), act(c,b)) → con(c,down, t4)
EXTENSION 9:
joint(con(a,up, t0), act(a,b), non_act(b,d)) → con(b,up, t1)
joint(con(b,up, t1), act(b,d), non_act(d,e)) → con(d,up, t2)
joint(con(d,up, t2), non_act(d,e), act(e,c)) → con(e,down, t3)
joint(con(e,down, t3), act(e,c)) → con(c,down, t4)Approche proposée et résultats 83
EXTENSION 10:
joint(con(a,up, t0), act(a,b), non_act(b,d)) → con(b,up, t1)
joint(con(b,up, t1), non_act(b,d), act(d,e)) → con(d,down, t2)
joint(con(d,down, t2), act(d,e)) → con(e,down, t3)
joint(con(e,down, t3), act(e,c)) → con(c,down, t4)
EXTENSION 11:
joint(con(a,up, t0), non_act(a,b), act(b,d)) → con(b,down, t1)
joint(con(b,down, t1), act(b,c)) → con(c,down, t2)
joint(con(b,down, t1), act(b,d)) → con(d,down, t2)
joint(con(d,down, t2), act(d,e)) → con(e,down, t3)
EXTENSION 12:
joint(con(a,up, t0), non_act(a,b), act(b,d)) → con(b,down, t1)
joint(con(b,down, t1), act(b,d)) → con(d,down, t2)
joint(con(d,down, t2), act(d,e)) → con(e,down, t3)
joint(con(e,down, t3), act(e,c)) → con(c,down, t4)
Cet algorithme a une complexité très grande. Il sera sans doute nécessaire de réduire les
possibilités d'expression du langage pour arriver à des temps de calcul raisonnables. On
retrouve ici la même problématique que pour la résolution pratique des problèmes NPComplets.
Pour la carte de Pommier, après une coupe de l’algorithme pour réduire les
extensions équivalentes, on a la base de données et le résultat ci-dessous, où un fait w dans W
est défini « dur : --> w », et un défaut d = A:C/C dans D est défini « def : A --> C ».
LA BASE DE DONNÉES:
1 dur : --> phosphorylation(atr,h2ax)
2 dur : --> stimulation(dsb,dna)
3 def : stimulation(dsb,dna) --> product(altered_dna)
4 def : product(altered_dna) --> binding(mre11,rad50)
5 def : binding(mre11,rad50) --> product(mre11_rad50)
6 def : product(mre11_rad50) --> binding(mre11_rad50,nbs1)
7 def : binding(mre11_rad50,nbs1) --> product(mrn)
8 def : product(mrn) --> binding(mrn,altered_dna)
9 def : binding(mrn,altered_dna) --> product(mrn_bound_to_dna)
10 def : product(mrn_bound_to_dna) --> binding(mrn_bound_to_dna,atm_atm)
11 def : binding(mrn_bound_to_dna,atm_atm) --> product(atm_bound_to_mrn)
12 def : product(atm_bound_to_mrn) --> bloq-product(atm_atm)
13 def : product(atm_bound_to_mrn) --> autophosphorylation(atm_bound_to_mrn)
14 def : autophosphorylation(atm_bound_to_mrn) --> product(p_atm_atm_bound) 84 Approche proposée et résultats
15 def : product(p_atm_atm_bound) --> bloq-product(atm_atm)
16 def : product(p_atm_atm_bound) --> dissociation(p_atm_atm_bound)
17 def : dissociation(p_atm_atm_bound) --> product(p_atm_bound)
18 def : dissociation(p_atm_atm_bound) --> product(p_atm_free)
19 def : product(p_atm_free) --> phosphorylation(p_atm_free,chk1)
20 def : phosphorylation(p_atm_free,chk1) --> product(p_chk1)
21 dur : --> phosphorylation(atr,chk1)
22 def : phosphorylation(atr,chk1) --> product(p_chk1)
23 def : product(mrn_bound_to_dna) --> product(p_smc1)
24 def : product(mrn_bound_to_dna) --> product(p_mre11)
25 def : phosphorylation(atr,h2ax) --> product(gamma_h2ax)
26 def : phosphorylation(p_atm_bound,h2ax) --> product(gamma_h2ax)
27 def : product(gamma_h2ax) --> binding(gamma_h2ax,mdc1)
28 def : binding(gamma_h2ax,mdc1) --> product(h2ax_mdc1)
29 def : product(h2ax_mdc1) --> phosphorylation(p_atm_bound,h2ax_mdc1)
30 def : phosphorylation(p_atm_bound,h2ax_mdc1) --> product(p_mdc1)
31 def : product(p_mdc1) --> binding(p_mdc1,rnf8)
32 def : binding(p_mdc1,rnf8) --> product(rnf8_bound)
33 def : product(rnf8_bound) --> binding(rnf8_bound,ubc13)
34 def : binding(rnf8_bound,ubc13) --> product(rnf8_ubc13)
35 def : product(rnf8_ubc13) --> ubiquitination(rnf8_ubc13,h2a)
36 def : ubiquitination(rnf8_ubc13,h2a) --> product(ub_h2a)
37 def : product(ub_h2a) --> binding(ub_h2a,rnf168)
38 def : binding(ub_h2a,rnf168) --> product(rnf168_bound)
39 def : product(rnf168_bound) --> binding(rnf168_bound,ubc13)
40 def : binding(rnf168_bound,ubc13) --> product(rnf168_ubc13)
41 def : product(rnf168_ubc13) --> ubiquitination(rnf168_ubc13,h2a)
42 def : ubiquitination(rnf168_ubc13,h2a) --> product(poly_ub_h2a)
43 def : product(poly_ub_h2a) --> stimulation(poly_ub_h2a,dna)
44 def : stimulation(poly_ub_h2a,dna) --> product(changed_struct_dna)
45 def : product(poly_ub_h2a) --> binding(poly_ub_h2a,rap80)
46 def : binding(poly_ub_h2a,rap80) --> product(rap80_bound)
47 def : product(rap80_bound) --> binding(rap80_bound,abraxas)
48 def : binding(rap80_bound,abraxas) --> product(abraxas_bound)
49 def : product(abraxas_bound) --> binding(abraxas_bound,bre)
50 def : binding(abraxas_bound,bre) --> product(bre_bound)
51 def : product(abraxas_bound) --> binding(abraxas_bound,brcc36)
52 def : binding(abraxas_bound,brcc36) --> product(brcc36_bound)
53 def : product(brcc36_bound) --> binding(brcc36_bound,merit40)
54 def : binding(brcc36_bound,merit40) --> product(merit40_bound)
55 def : product(merit40_bound) --> binding(merit40_bound,brcc36_bound)
56 def : binding(merit40_bound,brcc36_bound) --> product(brcc36_merit40)
57 def : product(brcc36_merit40) --> binding(brcc36_merit40,brca1)
58 def : binding(brcc36_merit40,brca1) --> product(brca1_bound_to_rap80_complex)
59 def : product(changed_struct_dna) --> phosphorylation(p_atm_bound,mmset)
60 def : phosphorylation(p_atm_bound,mmset) --> product(p_mmset)
61 def : product(h2ax_mdc1) --> binding(h2ax_mdc1,mdc1)
62 def : binding(h2ax_mdc1,mdc1) --> product(mdc1_multi)Approche proposée et résultats 85
63 def : product(mdc1_multi), product(p_mmset) --> binding(mdc1_multi,p_mmset)
64 def : binding(mdc1_multi,p_mmset) --> product(mmset_mdc1)
65 def : product(mmset_mdc1) --> methylation(mmset_mdc1,h4)
66 def : methylation(mmset_mdc1,h4) --> product(h4k20me2)
67 def : product(h4k20me2), product(brca1_bound_to_rap80_complex) -->
binding(h4k20me2,p53bp1)
68 def : binding(h4k20me2,p53bp1) --> product(p53bp1_bound)
69 def : product(p53bp1_bound) --> phosphorylation(p_atm_bound,p53bp1_bound)
70 def : phosphorylation(p_atm_bound,p53bp1_bound) --> product(p_53bp1)
71 def : product(p_atm_free) --> phosphorylation(p_atm_free,plk3)
72 def : phosphorylation(p_atm_free,plk3) --> product(p_plk3)
73 def : product(p_atm_free) --> phosphorylation(p_atm_free,chk2)
74 def : phosphorylation(p_atm_free,chk2) --> product(p_s33_35_chk2)
75 def : product(p_s33_35_chk2) --> phosphorylation(p_plk3,p_s33_35_chk2)
76 def : phosphorylation(p_plk3,p_s33_35_chk2) --> product(p_s33_35_s62_73_chk2)
77 def : product(p_s33_35_s62_73_chk2) --> phosphorylation(p_atm_free,p_s33_35_s62_73_chk2)
78 def : phosphorylation(p_atm_free,p_s33_35_s62_73_chk2) --> product(p_t68_chk2)
79 def : product(p_s33_35_s62_73_chk2) --> phosphorylation(atr,p_s33_35_s62_73_chk2)
80 def : phosphorylation(atr,p_s33_35_s62_73_chk2) --> product(p_t68_chk2)
81 def : product(p_t68_chk2) --> binding(p_t68_chk2,p_t68_chk2)
82 def : binding(p_t68_chk2,p_t68_chk2) --> product(chk2_chk2)
83 def : product(chk2_chk2) --> autophosphorylation(chk2_chk2)
84 def : autophosphorylation(chk2_chk2) --> product(p_active_chk2_chk2)
85 def : product(p_active_chk2_chk2), product(p_53bp1) -->
binding(p_active_chk2_chk2,p_53bp1)
86 def : binding(p_active_chk2_chk2,p_53bp1) --> product(chk2_53bp1)
87 dur : --> binding(brca1,ctip)
88 def : binding(brca1,ctip) --> product(brca1_ctip)
89 def : product(brca1_ctip), product(chk2_53bp1) --> binding(brca1_ctip,chk2_53bp1)
90 def : binding(brca1_ctip,chk2_53bp1) --> product(chk2_53bp1_bound_to_brca1)
91 def : binding(brca1_ctip,chk2_53bp1) --> product(brca1_ctip_bound_to_chk2)
92 def : product(chk2_53bp1_bound_to_brca1), product(brca1_ctip_bound_to_chk2) -->
phosphorylation(chk2_53bp1_bound_to_brca1,brca1_ctip_bound_to_chk2)
93 def : phosphorylation(chk2_53bp1_bound_to_brca1,brca1_ctip_bound_to_chk2) -->
product(p_brca1_ctip_bound_to_chk2)
94 def : product(p_brca1_ctip_bound_to_chk2) --> product(p_s988_brca_ctip)
95 def : product(chk2_53bp1_bound_to_brca1) --> product(chk2_53bp1)
96 def : product(p_s988_brca_ctip) --> phosphorylation(p_atm_bound,p_s988_brca_ctip)
97 def : phosphorylation(p_atm_bound,p_s988_brca_ctip) --> product(brca_p_ctip)
98 def : product(brca_p_ctip) --> bloq-product(brca1_ctip)
99 def : product(brca_p_ctip) --> dissociation(brca_p_ctip)
100 def : dissociation(brca_p_ctip) --> product(brca1)
101 def : dissociation(brca_p_ctip) --> product(p_ctip)
102 def : product(brca1) --> phosphorylation(p_atm_bound,brca1)
103 def : phosphorylation(p_atm_bound,brca1) --> product(p_brca1)
104 def : product(brca1) --> phosphorylation(atr,brca1)
105 def : phosphorylation(atr,brca1) --> product(p_brca1)
106 def : product(p_brca1), product(p_53bp1) --> binding(mrn_bound_to_dna,p_brca1)86 Approche proposée et résultats
107 def : binding(mrn_bound_to_dna,p_brca1) --> product(brca1_bound_to_mrn)
108 def : product(chk2_53bp1) --> phosphorylation(chk2_53bp1,pml)
109 def : phosphorylation(chk2_53bp1,pml) --> product(p_pml)
110 def : product(p_pml) --> stimulation(p_pml,cell)
111 def : stimulation(p_pml,cell) --> product(apoptosis)
112 def : product(p_pml) --> binding(p_pml,mdm2)
113 def : binding(p_pml,mdm2) --> product(pml_mdm2)
114 def : product(pml_mdm2) --> bloq-binding(mdm2,p53)
115 dur : --> product(p53)
116 def : product(mdm2), product(p53) --> binding(mdm2,p53)
117 def : binding(mdm2,p53) --> product(mdm2_p53)
118 def : product(mdm2_p53) --> stimulation(p53_degradation_effectors,mdm2_p53)
119 def : stimulation(p53_degradation_effectors,mdm2_p53) --> product(p53_degradation)
120 def : product(p_atm_free), product(mdm2_p53) --> phosphorylation(p_atm_free,mdm2_p53)
121 def : phosphorylation(p_atm_free,mdm2_p53) --> product(p_s15_p53_mdm2)
122 def : product(mdm2_p53) --> phosphorylation(atr,mdm2_p53)
123 def : phosphorylation(atr,mdm2_p53) --> product(p_s15_p53_mdm2)
124 def : product(p_s15_p53_mdm2), product(chk2_53bp1) -->
phosphorylation(chk2_53bp1,p_s15_p53_mdm2)
125 def : phosphorylation(chk2_53bp1,p_s15_p53_mdm2) --> product(p_p_p53_mdm2)
126 def : product(p_s15_p53_mdm2), product(p_chk1) -->
phosphorylation(p_chk1,p_s15_p53_mdm2)
127 def : phosphorylation(p_chk1,p_s15_p53_mdm2) --> product(p_p_p53_mdm2)
128 def : product(p_s15_p53_mdm2) --> bloq-product(p53_degradation)
129 def : product(p_p_p53_mdm2) --> bloq-product(p53_degradation)
130 def : product(p_p_p53_mdm2) --> dissociation(p_p_p53_mdm2)
131 def : dissociation(p_p_p53_mdm2) --> product(p_p_p53)
132 def : dissociation(p_p_p53_mdm2) --> product(mdm2)
133 def : product(p_atm_free), product(mdm2) --> phosphorylation(p_atm_free,mdm2)
134 def : phosphorylation(p_atm_free,mdm2) --> product(p_mdm2)
135 def : product(p_p_p53) --> binding(p300,p_p_p53)
136 def : product(p_pml), binding(p300,p_p_p53) --> product(active_p53)
137 def : product(active_p53) --> transcription_activation(active_p53,prom_p21_gadd45)
138 def : transcription_activation(active_p53,prom_p21_gadd45) --> product(p21_and_gadd45)
139 def : product(prom_and_gadd45) --> stimulation(prom_and_gadd45,cell_cycle)
140 def : stimulation(p21_and_gadd45,cell_cycle) --> product(cell_cycle_arrest)
141 def : product(active_p53) --> transcription_activation(active_p53,prom_bnpf)
142 def : transcription_activation(active_p53,prom_bnpf) --> product(box_nas_puma_fas)
143 def : product(box_nas_puma_fas) --> stimulation(box_nas_puma_fas,cell)
144 def : stimulation(box_nas_puma_fas,cell) --> product(apoptosis)
145 def : product(active_p53) --> transcription_activation(active_p53,prom_mdm2)
146 def : transcription_activation(active_p53,prom_mdm2) --> product(mdm2)
147 dur : --> product(e2f1)
148 def : product(e2f1), product(chk2_53bp1) --> phosphorylation(chk2_53bp1,e2f1)
149 def : phosphorylation(chk2_53bp1,e2f1) --> product(p_e2f1)
150 def : product(e2f1) --> stimulation(e2f1_degradation_effectors,e2f1)
151 def : stimulation(e2f1_degradation_effectors,e2f1) --> product(e2f1_degradation)
152 def : product(p_e2f1) --> phosphorylation(p_atm_free,p_e2f1) Approche proposée et résultats 87
153 def : phosphorylation(p_atm_free,p_e2f1) --> product(p_p_e2f1)
154 def : product(p_e2f1) --> phosphorylation(atr,p_e2f1)
155 def : phosphorylation(atr,p_e2f1) --> product(p_p_e2f1)
156 def : product(p_p_e2f1) --> transcription_activation(p_p_e2f1,prom_chk2)
157 def : transcription_activation(p_p_e2f1,prom_chk2) --> product(chk2)
158 def : product(p_p_e2f1) --> transcription_activation(p_p_e2f1,prom_arf)
159 def : transcription_activation(p_p_e2f1,prom_arf) --> product(arf)
160 def : product(p_p_e2f1) --> transcription_activation(p_p_e2f1,prom_p73_apaf1)
161 def : transcription_activation(p_p_e2f1,prom_p73_apaf1) --> product(p73_apaf1)
162 def : product(p73_apaf1) --> stimulation(p73_apaf1,cell)
163 def : stimulation(p73_apaf1,cell) --> product(apoptosis)
164 def : product(arf) --> binding(arf,mdm2)
165 def : binding(arf,mdm2) --> product(arf_mdm2)
166 def : product(arf_mdm2) --> bloq-product(mdm2_p53)
167 def : product(p_p_e2f1) --> stimulation(p_p_e2f1,unknown_atm_way)
168 def : stimulation(p_p_e2f1,unknown_atm_way) --> product(p_atm_free)
169 def : product(p_atm_free) --> phosphorylation(p_atm_free,p38)
170 def : phosphorylation(p_atm_free,p38) --> product(p_p38)
171 def : product(chk2_53bp1) --> phosphorylation(chk2_53bp1,cdc25a)
172 def : phosphorylation(chk2_53bp1,cdc25a) --> product(p_cdc25a)
173 def : product(p_chk1) --> phosphorylation(p_chk1,cdc25a)
174 def : phosphorylation(p_chk1,cdc25a) --> product(p_cdc25a)
175 def : product(p_cdc25a) --> stimulation(cdc25a,cell)
176 def : stimulation(cdc25a,cell) --> bloq-product(cell_cycle_arrest)
177 def : product(p_cdc25a) --> stimulation(p_cdc25a,cdc25a_degradation_effectors)
178 def : stimulation(p_cdc25a,cdc25_degradation_effectors) --> product(cdc25a_degradation)
179 def : product(cdc25a_degradation) --> bloq-stimulation(cdc25a,cell)
180 def : product(chk2_53bp1) --> phosphorylation(chk2_53bp1,cdc25c)
181 def : phosphorylation(chk2_53bp1,cdc25c) --> product(p_cdc25c)
182 def : product(p_plk3) --> phosphorylation(p_plk3,cdc25c)
183 def : phosphorylation(p_plk3,cdc25c) --> product(p_cdc25c)
184 def : product(p_chk1) --> phosphorylation(p_chk1,cdc25c)
185 def : phosphorylation(p_chk1,cdc25c) --> product(p_cdc25c)
186 def : product(p_p38) --> phosphorylation(p_p38,cdc25c)
187 def : phosphorylation(p_p38,cdc25c) --> product(p_cdc25c)
188 def : product(p_cdc25c) --> stimulation(cdc25c,cell)
189 def : stimulation(cdc25c,cell) --> bloq-product(cell_cycle_arrest)
190 def : product(p_cdc25c) --> stimulation(p_cdc25c,cdc25c_degradation_effectors)
191 def : stimulation(cdc25b,cell) --> bloq-product(cell_cycle_arrest)
192 def : product(p_p38) --> phosphorylation(p_p38,cdc25b)
193 def : phosphorylation(p_p38,cdc25b) --> product(p_cdc25b)
194 def : product(p_cdc25b) --> bloq-stimulation(cdc25b,cell)
195 def : stimulation(jnk,cdc25c) --> product(p_cdc25c)
196 def : phosphorylation(jnk,p_s15_p53_mdm2) --> product(p_p_p53_mdm2)
197 def : product(p_atm_bound) --> phosphorylation(p_atm_bound,nbs1)
198 def : phosphorylation(p_atm_bound,nbs1) --> product(p_nbs1)
199 def : product(p_nbs1) --> phosphorylation(p_atm_bound,fancd2)
200 def : phosphorylation(p_atm_bound,fancd2) --> product(p_fancd2)88 Approche proposée et résultats
201 def : product(p_fancd2) --> stimulation(p_fancd2,cell)
202 def : stimulation(p_fancd2,cell) --> bloq-product(cell_cycle_arrest)
203 def : product(chk2_53bp1) --> binding(chk2_53bp1,mus81)
204 def : binding(chk2_53bp1,mus81) --> product(mus81_chk2)
205 def : product(mus81_chk2) --> binding(mus81_chk2,altered_dna)
206 def : binding(mus81_chk2,altered_dna) --> product(mus81_bound_to_dna)
LE RÉSULTAT
def 3 : (stimulation(dsb,dna), up, t0) ==> (product(altered_dna), up, t1)
def 4 : (product(altered_dna), up, t1) ==> (binding(mre11,rad50), up, t2)
def 5 : (binding(mre11,rad50), up, t2) ==> (product(mre11_rad50), up, t3)
def 6 : (product(mre11_rad50), up, t3) ==> (binding(mre11_rad50,nbs1), up, t4)
def 7 : (binding(mre11_rad50,nbs1), up, t4) ==> (product(mrn), up, t5)
def 8 : (product(mrn), up, t5) ==> (binding(mrn,altered_dna), up, t6)
def 9 : (binding(mrn,altered_dna), up, t6) ==> (product(mrn_bound_to_dna), up, t7)
def 10 : (product(mrn_bound_to_dna), up, t7) ==> (binding(mrn_bound_to_dna,atm_atm), up, t8)
def 11 : (binding(mrn_bound_to_dna,atm_atm), up, t8) ==> (product(atm_bound_to_mrn), up, t9)
def 12 : (product(atm_bound_to_mrn), up, t9) ==> (product(atm_atm), down, t10)
def 13 : (product(atm_bound_to_mrn), up, t9) ==> (autophosphorylation(atm_bound_to_mrn), up,
t10)
def 14 : (autophosphorylation(atm_bound_to_mrn), up, t10) ==> (product(p_atm_atm_bound), up,
t11)
def 16 : (product(p_atm_atm_bound), up, t11) ==> (dissociation(p_atm_atm_bound), up, t12)
def 17 : (dissociation(p_atm_atm_bound), up, t12) ==> (product(p_atm_bound), up, t13)
def 18 : (dissociation(p_atm_atm_bound), up, t12) ==> (product(p_atm_free), up, t13)
def 19 : (product(p_atm_free), up, t13) ==> (phosphorylation(p_atm_free,chk1), up, t14)
def 20 : (phosphorylation(p_atm_free,chk1), up, t14) ==> (product(p_chk1), up, t15)
def 23 : (product(mrn_bound_to_dna), up, t7) ==> (product(p_smc1), up, t8)
def 24 : (product(mrn_bound_to_dna), up, t7) ==> (product(p_mre11), up, t8)
def 25 : (phosphorylation(atr,h2ax), up, t0) ==> (product(gamma_h2ax), up, t1)
def 27 : (product(gamma_h2ax), up, t1) ==> (binding(gamma_h2ax,mdc1), up, t2)
def 28 : (binding(gamma_h2ax,mdc1), up, t2) ==> (product(h2ax_mdc1), up, t3)
def 29 : (product(h2ax_mdc1), up, t3) ==> (phosphorylation(p_atm_bound,h2ax_mdc1), up, t4)
def 30 : (phosphorylation(p_atm_bound,h2ax_mdc1), up, t4) ==> (product(p_mdc1), up, t5)
def 31 : (product(p_mdc1), up, t5) ==> (binding(p_mdc1,rnf8), up, t6)
def 32 : (binding(p_mdc1,rnf8), up, t6) ==> (product(rnf8_bound), up, t7)
def 33 : (product(rnf8_bound), up, t7) ==> (binding(rnf8_bound,ubc13), up, t8)
def 34 : (binding(rnf8_bound,ubc13), up, t8) ==> (product(rnf8_ubc13), up, t9)
def 35 : (product(rnf8_ubc13), up, t9) ==> (ubiquitination(rnf8_ubc13,h2a), up, t10)
def 36 : (ubiquitination(rnf8_ubc13,h2a), up, t10) ==> (product(ub_h2a), up, t11)
def 37 : (product(ub_h2a), up, t11) ==> (binding(ub_h2a,rnf168), up, t12)
def 38 : (binding(ub_h2a,rnf168), up, t12) ==> (product(rnf168_bound), up, t13)
def 39 : (product(rnf168_bound), up, t13) ==> (binding(rnf168_bound,ubc13), up, t14)
def 40 : (binding(rnf168_bound,ubc13), up, t14) ==> (product(rnf168_ubc13), up, t15)
def 41 : (product(rnf168_ubc13), up, t15) ==> (ubiquitination(rnf168_ubc13,h2a), up, t16)
def 42 : (ubiquitination(rnf168_ubc13,h2a), up, t16) ==> (product(poly_ub_h2a), up, t17)
def 43 : (product(poly_ub_h2a), up, t17) ==> (stimulation(poly_ub_h2a,dna), up, t18)
def 44 : (stimulation(poly_ub_h2a,dna), up, t18) ==> (product(changed_struct_dna), up, t19)
def 45 : (product(poly_ub_h2a), up, t17) ==> (binding(poly_ub_h2a,rap80), up, t18) Approche proposée et résultats 89
def 46 : (binding(poly_ub_h2a,rap80), up, t18) ==> (product(rap80_bound), up, t19)
def 47 : (product(rap80_bound), up, t19) ==> (binding(rap80_bound,abraxas), up, t20)
def 48 : (binding(rap80_bound,abraxas), up, t20) ==> (product(abraxas_bound), up, t21)
def 49 : (product(abraxas_bound), up, t21) ==> (binding(abraxas_bound,bre), up, t22)
def 50 : (binding(abraxas_bound,bre), up, t22) ==> (product(bre_bound), up, t23)
def 51 : (product(abraxas_bound), up, t21) ==> (binding(abraxas_bound,brcc36), up, t22)
def 52 : (binding(abraxas_bound,brcc36), up, t22) ==> (product(brcc36_bound), up, t23)
def 53 : (product(brcc36_bound), up, t23) ==> (binding(brcc36_bound,merit40), up, t24)
def 54 : (binding(brcc36_bound,merit40), up, t24) ==> (product(merit40_bound), up, t25)
def 55 : (product(merit40_bound), up, t25) ==> (binding(merit40_bound,brcc36_bound), up, t26)
def 56 : (binding(merit40_bound,brcc36_bound), up, t26) ==> (product(brcc36_merit40), up, t27)
def 57 : (product(brcc36_merit40), up, t27) ==> (binding(brcc36_merit40,brca1), up, t28)
def 58 : (binding(brcc36_merit40,brca1), up, t28) ==> (product(brca1_bound_to_rap80_complex),
up, t29)
def 59 : (product(changed_struct_dna), up, t19) ==> (phosphorylation(p_atm_bound,mmset), up,
t20)
def 60 : (phosphorylation(p_atm_bound,mmset), up, t20) ==> (product(p_mmset), up, t21)
def 61 : (product(h2ax_mdc1), up, t3) ==> (binding(h2ax_mdc1,mdc1), up, t4)
def 62 : (binding(h2ax_mdc1,mdc1), up, t4) ==> (product(mdc1_multi), up, t5)
def 63 : (product(mdc1_multi), up, t5), (product(p_mmset), up, t21) ==>
(binding(mdc1_multi,p_mmset), up, t22)
def 64 : (binding(mdc1_multi,p_mmset), up, t22) ==> (product(mmset_mdc1), up, t23)
def 65 : (product(mmset_mdc1), up, t23) ==> (methylation(mmset_mdc1,h4), up, t24)
def 66 : (methylation(mmset_mdc1,h4), up, t24) ==> (product(h4k20me2), up, t25)
def 67 : (product(h4k20me2), up, t25), (product(brca1_bound_to_rap80_complex), up, t29) ==>
(binding(h4k20me2,p53bp1), up, t30)
def 68 : (binding(h4k20me2,p53bp1), up, t30) ==> (product(p53bp1_bound), up, t31)
def 69 : (product(p53bp1_bound), up, t31) ==> (phosphorylation(p_atm_bound,p53bp1_bound), up,
t32)
def 70 : (phosphorylation(p_atm_bound,p53bp1_bound), up, t32) ==> (product(p_53bp1), up, t33)
def 71 : (product(p_atm_free), up, t13) ==> (phosphorylation(p_atm_free,plk3), up, t14)
def 72 : (phosphorylation(p_atm_free,plk3), up, t14) ==> (product(p_plk3), up, t15)
def 73 : (product(p_atm_free), up, t13) ==> (phosphorylation(p_atm_free,chk2), up, t14)
def 74 : (phosphorylation(p_atm_free,chk2), up, t14) ==> (product(p_s33_35_chk2), up, t15)
def 75 : (product(p_s33_35_chk2), up, t15) ==> (phosphorylation(p_plk3,p_s33_35_chk2), up, t16)
def 76 : (phosphorylation(p_plk3,p_s33_35_chk2), up, t16) ==> (product(p_s33_35_s62_73_chk2),
up, t17)
def 77 : (product(p_s33_35_s62_73_chk2), up, t17) ==>
(phosphorylation(p_atm_free,p_s33_35_s62_73_chk2), up, t18)
def 78 : (phosphorylation(p_atm_free,p_s33_35_s62_73_chk2), up, t18) ==> (product(p_t68_chk2),
up, t19)
def 79 : (product(p_s33_35_s62_73_chk2), up, t17) ==>
(phosphorylation(atr,p_s33_35_s62_73_chk2), up, t18)
def 81 : (product(p_t68_chk2), up, t19) ==> (binding(p_t68_chk2,p_t68_chk2), up, t20)
def 82 : (binding(p_t68_chk2,p_t68_chk2), up, t20) ==> (product(chk2_chk2), up, t21)
def 83 : (product(chk2_chk2), up, t21) ==> (autophosphorylation(chk2_chk2), up, t22)
def 84 : (autophosphorylation(chk2_chk2), up, t22) ==> (product(p_active_chk2_chk2), up, t23)
def 85 : (product(p_active_chk2_chk2), up, t23), (product(p_53bp1), up, t33) ==> 90 Approche proposée et résultats
(binding(p_active_chk2_chk2,p_53bp1), up, t34)
def 86 : (binding(p_active_chk2_chk2,p_53bp1), up, t34) ==> (product(chk2_53bp1), up, t35)
def 88 : (binding(brca1,ctip), up, t0) ==> (product(brca1_ctip), up, t1)
def 89 : (product(brca1_ctip), up, t1), (product(chk2_53bp1), up, t35) ==>
(binding(brca1_ctip,chk2_53bp1), up, t36)
def 90 : (binding(brca1_ctip,chk2_53bp1), up, t36) ==> (product(chk2_53bp1_bound_to_brca1), up,
t37)
def 91 : (binding(brca1_ctip,chk2_53bp1), up, t36) ==> (product(brca1_ctip_bound_to_chk2), up,
t37)
def 92 : (product(chk2_53bp1_bound_to_brca1), up, t37), (product(brca1_ctip_bound_to_chk2), up,
t37) ==>(phosphorylation(chk2_53bp1_bound_to_brca1,brca1_ctip_bound_to_chk2), up,
t38)
def 93 : (phosphorylation(chk2_53bp1_bound_to_brca1,brca1_ctip_bound_to_chk2), up, t38) ==>
(product(p_brca1_ctip_bound_to_chk2), up, t39)
def 94 : (product(p_brca1_ctip_bound_to_chk2), up, t39) ==> (product(p_s988_brca_ctip), up, t40)
def 96 : (product(p_s988_brca_ctip), up, t40) ==>
(phosphorylation(p_atm_bound,p_s988_brca_ctip), up, t41)
def 97 : (phosphorylation(p_atm_bound,p_s988_brca_ctip), up, t41) ==> (product(brca_p_ctip), up,
t42)
def 99 : (product(brca_p_ctip), up, t42) ==> (dissociation(brca_p_ctip), up, t43)
def 100 : (dissociation(brca_p_ctip), up, t43) ==> (product(brca1), up, t44)
def 101 : (dissociation(brca_p_ctip), up, t43) ==> (product(p_ctip), up, t44)
def 102 : (product(brca1), up, t44) ==> (phosphorylation(p_atm_bound,brca1), up, t45)
def 103 : (phosphorylation(p_atm_bound,brca1), up, t45) ==> (product(p_brca1), up, t46)
def 104 : (product(brca1), up, t44) ==> (phosphorylation(atr,brca1), up, t45)
def 106 : (product(p_brca1), up, t46), (product(p_53bp1), up, t33) ==>
(binding(mrn_bound_to_dna,p_brca1), up, t47)
def 107 : (binding(mrn_bound_to_dna,p_brca1), up, t47) ==> (product(brca1_bound_to_mrn), up,
t48)
def 108 : (product(chk2_53bp1), up, t35) ==> (phosphorylation(chk2_53bp1,pml), up, t36)
def 109 : (phosphorylation(chk2_53bp1,pml), up, t36) ==> (product(p_pml), up, t37)
def 110 : (product(p_pml), up, t37) ==> (stimulation(p_pml,cell), up, t38)
def 111 : (stimulation(p_pml,cell), up, t38) ==> (product(apoptosis), up, t39)
def 112 : (product(p_pml), up, t37) ==> (binding(p_pml,mdm2), up, t38)
def 113 : (binding(p_pml,mdm2), up, t38) ==> (product(pml_mdm2), up, t39)
def 114 : (product(pml_mdm2), up, t39) ==> (binding(mdm2,p53), down, t40)
def 148 : (product(e2f1), up, t0), (product(chk2_53bp1), up, t35) ==>
(phosphorylation(chk2_53bp1,e2f1), up, t36)
def 149 : (phosphorylation(chk2_53bp1,e2f1), up, t36) ==> (product(p_e2f1), up, t37)
def 150 : (product(e2f1), up, t0) ==> (stimulation(e2f1_degradation_effectors,e2f1), up, t1)
def 151 : (stimulation(e2f1_degradation_effectors,e2f1), up, t1) ==> (product(e2f1_degradation), up,
t2)
def 152 : (product(p_e2f1), up, t37) ==> (phosphorylation(p_atm_free,p_e2f1), up, t38)
def 153 : (phosphorylation(p_atm_free,p_e2f1), up, t38) ==> (product(p_p_e2f1), up, t39)
def 154 : (product(p_e2f1), up, t37) ==> (phosphorylation(atr,p_e2f1), up, t38)
def 156 : (product(p_p_e2f1), up, t39) ==> (transcription_activation(p_p_e2f1,prom_chk2), up, t40)
def 157 : (transcription_activation(p_p_e2f1,prom_chk2), up, t40) ==> (product(chk2), up, t41)
def 158 : (product(p_p_e2f1), up, t39) ==> (transcription_activation(p_p_e2f1,prom_arf), up, t40) Approche proposée et résultats 91
def 159 : (transcription_activation(p_p_e2f1,prom_arf), up, t40) ==> (product(arf), up, t41)
def 160 : (product(p_p_e2f1), up, t39) ==> (transcription_activation(p_p_e2f1,prom_p73_apaf1),
up, t40)
def 161 : (transcription_activation(p_p_e2f1,prom_p73_apaf1), up, t40) ==> (product(p73_apaf1),
up, t41)
def 162 : (product(p73_apaf1), up, t41) ==> (stimulation(p73_apaf1,cell), up, t42)
def 164 : (product(arf), up, t41) ==> (binding(arf,mdm2), up, t42)
def 165 : (binding(arf,mdm2), up, t42) ==> (product(arf_mdm2), up, t43)
def 166 : (product(arf_mdm2), up, t43) ==> (product(mdm2_p53), down, t44)
def 167 : (product(p_p_e2f1), up, t39) ==> (stimulation(p_p_e2f1,unknown_atm_way), up, t40)
def 169 : (product(p_atm_free), up, t13) ==> (phosphorylation(p_atm_free,p38), up, t14)
def 170 : (phosphorylation(p_atm_free,p38), up, t14) ==> (product(p_p38), up, t15)
def 171 : (product(chk2_53bp1), up, t35) ==> (phosphorylation(chk2_53bp1,cdc25a), up, t36)
def 172 : (phosphorylation(chk2_53bp1,cdc25a), up, t36) ==> (product(p_cdc25a), up, t37)
def 173 : (product(p_chk1), up, t15) ==> (phosphorylation(p_chk1,cdc25a), up, t16)
def 175 : (product(p_cdc25a), up, t37) ==> (stimulation(cdc25a,cell), up, t38)
def 176 : (stimulation(cdc25a,cell), up, t38) ==> (product(cell_cycle_arrest), down, t39)
def 177 : (product(p_cdc25a), up, t37) ==> (stimulation(p_cdc25a,cdc25a_degradation_effectors),
up, t38)
def 180 : (product(chk2_53bp1), up, t35) ==> (phosphorylation(chk2_53bp1,cdc25c), up, t36)
def 181 : (phosphorylation(chk2_53bp1,cdc25c), up, t36) ==> (product(p_cdc25c), up, t37)
def 182 : (product(p_plk3), up, t15) ==> (phosphorylation(p_plk3,cdc25c), up, t16)
def 184 : (product(p_chk1), up, t15) ==> (phosphorylation(p_chk1,cdc25c), up, t16)
def 186 : (product(p_p38), up, t15) ==> (phosphorylation(p_p38,cdc25c), up, t16)
def 188 : (product(p_cdc25c), up, t37) ==> (stimulation(cdc25c,cell), up, t38)
def 190 : (product(p_cdc25c), up, t37) ==> (stimulation(p_cdc25c,cdc25c_degradation_effectors),
up, t38)
def 192 : (product(p_p38), up, t15) ==> (phosphorylation(p_p38,cdc25b), up, t16)
def 193 : (phosphorylation(p_p38,cdc25b), up, t16) ==> (product(p_cdc25b), up, t17)
def 194 : (product(p_cdc25b), up, t17) ==> (stimulation(cdc25b,cell), down, t18)
def 197 : (product(p_atm_bound), up, t13) ==> (phosphorylation(p_atm_bound,nbs1), up, t14)
def 198 : (phosphorylation(p_atm_bound,nbs1), up, t14) ==> (product(p_nbs1), up, t15)
def 199 : (product(p_nbs1), up, t15) ==> (phosphorylation(p_atm_bound,fancd2), up, t16)
def 200 : (phosphorylation(p_atm_bound,fancd2), up, t16) ==> (product(p_fancd2), up, t17)
def 201 : (product(p_fancd2), up, t17) ==> (stimulation(p_fancd2,cell), up, t18)
def 203 : (product(chk2_53bp1), up, t35) ==> (binding(chk2_53bp1,mus81), up, t36)
def 204 : (binding(chk2_53bp1,mus81), up, t36) ==> (product(mus81_chk2), up, t37)
def 205 : (product(mus81_chk2), up, t37) ==> (binding(mus81_chk2,altered_dna), up, t38)
def 206 : (binding(mus81_chk2,altered_dna), up, t38) ==> (product(mus81_bound_to_dna), up, t39)
Ce résultat est représenté dans la Figure 4.7. Les chiffres rouges sont les défauts utilisés
dans le résultat.92 Approche proposée et résultats
Figure 4.7. Une extension de la carte de PommierConclusion 93
Conclusion
Les voies de signalisation sont très importantes pour la compréhension des mécanismes
des fonctions biologiques.
Cette thèse étudie la synthèse automatique des voies de signalisation à partir
d’informations trouvées dans des bases de connaissances. Une composante essentielle de
cette approche est l’utilisation du raisonnement logique pour représenter la connaissance
biologique de la communication intracellulaire. En choisissant la représentation adéquate des
connaissances biologiques la partie « raisonnement » est capable d’assigner un ordre dans
l’acquisition des faits et d’extraire les interactions nécessaires à la synthèse des voies
métaboliques ou de signalisation.
La première partie de la thèse est consacrée à la synthèse des voies pharmaco-cinétiques
par des algorithmes de production. Cet algorithme est décidable, cohérent et complet. La
deuxième partie utilise la logique des défauts pour représenter les interactions dans les
réseaux de gènes.
Le problème de l'implémentation et de la complexité algorithmique n'a pas été abordé. Il
sera sans doute nécessaire de réduire les possibilités d'expression du langage pour arriver à
des temps de calcul raisonnables. On retrouve ici la même problématique que pour la
résolution pratique des problèmes NP-Complets. Bien entendu le problème est ici plus
compliqué. La complexité pratique peut alors rester accessible en contrôlant l'écriture des
règles. Par exemple dans un premier temps on peut essayer de se restreindre à quelque chose
qui ressemble à des clauses de Horn (clauses qui contiennent au plus un littéral positif [2]). Bibliographie 95
Bibliographie
[1] Demongeot J, “Multi-stationarity and cell differentiation”, J. Biol. Systems., 6, 1-2 (1998).
[2] Doncescu A. , Inoue K. and Yamamoto, “Knowledge-based discovery in systems biology using
CF-induction”. New Trends in Applied Artificial Intelligence: Proceedings of the 20th
International Conference on Industrial, Engineering and Other Applications of Applied Intelligent
Systems (IEA / AIE 2007), Lecture Notes in Artificial Intelligence, volume 4570, pages 395-404,
Springer-Verlag.
[3] Doncescu A, and Siegel P, “Utilisation de la logique des hypothèses pour la modélisation des
voies de signalisation dans la cellule”, JIAF 11, Lyon 8-10, June 2011.
[4] Doncescu A., Waissman J.,Richard G.,Roux G. “Characterization of bio-chemical signals by
inductive logic programming”, Knowledge-Based Systems 15 (1), 129-137, 2002.
[5] Christophe Chassagnole, Juan Carlos, A Rodriguez, Andrei Doncescu, Laurence T Yang
“Differential evolutionary algorithms for in vivo dynamic analysis of glycolysis and pentose
phosphate pathway in Escherichia Coli”, Parallel Computing for Bioinformatics and
Computational Biology: Models, Enabling Technologies, and Case Studies, 59-78, John Wiley &
Sons, Inc.,2006.
[6] Montseny E., Doncescu A., “Operatorial Parametrizing of Controlled Dynamic SystemsApplication
to the Fed-Batch Bioreactor Control Problem”, 17th World Congress The
International Federation of Automatic Control. Seoul, Korea, June 2008.
[7] Forget L, Rish V. , P Siegel. “Preferential Logics are X-logics” Journal of Computational Logic,
10, 2000, pp. 1-13.
[8] Ginsberg, ML, Smith, DE (July 1988). “Reasoning about action II: the qualification problem”.
Artificial Intelligence Vol. 35 No. 3 pp.311-342.
[9] Giunchiglia, E., Lee, J., Lifschitz, V., McCain, N., & Turner, H. (March 2004). “Nonmonotonic
causal theories”. Artificial Intelligence No. 1-2 vol.153 pp.49-104.
[10]Inoue K, “Induction as Consequence Finding”. Machine Learning, 55 (2) :109-135, 2004.
[11]Inoue K, Saito H. “Circumscripta Policies for Induction” Proceedings of 14th Conf. on Inductive
Logic Programming, LNAI 3194, pp.164-179, Springer, September 2004.
[12]K. Inoue, T. Sato, M. Ishihata, Y. Kameya and H. Nabeshima, “Evaluating abductive hypotheses
using an em algorithm on bdds”, in: Proceedings of IJCAI-09, Pasadena, CA, 2009, pp. 810–815.
[13]Kayser D., Levy F. “Modeling symbolic causal reasoning”, Intellecta 2004 / 1, 38, pp 291-232
[14]Nabeshima H. , Iwanuma K., Inoue K. Ray O. “SOLAR: An automated deduction system for
Finding consequence”. AI Commun. 23 (2-3): 183-203 (2010)
[15]Roux-Rouquié M., L. Hood, Imbeaud S., Auffray C. “Issues in Computational Methods for
Functional Genomics and Systems Biology”. CMSB 2003 : 182-186
[16]Schwind P. , Siegel P: “Modal Logic for Hypothesis Theory”, Fundamentae Informaticae, cal 21,
No. 1-2 89-101.
[17]Synnaeve G, Inoue K, Doncescu A, Nabeshima N, Kameya Y, Ishihata M., Sato T, “Kinetic
models and qualitative abstraction for relational learning in systems biology”, BIOSTEC
Bioinformatics 2011
[18]Siegel P. : “A modal language for Nonmonotonic Reasonning”, Proc. Workshop DRUMS / EEC
Marseille 24-27 February 90.
[19]P. Siegel , C. Schwind, “Modal logic based theory for nonmonotonic reasoning”. Journal of
Applied Non-classical Logic, Volume 3 - No. 1 / 1993, P 73-92.
[20]Synnaeve G., Doncescu A., Inoue K., “Kinetic models for logic-based hypothesis finding in
metabolic pathways”, Int’l Conf. on Inductive Logic Programming (ILP-09), 2009.
[21]Tran N. , C. Baral (2007) “Hypothesizing and reasoning about signaling networks”. Journal of
Applied Logic 7 (2009) 253-274 96 Bibliographie
[22]Barthélémy DWORKIN “Utilisation de SOLAR dans la voie de signalisation ATM-dépendante de
la cassure double-brin de l'ADN”. Mémoire de master 2 / Université Paul Sabatier, Toulouse
2011.
[23]Toulgoat I. “Modélisation du comportement humain dans les simulations de combat naval”. Thèse
doctorat / Université du Sud, Toulon-Var [s.n] 2011.
[24]Pommier Y et al. “Targeting Chk2 kinase: Molecular interaction maps and therapeutic rationale”.
2005
[25]Munna L. Agarwal et al. “The p53 Network”, Journal of Biological Chemistry, Vol. 273, No 1,
Issue of January 2, pp. 1-4, 1998
[26]P. Siegel, “Représentation et utilization de la connaissance en calcul propositionnel”, Thèse
d’État, Université d’Aix-Marseille II, Luminy, France, 1987.
[27]Tan Le, A. Doncescu, P. Siegel, “Default Logic for Diagnostic of Discrete Time System”, 8th
international conference BWCCA, October 28-30 2013, Compiegne, France, pp. 488-493.
[28]Tan Le, A. Doncescu, P. Siegel, “Utilization of Default Logic for Analyzing a Metabolic System
in Discrete Time”, 13th international conference ICCSA, June 24-27 2013, Ho Chi Minh City,
Vietnam, pp. 130-136.
[29]G. Bossu, P. Siegel, “Nonmonotonic Reasoning and databases”, Workshop Logic and Data Bases.
CERT - Toulouse - Décembre 1982
[30]G. Bossu, P. Siegel, “Saturation, Nonmonotonic Reasoning and the Closed World Assumption”,
Artificial Intelligence 25, Janvier 1985, p. 13-63
[31]J.M. Boi, E. Innocenti, A. Rauzy, P. Siegel, “Production Fields : a New approach to Deduction
Problems and two Algorithms for propositional Calculus”, Revue d'Intelligence Artificielle, vol 6
- n° 3/1992 , p 235, 255.
Equilibrage de charge dynamique avec un nombre ´
variable de processeurs bas´e sur des m´ethodes de
partitionnement de graphe
Cl´ement Vuchener
To cite this version:
Cl´ement Vuchener. Equilibrage de charge dynamique avec un nombre variable de processeurs ´
bas´e sur des m´ethodes de partitionnement de graphe. Distributed, Parallel, and Cluster Computing.
Universit´e de Bordeaux, 2014. French.
HAL Id: tel-00952777
https://tel.archives-ouvertes.fr/tel-00952777
Submitted on 27 Feb 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific
research documents, whether they are published
or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.THESE
`
PRESENT ´ EE´ A`
L’UNIVERSITE DE BORDEAUX ´
ECOLE DOCTORALE DE MATH ´ EMATIQUES ET ´
D’INFORMATIQUE
Par Cl´ement VUCHENER
POUR OBTENIR LE GRADE DE
DOCTEUR
SPECIALIT ´ E : INFORMATIQUE ´
Equilibrage de charge dynamique avec un nombre ´
variable de processeurs bas´e sur des m´ethodes de
partitionnement de graphe
Soutenue le : 7 f´evrier 2014
Apr`es avis des rapporteurs :
Pierre Manneback Professeur
Bora U¸car . . . . . . . . Charg´e de Recherche
Devant la commission d’examen compos´ee de :
Florent Duchaine . Senior Researcher . . . . Examinateur
Aur´elien Esnard . . Maˆıtre de Conf´erences Directeur de Th`ese
Pierre Manneback Professeur . . . . . . . . . . . . Pr´esident du Jury & Rapporteur
Fran¸cois Pellegrini Professeur . . . . . . . . . . . . Examinateur
Jean Roman . . . . . Professeur . . . . . . . . . . . . Directeur de Th`ese
Bora U¸car . . . . . . . . Charg´e de Recherches Rapporteur
2014iiiii
Remerciements
Avant tout, je remercie mes directeurs de th`ese Jean Roman et Aur´elien Esnard qui ont
accept´e d’encadrer cette th`ese. Et plus particuli`erement Aur´elien pour tout le temps qu’il m’a
accord´e, ces longues discussions qui ont permis `a cette th`ese d’avancer et tous les conseils donn´es.
Je remercie Pierre Manneback et Bora U¸car qui ont accept´e de rapporter cette th`ese malgr´e
des d´elais tr`es courts, ainsi que les autres membres du jury : Fran¸cois Pellegrini et Florent
Duchaine pour l’int´erˆet port´e `a mes travaux.
Je remercie ´egalement S´ebastien Fourestier et, encore une fois, Fran¸cois Pellegrini pour toute
leur aide sur Scotch et comment y ajouter ma m´ethode de partitionnement.
Je remercie toute l’´equipe INRIA HiePACS au sein de laquelle j’ai effectu´e cette th`ese et plus
particuli`erement les autres doctorants de l’´equipe qui m’ont tenu compagnie pendant pr`es de
trois ans pour certains.ivv
Equilibrage de charge dynamique avec un nombre variable ´
de processeurs bas´e sur des m´ethodes de partitionnement
de graphe
R´esum´e
L’´equilibrage de charge est une ´etape importante conditionnant les performances des applications
parall`eles. Dans le cas o`u la charge varie au cours de la simulation, il est important de
redistribuer r´eguli`erement la charge entre les diff´erents processeurs. Dans ce contexte, il peut
s’av´erer pertinent d’adapter le nombre de processeurs au cours d’une simulation afin d’obtenir
une meilleure efficacit´e, ou de continuer l’ex´ecution quand toute la m´emoire des ressources
courantes est utilis´ee. Contrairement au cas o`u le nombre de processeurs ne varie pas, le r´e´equilibrage
dynamique avec un nombre variable de processeurs est un probl`eme peu ´etudi´e que nous
abordons ici.
Cette th`ese propose diff´erentes m´ethodes bas´ees sur le repartitionnement de graphe pour
r´e´equilibrer la charge tout en changeant le nombre de processeurs. Nous appelons ce probl`eme
« repartitionnement M × N ». Ces m´ethodes se d´ecomposent en deux grandes ´etapes. Dans un
premier temps, nous ´etudions la phase de migration et nous construisons une « bonne » matrice
de migration minimisant plusieurs crit`eres objectifs comme le volume total de migration et le
nombre total de messages ´echang´es. Puis, dans un second temps, nous utilisons des heuristiques
de partitionnement de graphe pour calculer une nouvelle distribution optimisant la migration en
s’appuyant sur les r´esultats de l’´etape pr´ec´edente. En outre, nous proposons un algorithme de
partitionnement k-aire direct permettant d’am´eliorer le partitionnement biais´e. Finalement, nous
validons cette th`ese par une ´etude exp´erimentale en comparant nos m´ethodes aux partitionneurs
actuels.
Mots-cl´es
Simulation num´erique, parall´elisme, ´equilibrage de charge dynamique, redistribution, partitionnement
de graphe, repartitionnement.vi
Dynamic Load-Balancing with Variable Number of Processors
based on Graph Partitioning
Abstract
Load balancing is an important step conditioning the performance of parallel programs. If
the workload varies drastically during the simulation, the load must be redistributed regularly
among the processors. Dynamic load balancing is a well studied subject but most studies are
limited to an initially fixed number of processors. Adjusting the number of processors at runtime
allows to preserve the parallel code efficiency or to keep running the simulation when the memory
of the current resources is exceeded.
In this thesis, we propose some methods based on graph repartitioning in order to rebalance
the load while changing the number of processors. We call this problem “M × N repartitioning”.
These methods are split in two main steps. Firstly, we study the migration phase and we
build a “good” migration matrix minimizing several metrics like the migration volume or the
number of exchanged messages. Secondly, we use graph partitioning heuristics to compute a new
distribution optimizing the migration according to the previous step results. Besides, we propose
a direct k-way partitioning algorithm that allows us to improve our biased partitioning. Finally,
an experimental study validates our algorithms against state-of-the-art partitioning tools.
Keywords
Numerical simulation, parallelism, dynamic load-balancing, redistribution, graph partitioning,
repartitioning.Table des mati`eres
1 Introduction 1
2 Etat de l’art ´ 5
2.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Partitionnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.1 Mod´elisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.2 M´ethodes de partitionnement de graphe . . . . . . . . . . . . . . . . . . . 9
2.2.3 Etat de l’art des outils de partitionnement . . . . . . . . . . . . . . . . . . 11 ´
2.3 Repartitionnement pour l’´equilibrage dynamique . . . . . . . . . . . . . . . . . . 13
2.3.1 Mod´elisation du probl`eme de repartitionnement . . . . . . . . . . . . . . . 13
2.3.2 M´ethodes de repartitionnement de graphe . . . . . . . . . . . . . . . . . . 14
2.4 Positionnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3 Mod`ele de migration pour le repartitionnement M × N 25
3.1 Notations et d´efinitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.1 G´en´eralit´es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.1.2 D´efinitions pour le repartitionnement M × N . . . . . . . . . . . . . . . . 27
3.2 Matrices de migration optimales dans le cas ´equilibr´e . . . . . . . . . . . . . . . . 28
3.3 Construction des matrices de migration . . . . . . . . . . . . . . . . . . . . . . . 35
3.3.1 M´ethode bas´ee sur la chaˆıne (1D) . . . . . . . . . . . . . . . . . . . . . . . 35
3.3.2 M´ethode d’appariement (Matching) . . . . . . . . . . . . . . . . . . . . . 42
3.3.3 M´ethode gloutonne (Greedy) . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.3.4 Programme lin´eaire (LP) . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.4 Evaluation des m´ethodes et conclusion . . . . . . . . . . . . . . . . . . . . . . ´ . . 62
4 Repartitionnement M × N 67
4.1 Repartitionnement M × N bas´e sur le partitionnement biais´e (BIASED) . . . . . 67
4.1.1 M´ethodologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.1.2 Limitations des partitionneurs . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2 Partitionnement k-aire direct (KGGGP) . . . . . . . . . . . . . . . . . . . . . . . 73
4.2.1 Description de l’algorithme . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.2.2 Crit`eres de s´election . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.2.3 Complexit´e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.2.4 Am´eliorations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2.5 Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 ´
4.3 Repartitionnement M × N bas´e sur la diffusion (DIFF) . . . . . . . . . . . . . . 85
4.4 Partitionnement biais´e `a l’aide d’hyper-arˆetes de repartitionnement . . . . . . . . 89
4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
viiviii TABLE DES MATIERES `
5 R´esultats 91
5.1 M´ethodologie exp´erimentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.2 Influence du coˆut de migration et du facteur de repartitionnement . . . . . . . . 94
5.3 Influence du nouveau nombre de processeurs . . . . . . . . . . . . . . . . . . . . . 97
5.4 Comparaison sur des graphes complexes . . . . . . . . . . . . . . . . . . . . . . . 101
5.5 Etude de la complexit´e en temps . . . . . . . . . . . . . . . . . . . . . . . . . ´ . . 110
6 Conclusion et Perspectives 115
6.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.2 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
A Programmes lin´eaires pour optimiser les diff´erentes m´etriques 119
A.1 Minimisation de TotalV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
A.2 Minimisation de MaxV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
A.3 Minimisation de TotalZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
A.4 Minimisation de MaxZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
B Documentation du KGGGP dans Scotch 123
C R´esultats suppl´ementaires 125
C.1 Influence du coˆut de migration et du facteur de repartitionnement . . . . . . . . 125
C.2 Comparaison sur des graphes complexes . . . . . . . . . . . . . . . . . . . . . . . 126
Bibliographie 133
Liste des publications 137Chapitre 1
Introduction
Une simulation num´erique mod´elise g´en´eralement l’´evolution en temps d’un ph´enom`ene physique
dans un domaine de l’espace. Souvent, on utilise un sch´ema it´eratif en temps et une discr´etisation
de l’espace via un maillage d’´el´ements g´eom´etriques (triangles, carr´es, t´etra`edres, etc.).
Des simulations de plus en plus complexes demandent une plus grande puissance de calcul. Pour
cela, ces applications doivent fonctionner en parall`ele sur plusieurs nœuds de calcul. Les donn´ees
sont alors r´eparties sur les diff´erentes unit´es de traitement ou « processeurs ». Les processeurs
ne pouvant pas acc´eder directement et rapidement aux donn´ees des autres processeurs, ce parall´elisme
induit un surcout dˆu aux communications sur le r´eseau. La m´emoire ´etant distribu´ee, la
r´epartition des calculs implique une distribution des donn´ees.
Dans ce contexte, la distribution des donn´ees est une ´etape importante conditionnant les
performances d’une simulation num´erique et elle est faite selon deux objectifs :
— la charge de calcul affect´ee aux diff´erents processeurs doit ˆetre ´equilibr´ee pour minimiser
le temps de calcul de chacun ;
— les communications inter-processeurs induites par la distribution doivent ˆetre minimis´ees.
Certaines simulations num´eriques complexes ont une charge de calcul qui peut ´evoluer de fa¸con
impr´evisible ; c’est le cas par exemple des simulations de type AMR (Adaptive Mesh Refinement)
o`u la discr´etisation de l’espace ´evolue pour ˆetre plus fine autour de points d’int´erˆet. La charge de
certains processeurs peut augmenter plus rapidement que d’autres et il n’est alors plus possible de
garder une mˆeme distribution tout le long de la simulation. De nouvelles distributions doivent ˆetre
recalcul´ees pour r´e´equilibrer la charge lorsque le d´es´equilibre devient trop important. On parle
alors d’´equilibrage dynamique. En plus des deux objectifs pr´ec´edents, la nouvelle distribution doit
r´epondre `a deux nouvelles contraintes :
— la nouvelle partition doit ˆetre calcul´ee rapidement en parall`ele ;
— la migration des donn´ees n´ecessaire pour passer de l’ancienne distribution `a la nouvelle
doit ˆetre la plus rapide possible, c’est-`a-dire qu’il faut que le moins possible de donn´ees
ne change de processeurs.
Le probl`eme de calcul de telles distributions peut ˆetre r´esolu `a l’aide du partitionnement d’un
graphe non-orient´e en k parties. Les sommets du graphe repr´esentent les calculs et les arˆetes
repr´esentent les d´ependances entre ces calculs. Chaque partie repr´esente l’ensemble des calculs
affect´es `a un processeur. Deux sommets connect´es qui se trouvent dans deux parties diff´erentes (on
dira que l’arˆete est coup´ee) induisent un besoin de communication entre ces deux processeurs.
L’objectif de la distribution devient alors de construire une partition dont les parties sont de
mˆeme taille et coupant un minimum d’arˆetes. Dans le cas de l’´equilibrage dynamique, on parlera
de « repartitionnement ». Le partitionnement de graphe est un probl`eme d´ej`a bien ´etudi´e, que
12 CHAPITRE 1. INTRODUCTION
ce soit dans le cas statique o`u une seule partition est calcul´ee, ou dynamique o`u la partition est
recalcul´ee r´eguli`erement.
Augmentation
de la charge
M = 4 N = 6
Figure 1.1 – Allocation dynamique de processeurs pour un code parall`ele dont la charge augmente.
Lorsque la charge de calcul varie de fa¸con importante, il peut devenir int´eressant de changer
le nombre de processeurs allou´es. Cela peut permettre de continuer la simulation quand toute
la m´emoire des processeurs est utilis´ee, ou ainsi d’am´eliorer la consommation des ressources
pour garder une bonne efficacit´e au cours de la simulation. Par exemple, un code AMR utilise
initialement un maillage tr`es simple avec peu d’´el´ements, qu’il ne serait pas efficace de distribuer
sur un grand nombre de processeurs. Avec le raffinement du maillage, la quantit´e de calcul
augmente de fa¸con importante, et la parall´elisation sur un plus grande nombre de processeurs
devient plus int´eressante, voire n´ecessaire si la taille du probl`eme d´epasse la capacit´e m´emoire
des processeurs d´ej`a allou´es. Il faut alors ˆetre capable de calculer une nouvelle distribution pour
un plus grand nombre de processeurs, comme illustr´e en figure 1.1.
Augmentation de la
charge relative A/B
M + M' = 6 N + N' = 6
A B A B
Figure 1.2 – Allocation dynamique de processeurs pour deux codes coupl´es A et B dont la
charge relative de A par rapport `a B augmente.
L’allocation dynamique de processeurs est ´egalement utile dans le cas des codes coupl´es. Ce
sont diff´erents codes s’ex´ecutant en parall`ele et collaborant pour r´ealiser une simulation plus
complexe. Ces codes doivent r´eguli`erement ´echanger des donn´ees entre eux durant la « phase de
couplage » qui induit une synchronisation plus ou moins explicite. Il est donc n´ecessaire que les
diff´erents codes avancent `a la mˆeme vitesse pour ne pas se ralentir entre eux. Cet ´equilibrage entre
les codes peut s’av´erer tr`es difficile `a cause des natures tr`es diff´erentes de ces codes, ou dans le cas
o`u au moins un des codes a une charge de calcul qui ´evolue dynamiquement. La figure 1.2 pr´esente
un exemple avec deux codes coupl´es A et B utilisant initialement 3 processeurs chacun. Si
le code B devient trop rapide par rapport `a A, on peut transf´erer un processeur du code B vers A.
Cette th`ese propose un ensemble de m´ethodes permettant de r´esoudre le probl`eme d’´equilibrage
dynamique de la charge avec changement du nombre de processeurs, et ce en se basant sur3
le repartitionnement de graphe. Nous appellerons ce probl`eme, le repartitionnement M × N. Ce
repartitionnement doit r´ealiser les diff´erents objectifs d´ej`a cit´es :
— ´equilibrage de la charge ;
— minimisation des communications dues aux d´ependances de calculs ;
— rapidit´e de calcul de la nouvelle partition ;
— minimisation des communications dues `a la redistribution.
Ceci devra ˆetre fait en prenant en compte `a la fois une charge variable et un nombre de processeurs
variable.
Ces m´ethodes de repartitionnement se divisent en deux ´etapes : la construction d’une matrice
de migration puis le repartitionnement bas´e sur cette matrice de migration. Plusieurs m´ethodes
de construction de matrices de migration permettent d’optimiser diff´erentes m´etriques relatives
`a la migration des donn´ees. Deux m´ethodes de repartitionnement sont pr´esent´ees : l’une de
partitionnement biais´e et l’autre diffusive. De plus, des limitations des m´ethodes de bissections
r´ecursives utilis´ees habituellement sont mises en ´evidence dans le cadre du partitionnement biais´e
et nous proposons une m´ethode de partitionnement k-aire direct pour y rem´edier.
Nous commencerons par pr´esenter un ´etat de l’art du partitionnement et repartitionnement
de graphe (chapitre 2). Puis, dans le chapitre 3, nous d´efinirons et construirons des mod`eles
pour la migration. Le chapitre 4 pr´esentera des m´ethodes de repartitionnement s’appuyant sur
les mod`eles de migration introduits au chapitre pr´ec´edent. Puis, nous ´evaluerons nos m´ethodes
au travers d’une s´erie d’exp´eriences comparatives avec d’autres outils de repartitionnement de
graphe (chapitre 5). Finalement, nous conclurons et pr´esenterons quelques pistes d’am´eliorations
de ces m´ethodes dans le chapitre 6. Plusieurs annexes compl`etent ce manuscrit.4 CHAPITRE 1. INTRODUCTIONChapitre 2
Etat de l’art
´
Sommaire
2.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Partitionnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.1 Mod´elisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.2 M´ethodes de partitionnement de graphe . . . . . . . . . . . . . . . . . 9
2.2.3 Etat de l’art des outils de partitionnement . . . . . . . . . . . . . . . . ´ 11
2.3 Repartitionnement pour l’´equilibrage dynamique . . . . . . . . . . 13
2.3.1 Mod´elisation du probl`eme de repartitionnement . . . . . . . . . . . . . 13
2.3.2 M´ethodes de repartitionnement de graphe . . . . . . . . . . . . . . . . 14
2.4 Positionnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.1 Contexte
Une simulation num´erique mod´elise l’´evolution d’un ph´enom`ene physique dans le temps sur
un domaine de l’espace. Ces simulations s’appuient sur une discr´etisation en temps et en espace.
Le domaine de l’espace simul´e est discr´etis´e `a l’aide d’un maillage d’´el´ements g´eom´etriques :
triangles, carr´es, t´etra`edres, ... La discr´etisation en temps permet de calculer l’´etat du syst`eme
`a un instant donn´e `a partir de l’´etat pr´ec´edent. Plus pr´ecis´ement, l’´etat d’un ´el´ement est calcul´e
`a partir de son ´etat pr´ec´edent et de l’´etat de quelques autres ´el´ements en fonction du mod`ele
physique ; g´en´eralement, ce sont les ´el´ements voisins dans le maillage.
Ces simulations, de plus en plus complexes, n´ecessitent d’ˆetre ex´ecut´ees en parall`ele. Le domaine
doit donc ˆetre distribu´e parmi plusieurs unit´es de calcul. Le maillage est donc d´ecoup´e
en autant de parties que de processeurs utilis´es. Le calcul de l’´etat d’un ´el´ement d´ependant de
l’´etat d’autres ´el´ements, le plus souvent dans son voisinage, cette distribution induit des communications
entre processeurs quand l’un d’entre eux n´ecessite les donn´ees poss´ed´ees par un autre.
Ces communications sont synchronisantes et tous les processeurs doivent donc faire progresser la
simulation au mˆeme rythme. Une bonne distribution ou partition des donn´ees doit donc fournir
des parties ´equilibr´ees et minimisant le nombre de d´ependances de donn´ees entre processeurs,
minimisant ainsi le temps de calcul et de communication. Par exemple, un code simulant la diffusion
de la chaleur sur un maillage calcule la chaleur de chaque ´el´ement `a partir de sa propre
chaleur et de celle des ´el´ements voisins `a l’it´eration pr´ec´edente. Une unit´e de calcul travaillant
56 CHAPITRE 2. ETAT DE L’ART ´
sur un domaine doit donc recevoir les temp´eratures des ´el´ements sur la fronti`ere des domaines
voisins.
La distribution des donn´ees peut ˆetre statique, c’est-`a-dire fix´ee au d´ebut de la simulation,
ou dynamique qui ´evolue au cours de la simulation. Certaines simulations utilisent des maillages
dynamiques : le domaine de simulation peut s’´etendre, par exemple pour la simulation d’une
explosion, ou le maillage peut ˆetre raffin´e autour de certains points d’int´erˆet permettant ainsi
d’utiliser peu d’´el´ements tout en gardant une bonne pr´ecision l`a o`u c’est n´ecessaire. Cette derni`ere
m´ethode est appel´ee Adaptive Mesh Refinment (AMR). Au cours de ces simulations dynamiques,
la charge de calcul des processeurs ´evolue de fa¸con h´et´erog`ene. Il est donc n´ecessaire de r´e´equilibrer
r´eguli`erement cette charge en calculant une nouvelle partition des donn´ees. Une fois cette
nouvelle partition r´ealis´ee, les donn´ees doivent ˆetre migr´ees vers leur nouveau propri´etaire. La
nouvelle partition doit optimiser cette phase de migration en plus des crit`eres pr´ec´edents.
Il existe une grande vari´et´e de m´ethodes pour partitionner des maillages. Les plus courantes
sont les m´ethodes g´eom´etriques, s’appuyant uniquement sur les coordonn´ees des ´el´ements dans
l’espace, et les m´ethodes bas´ees sur les graphes utilisant les d´ependances de calcul entre ´el´ements
et ne s’int´eressant plus qu’`a la topologie et non `a la g´eom´etrie du probl`eme.
2.2 Partitionnement
Le partitionnement de maillages `a l’aide de graphes utilise les d´ependances de calcul entre les
´el´ements pour construire un graphe. Certains partitionneurs utilisent un mod`ele d’hypergraphe,
plus g´en´eral que le mod`ele de graphe. Un partitionneur de graphe ou d’hypergraphe calcule des
partitions en prenant en compte deux objectifs :
— les parties doivent ˆetre ´equilibr´ees, c’est-`a-dire de mˆeme taille. Les partitionneurs sont
g´en´eralement tol´erants et se contentent de cr´eer des parties `a peu pr`es ´equilibr´ees `a un
« facteur de d´es´equilibre » pr`es. Un facteur de d´es´equilibre de 5% veut dire qu’une partie
pourra atteindre jusqu’`a 1, 05 fois sa taille id´eale. Ce premier objectif permet d’optimiser
le temps de calcul de la simulation.
— une fonction de coˆut, appel´ee coupe du graphe, est minimis´ee. Cette fonction de coˆut varie
suivant les mod`eles mais repr´esente le temps de communication entre les processeurs.
2.2.1 Mod´elisation
Pour pouvoir appliquer le partitionnement de graphe ou d’hypergraphe `a un probl`eme donn´e,
il est n´ecessaire de mod´eliser celui-ci. Il est important de choisir une mod´elisation adapt´ee au
probl`eme pour que le partitionneur puisse cr´eer une partition optimisant les bons crit`eres pour
cette simulation.
a) Mod´elisation `a l’aide de graphes
L’approche la plus courante consiste `a mod´eliser les ´el´ements `a distribuer sous forme d’un
graphe. Le graphe construit doit mod´eliser les contraintes du calcul distribu´e : ´equilibrage de
charge et r´eduction de communications.
Un graphe est d´efini par un ensemble de sommets et un ensemble d’arˆetes connectant les
sommets par paires. Le graphe est donc construit avec un sommet pour repr´esenter chaque
´el´ement. Les arˆetes de ce graphe servent `a repr´esenter les d´ependances entre les ´el´ements. Par
exemple, le calcul sur un ´el´ement peut n´ecessiter les donn´ees des ´el´ements voisins dans le maillage.
Un sommet est donc connect´e `a tous les sommets repr´esentant les ´el´ements voisins dans le
maillage.2.2. PARTITIONNEMENT 7
Si des ´el´ements sont associ´es `a des charges de calcul diff´erentes, il est possible d’associer des
poids aux sommets repr´esentant ces charges de calcul. De la mˆeme fa¸con, si certaines communications
sont plus coˆuteuses que d’autres, un poids peut ˆetre affect´e aux arˆetes.
Un partitionneur de graphe optimise deux objectifs : l’´equilibrage et la coupe. La taille d’une
partie est le nombre de sommets dans cette partie ou, s’ils sont pond´er´es, la somme des poids de
ceux-ci. La fonction de coˆut la plus g´en´eralement utilis´ee dans les partitionneurs de graphe est
le nombre d’arˆetes coup´ees (ou la somme de leurs poids). Une arˆete est dite « coup´ee » lorsque
ses deux extr´emit´es sont affect´ees `a des parties diff´erentes. On vise ainsi `a r´eduire le volume de
donn´ees `a communiquer entre processeurs.
La figure 2.1 pr´esente la mod´elisation d’un maillage : une grille de 2 × 3 carr´es sous forme de
graphe. Chaque sommet du graphe correspond `a un carr´e de la grille et est reli´e aux sommets
correspondant `a ses voisins dans le maillage.
Figure 2.1 – Un maillage de 6 ´el´ements et le graphe associ´e mod´elisant les d´ependances.
Cette mod´elisation, bien que tr`es r´epandue, ne mod´elise pas toujours parfaitement le volume
de communication n´ecessaire pour la distribution induite. On pourrait penser que comme une
arˆete relie deux sommets, chaque arˆete coup´ee induit deux sommets devant communiquer. Mais
un sommet peut avoir plusieurs arˆetes coup´ees par la mˆeme partie et la coupe du graphe peut
sur´evaluer le volume de communication induit par cette partition. Sur la figure 2.2, un maillage
de 6 ´el´ements est partitionn´e en deux : une partie bleue et une partie verte. Il y a 4 ´el´ements qui
ont au moins un voisin dans l’autre partie, ce sont les ´el´ements qui ont besoin d’ˆetre communiqu´es
avec l’autre processeur. Mais 3 arˆetes sont coup´ees par la partition.
Figure 2.2 – Maillage et graphe partitionn´es en deux.8 CHAPITRE 2. ETAT DE L’ART ´
Figure 2.3 – Un maillage de 6 ´el´ements et l’hypergraphe associ´e mod´elisant les d´ependances.
Pour ne pas surcharger le dessin, seule l’hyper-arˆete correspondant `a l’´el´ement rouge est repr´esent´ee.
b) Mod´elisation `a l’aide d’hypergraphes
Il est ´egalement possible d’utiliser une mod´elisation `a partir d’hypergraphe. Le partitionnement
d’hypergraphe est depuis longtemps utilis´e pour le partitionnement de VLSI [33, 59], mais
il est ´egalement int´eressant dans le cas du partitionnement de matrices ou de maillages [63].
Les hypergraphes sont des extensions des graphes, o`u une arˆete appel´ee hyper-arˆete, ne
connecte plus deux sommets mais un nombre quelconque de sommets. Un graphe peut ˆetre
consid´er´e comme un hypergraphe particulier contenant uniquement des hyper-arˆetes de taille 2.
Ces hyper-arˆetes plus complexes rendent la repr´esentation graphique des hypergraphe plus
difficile. Il existe plusieurs fa¸cons de repr´esenter une hyper-arˆete ; par exemple, on peut dessiner
une courbe entourant les sommets inclus dans l’hyper-arˆete. Il est aussi possible de repr´esenter
une hyper-arˆete par un sommet sp´ecial reli´e aux sommets qu’elle connecte. Cette repr´esentation
est en fait celle d’un graphe biparti dont les parties sont l’ensemble des sommets et l’ensemble
des hyper-arˆetes.
Comme avec les graphes, chaque ´el´ement d’un maillage est repr´esent´e par un sommet de
l’hypergraphe. Mais les hyper-arˆetes permettent de mod´eliser diff´eremment les d´ependances. Une
hyper-arˆete est associ´ee `a chaque sommet, repr´esentant toutes les d´ependances de cet ´el´ement.
Une hyper-arˆete contient donc le sommet auquel elle est associ´ee, ainsi que tous les sommets qui
d´ependent de celui-ci.
La figure 2.3 montre une hyper-arˆete de l’hypergraphe mod´elisant la grille 2×3. Cette hyperarˆete
est associ´ee au sommet rouge et contient tous les sommets voisins.
Cette nouvelle mod´elisation des d´ependances permet d’utiliser des mod`eles de coupe diff´erents
repr´esentant mieux les communications induites par le partitionnement. La coupe connectivit´e−1,
aussi app´el´ee λ−1, permet de repr´esenter fid`element les communications [63]. Ce mod`ele de coupe
prend en compte le nombre de parties coupant une arˆete. Si une hyper-arˆete est coup´ee par λ
parties, son poids est compt´e λ−1 fois dans la coupe finale. En effet, une hyper-arˆete est associ´ee
`a un ´el´ement et λ parties poss`edent des ´el´ements appartenant `a cette hyper-arˆete. Ces ´el´ements
sont soit ceux qui ont une d´ependance sur l’´el´ement associ´e `a l’hyper-arˆete, soit l’´el´ement luimˆeme.
Parmi ces λ parties, une poss`ede l’´el´ement et les λ−1 autres devront recevoir les donn´ees
associ´ees `a cet ´el´ement.
La figure 2.4 montre la mˆeme partition que la figure 2.2 mais en utilisant un mod`ele d’hypergraphe.
Parmi les 6 hyper-arˆetes de cet hypergraphe, 4 sont coup´ees (en rouge). Ce sont les
hyper-arˆetes associ´ees aux sommets se trouvant sur la fronti`ere.
La mod´elisation `a l’aide d’hypergraphe permet de mod´eliser exactement la quantit´e de donn´ees
se trouvant sur la fronti`ere des domaines contrairement `a la mod´elisation `a l’aide de graphe.2.2. PARTITIONNEMENT 9
Figure 2.4 – Maillage et hypergraphe partitionn´e en deux. Les hyper-arˆetes en rouge sont coup´ees
par les deux parties.
c) Sommets fixes
Certains partitionneurs permettent d’utiliser des sommets fixes. Ces sommets sont initialement
fix´es dans une partie et le partitionneur ne remettra pas en cause cette affectation, mais
en tiendra compte dans l’´equilibrage et l’optimisation de la coupe. Les sommets fixes ont ´et´e
largement utilis´es dans le cadre du partitionnement de VLSI [7] mais ont ´egalement trouv´e une
utilisation dans le cadre du r´e´equilibrage dynamique [2, 9]. Le probl`eme de partitionnement `a
sommets fixes est une version plus contrainte du partitionnement de graphe ou hypergraphe
compl`etement libre. Bien que le probl`eme puisse paraitre plus simple, comme il y a moins de
sommets `a placer dans les diff´erentes parties, les heuristiques ´elabor´ees pour le partitionnement
libre peuvent avoir du mal `a prendre en compte ces nouvelles contraintes [3, 7].
2.2.2 M´ethodes de partitionnement de graphe
Le partitionnement d’un graphe ou d’un hypergraphe est un probl`eme NP-complet [20,
GRAPH PARTITIONING]. On utilise donc diverses heuristiques pour pouvoir calculer une partition
en un temps raisonnable. La plupart des m´ethodes utilis´ees s’appliquent aussi bien sur des
graphes que sur des hypergraphes.
La plupart des partitionneurs de graphe ou d’hypergraphe utilisent des m´ethodes appel´ees
« multi-niveaux » [4, 22, 36]. L’approche multi-niveaux permet d’acc´el´erer les m´ethodes de partitionnement
classiques tout en gardant une bonne qualit´e. Cette approche se d´ecompose en trois
´etapes, comme indiqu´e en figure 2.5.
G0
G1
Gk
...
P0
P1
Pk
... Contraction
Expansion
Partitionnement
Initial
Figure 2.5 – Phases d’un partitionnement multi-niveaux.10 CHAPITRE 2. ETAT DE L’ART ´
La phase de contraction : Dans un premier temps, la taille du graphe est r´eduite en fusionnant
des sommets. Cela est r´ep´et´e pendant plusieurs it´erations, jusqu’`a obtenir un
graphe suffisamment petit. Une suite de graphes de taille d´ecroissante a ainsi ´et´e cr´e´ee :
(G0, G1, . . . , Gk).
Le partitionnement initial : Une fois que le graphe a ´et´e suffisamment contract´e, on applique
une heuristique de partitionnement pour calculer la partition Pk du graphe Gk. N’importe
quelle strat´egie de partitionnement peut ˆetre appliqu´ee ici. Certaines seront d´etaill´ees par
la suite.
La phase d’expansion : La suite des diff´erents graphes construits pendant l’´etape de contraction
est alors « remont´ee ». La partition Pi+1 du graphe Gi+1 est prolong´ee sur le graphe
Gi puis cette nouvelle partition Pi est raffin´ee `a l’aide d’une heuristique am´eliorant localement
la coupe.
a) Strat´egies de contraction
Il existe plusieurs heuristiques pour s´electionner les sommets `a fusionner. La plus connue,
appel´ee Heavy Edge Matching (HEM), recherche les arˆetes de poids les plus ´elev´es et en fusionne
les deux extr´emit´es. Cette op´eration est r´ep´et´ee jusqu’`a obtenir un graphe suffisamment petit.
Dans un partitionneur supportant les sommets fixes, ces derniers doivent ˆetre trait´es de mani`ere
particuli`ere pendant la phase de contraction. En effet, le graphe contract´e doit garder les mˆemes
informations sur les sommets fixes. Dans certains partitionneurs, il peut ˆetre d´ecid´e de ne jamais
fusionner ces sommets fixes. Dans d’autres, il peut ˆetre d´ecid´e de les fusionner seulement avec
des sommets non fix´es ou fix´es dans la mˆeme partie. Dans ce cas, le sommet obtenu apr`es fusion
est consid´er´e comme un sommet fixe dans le graphe contract´e.
b) Strat´egies de partitionnement initial
La strat´egie de partitionnement utilis´ee au niveau le plus bas dans un partitionneur multiniveaux
peut ˆetre n’importe quelle strat´egie de partitionnement, y compris un autre algorithme
multi-niveaux. Il existe une tr`es grande vari´et´e de m´ethodes de partitionnement ou de bissection
comme par exemple des algorithmes gloutons ajoutant les sommets un `a un dans les parties [5,
6, 29], ou des algorithmes spectraux utilisant des propri´et´es d’alg`ebre lin´eaire pour obtenir une
partition [53].
La strat´egie la plus utilis´ee est celle des bissections r´ecursives. Le graphe est coup´e r´ecursivement
en deux parties jusqu’`a obtenir le nombre de parties souhait´e. Il est possible d’obtenir
un nombre de parties qui n’est pas une puissance de 2 en cr´eant des parties d´es´equilibr´ees. Par
exemple pour obtenir 3 parties, on cr´ee deux parties avec les proportions 1/3 et 2/3, la partie
de taille 2/3 est ensuite coup´ee en deux parties ´egales de 1/3 chacune. Son int´erˆet r´eside
dans la grande vari´et´e et qualit´e des heuristiques de bissection souvent mieux maˆıtris´ees que les
heuristiques de partitionnement k-aires [35].
Le graphe peut ´egalement ˆetre partitionn´e directement en k parties ; on parlera de partitionnement
k-aire direct. Ces strat´egies peuvent ˆetre plus rapides que les bissections r´ecursives
car une seule partition est calcul´ee. Th´eoriquement, le partitionnement k-aire direct permet une
meilleure qualit´e car il profite d’une vision globale du probl`eme que les bissections r´ecursives n’ont
pas [60]. Mais en pratique, il est plus difficile de calculer une bonne partition k-aire directement
et la m´ethode des bissections r´ecursives donne souvent de meilleurs r´esultats [35].2.2. PARTITIONNEMENT 11
c) Strat´egies de raffinement utilis´ees dans la phase d’expansion
Les strat´egies de raffinement modifient une partition d´ej`a existante en changeant quelques
sommets de partie pour am´eliorer la coupe.
L’algorithme de Kernighan et Lin [39] (KL) raffine une bissection en cherchant des paires de
sommets dont l’´echange am´eliore le plus la coupe (ou la d´egrade le moins). Un sommet d´eplac´e ne
sera plus consid´er´e pour un ´echange dans la mˆeme passe. Ces ´echanges sont consid´er´es mˆeme s’ils
d´egradent la coupe, cela permettant de ne pas rester bloqu´e sur une solution localement optimale
mais qui pourrait ˆetre am´elior´ee en s’en ´eloignant plus. A la fin de la passe, seuls les ´echanges `
menant `a la meilleure coupe sont conserv´es. L’´echange par paires permet de conserver l’´equilibre
mais rend l’algorithme complexe. Plusieurs passes peuvent ˆetre appliqu´ees pour am´eliorer encore
plus la coupe.
Fiduccia et Mattheyses [17] (FM) s’inspirent de cet algorithme pour d´ecrire un raffinement
lin´eaire en temps en ne d´epla¸cant les sommets que un par un et grˆace `a une structure de donn´ees
adapt´ee. L’´equilibre est conserv´e en se refusant d’effectuer des d´eplacements qui d´es´equilibreraient
trop la partition, c’est-`a-dire que la partition d´epasserait la taille maximale donn´ee par le facteur
de d´es´equilibre. Cet algorithme, initialement con¸cu pour les bissections, a ´egalement l’avantage
de s’´etendre facilement aux k-partitions. Le principe g´en´eral reste le mˆeme, mais il y a plusieurs
d´eplacements `a consid´erer pour chaque sommet.
Les sommets fixes s’int`egrent facilement aux m´ethodes de types KL/FM, car il suffit de ne
pas consid´erer ces sommets parmi les d´eplacements possibles.
Comme un algorithme de raffinement se contente d’am´eliorer une partition d´ej`a existante en
ne d´epla¸cant souvent que les sommets le long de la fronti`ere, il n’est pas toujours n´ecessaire de
l’appliquer sur le graphe entier. Ces strat´egies sont souvent appliqu´ees sur un graphe « bande »
ne contenant que les sommets `a une certaine distance de la fronti`ere entre les parties, les autres
sommets ´etant r´eunis en un seul sommet fixe pour chaque partie appel´e « ancre ». La taille du
probl`eme est ainsi largement r´eduite [10].
D’autres m´ethodes de raffinement s’inspirent de la diffusion d’un liquide dans le graphe [42,49].
Ces m´ethodes se basent sur des graphes bandes : un type liquide diff´erent pour chaque partie
est inject´e dans chaque sommet ancre. Le liquide se diffuse it´erativement dans le graphe le long
des arˆetes et est d´etruit lorsqu’il rencontre un autre type de liquide. Quand un sommet re¸coit
plusieurs type de liquide, il choisit la partie dont il en re¸coit le plus. Cette heuristique tend
`a cr´eer des parties aux formes tr`es lisses mais la coupe n’est pas toujours optimale. Elle aussi
pour avantage d’ˆetre locale et donc d’ˆetre plus efficace en parall`ele que les heuristiques de type
KL/FM.
2.2.3 Etat de l’art des outils de partitionnement ´
Il existe une grande vari´et´e d’outils de partitionnement. Le tableau 2.1 pr´esente quelques partitionneurs
de graphe ou d’hypergraphe et quelques unes de leurs fonctionnalit´es. Les sommets
fixes sont surtout support´es par les partitionneurs d’hypergraphe car ils sont utilis´es depuis longtemps
pour le partitionnement de circuits int´egr´es (VLSI). Beaucoup de partitionneurs offrent le
choix entre un partitionnement multi-niveaux r´ecursif ou directement k-aire, mais le partitionnement
initial du multi-niveaux direct utilise le plus souvent des bissections r´ecursives.
Metis [31] est un des partitionneurs les plus connus et utilis´es. Il poss`ede deux m´ethode de
partitionnement : r´ecursif ou k-aire mais la m´ethode k-aire se base sur des bissections r´ecursives
pour son partitionnement initial. Il existe ´egalement une version parall`ele : ParMetis permettant
de cr´eer une partition en parall`ele sur au moins 2 processus. ParMetis propose ´egalement une
m´ethode de repartitionnement permettant de r´e´equilibrer une partition existante [57]. hMetis est
un partitionneur d’hypergraphe ´egalement disponible en version r´ecursive ou k-aire. Il supporte12 CHAPITRE 2.
´ETAT DE L’ART
Outil Type Sommets fixes Parall`ele Type de multi-niveaux Partitionnement initial
Metis [31] graphe non non bissections [34] —
k-aire [35] bissections
ParMetis [32] graphe non oui
k-aire [37] bissections
hMetis [30] hypergraphe oui non bissections [33] —
non
k-aire [38] bissections
PaToH [64] hypergraphe oui non bissections —
kPaToH [3] hypergraphe oui non
k-aire bissections + matching
Zoltan [1] hypergraphe oui oui bissections —
Scotch [48] graphe oui non bissections —
k-aire bissections
PT-Scotch [48] graphe non oui bissections
RM-Metis [2] graphe oui (exactement
k) non
k-aire
k-aire direct (GGGP)
Mondriaan [62] hypergraphe non non bissections —
ML-Part [47] hypergraphe oui non bissections —
Parkway [61] hypergraphe non oui
k-aire bissections
Chaco [24] graphe non non bissections —
Table 2.1 – Partitionneurs de graphe et d’hypergraphe.2.3. REPARTITIONNEMENT POUR L’EQUILIBRAGE DYNAMIQUE ´ 13
les sommets fixes mais ne peut optimiser que le nombre d’hyper-arˆetes coup´ees et non la coupe
λ − 1.
Scotch [48] est un partitionneur de graphe et de maillage sous licence libre. Il est tr`es configurable
et modulaire. Il propose une grande vari´et´e de m´ethodes de partitionnement, mais seulement
des m´ethodes de bissections sont disponibles pour le partitionnement initial. Depuis sa derni`ere
version (6.0), il permet d’utiliser des sommets fixes et de r´e´equilibrer une partition existante.
PT-Scotch est la version parall`ele multi-thread et multi-processus de Scotch.
Zoltan [1] est une biblioth`eque permettant de g´erer la distribution des donn´ees pour des
applications parall`eles. Il offre en particulier des fonctionnalit´es de partitionneur. Il est possible
d’utiliser ParMetis ou Scotch, mais il contient ´egalement son propre partitionneur d’hypergraphe.
Le partitionneur d’hypergraphe de Zoltan utilise des bissections r´ecursives et supporte les sommets
fixes. Il est ´egalement capable de r´e´equilibrer la distribution des donn´ees lorsque celles-ci
´evoluent dynamiquement [8, 9].
2.3 Repartitionnement pour l’´equilibrage dynamique
Dans certaines simulations num´eriques, la charge varie dynamiquement. C’est par exemple le
cas des simulations AMR (Adaptive Mesh Refinement) dans lesquelles la r´esolution du maillage
s’adapte dynamiquement pour r´eduire la quantit´e de calcul tout en gardant une pr´ecision suffi-
sante l`a o`u elle est n´ecessaire.
La charge ne varie pas de fa¸con homog`ene et il devient n´ecessaire apr`es un certain temps de
simulation de r´e´equilibrer la charge entre les diff´erents processeurs. Le graphe repr´esentant les
donn´ees doit alors ˆetre « repartitionn´e ». Les objectifs du repartitionnement de graphe sont :
— la charge de calcul doit ˆetre ´equilibr´ee entre tous les processeurs ;
— le volume de donn´ees `a communiquer entre les processeurs doit ˆetre minimal ;
— le temps de calcul de la nouvelle partition doit ˆetre minimal ;
— la migration des donn´ees, c’est `a dire l’envoi depuis l’ancien propri´etaire des sommets vers
le nouveau, doit ˆetre le plus rapide possible.
Aux deux premiers objectifs communs avec le partitionnement classique, on ajoute la minimisation
du temps de repartitionnement (calcul de la nouvelle partition et migration induite par
celle-ci). Notons que pour obtenir une partition de qualit´e (d’apr`es les deux premiers crit`eres), il
est souvent n´ecessaire de migrer beaucoup de sommets.
2.3.1 Mod´elisation du probl`eme de repartitionnement
On peut exprimer le temps total de la simulation (Ttotal) `a minimiser sous la forme [8, 57] :
Ttotal = α × (Tcalcul + Tcomm) + Trepart + Tmig
avec :
— α le nombre d’it´erations avant que la partition devienne trop d´es´equilibr´ee et qu’un repartitionnement
devienne n´ecessaire ;
— Tcalcul le temps d’une it´eration de calcul, pris sur le processeur le plus lent et donc minimis´e
par l’´equilibrage ;
— Tcomm le temps des communications entre processeurs, correspondant `a la coupe du
graphe ;
— Trepart le temps pass´e `a calculer la nouvelle partition ;
— Tmig le temps de migration des sommets vers leur nouvelle partie.14 CHAPITRE 2. ETAT DE L’ART ´
Ce mod`ele d’une simulation it´erative est repr´esent´e en figure 2.6. Apr`es chaque it´eration de calcul,
les processeurs effectuent une phase de communication collective qui les synchronise ; le temps de
calcul en parall`ele est donc celui du processeur le plus lent. Apr`es α = 3 it´erations, la partition
devient trop d´es´equilibr´ee ; une nouvelle partition est calcul´ee lors du repartitionnement puis les
sommets sont migr´es pour respecter cette nouvelle partition.
En pratique, le repartitionnement n’est pas effectu´e apr`es un nombre fixe d’it´erations mais
quand le d´es´equilibre d´epasse un certain seuil. On peut alors consid´erer que α est le nombre
moyen d’it´erations avant que ce seuil soit d´epass´e.
Obtenir une nouvelle partition de qualit´e (c’est-`a-dire avec Tcalcul et Tcomm faibles), impose
un repartitionnement plus complexe et une nouvelle partition plus ´eloign´ee de l’ancienne (Trepart
et Tmig plus ´elev´es). Il est donc n´ecessaire de r´ealiser un compromis suivant la valeur de α entre
la qualit´e de la nouvelle partition et la rapidit´e de sa construction et mise en place. Si le besoin
de repartitionnement est rare (α ´elev´e), il faut privil´egier la qualit´e de la partition avant celle de
la migration. Mais pour les applications tr`es dynamiques qui n´ecessitent des repartitionnements
fr´equents (α faible), il faut mieux privil´egier la migration devant la qualit´e de la partition qui se
d´egradera de toute fa¸con rapidement.
Concernant la migration, diff´erents crit`eres peuvent ˆetre optimis´es [44]. L’objectif le plus
souvent optimis´e est le volume total des donn´ees migr´ees, appel´e volume total de migration. Mais
il peut aussi ˆetre int´eressant de minimiser le volume de migration par processeur, ou encore le
nombre de messages n´ecessaires `a la migration d’un point de vue global ou par processeur.
Les communications de migration peuvent ˆetre mod´elis´ees par une matrice que nous appellerons
matrice de migration dans laquelle chaque ´el´ement repr´esente le volume de donn´ees d’un
message. Chaque ligne est associ´ee `a un processeur (et `a son ancienne partie) et chaque colonne
est associ´ee `a une nouvelle partie. L’´el´ement (i, j) repr´esente le volume de donn´ees que le
processeur i enverra au processeur associ´e `a la nouvelle partie j.
La figure 2.7 pr´esente deux exemples de repartitionnement. La partition initiale sur la fi-
gure 2.7a est d´es´equilibr´ee : la partie 1 poss`ede quatre sommets alors que la partie 3 n’en a que
deux. Les figures 2.7b et 2.7c pr´esentent deux nouvelles partitions et les matrices de migrations
associ´ees. Les sommets migrants (en rouge) correspondent aux ´el´ements hors diagonale alors que
les sommets ne migrant pas correspondent aux ´el´ements de la diagonale (les messages qu’une
partie « s’envoie » `a elle-mˆeme). Par exemple, sur la figure 2.7c, la nouvelle partie 4 contient
deux sommets de l’ancienne partie 4 et un de l’ancienne partie 1 : la quatri`eme colonne de la
matrice contient donc un 1 sur la premi`ere ligne et un 2 sur la quatri`eme.
2.3.2 M´ethodes de repartitionnement de graphe
Pour ´equilibrer la charge, il existe diff´erentes approches bas´ees sur le repartitionnement de
graphe dont les plus courantes sont le Scratch-Remap, les m´ethodes diffusives et le partitionnement
biais´e. Il existe d’autres approches bas´ees des m´ethodes g´eom´etriques (bissections r´ecursives
ou SFC [52]) ou encore des m´ethodes spectrales modifi´ees pour prendre en compte la
migration [23]. Nous allors maintenant pr´esenter les trois approches les plus courantes.
a) Scratch-Remap
La m´ethode la plus simple et la plus ´evidente est le « Scratch-Remap ». Cette m´ethode
se d´ecompose en deux ´etapes. Dans un premier un temps, le graphe est partitionn´e « from
scratch », c’est-`a-dire sans prendre en compte l’ancienne partition. Ensuite les parties obtenues
sont renum´erot´ees pour optimiser la migration.2.3. REPARTITIONNEMENT POUR L’EQUILIBRAGE DYNAMIQUE ´ 15 Calcul Calcul Calcul Calcul Calcul Calcul Calcul Calcul
Communications
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Communications
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Communications
Repartitionnement
Migration
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Communications
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Communications
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Calcul
Communications
Repartitionnement
Migration
Figure 2.6 – Etapes d’un code se r´e´equilibrant toutes les
´ α = 3 it´erations.16 CHAPITRE 2. ETAT DE L’ART ´
1
2
3
4
(a) Partition initiale d´es´equilibr´ee
en 4 parties.
4 3
1 2
1 0 0 3
0 0 3 0
0 2 0 0
2 1 0 0
(b) Partition en 4 parties avec
une mauvaise correspondance
des parties.
1 2
4 3
3 0 0 1
0 3 0 0
0 0 2 0
0 0 1 2
(c) Mˆeme partition que pr´ec´edemment
mais avec une bonne
correspondance.
Figure 2.7 – Exemples de repartitionnement. Les sommets migrants sont dessin´es en rouge.
La figure 2.7 pr´esente deux exemples de repartitionnement produisant la mˆeme nouvelle
partition, mais avec une num´erotation diff´erente des nouvelles parties. Un repartitionnement
« from scratch » peut tout `a fait donner la partition de la figure 2.7b o`u tous les sommets sauf
un sont migr´es, alors qu’en renum´erotant les nouvelles parties par rapport `a l’ancienne partition
comme sur la figure 2.7c, seulement deux sommets doivent ˆetre migr´es.
Dans PLUM, Oliker et Biswas [45] proposent une heuristique gloutonne pour r´esoudre le probl`eme
d’association des nouvelles parties aux processeurs (remap). Cette heuristique est d´ecrite
par l’algorithme 1. Il parcourt les ´el´ements Ci,j de la matrice de migration du plus grand au
plus petit ´el´ement. La partie j est associ´ee au processeur i d`es que c’est possible, c’est-`a-dire si
le processeur i est libre (free[i] est vrai) et si la partie j n’est pas d´ej`a associ´ee `a un processeur
(unassigned[j] est vrai). L’algorithme se termine lorsque toutes les parties ont ´et´e affect´ees `a un
processeur.
Comme la m´ethode Scratch-Remap recalcule une partition sans prendre en compte la migration,
celle-ci poss`ede g´en´eralement une bonne coupe car c’est le seul crit`ere optimis´e lors du
partitionnement. En revanche, la migration n’est minimis´ee que dans un second temps et peut
ˆetre tr`es sup´erieure `a l’optimal.
Il est possible d’apporter quelques am´eliorations au Scratch-Remap. Pour obtenir un volume
de migration plus faible, Oliker et Biswas [45] repartitionne en kM parties au lieu de M. Lors
de la phase de remapping, k nouvelles parties sont associ´ees `a chaque processeur. Ce grain plus
fin permet un volume de migration moindre mais une coupe un peu plus ´elev´ee. Schloegel et
al. [58] proposent une autre variante du Scratch-Remap appel´ee LMSR (Locally Matched Scratch
Remap) dans laquelle la phase de contraction du partitionnement multi-niveaux est contrainte
pour ne fusionner que des sommets appartenant `a une mˆeme ancienne partie en esp´erant cr´eer
une nouvelle partition avec des fronti`eres plus proches de l’ancienne partition.
b) Diffusion
Les m´ethodes diffusives s’inspirent du ph´enom`ene physique de diffusion de la chaleur pour
r´e´equilibrer la charge. L’id´ee de base des m´ethodes diffusives est que chaque processeur ´echange2.3. REPARTITIONNEMENT POUR L’EQUILIBRAGE DYNAMIQUE ´ 17
Algorithme 1 R´eaffectation des nouvelles parties aux anciens processeurs (remap)
Entr´ee : Matrice de migration C de taille M × M
map : vecteur d’association des nouvelles parties
unassigned : vecteur de bool´eens initialement vrais
free : vecteur de bool´eens initialement vrais
n ← M
L ← liste tri´ee des Ci,j par ordre d´ecroissant
tant que n > 0 faire
Prendre et retirer le premier ´el´ement Ci,j de L
si free[i] ∧ unassigned[j] alors
map[j] ← i
free[i] ← faux
unassigned[j] ← faux
n ← n − 1
fin si
fin tant que
retourner map
des sommets avec ses voisins selon le d´es´equilibre de charge entre les deux parties. Ces ´echanges
locaux de sommets `a la fronti`ere des parties concern´ees permettent de r´e´equilibrer la charge.
Dans la version it´erative de cette m´ethode, un r´e´equilibrage partiel est r´ep´et´e `a chaque it´eration.
Lors de ce r´e´equilibrage partiel, deux processeurs voisins ´echangent un nombre de sommets
proportionnel `a leur diff´erence de charge. Cybenko [12] calcule la nouvelle charge w
(t+1)
i
d’une
partie i `a l’it´eration t + 1, `a l’aide la formule :
w
(t+1)
i = w
(t)
i +
X
j
αij (w
(t)
j − w
(t)
i
). (2.1)
Les αij sont des coefficients positifs ou nuls et tels que ∀i,P
j αij ≤ 1 (chaque partie ne peut pas
donner plus de charge qu’elle n’en poss`ede), permettant de choisir si les parties i et j ´echangeront
facilement des sommets. Cela permet de favoriser les ´echanges entre parties proches dans le
graphe ou entre processeurs proches sur le r´eseau. Apr`es plusieurs it´erations, cette m´ethode tend
`a homog´en´eiser la charge, conform´ement au principe de diffusion de la chaleur.
Le r´e´equilibrage peut ´egalement ˆetre r´ealis´e directement en cherchant la solution finale du
probl`eme de diffusion `a l’aide d’un solveur. Hu et Blake [26] montrent que chercher la solution
optimisant la norme 2 de la migration (la racine carr´e de la somme des carr´es de la taille de
chaque message) est ´equivalent au probl`eme de diffusion. La solution est calcul´ee `a l’aide de la
m´ethode du gradient conjugu´e.
Ou et Ranka [46] expriment le probl`eme sous forme d’un programme lin´eaire pour minimiser
la norme 1 de la migration (la somme des tailles de chaque message). Ce programme est r´esolu
`a l’aide de la m´ethode du simplexe [43].
Une fois que la charge `a ´echanger entre chaque processeur a ´et´e d´ecid´ee, il faut choisir quels
seront les sommets `a migrer. Ce choix est fait de fa¸con `a optimiser la coupe de la partition finale
et peut ˆetre r´ealis´e `a l’aide d’un algorithme de type FM. Comme les d´eplacements de sommets
s’effectuent entre des pairs de parties, il est n´ecessaire de trouver un bon ordonnancement de
ses migrations [58]. En effet un processeur peut avoir besoin de transmettre plus de sommets
qu’il n’en poss`ede initialement et il a donc besoin de recevoir des sommets avant de pouvoir en
envoyer.18 CHAPITRE 2. ETAT DE L’ART ´
1
2
3
(a) Partition d´es´equilibr´ee.
0
0
1
1
2
3
(b) Echanges de sommets entre ´
parties.
1
2
3
(c) Partition finale r´e´equilibr´ee.
Figure 2.8 – Exemple de diffusion.
Un exemple de repartitionnement par diffusion est illustr´e sur la figure 2.8. Tous les sommets
sont de poids unitaires. A partir de la partition initialement d´es´equilibr´ee (figure 2.8a) ` , on calcule
la migration optimale (figure 2.8b). Il faut alors d´eplacer un sommet de la partie 3 vers la partie
2. Ce sommet est choisi de fa¸con `a obtenir la meilleure coupe possible et ainsi obtenir la partition
finale ´equilibr´ee de la figure 2.8c.
Les m´ethodes diffusives permettent d’obtenir de faibles volumes de migration. Mais les heuristiques
locales utilis´ees se comportent mal si il y a de grandes variations de charge.
c) Partitionnement biais´e
Le partitionnement peut ˆetre biais´e pour optimiser la migration. Les heuristiques habituelles
sont modifi´ees pour ne plus optimiser seulement la coupe mais un compromis entre la coupe et
le volume total de migration.
Au lieu de modifier les heuristiques, il est ´egalement possible de modifier le graphe `a partitionner
pour biaiser le partitionnement. Plusieurs ´etudes [2, 8, 9] montrent qu’il est possible de
mod´eliser le probl`eme de repartitionnement `a l’aide de sommets fixes. Le graphe `a partitionner
est enrichi pour mod´eliser les objectifs du repartitionnement : la coupe des arˆetes ajout´ees repr´esente
la migration des sommets. Cette m´ethode est utilis´ee par le partitionneur d’hypergraphe
Zoltan [9] et le partitionneur de graphe RM-Metis [2].
Des sommets sont ajout´es dans ce graphe pour mod´eliser les processeurs. Les processeurs ne
sont pas des calculs `a distribuer ; le poids de ces sommets est donc nul et ils sont fix´es dans
la partie du processeur qu’il mod´elise, c’est-`a-dire que le partitionneur ne pourra pas les placer
dans une autre partie. Ces sommets fixes sont ensuite connect´es `a tous les sommets contenus
dans l’ancienne partie associ´ee au sommet fixe. Ces nouvelles arˆetes permettent de mod´eliser la
migration et sont donc appel´ees arˆetes de migration. En effet, si un sommet est migr´e, l’arˆete
le connectant au sommet fixe de son ancienne partie sera coup´ee, ajoutant ainsi un coˆut de
migration dans la taille de la coupe de la nouvelle partition. Le poids de l’arˆete de migration
permet donc de repr´esenter la taille des donn´ees `a migrer.
Sur la figure 2.9, on peut voir un exemple de repartitionnement qui illustre cette m´ethode. La
partition en 5 parties est initialement d´es´equilibr´ee ; 5 sommets fixes (carr´es) sont ajout´es et reli´es
par des arˆetes de migration aux sommets de leur partie respective (figure 2.9a). Apr`es l’utilisation
d’un partitionneur `a sommets fixes, une nouvelle partition ´equilibr´ee est obtenue (figure 2.9b).
Les arˆetes de migration associ´ees aux sommets ayant migr´e sont coup´ees (en rouge). La plus2.3. REPARTITIONNEMENT POUR L’EQUILIBRAGE DYNAMIQUE ´ 19
(a) Graphe colori´e selon l’ancienne partition auquel les sommets fixes ont
´et´e ajout´es.
(b) Graphe colori´e selon la nouvelle partition. Les arˆetes de migration
coup´ees sont colori´ees en rouge.
Figure 2.9 – Exemple de repartitionnement bas´e sur des sommets fixes.20 CHAPITRE 2. ETAT DE L’ART ´
grande partie des arˆetes n’est pas coup´ee (en vert). Le partitionneur a donc cr´e´e une nouvelle
partition avec peu de migration (15 sommets migrent correspondant aux 15 arˆetes de migration
coup´ees).
Scotch [18,19] utilise une m´ethode de repartitionnement biais´e : sa m´ethode de raffinement par
« diffusion » est modifi´ee dans le cas du repartitionnement. Pour prendre en compte la migration
des sommets, une nouvelle source de « liquide » est ajout´ee pour chaque sommet l’incitant `a
rester dans sa partie d’origine.
Hendrikson et al. [23] proposent une autre approche du repartitionnement biais´e o`u chaque
sommet u a un d´esir dk(u) d’ˆetre dans un partie k. Au lieu de minimiser le coˆut de migration,
le but est de maximiser les d´esirs de chaque sommet (si p(u) est la partie de u, on maximise la
somme P
u
dp(u)(u)). Deux approches sont pr´esent´ees : un raffinement de type FM modifi´e et
une m´ethode de partitionnement spectrale prenant en compte les d´esirs des sommets.
Le partitionnement biais´e permet un compromis entre qualit´e de la nouvelle partition et volume
de migration grˆace `a un coˆut de migration introduit dans la coupe `a optimiser, par exemple,
`a l’aide du poids des arˆetes de migration. Mais le repartitionnement est plus complexe car une
nouvelle partition est compl`etement recalcul´ee avec des heuristiques modifi´ees.
Le partitionnement biais´e peut ´egalement ˆetre hybride [57]. Dans le cadre d’un partitionnement
multi-niveaux, le partitionnement initial est r´ealis´e `a l’aide d’une m´ethode Scratch-Remap
ou diffusive, mais le raffinement appliqu´e lors de la phase d’expansion est biais´e pour optimiser
la migration.
2.4 Positionnement
Toutes les m´ethodes de repartitionnement pour l’´equilibrage dynamique pr´esent´ees ici ne
s’int´eressent qu’au cas o`u le nombre de processeurs reste fixe. Le probl`eme de l’´equilibrage dynamique
avec variation du nombre de processeurs est peu ´etudi´e. Iqbal et Carey [27,28] ont pourtant
montr´e que faire varier le nombre de processeurs au cours de la simulation permet d’optimiser la
consommation de ressources et mˆeme, dans certains cas, le temps d’ex´ecution.
Bien choisir le nombre de processeurs allou´es `a une simulation est essentiel pour avoir une
bonne performance ou efficacit´e. Si une simulation est lanc´ee en parall`ele sur un trop grand
nombre de processeurs, le temps pass´e `a communiquer peut devenir trop important par rapport
au temps de calcul. Utiliser le maximum de processeurs possible n’est pas toujours un bon choix
suivant la taille du probl`eme. La taille du probl`eme pouvant varier au cours de la simulation, le
nombre de processeurs devrait varier en cons´equence.
Augmentation
de la charge
M = 4 N = 6
Figure 2.10 – Allocation dynamique de processeurs pour un seul code dont la charge augmente.
Par exemple, un code AMR (Adaptive Mesh Refinement) commence sa simulation sur un
maillage grossier contenant peu d’´el´ements. Puis, au cours de la simulation, le maillage est raf-2.4. POSITIONNEMENT 21
Augmentation de la
charge relative A/B
M + M' = 6 N + N' = 6
A B A B
Figure 2.11 – Allocation dynamique de processeurs pour deux codes coupl´es A et B dont la
charge relative de A par rapport `a B augmente.
fin´e l`a o`u c’est n´ecessaire. La charge de calcul, initialement tr`es faible, croˆıt avec le temps. La
simulation tr`es l´eg`ere au d´ebut finit par demander beaucoup de ressources, que ce soit en puissance
de calcul ou en m´emoire. En commen¸cant le calcul sur tr`es peu de processeurs puis en
l’augmentant quand la limite m´emoire est atteinte, il est possible de garder une meilleure efficacit´e
tout le long de la simulation. Les surcoˆuts dus au parall´elisme inutile en d´ebut de simulation
sont ´evit´es quand c’est possible. C’est la cas pr´esent´e sur la figure 2.10 : apr`es une augmentation
significative de la charge, deux processeurs suppl´ementaires sont allou´es, et il faut donc effectuer
un repartitionnement de 4 processeurs vers 6.
L’allocation dynamique de processeurs peut aussi ˆetre utile dans le cas du couplage de codes.
Dans un couplage de codes, plusieurs codes parall`eles s’ex´ecutent simultan´ement et doivent r´eguli`erement
´echanger des donn´ees. Cette phase d’´echange est synchronisante. Il est donc important
que tous les codes concern´es progressent `a la mˆeme vitesse pour minimiser le temps d’attente
lors de cette synchronisation. Le choix du nombre de processeurs utilis´es par chaque code doit
ˆetre fait en prenant en compte les charges relatives de chacun. Cette ´equilibrage entre plusieurs
codes peut ˆetre difficile, plus particuli`erement si la charge de ces codes peut varier dynamiquement.
Pour r´e´equilibrer ces codes, une solution serait donc de r´eallouer des ressources d’un code
vers un autre. Le nombre id´eal de processeurs allou´es `a chaque code peut donc ˆetre approch´e
exp´erimentalement en corrigeant au cours de la simulation les d´es´equilibre qui surviendraient.
Par exemple, sur la figure 2.11, le code A est devenu trop lent par rapport `a B, un processeur
est donc r´eallou´e du code B vers le code A. Il faut repartitionner chacun des deux codes : de 3
processeurs vers 4 pour A, et de 3 vers 2 pour B.
Pour r´ealiser ce changement du nombre de ressources, il est n´ecessaire de mettre en place
une m´ethode repartitionnement prenant en compte le changement du nombre de parties. Nous
appelons ce probl`eme, le repartitionnement M × N. Les objectifs du repartitionnement sont
similaires `a ceux du repartitionnement classiques :
— ´equilibrer la charge parmi les N processeurs ;
— minimiser la coupe du graphe ;
— calculer rapidement la nouvelle partition ;
— minimiser la migration (diff´erentes m´etriques seront pr´esent´ees).
Les outils de repartitionnement suivent d´ej`a ces objectifs mais ne sont pas pr´evus pour le changement
du nombre de processeurs. La m´ethode de Scratch-Remap est facilement adaptable au
repartitionnement M × N. Lors du partitionnement from scratch, l’ancienne partition, et donc
l’ancien nombre de processeurs, n’a pas d’influence. L’algorithme de Remapping peut ˆetre facilement
adapt´e en prenant en compte le fait que certaines parties ne seront pas associ´ees `a un
ancien processeur (lors de l’ajout de processeurs), ou que des anciens processeurs ne recevront
pas de nouvelles parties (lors de la suppression de processeurs).22 CHAPITRE 2. ETAT DE L’ART ´
Nous proposons donc une nouvelle m´ethode de repartitionnement adapt´ee au cas o`u le nombre
de processeurs varie. La m´ethode propos´ee est pr´esent´ee sur la figure 2.12. Elle se d´ecompose en
deux ´etapes.
Dans un premier temps, nous cherchons `a construire des matrices de migrations adapt´ees `a ce
probl`eme. Apr`es une ´etude de quelques matrices optimales, plusieurs m´ethodes seront pr´esent´ees
dans le chapitre 3. La construction de la matrice de migration ne s’int´eresse pas aux sommets du
graphe individuellement mais seulement aux parties, `a leurs tailles et `a leurs positions respectives.
Ainsi, la construction de la matrice s’effectue `a partir du graphe quotient des parties.
Ensuite, la matrice de migration construite est utilis´ee pour guider un repartitionnement du
graphe remplissant les objectifs habituels du partitionnement de graphe : l’´equilibre et la coupe
tout en fournissant une migration telle que pr´evue par la matrice construite `a l’´etape pr´ec´edente.
Plusieurs approches sont possibles : un partitionnement biais´e utilisant des sommets fixes pour
imposer une matrice de migration lors du repartitionnement ; une approche diffusive adapt´ee
pour le repartitionnement M × N ; et un partitionnement biais´e utilisant des hyper-arˆetes pour
optimiser les messages de migration sans utiliser de matrice de migration calcul´ee `a l’avance.
Les m´ethodes de partitionnement biais´e mettent en ´evidence les limites des bissections r´ecursives
utilis´ees dans les partitionneurs usuels. Un module de partitionnement k-aire utilisant une
heuristique de greedy graph growing est ajout´ee dans le partitionneur Scotch pour am´eliorer la
qualit´e de nos partitionnements.2.4. POSITIONNEMENT 23 Méthode d'appariement (Matching) Méthode de la chaîne (1D) Méthode gloutonne (Greedy) Méthode de partitionnement biaisé (Biased) Méthode diffusive (Diff) Hyper-arêtes de repartitionnement Matrice de migration Graphe quotient Nouvelle partition en N Graphe partitionné en M Construction de la matrice de migration M×N Repartitionnement M×N Programme linéaire (LP) Figure 2.12 – Vue d’ensemble de nos m´ethodes de repartitionnement M × N.24 CHAPITRE 2. ETAT DE L’ART ´Chapitre 3
Mod`ele de migration pour le
repartitionnement M × N
Sommaire
3.1 Notations et d´efinitions . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.1 G´en´eralit´es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.1.2 D´efinitions pour le repartitionnement M × N . . . . . . . . . . . . . . 27
3.2 Matrices de migration optimales dans le cas ´equilibr´e . . . . . . . 28
3.3 Construction des matrices de migration . . . . . . . . . . . . . . . . 35
3.3.1 M´ethode bas´ee sur la chaˆıne (1D) . . . . . . . . . . . . . . . . . . . . . 35
3.3.2 M´ethode d’appariement (Matching) . . . . . . . . . . . . . . . . . . . 42
3.3.3 M´ethode gloutonne (Greedy) . . . . . . . . . . . . . . . . . . . . . . . 47
3.3.4 Programme lin´eaire (LP) . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.4 Evaluation des m´ethodes et conclusion . . . . . . . . . . . . . . . . 62 ´
La premi`ere ´etape de notre m´ethode de repartitionnement consiste `a construire une matrice
de migration optimis´ee. Pour r´ealiser cela, il n’est pas n´ecessaire de disposer de toute l’information
sur le graphe partitionn´e mais seulement du graphe quotient. Nous proposons plusieurs
algorithmes permettant de construire des matrices de migration optimisant diff´erents crit`eres.
Cette ´etape est r´esum´ee en figure 3.1.
Dans un premier temps, nous ´enoncerons quelques d´efinitions g´en´erales sur le graphe et le
partitionnement, puis des d´efinitions particuli`eres pour nos algorithmes de repartitionnement.
Ensuite, nous ´etudierons plus en d´etails les matrices de migration dans le cas o`u l’ancienne
partition est d´ej`a ´equilibr´ee. Enfin, nous d´ecrirons nos algorithmes de construction de matrice
de migration, avant de conclure sur une comparaison de ces diff´erents m´ethodes.
3.1 Notations et d´efinitions
Dans cette section, nous d´efinissons les notations et termes qui seront utilis´es dans cette th`ese.
Nous rappelons d’abord les d´efinitions relatives au partitionnement, puis nous introduisons les
nouvelles notations que nous utiliserons pour le repartitionnement M × N.
2526 CHAPITRE 3. MODELE DE MIGRATION `
Méthode d'appariement (Matching)
Méthode de la chaîne (1D)
Méthode gloutonne (Greedy)
Matrice de
migration
Graphe
quotient
Graphe
partitionné
en M Construction de la matrice de migration M×N
Programme linéaire (LP)
Figure 3.1 – Vue d’ensemble de nos algorithmes de construction des matrices de migration.
3.1.1 G´en´eralit´es
Soit G = (V, E), un graphe o`u V est l’ensemble des sommets et E l’ensemble des arˆetes. A`
chaque sommet v est associ´e un poids wv repr´esentant la charge de calcul associ´e `a ce sommet.
P
Une arˆete e peut avoir un poids we repr´esentant le coˆut de la communication. On notera W =
v∈V wv le poids total du graphe.
D´efinition 1 (Partition). Une k-partition P de V est un ensemble de k sous-ensembles deux `a
deux disjoints (Pi)i∈J1,kK de V tels que l’union de tous les sous-ensembles couvre V .
D´efinition 2 (Poids d’une partie). Le poids d’une partie Pi not´e w(Pi) est la somme des poids
des tous les sommets de la partie : w(Pi) = P
v∈Pi
wv.
D´efinition 3 (Partition ´equilibr´ee). La k-partition P est dite ´equilibr´ee au facteur de d´es´equilibre
ǫ ≥ 0 pr`es si ∀Pi ∈ P, w(Pi) ≤ (1 + ǫ)
W
k
.
En pratique, le facteur de d´es´equilibre souvent utilis´e est de l’ordre de quelques pour cent.
Avec un facteur de 5 % (ǫ = 0, 05), une partie qui aurait une taille id´eale de 1000 ´el´ements, ne
devra pas d´epasser 1050.
D´efinition 4 (Coupe d’un graphe). On appelle taille de la coupe (ou par abus de langage, coupe)
d’un graphe pour une partition donn´ee, le nombre d’arˆetes coup´ees ou la somme de leurs poids
si elles sont pond´er´ees. Les arˆetes coup´ees sont les arˆetes dont les deux extr´emit´es sont dans des
parties diff´erentes.
D´efinition 5 (Graphe quotient). La graphe quotient Q = G/P d’un graphe G par rapport `a la
partition P est obtenu `a partir de G en fusionnant les sommets appartenant `a une mˆeme partie
de P. Les arˆetes devenues identiques apr`es la fusion des sommets sont ´egalement fusionn´ees et
leurs poids sont additionn´es. Si les arˆetes n’´etaient pas pond´er´ees, le poids des arˆetes du graphe
quotient est le nombre d’arˆetes fusionn´ees.
Le graphe quotient Q = G/P poss`ede autant de sommets qu’il y a de parties dans P. Le poids
de chaque sommet est le poids de la partie correspondante (la somme des poids des sommets de
cette partie). Les sommets sont connect´es aux sommets correspondant aux parties voisines et le
poids des arˆetes est la somme des poids des arˆetes coup´ees entre ces deux parties.3.1. NOTATIONS ET DEFINITIONS ´ 27
(a) Partition d’un graphe en 5 parties.
4
3
2 1 4
7 7
(b) Graphe quotient correspondant `a la partition.
Figure 3.2 – Exemple de construction d’un graphe quotient pour une grille 10 × 10.
La figure 3.2 montre la partition d’un graphe issu d’une grille 2D de taille 10 × 10 et le
graphe quotient associ´e. La partition est en 5 parties et le graphe quotient poss`ede 5 sommets
colori´es de la mˆeme couleur que la partie `a laquelle il est associ´e. La partition ´etant parfaitement
´equilibr´ee, le poids de chaque sommet est ´egal, et vaut 20. Le poids des arˆetes est plus variable :
par exemple, l’arˆete entre le sommet jaunes et cyan a un poids 7, comme il y a 7 arˆetes dans le
graphe partitionn´e connectant des sommets jaunes et cyan.
3.1.2 D´efinitions pour le repartitionnement M × N
Dans le cas du repartitionnement, on distinguera deux partitions : la partition initiale P en
M parties et une partition finale d´esir´ee P
′
en N parties.
D´efinition 6 (Matrice de migration). On appelle matrice de migration, la matrice C de dimension
M × N d´ecrivant les volumes de donn´ees `a migrer entre les diff´erents parties. L’´el´ement Ci,j
correspond au nombre d’´el´ements en commun entre l’ancienne partie i et la nouvelle partie j.
C’est aussi la quantit´e de donn´ees envoy´ee par le processeur i au processeur j si i 6= j ; si i = j,
Ci,i est la quantit´e de donn´ees ne migrant pas, c’est-`a-dire restant « sur place ».
Chaque ligne repr´esente une ancienne partie, donc la somme des ´el´ements sur cette ligne est
´egale `a sa taille. De la mˆeme fa¸con, une colonne repr´esente une nouvelle partie et la somme des
´el´ements de chaque colonne est ´egale `a sa taille.
Pour ´evaluer la qualit´e des matrices de migration, nous d´efinissons plusieurs m´etriques :
TotalV et MaxV sont d´ej`a introduits par Oliker et al. [45] ; nous y ajoutons deux nouvelles
m´etriques TotalZ et MaxZ.
Le volume total de migration, not´e TotalV, est la quantit´e de sommets qui migrent (ou
la somme de leurs poids s’il sont pond´er´es). Cela correspond donc `a la somme des ´el´ements
non-diagonaux de la matrice de migration. Le volume maximum par processeur, not´e MaxV,
correspond `a la plus grande quantit´e de sommets (ou somme des poids) re¸cus et envoy´es par
un mˆeme partie. Il correspond `a la plus grande somme sur une ligne et une colonne de mˆemes
num´eros des ´el´ements hors diagonale de la matrice de migration.28 CHAPITRE 3. MODELE DE MIGRATION `
Le nombre total de messages n´ecessaires `a la migration, not´e TotalZ, correspond au nombre
de non-z´eros hors diagonale. De la mˆeme fa¸con, on d´efinit le nombre maximal de messages
(envoy´es et re¸cus) par processeur, not´e MaxZ.
TotalZ vaut au plus M × N − min(M, N) dans le cas o`u tous les ´el´ements non-diagonaux
de C sont non nuls.
La figure 3.3 montre plusieurs cas de repartitionnement de la partition initiale de la figure 3.3a.
Pour chaque repartitionnement, la matrice de migration et les diff´erentes m´etriques sont donn´ees.
Les figures 3.3b et 3.3c montrent la mˆeme nouvelle partition mais avec une num´erotation
diff´erente. Il est important de bien faire correspondre les anciennes et nouvelles parties pour avoir
une faible migration. En effet, le volume total de migration TotalV est bien plus important
dans le cas de la figure 3.3b. La figure 3.3d montre une partition diff´erente ayant une meilleure
coupe mais une migration plus ´elev´ee.
D´efinition 7 (Graphe biparti de migration). Le graphe biparti de migration est le graphe biparti
G = ((A, B), E) o`u A est l’ensemble des M anciennes parties et B l’ensemble des N nouvelles
parties. Il existe une arˆete dans E entre une ancienne et une nouvelle partie si elles partagent
des sommets. Le poids de cette arˆete est la somme des poids des sommets partag´es.
La matrice d’adjacence de ce graphe biparti est la matrice de migration C. Il existe une arˆete
entre les sommets i et j si et seulement si Ci,j est non nul et si le poids de cette arˆete vaut Ci,j .
Des exemples de graphes biparti de migration sont pr´esent´es sur la figure 3.3. Chaque arˆete du
graphe repr´esente soit un message de migration, soit les donn´ees qui restent sur place lorsque
l’arˆete relie une ancienne partie `a sa nouvelle partie associ´ee.
D´efinition 8 (Hypergraphe de repartitionnement). L’hypergraphe de repartitionnement est l’hypergraphe
comportant M sommets correspondant aux anciennes parties et N hyper-arˆetes correspondant
aux nouvelles parties. Une hyper-arˆete contient tous les sommets correspondant aux
anciennes parties avec lesquelles la nouvelle partie ´echange des sommets. Les hyper-arˆetes ne
sont pas pond´er´ees.
La matrice d’adjacence de cet hypergraphe est la matrice de migration sans prendre en compte
les valeurs : on ne s’int´eresse qu’aux z´eros et non-z´eros. Le sommet v appartient `a l’hyper-arˆete
e si et seulement si Cv,e est non nul. Chaque ligne de la matrice ou ancienne partie correspond `a
un sommet de l’hypergraphe et chaque colonne ou nouvelle partie correspond `a une hyper-arˆete.
Une hyper-arˆete contient tous les sommets dont l’´el´ement dans la matrice est non nul.
Les hypergraphes de repartitionnement correspondant `a chaque matrice de migration sont
donn´es dans la figure 3.3. La renum´erotation des parties entre les figures 3.3b et 3.3c ne change
pas l’hypergraphe de repartitionnement mais seulement les num´eros des hyper-arˆetes.
L’utilisation de ces graphes bipartis et hypergraphes permet de repr´esenter le sch´ema de
communication utilis´e lors de la migration. Les hypergraphes de repartitionnement permettent
une repr´esentation plus graphique des relations entre une ancienne et une nouvelle partition :
c’est ce que l’on constate par exemple sur la figure 3.4 en le superposant avec le graphe quotient
de l’ancienne partition.
3.2 Matrices de migration optimales dans le cas ´equilibr´e
Dans un premier temps, nous allons ´etudier les matrices de migration dans le cas particulier
o`u la partition initiale est d´ej`a parfaitement ´equilibr´ee. Plus pr´ecis´ement, on consid`ere que les
partitions initiales et finales sont parfaitement ´equilibr´ees. Dans ce cas, W doit ˆetre un multiple
commun de M et de N. On a donc W = k × ppcm(M, N) avec k un entier strictement positif.3.2. MATRICES DE MIGRATION OPTIMALES DANS LE CAS EQUILIBR ´ E´ 29
1
2
3
Coupe : 8
(a) Partition initiale d´es´equilibr´ee en 3
parties.
4 3
1 2
Coupe : 11
TotalV : 11
MaxV : 8
TotalZ : 4
MaxZ : 3
1 0 0 3
0 0 3 0
2 3 0 0
1
2
3
1
2
3
4
1
3
2
4
2
1
3
(b) Partition en 4 parties avec
une mauvaise correspondance
des parties.
1 2
4 3
Coupe : 11
TotalV : 3
MaxV : 3
TotalZ : 2
MaxZ : 2
3 0 0 1
0 3 0 0
0 0 3 2
1
2
3
1
2
3
4
1
3
2
1
3
4
2
(c) Mˆeme partition que pr´ec´edemment
mais avec une bonne
correspondance.
2
1
4
3
Coupe : 10
TotalV : 4
MaxV : 3
TotalZ : 3
MaxZ : 2
3 1 0 0
0 2 0 1
0 0 3 2
1
2
3
1
2
3
4
1
3
2
1
3
2
4
(d) Autre exemple de repartitionnement
en 4 parties.
Figure 3.3 – Exemples de repartitionnement avec les matrices de migration, graphes bipartis de
migration, hypergraphes de repartitionnement et mesures associ´ees.30 CHAPITRE 3. MODELE DE MIGRATION `
1
2
3
4
1
3
2
Figure 3.4 – Superposition de l’hypergraphe de repartitionnement de la figure 3.3c et du graphe
quotient de la partition de la figure 3.3a.
Pour simplifier notre discussion, on supposera que les poids des sommets sont unitaires. Ainsi le
probl`eme de la partition du graphe est ´equivalent `a la partition de l’entier correspondant `a son
poids.
D´efinition 9 (Matrice de migration optimale). Nous appelons matrice de migration optimale,
une matrice de migration C minimisant `a la fois le volume de total de migration (TotalV) et
le nombre de messages (TotalZ).
Lemme 1. Le volume total de migration optimal v´erifie :
TotalVopt ≥ W
1 −
min(M, N)
max(M, N)
.
D´emonstration. Il y a min(M, N) parties communes entre les partitions initiale et finale et |M −
N| parties diff´erentes. Comme les partitions sont ´equilibr´ees, les tailles des parties initiales et
finales sont respectivement W
M et W
N
. Donc au plus, min(W
M ,
W
N
) = W
max(M,N)
donn´ees restent
en place pour chaque partie commune. Le reste des donn´ees migre, donc TotalVopt ≥ W −
min(M, N) ×
W
max(M,N) = W × (1 −
min(M,N)
max(M,N)
).
Lemme 2. Une matrice de migration minimisant le nombre de messages poss`ede au moins
M + N − pgcd(M, N) coefficients non nuls. Le nombre minimal de messages v´erifie :
TotalZopt ≥ max(M, N) − pgcd(M, N).
D´emonstration. Le volume total de donn´ees est W = k × ppcm(M, N) = kaM = kbN avec a
et b deux entiers strictement positifs premiers entre eux. Chaque partie poss`ede initialement ka
sommets et finalement kb sommets.
Soit G = ((A, B), E) le graphe biparti de migration. Pour d´enombrer les ´el´ements non nuls
dans la matrice de migration, il suffit de compter le nombre d’arˆetes dans le graphe biparti de
migration.
On note (Gi = ((Ai
, Bi), Ei))i∈J1,KK
, les K composantes connexes de G. Pour chaque composante
Gi
, Mi = |Ai
| processeurs envoient Mika sommets `a Ni = |Bi
| processeurs qui re¸coivent
Nikb sommets. Dans Gi
, on a donc Wi = Mika = Nikb sommets qui sont ´echang´es, avec Mi et
Ni non nuls. Comme Wi est un multiple commun de ka et kb et comme a et b sont premiers
entre eux, le plus petit multiple commun de ka et kb est kab. Donc Wi ≥ kab. Le volume total
´echang´e W =
PK
i=1 Wi est donc sup´erieur ou ´egal `a Kkab. Autrement dit, K ≤
W
kab =
M
b
.3.2. MATRICES DE MIGRATION OPTIMALES DANS LE CAS EQUILIBR ´ E´ 31
D’autre part, on sait que MN = pgcd(M, N) × ppcm(M, N) et ppcm(M, N) = bN. On a
donc M
b = pgcd(M, N). On obtient alors K ≤ pgcd(M, N).
Comme Gi est un graphe connexe, il poss`ede au moins Mi + Ni − 1 arˆetes. Donc le nombre
total d’arˆetes |E| =
PK
i=1 |Ei
| est au moins PK
i=1 Mi +
PK
i=1 Ni − K = M + N − K. Comme
K ≤ pgcd(M, N), on obtient |E| ≥ M + N − pgcd(M, N). Le nombre de coefficients non nuls
dans la matrice de migration est donc au moins M + N − pgcd(M, N).
TotalZ est le nombre de coefficients non nuls hors de la diagonale. Il y a au plus min(M, N)
coefficients non nuls sur la diagonale. Donc TotalZ ≥ M + N − pgcd(M, N) − min(M, N) =
max(M, N) − pgcd(M, N).
B
A×B
1 2 3 4 5 6 7
1 2 3 4 5 6 7 8 9 10
A 8
11 12
ka
kb
kab
Figure 3.5 – Partitionnement d’un graphe chaˆıne en 8 et 12 parties, le motif de l’intersection
A × B permet de construire la matrice de migration « en escalier ».
Il existe diff´erentes m´ethodes pour obtenir de telles matrices avec un nombre minimal d’´el´ements
non nuls.
Une premi`ere m´ethode s’inspire du partitionnement d’un graphe « chaˆıne » ou d’un tableau,
comme pr´esent´e sur la figure 3.5. Pour compter le nombre de messages, il faut compter le nombre
d’arˆetes du graphe biparti. En reprenant les notations de la d´emonstration du lemme 2, la taille
des parties de A est ka et celle des parties de B est kb. Tous les ppcm(ka, kb) = kab sommets,
les s´eparateurs des anciennes parties et des nouvelles parties sont juxtapos´es. Le graphe biparti
de migration est coup´e en sous-graphes (composantes connexes), chacun avec b anciennes parties
de taille ka et a nouvelles parties de taille kb. Ce motif de longueur kab est donc r´ep´et´e W
kab =
M
b =
N
a = pgcd(M, N) fois. Chacun de ces sous-graphes contient b + a − 1 arˆetes. Le nombre
total d’arˆetes est donc (b + a − 1) × pgcd(M, N) = M + N − pgcd(M, N). Sur l’exemple de la
figure 3.5, on a ppcm(8, 12) = 24 donc a = 3 et b = 2. Chacune des pgcd(8, 12) = 4 composantes
connexes contient 3 + 2 − 1 = 4 arˆetes. Le graphe biparti contient 16 arˆetes. Cette construction
donne une matrice « en escalier » comme montr´e sur la figure 3.7a.
Il est ´egalement possible de construire une telle matrice r´ecursivement. On remplit la matrice
avec des blocs qui sont des matrices carr´ees diagonales de taille min(M, N), et le bloc restant
est rempli en r´ep´etant la mˆeme m´ethode sur le nouveau sous-probl`eme. Pour que la matrice soit
une matrice de migration, il faut que les sommes sur les lignes ou colonnes soient respectivement
les tailles des anciennes et nouvelles parties. Les valeurs diagonales sont donc W
max(M,N)
. La
figure 3.6 donne un exemple de telle construction dans le cas 7 × 10 avec W = 7 × 10 en trois
´etapes. Calculer le nombre de non-z´eros avec cette m´ethode, revient `a appliquer l’algorithme
d’Euclide. La division euclidienne de M par N donne M = qN + r : on commence `a remplir q
blocs carr´es de taille N × N et on recommence r´ecursivement sur le bloc restant de taille r × N32 CHAPITRE 3. MODELE DE MIGRATION `
avec r < N. L’algorithme d’Euclide donne une suite d’´equations :
M = q2N + r2 (3.1)
.
.
. (3.2)
ri−2 = qiri−1 + ri (3.3)
.
.
. (3.4)
rn−3 = qn−1rn−2 + rn−1 (3.5)
rn−2 = qnrn−1 (3.6)
avec r0 = M, r1 = N et rn−1 = pgcd(M, N). A chaque ´etape de l’algorithme, ` qiri−1 ´el´ements non
nuls sont ajout´es dans la matrice : ce sont les ´el´ements diagonaux des qi blocs carr´es. Le nombre
total d’´el´ements non nuls est donc Pn
i=2 qiri−1. En faisant la somme de toutes les ´equations
pr´ec´edentes, on obtient :
nX−2
i=0
ri =
Xn
i=2
qiri−1 +
Xn
i=2
ri (3.7)
Xn
i=2
qiri−1 = r0 + r1 − rn−1 − rn (3.8)
Xn
i=2
qiri−1 = M + N − pgcd(M, N). (3.9)
D’apr`es l’´equation 3.9, cette m´ethode construit bien une matrice avec un nombre minimal de
non-z´eros. La figure 3.7d pr´esente un exemple d’une telle matrice.
Th´eor`eme 3. Les bornes inf´erieures donn´ees dans les lemmes 1 et 2 sont atteintes. C’est-`a-dire :
TotalVopt = W
1 −
min(M, N)
max(M, N)
(3.10)
TotalZopt = max(M, N) − pgcd(M, N). (3.11)
D´emonstration. La m´ethode de construction bas´ee sur l’algorithme d’Euclide construit une matrice
de migration avec M + N − pgcd(M, N) coefficients non nuls. Les min(M, N) ´el´ements sur
la diagonale sont maximis´es et valent W
max(M,N)
. On a donc TotalV = W
1 −
min(M,N)
max(M,N)
et
TotalZ = max(M, N) − pgcd(M, N).
Proposition 4. Soient M et N deux entiers tels que M < N. Soient D une matrice diagonale
de dimension M × M dont les ´el´ements diagonaux sont W
N
et A une matrice de migration de
dimension M × (N − M) minimisant le nombre de messages. Alors, la matrice
D A
est une
matrice de migration optimale au sens de la d´efinition 9.
De mˆeme, dans le cas o`u M > N, si D est de taille N × N avec des ´el´ements diagonaux
valant W
M et si A est de taille (M − N) × N, alors
D
A
est une matrice de migration optimale.
D´emonstration. La d´emonstration est faite dans le cas M < N. La d´emonstration du cas M > N
est similaire.
La quantit´e de donn´ees qui reste sur place correspond `a la premi`ere diagonale de la matrice,
soit D. Donc, on a W M
N
donn´ees qui restent sur place, ce qui est bien le cas optimal.3.2. MATRICES DE MIGRATION OPTIMALES DANS LE CAS EQUILIBR ´ E´ 33
7
7
7
7 reste
7
7
7
10 = 1 × 7 + 3
7 3
7 3
7 3
7 3
7 3
7 3
7 reste
7 = 2 × 3 + 1
7 3
7 3
7 3
7 3
7 3
7 3
7 1 1 1
3 = 3 × 1 + 0
Figure 3.6 – Exemple de construction r´ecursive (avec les divisions euclidiennes associ´ees `a chaque
´etape) d’une matrice de migration avec un nombre minimal de communications.
D contient M ´el´ements non nuls et A contient par hypoth`ese un nombre minimal d’´el´ements
non nuls pour sa taille : M + (N − M) − pgcd(M, N − M) = N − pgcd(M, N). Le nombre total
d’´el´ements non nuls est donc M + N − pgcd(M, N) qui est bien le nombre minimal.
La matrice
D A
remplit bien les deux crit`eres pour ˆetre optimale.
La figure 3.7 pr´esente quelques exemples de matrices de migration. La matrice de la figure 3.7a
a ´et´e obtenue par la m´ethode inspir´ee du repartitionnement d’une chaˆıne qui donne une forme en
escalier. Le nombre de messages est optimal mais pas le volume de migration. Seules 12 donn´ees
restent sur place (les nombres en rouges) contre W
M × N
= 49 dans le cas d’une migration
optimale. Le volume de migration peut ˆetre am´elior´e `a l’aide d’une simple renum´erotation des
parties similaires au « remapping » de la m´ethode Scratch-Remap (cf. section 2.3). La matrice
obtenue est pr´esent´ee sur le figure 3.7b, 45 donn´ees restent alors sur place, ce qui est tr`es proche
de l’optimal.
D’apr`es le th´eor`eme pr´ec´edent, il nous suffit de combiner une matrice diagonale et une matrice
minimisant le nombre de message pour obtenir une matrice optimale. La figure 3.7c montre la
combinaison d’une matrice diagonale et d’une matrice en escalier. Dans le cas de la figure 3.7d,
on construit r´ecursivement une matrice optimale `a l’aide de matrices diagonales en se basant sur
l’algorithme d’Euclide. Bien que ces deux matrices soient optimales pour les m´etriques d´esir´ees
(TotalV et TotalZ), la matrice construite `a partir de la matrice en escalier donne un nombre
de messages par processeur (MaxZ) plus faible que la m´ethode r´ecursive.
En pratique, les partitions ne sont pas parfaitement ´equilibr´ees car cela n’est pas n´ecessaire :
on se contente d’une partition `a peu pr`es ´equilibr´ee `a un facteur de d´es´equilibre pr`es. Cette
´equilibre parfait peut mˆeme ˆetre impossible lorsque W n’est pas divisible par M ou N ou que le34 CHAPITRE 3. MODELE DE MIGRATION `
7 3
4 6
1 7 2
5 5
2 7 1
6 4
3 7
1
2
3
4
7
5
6
a
b c
d
e
f
g
h
i j
(a) Matrice « en escalier ».
7 3
6 4
1 7 2
5 5
7 1 2
6 4
7 3
1
2
3
4
7
5
6
a
h b
c
d
i
e
f
j g
(b) Matrice « en escalier » avec permutation
des colonnes pour minimiser TotalV.
7 3
7 3
7 1 2
7 3
7 2 1
7 3
7 3
1
2
3 4
5
6
7
a
b
c
d
e
f
g
h
i
j
(c) Matrice optimale utilisant une sousmatrice
en escalier.
7 3
7 3
7 3
7 3
7 3
7 3
7 1 1 1
1
2
4 3
5
6
7
a
b
c
d
e
f
g
h
i
j
(d) Exemple de matrice optimale
construite par ajout de blocs diagonaux
r´ecursivement.
Figure 3.7 – Exemples de matrices de migration pour le cas 7 × 10 et leurs repr´esentations en
hypergraphe de repartitionnement. Les ´el´ements nuls ne sont pas montr´es. Les lignes num´erot´ees
de 1 `a 7 correspondent aux sommets et les colonnes num´erot´ees de a `a j correspondent aux
hyper-arˆetes. Les ´el´ements en rouge montrent les donn´ees qui restent en place. Les ´el´ements en
noir sont ceux qui migrent, la somme de ces ´el´ements donne le volume de migration.3.3. CONSTRUCTION DES MATRICES DE MIGRATION 35
poids des sommets de permet pas un d´ecoupage en parties rigoureusement ´egales. Les r´esultats
pr´esent´es dans cette section sur le nombre de messages restent vrais pour des d´es´equilibres faibles.
En effet, il est possible de profiter de la tol´erance au d´es´equilibre des nouvelles parties pour mieux
s’adapter aux anciennes parties l´eg`erement d´es´equilibr´ees et ´economiser des messages. Le volume
de migration optimal reste proche.
Dans le cas o`u la partition initiale est fortement d´es´equilibr´ee, il est difficile de donner des valeurs
optimales pour tous les cas. Il est toujours possible d’effectuer la migration en max(M, N)−1
messages (le nombre minimal d’arˆetes d’un graphe biparti connexe ´etant M + N − 1), mais ce
nombre n’est pas toujours minimal.
3.3 Construction des matrices de migration
3.3.1 M´ethode bas´ee sur la chaˆıne (1D)
a) Cas ´equilibr´e
Dans le cas d’une partition initiale ´equilibr´ee, la m´ethode la plus simple pour construire une
matrice de migration permettant `a la fois une bonne migration (m´etriques TotalV, MaxV,
TotalZ et MaxZ) et une bonne coupe, consiste `a r´eutiliser le principe du partitionnement de
la chaˆıne pr´esent´ee dans la section 3.2.
De telles matrices de migration peuvent ˆetre obtenues `a l’aide d’un repartitionnement bas´e sur
des courbes de remplissage ou space filling curve (SFC) [52,54]. Ce repartitionnement g´eom´etrique
construit une courbe remplissant l’espace `a partitionner, comme par exemple `a l’aide d’une courbe
de Hilbert [54] (cf. figure 3.8). On peut facilement obtenir une partition en M parties en coupant
cette courbe en M sections ´egales. Si on construit une nouvelle partition en N parties en utilisant
la mˆeme courbe de remplissage, on obtient un repartitionnement bas´e sur la chaˆıne (la chaˆıne
´etant la courbe de remplissage). Cette m´ethode a l’inconv´enient de n´ecessiter des informations
g´eom´etriques sur les donn´ees `a partitionner et donne une coupe assez ´elev´ee `a cause de la nature
fractale des courbes utilis´ees.
Pour appliquer le principe du partitionnement de la chaˆıne sur un graphe quelconque, il
suffit de trouver un chemin dans le graphe quotient. L’utilisation du graphe quotient au lieu du
graphe `a partitionner permet de laisser `a une heuristique de partitionnement classique le choix
de la distribution des sommets. Ainsi, le probl`eme de coupe des courbes de remplissage est r´egl´e
tout en gardant le mˆeme sch´ema de communication. Le chemin de M sommets dans le graphe
quotient est alors d´ecoup´e en N nouvelles parties, un sommet (correspondant `a une ancienne
partie) pouvant ˆetre partag´e entre plusieurs nouvelles parties. Le choix de ce chemin influence
directement la coupe de la partition finale. En effet, comme une nouvelle partie peut prendre
des sommets de plusieurs anciennes parties cons´ecutives dans ce chemin, il est pr´ef´erable que ces
parties soient bien connect´ees entre elles. Il faudra donc trouver un chemin dont les arˆetes ont
des poids ´elev´es dans le graphe quotient.
Pour optimiser la migration, une renum´erotation des nouvelles parties est n´ecessaire, car en
num´erotant les parties dans l’ordre du chemin, les num´eros sont d´ecal´es par rapport `a la partition
initiale comme on peut le voir sur la figure 3.9. L’utilisation d’un chemin peut aussi ˆetre vue
comme une renum´erotation des anciennes parties apr`es laquelle on applique le repartitionnement
de la chaˆıne sur le nouvel ordre des parties. Donc, deux renum´erotations sont en fait n´ecessaires :
l’une permutant les anciennes parties (ou lignes de la matrice de migration) en fonction du
chemin, l’autre permutant les nouvelles parties (ou colonnes de la matrice de migration) pour
optimiser la migration.36 CHAPITRE 3. MODELE DE MIGRATION `
(a) Partitionnement en 3. (b) Partitionnement en 5.
13 8
5 12 5
8 13
(c) Matrice de migration.
Figure 3.8 – Partitionnement et repartitionnemnent d’une grille 8 × 8 bas´es sur une courbe de
remplissage de Hilbert.
B
1 2 3 4 5 6 7
1 2 3 4 5 6 7 8 9 10
A 8
11 12
(a) Num´erotation des nouvelles parties dans l’ordre du chemin.
B
1 2 3 4 5 6 7
1 9 2 3 10 4 5 11 6 7
A 8
12 8
(b) Renum´erotation pour optimiser la migration.
Figure 3.9 – Exemple de num´erotations des nouvelles parties. Les arˆetes en pointill´es correspondent
aux « communications » d’un processeur vers lui-mˆeme. Les donn´ees qui ne migrent pas
sont en gris clair.3.3. CONSTRUCTION DES MATRICES DE MIGRATION 37
Nœud courant Partie suivante
Partie précédente
Figure 3.10 – Exemple d’´etape de l’algorithme de recherche de chemin `a partir de l’arbre des
bissections. La zone verte contient les nœuds dont l’ordre est d´ej`a fix´e, la zone rouge ceux dont
on ne connait pas encore l’ordre. Le choix de l’ordre est `a faire entre les deux sommets de la zone
bleue claire.
La recherche d’un tel chemin dans le graphe quotient est un probl`eme analogue `a celui du
voyageur de commerce, qui est NP-complet [20, TRAVELING SALESMAN].
Il existe de nombreuses m´ethodes pour obtenir des chemins non optimaux mais assez proches
de l’optimal, comme par exemple des algorithmes probabilistes. Mais certains « bons » chemins
peuvent cr´eer des probl`emes dans le cas d’un partitionnement par bissections r´ecursives. En effet,
une bissection devra couper ce chemin en deux en mˆeme temps que le graphe. La bissection du
chemin est forc´ee par la num´erotation des nouvelles parties : elle s´epare les plus petits num´eros
des plus grands. Une bissection du chemin par le milieu doit donc laisser la possibilit´e d’une
bonne bissection du graphe.
Dans le cas o`u la partition initiale a ´et´e r´ealis´ee par un partitionneur utilisant des bissections
r´ecursives, l’arbre des bissections peut ˆetre utilis´e pour trouver rapidement un chemin. Les parties
issues d’une bissection r´ecursive sont num´erot´ees dans l’ordre des feuilles. Les nœuds internes
repr´esentent l’union des parties dans le sous-arbre. A l’aide d’un parcours en largeur de l’arbre, `
chaque nœud interne est visit´e. L’ordre de ses deux fils est choisi de fa¸con `a maximiser les
connexions avec les parties (ou unions de parties) pr´ec´edentes et suivantes. Comme tout l’arbre
n’a pas encore ´et´e visit´e, l’ordre de toutes les parties n’a pas encore ´et´e d´ecid´e. On prend donc la
partie pr´ec´edente au mˆeme niveau dans l’arbre et la partie suivante au niveau sup´erieur comme
indiqu´e sur la figure 3.10.
La figure 3.12 pr´esente un exemple d’ex´ecution de cet algorithme sur le graphe quotient de
la figure 3.11. L’arbre initial est celui de la figure 3.12a. Au niveau de la racine, il n’y a pas de
choix `a faire car il n’y a ni partie pr´ec´edente ni suivante. Le premier choix arrive avec le nœud
unissant 0 et 1. La partie suivante est 2–4 dont la connexion avec 0 est 39 + 14 = 53 et celle avec
1 est 17 + 34 = 51. La partie 0 est donc plac´ee en second comme indiqu´e sur la figure 3.12b. Sur
la figure 3.12c, les connexions des parties 2 et 3–4 avec la partie pr´ec´edente 0 sont compar´ees.
Enfin, les connexions des parties 3 et 4 avec les parties pr´ec´edente 0 et suivante 2 sont compar´ees,
et l’ordre est conserv´e (figure 3.12d).
En pratique, pour am´eliorer la qualit´e du chemin en gardant un algorithme rapide, toutes les
solutions possibles sont recherch´ees quand on arrive sur un sous-arbre suffisamment petit.
Une fois la nouvelle partition obtenue, il faut renum´eroter les parties pour optimiser la migration
comme montr´e sur la figure 3.9. De la mˆeme fa¸con que le Scratch-Remap, il faut chercher
la meilleure association entre anciennes et nouvelles parties. Mais dans le cas du partitionnement38 CHAPITRE 3. MODELE DE MIGRATION `
39
39
14
34
17
62
65
0
1
2
3
4
Figure 3.11 – Exemple de partition initiale en 5 partie et du graphe quotient associ´e.
de la chaˆıne, le choix est plus simple :
— si M < N, pour chaque ancienne partie, on choisit la nouvelle partie qui re¸coit le plus de
donn´ees ;
— si M > N, pour chaque nouvelle partie, on choisit l’ancienne partie qui lui en envoie le
plus.
Les nouvelles parties qui ne sont pas associ´ees `a une ancienne prennent alors de nouveaux
num´eros qui n’existaient pas dans l’ancienne partition : ce sont les N − M plus grands.
On peut v´erifier par l’absurde que ces choix sont possibles dans le cas M < N. Cette m´ethode
de renum´erotation poserait probl`eme si et seulement si une mˆeme nouvelle partie est le meilleur
choix pour deux anciennes. Si une ancienne partie partage des donn´ees avec trois ou plus nouvelles
parties, une de ces nouvelles parties ne re¸coit des donn´ees que de cette ancienne partie et ne serait
le meilleur choix que pour celle-ci. Ces deux anciennes parties n’ont donc chacune des donn´ees
partag´ees qu’avec deux nouvelles : les nouvelles parties ´etant plus petites, il y en a au moins
deux. La nouvelle partie qui serait le meilleur choix pour les deux anciennes doit donc recevoir
plus de la moiti´e des donn´ees de chacune des deux anciennes parties. Elle serait donc plus grande
que les anciennes, ce qui est en contradiction avec l’hypoth`ese M < N.
On peut faire un raisonnement similaire dans le cas M > N, en inversant les rˆoles des
anciennes et nouvelles parties.
b) Illustration dans le cas ´equilibr´e
La figure 3.13 pr´esente un exemple de repartitionnement dans le cas o`u il y a 5 parties
initiales ´equilibr´ees (1400 ´el´ements chacune) et 7 parties finales qui doivent contenir 1000 ´el´ements
chacune pour ˆetre ´equilibr´ees. On commence par construire une matrice correspondant au
repartitionnement de la chaˆıne comme pr´esent´e dans la section 3.2 (matrice en escalier) :
1000 400 0 0 0 0 0
0 600 800 0 0 0 0
0 0 200 1000 200 0 0
0 0 0 0 800 600 0
0 0 0 0 0 400 1000
3.3. CONSTRUCTION DES MATRICES DE MIGRATION 39
0–4
0–1 2–4
0 1 2 3–4
3 4
(a) Arbre de bissections initial.
0–4
0–1 2–4
1 0 2 3–4
3 4
(b) Permutation de 0 et 1.
0–4
0–1 2–4
1 0 3–4
3 4
2
(c) Permutation de 2 et 3–4.
0–4
0–1 2–4
1 0 3–4
3 4
2
(d) L’ordre entre 3 et 4 est pr´eserv´e.
Figure 3.12 – Exemple de recherche de chemin par permutation de l’arbre des bissections.
Ensuite, un chemin est recherch´e dans le graphe, maximisant la connexion entre les sommets
successifs (les anciennes parties). Ici, le chemin choisi est 1, 0, 3, 4 et 2. Les lignes de la matrice
sont permut´ees en cons´equence. Enfin, il faut renum´eroter les nouvelles parties pour minimiser
le volume de migration. On choisit les nouvelles parties recevant le plus d’´el´ements des anciennes
parties. Les nouvelles parties correspondant aux anciennes 1, 0, 3, 4 et 2, sont respectivement
0, 2, 3, 4 et 6. Renum´eroter les nouvelles parties revient `a permuter les colonnes de la matrice
de migration. Les nouvelles parties non associ´ees aux anciennes (1 et 5) prennent de nouveaux
num´eros, ici 5 et 6. Les colonnes sont permut´ees en cons´equence, les colonnes suppl´ementaires (5
et 6) peuvent ˆetre dans un ordre quelconque.
La figure 3.14 pr´esente les hypergraphes de repartitionnement dans trois cas de repartitionnement.
Dans les cas ou les nombres de parties initial et final ne sont pas premiers entre eux
(8×12 et 12×14), les chemins sont coup´es en plusieurs parties : ce sont les composantes connexes
utilis´ees dans la d´emonstration du lemme 2. On remarque ´egalement que les hyper-arˆetes sont
de petites tailles et regroupent des anciennes parties voisines comme on le souhaitait.
c) G´en´eralisation au cas d´es´equilibr´e
Cette m´ethode peut ˆetre facilement adapt´ee dans le cas o`u la partition initiale est d´es´equilibr´ee.
Il faut d’abord trouver un chemin dans le graphe quotient. Ensuite, connaissant cet ordre
des parties, il suffit de le red´ecouper en parties de tailles ´egales. Dans le cas d´es´equilibr´e, toutes40 CHAPITRE 3. MODELE DE MIGRATION `
39
39
14
34
17
62
65
800 0 0 0 0 0 600
0 1000 0 0 0 0 400
0 0 1000 0 0 400 0
200 0 0 1000 200 0 0
0 0 0 0 800 600 0
TotalV = 2400
MaxV = 1000
TotalZ = 6
MaxZ = 2
Figure 3.13 – Exemple de repartitionnement bas´e sur la chaˆıne dans le cas 5×7 (cas ´equilibr´e).
52
22
49
5
26
47
6
50
51
8
24
22
51
(a) Hypergraphe de repartitionnement
dans le cas 8 × 12.
26 21
17
32
26 23
30
12
28
27
40
30
3
9
29
19
22
21
25
21
17
29
29
(b) Hypergraphe de repartitionnement
dans le cas 12 × 14.
27
20
24 4
23
4
5
30 23
21
5
25
21
25
8
21
21
4
25
29
26
10 24
8 26
23
20
28
4 23
23
24
23
(c) Hypergraphe de repartitionnement
dans le cas 16 × 21.
Figure 3.14 – Applications du repartitionnement bas´e sur la chaˆıne dans le cas ´equilibr´e.3.3. CONSTRUCTION DES MATRICES DE MIGRATION 41
900 500 1500 1700 2400
1000
1 0 3 4 2
1 0 3 4 6 2 5
39
39
14
34
17
62
65
400 100 0 0 0 0 0
0 900 0 0 0 0 0
0 0 1000 0 0 1000 400
600 0 0 900 0 0 0
0 0 0 100 1000 0 600
TotalV = 2800
MaxV = 1400
TotalZ = 6
MaxZ = 2
Figure 3.15 – Exemple de repartitionnement bas´e sur la chaˆıne dans le cas 5×7 (cas d´es´equilibr´e).
les parties ne se valent pas. La forme de l’hypergraphe de repartitionnement utilis´e peut varier
suivant l’ordre choisi.
Par exemple, consid´erons le cas 5 × 7 o`u les parties sont initialement d´es´equilibr´ees avec
comme poids dans l’ordre de 0 `a 4 : 500, 900, 2400, 1500 et 1700. En reprenant le mˆeme chemin 1
que dans le cas ´equilibr´e (figure 3.12), l’ordre des poids devient 900, 500, 1500, 1700 et 2400, et
on obtient le repartitionnement pr´esent´e sur la figure 3.15.
La figure 3.16 pr´esente alors les hypergraphes de repartitionnement obtenus avec la m´ethode
de la chaˆıne dans le cas d´es´equilibr´e. Contrairement au cas ´equilibr´e, il n’est plus garanti que
certaines s´eparations entre parties soient communes entre l’ancienne partition et la nouvelle. Le
nombre de messages peut donc atteindre, au pire, M+N −1 messages. On peut voir que les hyperarˆetes
forment les mˆemes chemins que ceux de la figure 3.14 mais « sans ˆetre coup´ees ». Dans
le cas ´equilibr´e, le chemin ´etait d´ecoup´e en pgcd(M, N) parties correspondant aux composantes
connexes du graphe biparti de repartitionnement utilis´ees dans la section 3.2.
1. Le chemin ne d´epend que de la connectivit´e du graphe quotient, pas du poids de ses sommets.42 CHAPITRE 3. MODELE DE MIGRATION `
52
22
49
5
26
47
6
50
51
8
24
22
51
(a) Hypergraphe de repartitionnement
dans le cas 8 × 12.
26 21
17
32
26 23
30
12
28
27
40
30
3
9
29
19
22
21
25
21
17
29
29
(b) Hypergraphe de repartitionnement
dans le cas 12 × 14.
27
20
24 4
23
4
5
30 23
21
5
25
21
25
8
21
21
4
25
29
26
10 24
8 26
23
20
28
4 23
23
24
23
(c) Hypergraphe de repartitionnement
dans le cas 16 × 21.
Figure 3.16 – Applications du repartitionnement bas´e sur la chaˆıne dans le cas d´es´equilibr´e.
3.3.2 M´ethode d’appariement (Matching)
Dans le cas ´equilibr´e, nous avons vu en section 3.2 qu’il est possible de construire des matrices
de migration optimales, c’est-`a-dire optimisant `a la fois le volume de migration et le nombre de
messages. Mais l’optimisation de la coupe n’est pas consid´er´ee. Comme on l’a vu avec la m´ethode
de la chaˆıne, il peut ˆetre n´ecessaire de permuter la matrice de migration pour obtenir une bonne
coupe. Mais une matrice optimale ne correspond pas toujours `a une chaˆıne : il ne suffit plus
de trouver un bon chemin dans le graphe quotient. On cherche donc `a apparier correctement la
matrice de migration avec le graphe quotient pour que la partition finale ait une bonne coupe.
Comme les valeurs des ´el´ements de la matrice de migration n’influencent pas cet appariement,
nous utiliserons l’hypergraphe de repartitionnement dans cette section.
Le choix de la matrice de migration ou de l’hypergraphe repartitionnement conditionne la
qualit´e de la migration. Nous d´ecidons de prendre une matrice de migration optimale (d’apr`es
la d´efinition 9), plus pr´ecis´ement la matrice optimale compos´ee d’une diagonale et compl´et´ee
avec une sous-matrice « chaˆıne » (comme celle de la figure 3.7c). En plus de minimiser T otalV
et T otalZ, cette matrice a l’avantage de garder un M axZ plus faible que les autres matrices
optimales.
a) Probl`eme d’appariement entre le graphe quotient et l’hypergraphe de repartitionnement
Une bonne matrice de migration ne suffit donc pas pour obtenir un bon repartitionnement.
Elle ne permet que d’optimiser la migration et l’´equilibre. Un bon repartitionnement doit aussi
fournir une coupe basse. La coupe sera principalement d´ecid´ee lors de l’´etape de repartitionnement,
mais la matrice de migration a une influence sur la coupe. Une matrice de migration
indique l’emplacement des nouvelles parties : elles seront l`a o`u se trouvent les anciennes parties
dont elles prennent les sommets. Pour permettre au partitionneur de bien optimiser la coupe, il
faut que les anciennes parties communiquant avec une mˆeme nouvelle partie soient proches.
Pour obtenir ce r´esultat, on apparie l’hypergraphe de repartitionnement avec le graphe quotient,
c’est-`a-dire qu’on cherche une correspondance entre les sommets de l’hypergraphe et ceux
du graphe quotient comme pr´esent´e sur la figure 3.17. En effet, les hyper-arˆetes regroupent les
anciennes parties donnant des sommets `a une mˆeme nouvelle partie, alors que les arˆetes du graphe
quotient connectent les anciennes parties proches.3.3. CONSTRUCTION DES MATRICES DE MIGRATION 43
1
2
3
4
5
6
7
7
2
1
4
3
6
5
Figure 3.17 – Appariement d’un graphe quotient et d’un hypergraphe de repartitionnement.
Par exemple, il y a plusieurs fa¸cons d’apparier l’hypergraphe de repartitionnement pour repartitionner
la partition initiale d’un maillage en grille visible sur la figure 3.18a. Les figures 3.18b
et 3.18c pr´esentent deux possibilit´es d’appariement de l’hypergraphe de repartitionnement en
le superposant au graphe quotient. Dans le premier cas, les hyper-arˆetes regroupant plusieurs
sommets contiennent des sommets « proches » organis´es en cliques. En cons´equence la partition
finale sur la figure 3.18d a des parties bien form´ees, alors que, dans le second cas, les hyper-arˆetes
regroupent des sommets « ´eloign´es » et la partition finale sur la figure 3.18e a des parties d´econnect´ees
sur le maillage. Les m´etriques pour ´evaluer la migration (TotalV, MaxV, TotalZ et
MaxZ) sont les mˆemes dans ces deux cas, mais la coupe du graphe est bien meilleure dans le
premier cas.
Pour ´eviter de tels sc´enarios, une m´etrique suppl´ementaire est introduite pour estimer la
qualit´e de la coupe finale. Cette m´etrique doit favoriser les nouvelles parties prenant des donn´ees
`a un ensemble d’anciennes parties bien connect´ees, autrement dit des quasi-cliques. Cette
m´etrique s’exprime `a l’aide du graphe quotient de l’ancienne partition et de l’hypergraphe de
repartitionnement.
b) D´efinition d’un score d’appariement
Une fois la matrice choisie, il faut trouver une bonne correspondance entre les sommets
du graphe quotient et ceux de l’hypergraphe de repartitionnement associ´e `a la matrice. Cet
appariement n´ecessite la d´efinition d’un score.
Notons Q = (VQ, EQ) le graphe quotient par rapport `a l’ancienne partition, H = (VH, EH)
l’hypergraphe de repartitionnement d´ej`a appari´e (on consid`ere que les sommets de Q et de H
sont les mˆemes, on pose V = VQ = VH) et ES(e) l’ensemble des arˆetes du sous-graphe de Q
induit par l’hyper-arˆete e. Une premi`ere version simple de ce score compte la somme des poids
des arˆetes des sous-graphes induits par chaque hyper-arˆete e :
Score = X
e∈EH
X
e
′∈ES (e)
we
′
(3.12)
o`u ES(e) = {(i, j) ∈ EQ : i ∈ e ∧ j ∈ e} .44 CHAPITRE 3. MODELE DE MIGRATION `
(a) Hypergraphe de repartitionnement et partition initiale.
(b) Exemple de bonne correspondance. (c) Exemple de mauvaise correspondance.
(d) La partition est bien form´ee. (e) Certaines parties sont d´econnect´ees.
Figure 3.18 – Deux cas d’application d’un mˆeme hypergraphe de repartitionnement.3.3. CONSTRUCTION DES MATRICES DE MIGRATION 45
Il est possible d’´ecrire ce score sous forme matricielle. Notons X la matrice d’appariement (ou
de permutation) de taille M × M `a trouver : Xi,i′ vaut 1 si et seulement si le sommet i de
l’hypergraphe de repartitionnement est associ´e au sommet i
′ du graphe quotient, sinon 0. La
matrice H repr´esente l’hypergraphe de repartitionnement 2
. Elle est de taille M × N et Hi,j vaut
1 si est seulement si le sommet i est inclus dans l’hyper-arˆete j. Q est la matrice d’adjacence
du graphe quotient de taille M × M, Qi,j est le poids de l’arˆete entre les sommets i et j. Ces
notations sont r´esum´ees sur la figure 3.19.
i'
j'
j
i
k
Qi',j'
Xi,i' = 1
Xj,j' = 1
Figure 3.19 – Illustration des notations utilis´ees dans la formule de score avec une arˆete (i
′
, j′
)
du graphe quotient Q `a gauche et une hyper-arˆete k `a droite.
Grˆace aux matrices `a valeurs binaires X et H, on peut ´ecrire la somme du poids des arˆetes
ei
′
,j′ dont les extr´emit´es i
′
et j
′
sont respectivement associ´ees `a deux sommets i et j dans la
mˆeme hyper-arˆete k :
Score = X
i,j,i′
,j′
,k
Xi,i′Xj,j′Hi,kHj,kQi
′
,j′ soit (3.13)
Score = X
i,i′
Xi,i′
X
j,j′
Xj,j′
X
k
Hi,kHj,k!
Qi
′
,j′
!
. (3.14)
D´efinition 10 (Produit de Kronecker). Le produit de Kronecker de deux matrices A ⊗ B, A de
taille m × n et B de taille m′ × n
′
, est une matrice de taille mm′ × nn′
, d´ecrite par la matrice
bloc suivante :
A1,1B · · · A1,nB
.
.
.
.
.
.
.
.
.
Am,1B · · · Am,nB
.
En notant A = HHT ⊗ Q, o`u ⊗ est le produit de Kronecker, et x le vecteur colonne de taille
M2
tel que xiM+i
′ = Xi,i′ , le score s’´ecrit comme la forme quadratique :
Score = x
T Ax. (3.15)
Dans l’´equation 3.14, on reconnait le coefficient de la matrice A = HHT ⊗ Q :
AiM+i
′
,jM+j
′ =
X
k
Hi,kHj,k!
Qi
′
,j′ ,
2. Par abus de langage, on confond les graphes et hypergraphes avec leurs matrices d’adjacence.46 CHAPITRE 3. MODELE DE MIGRATION `
20 20
(a) Chaine de 3 parties r´eunies dans une mˆeme
hyper-arˆete. Les deux parties aux extr´emit´es
sont ´eloign´ees l’une de l’autre.
15 20
5
(b) Clique de 3 parties r´eunies dans une mˆeme
hyper-arˆete.
Figure 3.20 – Deux exemples de sous-graphes quotients appari´es avec une hyper-arˆete.
P
k Hi,kHj,k correspondant au coefficient (i, j) de la matrice HHT
.
Cette m´etrique favorise les hyper-arˆetes regroupant des sommets fortement connect´es. Mais
elle est loin d’ˆetre parfaite, car elle ne prend pas en compte le nombre d’arˆetes du graphe quotient
associ´ees `a une hyper-arˆete. A score ´egal, il apparait plus avantageux de favoriser trois sommets `
connect´es par trois arˆetes plutˆot que par deux.
Sur l’exemple de la figure 3.20, les deux appariements d’une hyper-arˆete avec un graphe de
3 sommets ont le mˆeme score : 40. Pourtant, dans le cas de la figure 3.20a, les deux parties aux
extr´emit´es de la chaˆıne peuvent ˆetre ´eloign´ees et la nouvelle partie cr´e´ee devra alors ˆetre ´etir´ee,
ce qui n’est pas optimal pour la coupe. On pr´ef´ererait favoriser les cas de cliques comme sur la
figure 3.20b, o`u les 3 parties sont bien regroup´ees.
Pour corriger ces d´efauts, nous allons modifier le score pour prendre en compte la quantit´e
d’arˆetes et la taille des hyper-arˆetes 3
. On propose la nouvelle formule de score suivante. Soient
ES(e) l’ensemble des arˆetes du sous-graphe induit par l’hyper-arˆete e et K(e) l’ensemble des
arˆetes d’une clique entre les sommets de l’hyper-arˆete e. La m´etrique s’exprime :
ScoreR =
X
e∈EH
|ES(e)|
|K(e)|
X
e
′∈ES (e)
we
′
(3.16)
o`u
ES(e) = {(i, j) ∈ EQ : i ∈ e ∧ j ∈ e}
K(e) =
(i, j) ∈ V
2
: i 6= j ∧ i ∈ e ∧ j ∈ e
.
En reprenant l’exemple 3.20, les anciens scores sont multipli´es par 2/3 dans le cas de la chaˆıne
(fig. 3.20a) et par 1 dans le cas de la clique (fig. 3.20b), ce qui donne les scores 26 et 40 : la clique
est maintenant favoris´ee par rapport `a la chaˆıne.
c) Choix d’un appariement par une m´ethode d’optimisation du score
Afin de choisir un bon appariement, nous allons utiliser une m´ethode d’optimisation du score
d´efini pr´ec´edemment.
La maximisation de l’´equation 3.15 est un probl`eme d’optimisation quadratique `a valeurs
binaires. C’est un probl`eme NP-difficile [20, QUADRATIC PROGRAMMING] mais d´ej`a beaucoup
´etudi´e, en particulier dans le domaine de la vision num´erique [15,41]. Une premi`ere solution
consiste `a utiliser une m´ethode spectrale. Comme x
T x = M est une constante, maximiser revient
3. On rappelle que la taille d’une hyper-arˆete est le nombre de sommets qu’elle regroupe.3.3. CONSTRUCTION DES MATRICES DE MIGRATION 47
`a maximiser le quotient de Rayleigh-Ritz [25] x
T Ax
xT x
. Dans le cas o`u x est `a coefficient r´eels, ce
quotient atteint son maximum pour un vecteur propre associ´e `a la plus grande valeur propre.
Mais ici x est `a valeur binaire, et la relaxation du probl`eme ne donne pas de solution convenable.
En effet, approcher le vecteur propre avec un vecteur correspondant `a une permutation est une
approximation trop importante.
D’autres heuristiques pour trouver un bon appariement sont possibles, comme par exemple
des algorithmes probabilistes, combinatoires de type branch & bound, ... Nous avons choisi d’utiliser
un algorithme de recuit simul´e [40] qui donne des r´esultats satisfaisants. En partant d’une
correspondance quelconque, des permutations de deux sommets al´eatoires sont appliqu´ees. Si la
nouvelle correspondance a un meilleur score, elle est conserv´ee. Sinon, elle est conserv´ee ou non
avec une probabilit´e qui d´ecroit exponentiellement avec le nombre d’it´erations. Apr`es un nombre
d’it´erations fix´e, l’algorithme s’arrˆete. Cette m´ethode peut s’appliquer `a n’importe quelle forme
de score et notamment `a la formule du score 3.16.
d) Illustration de la m´ethode de matching
La figure 3.21 pr´esente un exemple de repartitionnement bas´e sur le matching. Dans un premier
temps, une matrice de migration optimale est choisie. Ici, on choisit une matrice combinant
une sous-matrice diagonale avec une sous-matrice en escalier dont l’hypergraphe de repartitionnement
associ´e est repr´esent´e dans la figure 3.21a. Cette classe de matrice a l’avantage de fournir
un nombre de messages par partie souvent plus faible que les matrices construites r´ecursivement
(cf. section 3.2). Ensuite, cet hypergraphe de repartitionnement est mis en correspondance
avec le graphe quotient `a l’aide de l’heuristique de recuit simul´e optimisant la fonction ScoreR
(´equation 3.16). Le r´esultat est visible sur la figure 3.21b. Cette appariement correspond `a une
permutation des lignes de la matrice mais aussi des 5 premi`eres colonnes pour garder une diagonale
optimisant le volume de migration.
La figure 3.22 pr´esente des r´esultats d’application de la m´ethode d’appariement dans diff´erents
cas. On remarque que dans le cas 8×12 (figure 3.22a), le r´esultat est le mˆeme qu’avec la m´ethode
de la chaˆıne. En effet, les matrices 8×12 choisies dans les deux m´ethodes sont ´equivalentes `a une
permutation pr`es dans ce cas pr´ecis. Dans le cas 12×14 (figure 3.22b), il y a de tr`es grandes hyperarˆetes.
Cela risque de poser probl`eme pour la construction des parties associ´ees `a ces grandes
hyper-arˆetes. Ce probl`eme vient du choix de la matrice optimale qui concentre les non-z´eros dans
les derni`eres colonnes de la matrice. Cela aurait pu ˆetre ´evit´e en choisissant un autre type de
matrice, mais le volume total de migration n’aurait pas ´et´e optimal. Le recuit simul´e ne trouve
pas toujours de bonne solution : sur la figure 3.22c, l’hyper-arˆete contenant les sommets 0, 4, 7 et
15 ne contient que deux arˆetes (4–7 de poids 25 et 0–15 de poids 4), mais les autres hyper-arˆetes
sont assez bien plac´ees.
Notons que cette m´ethode de repartitionnement ne peut pas ˆetre appliqu´ee dans le cas o`u les
parties sont initialement d´es´equilibr´ees. La mise en correspondance de l’hypergraphe de repartitionnement
et du graphe quotient n´ecessite que les parties initiales soient interchangeables, ce
qui n’est le cas que quand les parties initiales ont toutes le mˆeme poids.
3.3.3 M´ethode gloutonne (Greedy)
Dans le cas g´en´eral, il n’est pas possible de choisir une matrice avant de l’apparier au graphe
quotient : les anciennes parties ont chacune un poids diff´erent et elles ne sont plus interchangeables.
Il faut construire la matrice de migration directement en tenant compte de la connectivit´e
entre les parties et de leurs diff´erents poids.48 CHAPITRE 3. MODELE DE MIGRATION `
1000 0 0 0 0 400 0
0 1000 0 0 0 400 0
0 0 1000 0 0 200 200
0 0 0 1000 0 0 400
0 0 0 0 1000 0 400
(a) Matrice de migration optimale et hypergraphe de repartitionnement associ´e pour le cas 5 × 7.
39
39
14
34
17
62
65
1000 0 0 0 0 0 400
0 1000 0 0 0 400 0
0 0 1000 0 0 400 0
0 0 0 1000 0 0 400
0 0 0 0 1000 200 200
TotalV = 2000
MaxV = 1000
TotalZ = 6
MaxZ = 3
(b) Hypergraphe appari´e au graphe quotient et matrice de migration finale.
Figure 3.21 – Exemple de repartitionnement bas´e sur le matching dans le cas 5 × 7.3.3. CONSTRUCTION DES MATRICES DE MIGRATION 49
52
22
49
5
26
47
6
50
51
8
24
22
51
(a) Hypergraphe de repartitionnement
dans le cas 8 × 12.
26 21
17
32
26 23
30
12
28
27
40
30
3
9
29
19
22
21
25
21
17
29
29
(b) Hypergraphe de repartitionnement
dans le cas 12 × 14.
27
20
24 4
23
4
5
30 23
21
5
25
21
25
8
21
21
4
25
29
26
10 24
8 26
23
20
28
4 23
23
24
23
(c) Hypergraphe de repartitionnement
dans le cas 16 × 21.
Figure 3.22 – Application du repartitionnement bas´e sur le matching.
a) Construction de la matrice de migration par une m´ethode gloutonne
La matrice de migration C est construite par l’algorithme 2 selon une m´ethode gloutonne en
prenant en entr´ee le graphe quotient Q = (V, E) et le nouveau nombre de parties N. On note
(Pi)i∈J0,M−1K
les anciennes parties et (P
′
j
)j∈J0,N−1K
les nouvelles parties. L’algorithme commence
avec une matrice vide, puis les colonnes de la matrice (correspondant aux hyper-arˆetes de l’hypergraphe
de repartitionnement) sont remplies une par une. Ce remplissage s’effectue de fa¸con
`a respecter les contraintes sur les sommes des lignes et des colonnes qui correspondent respectivement
aux poids des anciennes parties (w(Pi)) et des nouvelles parties (w(P
′
j
)). La migration
peut ˆetre minimis´ee (optdiag = vrai en entr´ee de l’algorithme) en construisant une hyper-arˆete
de taille 1 pour chaque sommet du graphe quotient quand cela est possible, c’est-`a-dire quand
l’ancienne partie est plus grosse que la nouvelle (w(Pi) > w(P
′
j
)). Les hyper-arˆetes suivantes
sont construites de fa¸con gloutonne en commen¸cant par une sommet pseudo-p´eriph´erique (voir
d´efinition 12) de faible degr´e, puis en ajoutant des sommets v un `a un dans l’hyper-arˆete h en
cherchant `a maximiser un score inspir´e de celui pr´esent´e dans la section 3.3.2 :
score (v, h) =|ES(h) ∩ EV (v)|
|EV (v)|
× |ES(h)| ×
P
e∈ES (h)∩EV (v) we P
e∈EV (v) we
×
X
e∈ES (h)
we
avec
ES(h) = {(u, v) ∈ E : u ∈ h ∧ v ∈ h}
EV (v) = {e ∈ E : v ∈ e} .
(3.17)
ES(h) est l’ensemble des arˆetes du sous-graphe d´efini par l’hyper-arˆete h. EV (v) est l’ensemble des
arˆetes dont une extr´emit´e est v (son voisinage). Le score de l’´equation 3.17 reprend du score 3.16
le produit du nombre d’arˆetes et de leur poids permettant d’obtenir des groupes d’anciennes
parties bien connect´ees et le multiplie par la proportion des arˆetes autour du nouveau sommet
v qui sont dans l’hyper-arˆete h, en nombre et en poids. Cette modification du score permet de
mieux guider l’algorithme glouton qui pr´ef´erera alors choisir des sommets sur le bord ou encercl´es
par l’hyper-arˆete, laissant de meilleurs choix pour la construction des hyper-arˆetes suivantes.
Pour chaque sommet ajout´e dans l’hyper-arˆete, on remplit le coefficient correspondant dans
la matrice avec la valeur maximale permettant de respecter les contraintes de poids sur les lignes
et colonnes. Comme les coefficients de la matrice doivent ˆetre positifs, la somme des valeurs
sur la ligne (et respectivement la colonne) ne doit pas d´epasser la taille d’une partie initiale (et
respectivement finale). A une it´eration de notre algorithme, la valeur choisie pour l’´el´eme ` nt Ci,j50 CHAPITRE 3. MODELE DE MIGRATION `
est donc min(w(Pi) −
P
k Ci,k, w(P
′
j
) −
P
k Ck,j ). Comme on veut obtenir une partition finale
´equilibr´ee, on pose ∀j, w(P
′
j
) = wf inal =
W
N
.
Le volume total de migration peut ˆetre minimis´e en commen¸cant par remplir la diagonale de
la matrice de migration avec les plus grandes valeurs possibles. Le reste de la matrice est alors
rempli normalement selon l’heuristique gloutonne.
Algorithme 2 Construction de la matrice de migration C (Greedy1)
Entr´ee : Nombre d’anciennes parties M
Entr´ee : Nombre de nouvelles parties N
Entr´ee : Graphe quotient de l’ancienne partition Q = (V, E)
Entr´ee : Bool´een optdiag indiquant l’optimisation de la diagonale
C ← matrice nulle de dimension M × N
j ← 0 /* Indice de l’hyper-arˆete en cours de construction. */
/* Construction d’hyper-arˆetes de taille 1. */
si optdiag alors
pour tout v ∈ V correspondant `a l’ancienne partie Pi faire
si wv ≥ wf inal et j < N alors
Ci,j ← wf inal
wv ← wv − wf inal
j ← j + 1
fin si
fin pour
fin si
/* Construction gloutonne des hyper-arˆetes */
tant que j < N faire
v ← sommet pseudo-p´eriph´erique de Q d’indice i et de poids wi non nul
h ← {v} /* Hyper-arˆete d’indice j en cours de construction. */
Ci,j ← min(wi
, wf inal)
wi ← wi − Ci,j
tant que P
k Ck,j < wf inal faire
v ← sommet de V d’indice i, de poids wi non nul tel que score(v, h ∪ {v})
soit maximal
h ← h ∪ {v}
Ci,j ← min(wi
, wf inal −
P
k Ck,j )
wi ← wi − Ci,j
fin tant que
j ← j + 1
fin tant que
retourner C
Notre algorithme se base sur la notion de sommet pseudo-p´eriph´erique pour trouver un sommet
sur le « bord » du graphe. Rechercher un sommet p´eriph´erique 4
est plus complexe et n’est
pas n´ecessaire pour l’application de notre heuristique.
D´efinition 11 (Excentricit´e). L’excentricit´e d’un sommet v dans un graphe, not´ee ǫ(v), est la
plus grande distance entre v et n’importe quel autre sommet du graphe.
4. Un sommet p´eriph´erique est un sommet d’excentricit´e maximale.3.3. CONSTRUCTION DES MATRICES DE MIGRATION 51
D´efinition 12 (Sommet pseudo-p´eriph´erique). Un sommet v est un sommet pseudo-p´eriph´erique
si pour tous les sommets u les plus ´eloign´es de v, on a ǫ(v) = ǫ(u) = d(u, v). Plus formellement
v est pseudo-p´eriph´erique si ∀u ∈ V, d(u, v) = ǫ(v) =⇒ d(u, v) = ǫ(u).
Un sommet pseudo-p´eriph´erique peut ˆetre facilement trouv´e comme le montre l’algorithme 3.
En partant d’un sommet quelconque, on cherche, `a l’aide d’un parcours en largeur, un sommet
le plus loin possible (calculant ainsi l’excentricit´e du sommet de d´epart) et de faible degr´e.
Cette recherche est r´ep´et´ee `a partir du nouveau sommet jusqu’`a trouver un sommet dont l’excentricit´e
est ´egale `a celle du sommet pr´ec´edent. En pratique cet algorithme termine en tr`es peu
d’it´erations [21] (2 ou 3 it´erations lors de nos tests).
Algorithme 3 Recherche d’un sommet pseudo-p´eriph´erique de degr´e faible
Entr´ee : Graphe G
u ← sommet quelconque de G
ǫnouveau ← 0
r´ep´eter
Effectuer un parcours en largeur du graphe G en partant de u
v ← sommet avec une distance maximale et un degr´e minimal
ǫcourant ← ǫnouveau
ǫnouveau ← d(u, v) /* correspond `a l’excentricit´e de u */
u ← v
jusqu’`a ǫnouveau = ǫcourant
retourner u
b) Optimisation du nombre de messages par une recherche de sous-ensembles
L’algorithme 2 construit une matrice de migration avec M + N − 1 messages. A chaque `
it´eration, la valeur de l’´el´ement est choisie pour satisfaire la contrainte de poids sur la ligne ou
la colonne, sauf `a la derni`ere it´eration o`u les contraintes sur la ligne et la colonne de l’´el´ement
sont satisfaites. Comme il y a M lignes et N colonnes, il y a au plus M + N − 1 it´erations et
´el´ements non nuls.
Il est possible de diminuer ce nombre de messages en d´ecomposant le probl`eme de construction
de la matrice de migration en plusieurs sous-probl`emes de repartitionnement sur des sousensembles
disjoints de parties, comme le montre la d´emonstration du lemme 2. Pour d´ecomposer
le probl`eme en K sous-probl`emes, l’ensemble des parties (Pi)i∈J1,MK est partitionn´e en K
sous-ensembles (Sj )j∈J1,KK
. Pour chaque sous ensemble Sj , la somme des poids des parties qu’il
contient est `a peu pr`es un multiple de la taille id´eale d’une partie finale. Plus formellement, avec
un facteur de d´es´equilibre ǫ, un sous-ensemble Sj est de « bonne taille » si il existe un entier Nj
tel que P
j Nj = N et
(1 − ǫ) × Nj
W
N
<
X
Pi∈Sj
w(Pi) < (1 + ǫ) × Nj
W
N
.
On note Mj = |Sj | la taille de chaque sous-ensemble. Comme les sous-ensembles sont une partition
de l’ensemble des parties, on a P
j Mj = M. Chaque sous probl`eme est donc de taille
Mj × Nj et construit une sous-matrice de migration avec Mj + Nj − 1 messages. Le nombre
de messages total est donc M + N − K. Pour minimiser le nombre de messages, il faut donc
trouver le plus possible de sous-ensembles. Dans le cas ´equilibr´e, on trouvait pgcd(M, N) tels
sous-ensembles de chacun M/pgcd(M, N) parties.52 CHAPITRE 3. MODELE DE MIGRATION `
La recherche de tels sous-ensembles est une version plus g´en´erale du probl`eme de la somme
d’un sous-ensemble 5 qui est NP-complet [20, SUBSET SUM]. Ces sous-ensembles peuvent ˆetre
construits avec un algorithme glouton similaire `a celui de construction de la matrice de migration.
Dans l’algorithme 4, on commence par trouver un sommet pseudo-p´eriph´erique dans le graphe
quotient, puis on cherche parmi ses voisins si il existe un sommet permettant de cr´eer un sousensemble
de la bonne taille, sinon on en choisit un qui maximise le score du sous-ensemble comme
dans l’algorithme 2. Puis on recommence `a chercher parmi les voisins du sous-ensemble jusqu’`a
construire un sous-ensemble de bonne taille. Au pire, l’algorithme termine en s´electionnant tous
les sommets du graphe quotient dans un seul sous-ensemble, puisque par d´efinition de la taille
id´eale, le poids total du graphe vaut N fois celle-ci.
Algorithme 4 Construction de la matrice de migration avec une recherche de sous-ensembles
(Greedy2)
Entr´ee : Nombre d’anciennes parties M
Entr´ee : Nombre de nouvelles parties N
Entr´ee : Graphe quotient Q = (V, E)
R ← V /* Ensemble des sommets restants */
tant que R 6= ∅ faire
u ← un sommet pseudo-p´eriph´erique du sous-graphe de Q restreint `a R
S ← {u}
R ← R \ {u}
tant que S n’est pas un sous-ensemble de bonne taille pour N′ nouvelles parties faire
si il existe v ∈ R tel que v est connect´e `a S et S ∪ {v} est de bonne taille alors
S ← S ∪ {v} /* S´electionner v */
R ← R \ {v}
sinon
u ← sommet maximisant le score du sous-ensemble S ∪ {u}
S ← S ∪ {u} /* S´electionner u */
R ← R \ {u}
fin si
fin tant que
Construire la sous-matrice |S| × N′ associ´ee au sous-ensemble S (appel de l’algorithme 2
(Greedy1) sur le sous-graphe de Q restreint `a S)
fin tant que
Un exemple d’application de ces algorithmes est pr´esent´e sur les figures 3.23 `a 3.25 avec
le cas 5 × 7 d´es´equilibr´e. La figure 3.23 pr´esente la recherche des sous-ensembles, alors que les
figures 3.24 et 3.25 pr´esentent respectivement les constructions des sous-matrices pour chacun
des sous-ensembles. Les poids des parties initiales sont dans l’ordre 500, 900, 2400, 1500 et
1700. Les parties finales devront ˆetre de poids 1000. Les valeurs indiqu´ees `a cot´e des sommets
correspondent aux donn´ees des anciennes parties qui n’ont pas encore ´et´e affect´ees dans une
nouvelle. Les ´el´ements de la matrice ne faisant pas partie de la sous-matrice concern´ee sont
gris´es.
L’algorithme commence par chercher un sous-ensemble en partant d’un sommet pseudop´eriph´erique
(figure 3.23a). Parmi les voisins, la partie 3 permet d’avoir un sous-ensemble adapt´e
5. Etant donn´e un ensemble d’entiers, existe-t-il un sous-en ´ semble non vide dont la somme vaut une valeur
donn´ee ?3.3. CONSTRUCTION DES MATRICES DE MIGRATION 53
39
39
14
34
17
62
65
500
1 900
2 2400
3 1500
4 1700
(a) Premi`ere ´etape de
la construction des sousensembles.
39
39
14
34
17
62
65
500
1 900
2 2400
4 1700
(b) Seconde ´etape de la
construction des sousensembles
: le premier
sous-ensemble est termin´e.
39
39
14
34
17
62
65
500
900
(c) Cinqui`eme et derni`ere ´etape
de la construction des sousensembles.
Figure 3.23 – Construction des sous-ensembles.
au repartitionnement en 2 parties (500+1500 = 2×1000) (figure 3.23b). L’algorithme de construction
de la matrice de migration est alors appliqu´e sur le sous-ensemble {0, 3}. La partie 0 est trop
petite pour cr´eer une hyper-arˆete de taille 1 (figure 3.24a). La partie 3 a un poids suffisant donc
1000 est ajout´e sur la diagonale (figure 3.24b). Il reste alors une hyper-arˆete `a construire : elle
part du sommet 0 (figure 3.24c) et s’´etend sur le seul sommet voisin 3 (figure 3.24d). Les deux
hyper-arˆetes n´ecessaires sont donc construites et toutes les donn´ees de 0 et 3 ont ´et´e redistribu´ees.
Le second sous-ensemble est construit avec le reste du graphe quotient (figure 3.23c). Les
parties 1, 2 et 4 seront repartitionn´ees vers 5 parties (900 + 2400 + 1700 = 5 × 1000). On commence
par construire les hyper-arˆetes de taille 1 (figure 3.25a) pour optimiser la diagonale de
la matrice, ici 2 et 4 sont de poids suffisants. L’hyper-arˆete suivante est construite `a partir de 1
(figure 3.25b) et s’´etend sur le voisin « libre » le plus connect´e `a 1 : 2 (figure 3.25c). La suivante
est construite `a partir de 2 qui a encore assez de donn´ees (1300) pour construire une hyper-arˆete
de taille 1 (figure 3.25d). La derni`ere hyper-arˆete part de 2 (figure 3.25e) et s’´etend sur le seul
sommet restant, la partie 4 (figure 3.25f).
Par la suite, nous utiliserons syst´ematiquement la recherche des sous-ensembles (Greedy2)
pour notre algorithme glouton (Greedy).
c) Illustration de la m´ethode gloutonne
Les figures 3.26 et 3.27 pr´esentent des r´esultats de la m´ethode gloutonne avec optimisation de
la diagonale dans les cas ´equilibr´es et d´es´equilibr´es. Comme avec la m´ethode d’appariement, de
grandes hyper-arˆetes sont cr´e´ees. Cela est dˆu au remplissage de la diagonale qui laisse de petits
restes pour cr´eer les parties suppl´ementaires. Dans le cas d´es´equilibr´e, cet effet est att´enu´e : la
diagonale ne peut pas toujours ˆetre remplie et les restes peuvent ˆetre plus importants.
Les figures 3.28 et 3.29 montrent les r´esultats dans les mˆemes cas, mais sans l’optimisation
de la diagonale. Les tailles des hyper-arˆetes sont bien plus raisonnables. Comme avec la m´ethode
de la chaˆıne, les nouvelles parties sont souvent plac´ees entre deux anciennes parties voisines.54 CHAPITRE 3. MODELE DE MIGRATION `
39
39
14
34
17
62
65
0 500
1 0
2 0
3 1500
4 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
(a) Premi`ere ´etape du remplissage de la diagonale.
39
39
14
34
17
62
65
0 500
1 0
2 0
500
4 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 1000 0 0 0
0 0 0 0 0 0 0
(b) Seconde ´etape du remplissage de la diagonale.
39
39
14
34
17
62
65
0
1 0
2 0
500
4 0
500 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 1000 0 0 0
0 0 0 0 0 0 0
(c) Premi`ere ´etape de la construction de la seconde
hyper-arˆete.
39
39
14
34
17
62
65
0
1 0
2 0
4 0
500 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0 0
500 0 0 1000 0 0 0
0 0 0 0 0 0 0
(d) L’hyper-arˆete est construite.
Figure 3.24 – Construction des sous-ensembles et de la sous-matrice correspondant au premier
sous-ensemble {0, 3}.3.3. CONSTRUCTION DES MATRICES DE MIGRATION 55
39
39
14
34
17
62
65
1 900
1400
700
500 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 1000 0 0 0 0
500 0 0 1000 0 0 0
0 0 0 0 1000 0 0
(a) Remplissage de la diagonale.
39
39
14
34
17
62
65
1400
700
500 0 0 0 0 0 0
0 900 0 0 0 0 0
0 0 1000 0 0 0 0
500 0 0 1000 0 0 0
0 0 0 0 1000 0 0
(b) Premi`ere ´etape de la construction de la troisi`eme
hyper-arˆete.
39
39
14
34
17
62
65
700
500 0 0 0 0 0 0
0 900 0 0 0 0 0
0 100 1000 0 0 0 0
500 0 0 1000 0 0 0
0 0 0 0 1000 0 0
(c) Seconde ´etape de la construction de la troisi`eme
hyper-arˆete.
39
39
14
34
17
62
65
700
500 0 0 0 0 0 0
0 900 0 0 0 0 0
0 100 1000 0 0 1000 0
500 0 0 1000 0 0 0
0 0 0 0 1000 0 0
(d) Construction de la quatri`eme hyper-arˆete.
39
39
14
34
17
62
65
700
500 0 0 0 0 0 0
0 900 0 0 0 0 0
0 100 1000 0 0 1000 300
500 0 0 1000 0 0 0
0 0 0 0 1000 0 0
(e) Premi`ere ´etape de la construction de la cinqui`eme
hyper-arˆete.
39
39
14
34
17
62
65
500 0 0 0 0 0 0
0 900 0 0 0 0 0
0 100 1000 0 0 1000 300
500 0 0 1000 0 0 0
0 0 0 0 1000 0 700
(f) Seconde ´etape de la construction de la cinqui`eme
hyper-arˆete et fin de l’algorithme.
Figure 3.25 – Construction de la sous-matrice correspondant au second sous-ensemble {1, 2, 4}.56 CHAPITRE 3. MODELE DE MIGRATION `
52
22
49
5
26
47
6
50
51
8
24
22
51
(a) Hypergraphe de repartitionnement
dans le cas 8 × 12
´equilibr´e.
26 21
17
32
26 23
30
12
28
27
40
30
3
9
29
19
22
21
25
21
17
29
29
(b) Hypergraphe de repartitionnement
dans le cas 12 × 14
´equilibr´e.
27
20
24 4
23
4
5
30 23
21
5
25
21
25
8
21
21
4
25
29
26
10 24
8 26
23
20
28
4 23
23
24
23
(c) Hypergraphe de repartitionnement
dans le cas 16×21 ´equilibr´e.
Figure 3.26 – Evaluation du repartitionnement `a l’aide de l’algorithme glouton avec op ´ timisation
de la diagonale dans des cas ´equilibr´es.
52
22
49
5
26
47
6
50
51
8
24
22
51
(a) Hypergraphe de repartitionnement
dans le cas 8 × 12
d´es´equilibr´e.
26 21
17
32
26 23
30
12
28
27
40
30
3
9
29
19
22
21
25
21
17
29
29
(b) Hypergraphe de repartitionnement
dans le cas 12 × 14
d´es´equilibr´e.
27
20
24 4
23
4
5
30 23
21
5
25
21
25
8
21
21
4
25
29
26
10 24
8 26
23
20
28
4 23
23
24
23
(c) Hypergraphe de repartitionnement
dans le cas 16 × 21 d´es-
´equilibr´e.
Figure 3.27 – Evaluation du repartitionnement `a l’aide de l’algorithme glouton avec op ´ timisation
de la diagonale dans des cas d´es´equilibr´es.3.3. CONSTRUCTION DES MATRICES DE MIGRATION 57
52
22
49
5
26
47
6
50
51
8
24
22
51
(a) Hypergraphe de repartitionnement
dans le cas 8 × 12
´equilibr´e.
26 21
17
32
26 23
30
12
28
27
40
30
3
9
29
19
22
21
25
21
17
29
29
(b) Hypergraphe de repartitionnement
dans le cas 12 × 14
´equilibr´e.
27
20
24 4
23
4
5
30 23
21
5
25
21
25
8
21
21
4
25
29
26
10 24
8 26
23
20
28
4 23
23
24
23
(c) Hypergraphe de repartitionnement
dans le cas 16×21 ´equilibr´e.
Figure 3.28 – Evaluation du repartitionnement `a l’aide de l’algorithme glouton sans opt ´ imisation
de la diagonale dans des cas ´equilibr´es.
52
22
49
5
26
47
6
50
51
8
24
22
51
(a) Hypergraphe de repartitionnement
dans le cas 8 × 12
d´es´equilibr´e.
26 21
17
32
26 23
30
12
28
27
40
30
3
9
29
19
22
21
25
21
17
29
29
(b) Hypergraphe de repartitionnement
dans le cas 12 × 14
d´es´equilibr´e.
27
20
24 4
23
4
5
30 23
21
5
25
21
25
8
21
21
4
25
29
26
10 24
8 26
23
20
28
4 23
23
24
23
(c) Hypergraphe de repartitionnement
dans le cas 16 × 21 d´es-
´equilibr´e.
Figure 3.29 – Evaluation du repartitionnement `a l’aide de l’algorithme glouton sans opt ´ imisation
de la diagonale dans des cas d´es´equilibr´es.58 CHAPITRE 3. MODELE DE MIGRATION `
3.3.4 Programme lin´eaire (LP)
Les m´ethodes de repartitionnement diffusives [26,46] optimisent le volume de migration en effectuant
des communications entre les parties voisines sur le graphe quotient (cf. section 2.3.2 b)).
Nous proposons d’´etendre la m´ethode en utilisant un programme lin´eaire dans le cas du repartitionnement
avec changement dynamique du nombre de processeurs et pour optimiser les
diff´erentes m´etriques TotalV, MaxV, TotalZ et MaxZ.
Le principal probl`eme de cette adaptation est que le graphe quotient ne prend en compte que
les anciennes parties et non les nouvelles. Il faut donc adapter celui-ci pour prendre en compte ce
changement de nombre de parties. Pour un repartitionnement de M vers N parties, on utilise un
graphe d´ecrivant les messages possibles entre max(M, N) parties. Le poids de certaines parties
peut ˆetre initialement nul, si elles n’existaient pas dans l’ancienne partition (cas o`u M < N) ; on
peut aussi vouloir un poids final nul pour les parties qui n’existent pas dans la nouvelle partition
(cas o`u M > N).
Dans le cas o`u le nombre de parties augmente (M < N), il faut ajouter des nouveaux
sommets dans le graphe quotient et, pour que la migration soit possible, connecter ces nouveaux
sommets avec le reste du graphe. En effet, Hu et al. [26] montrent que pour qu’une solution soit
possible, le graphe doit ˆetre connexe. On veut donc construire `a partir du graphe quotient Q, un
nouveau graphe quotient enrichi Q˜. La fa¸con dont sont connect´es ces nouveaux sommets influence
grandement la migration optimale possible, mais aussi la coupe de la partition finale. Pour obtenir
une bonne migration, il faut placer les nouvelles parties proches des anciennes parties capables
de fournir les sommets n´ecessaires. Pour obtenir une bonne coupe, il faut connecter les nouvelles
parties avec des anciennes proches entre elles. Une m´ethode na¨ıve pour trouver de tels placements
est de rechercher dans le graphe quotient de petites cliques de parties bien connect´ees entre elles
et poss´edant un poids ´elev´e.
Dans le cas o`u le nombre de parties diminue, le graphe quotient n’a pas besoin d’ˆetre modifi´e
mais il faut choisir les parties qui seront supprim´ees, c’est-`a-dire dont le poids final vis´e est nul.
a) Optimisation du volume total de migration TotalV
Une fois le graphe Q˜ des messages autoris´es construit, il faut d´ecider du volume de donn´ees
`a communiquer sur chaque arˆete. Pour minimiser le volume total de migration, il est possible
d’utiliser le programme lin´eaire suivant :
minimiser X
i,j
eij
. Contraintes lin´eaires :
∀i ∈ V, vi =
X
j
(eji − eij ). (3.18)
Bornes :
∀i ∈ V, vi ≤ di + ub. (3.19)
∀(i, j) ∈ E, 0 ≤ eij . (3.20)
On note eij la quantit´e de donn´ees envoy´ees par la partie i vers la partie j. Cette variable
est toujours positive ou nulle (´equation 3.20) ; si le message se passe dans l’autre sens, eij est
nul et eji contient le volume de donn´ees ´echang´ees. vi est la variation de la quantit´e de donn´ees
de la partie i et est ´egale `a la diff´erence des donn´ees re¸cues et envoy´ees (´equation 3.18). di est3.3. CONSTRUCTION DES MATRICES DE MIGRATION 59
1
2
3
1
3
2
4
4 3
5
2
3 3
0
Figure 3.30 – Exemple de partition initiale et de son graphe quotient enrichi.
la variation souhait´ee de la quantit´e de donn´ees de la partie i, c’est-`a-dire la diff´erence entre le
poids initial et le poids souhait´e. vi doit ˆetre `a peu pr`es ´egal `a di `a une tol´erance de d´es´equilibre
ub pr`es (´equation 3.19).
Par exemple, en prenant la partition en trois parties de la figure 3.30, on construit un graphe
quotient de trois sommets auquel on ajoute un quatri`eme pour repartitionner en 4 parties. Ici,
le nouveau sommet est connect´e aux trois autres.
L’application des contraintes 3.18 donne :
v1 = e21 − e12 + e31 − e13 + e41 − e14
v2 = e12 − e21 + e21 − e23 + e42 − e24
v3 = e13 − e31 + e23 − e32 + e43 − e34
v4 = e14 − e41 + e24 − e42 + e34 − e43
et les bornes 3.19 :
v1 ≤ −1
v2 ≤ 0
v3 ≤ −2
v4 ≤ 3.
De plus tous les eij sont positifs ou nuls. La solution de ce probl`eme est :
e41 = 1
e43 = 2
et tous les autres eij sont nuls. Ce qui veut dire que la partie 1 devra envoyer un sommet `a la
partie 4 et la partie 3 devra en envoyer deux. Il n’y a pas d’autre communication.
b) Extension `a d’autres m´etriques
Il est possible d’´etendre le programme lin´eaire pour d’autres objectifs, tels que : MaxV,
TotalZ, MaxZ ou n’importe quelle combinaison lin´eaire de ceux-ci.
Pour optimiser MaxV, il suffit d’ajouter une variable v repr´esentant le volume maximal de
migration par partie. On cherche donc `a minimiser v = maxi∈V
P
j
(eij + eji)
. Cela se traduit
par les contraintes suppl´ementaires :60 CHAPITRE 3. MODELE DE MIGRATION `
39
39
14
34
17 62
65 0 2020
1 1984
2 1986
3 2014
4 1996
(a) Graphe quotient.
39
39
14
34
17
62
65
(b) Groupes de sommets retenus
pour les nouvelles parties
ajout´ees.
0
1
2
3
4
5
6
(c) Graphe quotient enrichi
avec les nouveaux sommets.
1500 0 0 0 0 520 0
0 1184 0 0 0 0 800
0 0 1428 0 0 0 558
0 0 0 1500 0 514 0
0 172 0 0 1500 324 0
(d) Matrice de migration obtenue pour l’optimisation de TotalV.
Figure 3.31 – Enrichissement du graphe quotient puis construction de la matrice de migration
pour le cas 5 × 7.
∀i ∈ V,X
j
(eij + eji) ≤ v. (3.21)
v ´etant minimis´e, il vaut bien la plus grande des valeurs P
j
(eij + eji).
Lorsque les valeurs eij sont enti`eres, on peut ajouter des variables binaires xij pour chaque
arˆete donnant l’existence ou non d’un message sur cette arˆete grˆace aux contraintes :
xij ≤ eij ≤ W xij . (3.22)
W est le poids total du graphe, aucun message ne peut d´epasser cette taille. En ´etudiant les deux
cas possibles suivant la valeur de xij , on obtient :
eij = 0 si xij = 0
1 ≤ eij ≤ W si xij = 1.
(3.23)
xij correspond donc bien `a l’existence d’un message de la partie i vers la partie j. Il est alors
possible de minimiser TotalZ en minimisant la somme des xij et MaxZ en utilisant une m´ethode
similaire `a celle pour MaxV.
Les programmes lin´eaires complets pour les diff´erentes m´etriques sont d´ecrits dans l’annexe A.
c) Application du programme lin´eaire
Pour enrichir le graphe quotient, un algorithme recherche, pour chaque nouvelle partie suppl´ementaire,
de petits groupes de sommets (de taille 1, 2 ou 3) bien connect´es et de poids importants.3.3. CONSTRUCTION DES MATRICES DE MIGRATION 61
52
22
49
5
26
47
6
50
51
8
24
22
51
(a) Hypergraphe de repartitionnement
dans le cas 8 × 12
´equilibr´e.
26 21
17
32
26 23
30
12
28
27
40
30
3
9
29
19
22
21
25
21
17
29
29
(b) Hypergraphe de repartitionnement
dans le cas 12 × 14
´equilibr´e.
27
20
24 4
23
4
5
30 23
21
5
25
21
25
8
21
21
4
25
29
26
10 24
8 26
23
20
28
4 23
23
24
23
(c) Hypergraphe de repartitionnement
dans le cas 16×21 ´equilibr´e.
Figure 3.32 – Application de la construction de la matrice de migration `a l’aide du programme
lin´eaire dans des cas ´equilibr´es.
Nous ne d´etaillerons pas ici cet algorithme qui utilise une approche gloutonne selon un crit`ere
comparable `a celui de la m´ethode Greedy, mais en bornant la taille des hyper-arˆetes (entre 1 et
3). Sur l’exemple de la figure 3.31, pour passer de 5 `a 7 parties, il faut ajouter deux nouvelles
parties : un groupe de trois sommets et un groupe de deux sont choisis (fig. 3.31b). Les deux
nouveaux sommets sont connect´es aux anciens sommets d’apr`es ces ensembles (fig. 3.31c). En
appliquant le programme lin´eaire pour l’optimisation de TotalV sur ce graphe quotient enrichi,
on obtient 6 messages : 5 messages correspondant aux arˆetes ajout´ees pour cr´eer les nouvelles
parties suppl´ementaires et un message entre les parties 4 et 1. Pr´esent´es sous forme de matrice
de migration, ces r´esultats donnent la matrice sur la figure 3.31d. Les valeurs sur la diagonale (en
gris) ne sont pas obtenues directement par le programme lin´eaire mais calcul´ees indirectement
d’apr`es les tailles des messages et les tailles des anciennes parties.
52
22
49
5
26
47
6
50
51
8
24
22
51
(a) Hypergraphe de repartitionnement
dans le cas 8 × 12
d´es´equilibr´e.
26 21
17
32
26 23
30
12
28
27
40
30
3
9
29
19
22
21
25
21
17
29
29
(b) Hypergraphe de repartitionnement
dans le cas 12 × 14
d´es´equilibr´e.
27
20
24 4
23
4
5
30 23
21
5
25
21
25
8
21
21
4
25
29
26
10 24
8 26
23
20
28
4 23
23
24
23
(c) Hypergraphe de repartitionnement
dans le cas 16 × 21 d´es-
´equilibr´e.
Figure 3.33 – Application de la construction de la matrice de migration `a l’aide du programme
lin´eaire dans des cas d´es´equilibr´es.
Les r´esultats obtenus pour diff´erents cas avec l’optimisation de TotalV sont pr´esent´es sur62 CHAPITRE 3. MODELE DE MIGRATION `
les figures 3.32 et 3.33. Les tailles des hyper-arˆetes finales correspondant aux nouvelles parties
sont effectivement limit´ees `a un maximum de 3 et les autres communications se font uniquement
le long des arˆetes du graphe quotient.
Cet algorithme optimise la m´etrique souhait´ee, mais relativement `a un graphe quotient enrichi
donn´e dont la construction ne permet pas toujours une migration optimale.
3.4 Evaluation des m´ethodes et conclusion ´
Nous comparons les m´ethodes de construction de matrice de migration pr´esent´ees dans ce
chapitre : la m´ethode bas´ee sur la chaˆıne (1D), la m´ethode d’appariement (Matching, seulement
dans le cas ´equilibr´e), les deux variantes de l’algorithme glouton avec optimisation de la diagonale
(GreedyD) et sans (Greedy) et le programme lin´eaire optimisant TotalV (LP).
Les m´ethodes pr´esent´ees sont ´evalu´ees sur six cas ´equilibr´es et d´es´equilibr´es. Les trois cas
´equilibr´es sont :
— 8×12 avec des anciennes parties de taille 1500 et donc des nouvelles parties de taille 1000 ;
— 12 × 14 avec des anciennes parties de taille 1000 et donc des nouvelles parties de taille
857 ;
— 16 × 21 avec des anciennes parties de taille 1000 et donc des nouvelles parties de taille
761.
Les trois cas d´es´equilibr´es utilisent les mˆemes nombres de parties :
— 8 × 12 avec un d´es´equilibre de 49 % et des nouvelles parties de taille 1509 ;
— 12 × 14 avec un d´es´equilibre de 58 % et des nouvelles parties de taille 1311 ;
— 16 × 21 avec un d´es´equilibre de 50 % et des nouvelles parties de taille 922.
Ces d´es´equilibres ont ´et´e r´ealis´es avec la m´ethode utilis´ee par l’article [56] : pour chaque partie,
un nombre al´eatoire de sommets sont s´electionn´es pour avoir leur poids tripl´es, conduisant `a un
d´es´equilibre d’environ 50 %.
Les tableaux 3.1 et 3.2 pr´esentent les m´etriques associ´ees aux applications pr´esent´ees dans
les sections pr´ec´edentes. Les quatre m´etriques pr´esent´ees ne permettent pas d’´evaluer la qualit´e
de la coupe finale mais seulement la qualit´e de la migration. La coupe ne pourra ˆetre ´evalu´ee
qu’apr`es le repartitionnement dans le chapitre 5.
En dehors du repartitionnement 8×12 dans le cas ´equilibr´e, on remarque que les optimisations
de TotalV et MaxZ sont contradictoires. En effet, comme expliqu´e avec la m´ethode d’appariement,
l’optimisation de la diagonale oblige les nouvelles parties suppl´ementaires `a prendre
les donn´ees depuis de nombreuses anciennes parties, ce qui favorise des hyper-arˆetes de grandes
tailles et donc l’augmentation de MaxZ. Les m´ethodes 1D et Greedy donnent un MaxZ bas
mais un TotalV plus ´elev´e, contrairement aux m´ethodes Matching (avec choix d’une matrice
diagonale) et GreedyD qui optimisent en priorit´e TotalV. Le cas du programme lin´eaire est
particulier : bien que le programme lin´eaire minimise TotalV, la construction du graphe quotient
enrichi impose un degr´e faible. Malgr´e cette minimisation, TotalV peut ˆetre plus ´elev´e
qu’avec d’autres m´ethodes mais MaxZ est maintenu bas. TotalV aurait pu ˆetre plus bas avec
un choix de graphe quotient enrichi diff´erent. Il est ´egalement possible d’utiliser le programme
lin´eaire pour optimiser d’autres crit`eres.
Dans le cas 8 × 12 ´equilibr´e, il existe une solution donnant `a la fois un TotalV bas et un
MaxZ bas que toutes les m´ethodes trouvent. Le programme lin´eaire est capable de donner un
TotalV plus bas que l’optimal (4000) en profitant de la tol´erance au d´es´equilibre.
Le MaxV varie peu d’une m´ethode `a l’autre et il est g´en´eralement proche de la taille d’une
nouvelle partie. Une nouvelle partie devant recevoir l’int´egralit´e de ses donn´ees, il n’est pas3.4. EVALUATION DES M ´ ETHODES ET CONCLUSION ´ 63
possible d’avoir un MaxV inf´erieur `a la taille id´eale d’une nouvelle partie.
Dans le cas ´equilibr´e, le TotalZ optimal est bien atteint pour toutes les m´ethodes sauf le
programme lin´eaire qui n’optimise pas ce crit`ere. Dans le cas d´es´equilibr´e, l’optimal n’est pas
connu. La m´ethode de la chaˆıne atteint max(M, N) − 1 messages et les algorithmes gloutons
donne un nombre de messages inf´erieur grˆace `a la recherche des sous-ensembles. Bien que le
programme lin´eaire n’optimise pas le nombre de messages, celui-ci reste tr`es bas. C’est un effet
de bord de la minimisation de TotalV.
Dans la suite de cette th`ese, nous retiendrons les m´ethodes utilisant l’algorithme glouton
(Greedy et GreedyD) et le programme lin´eaire (LP). L’algorithme glouton permet de minimiser
TotalZ et offre deux variantes permettant au choix de minimiser fortement TotalV ou de
garder MaxZ bas. La m´ethode d’appariement (Matching) n’est pas utilisable dans le cas g´en´eral
et la m´ethode 1D donne des r´esultats comparables `a la m´ethode Greedy (MaxZ faible mais
TotalV plus ´elev´e) mais avec de moins bons r´esultats.
La construction de matrices de migration `a partir du graphe quotient est la premi`ere ´etape
de notre m´ethode de repartitionnement dont la d´emarche globale est rappel´ee en figure 3.34. Les
matrices de migration ainsi construites vont ˆetre utilis´ees par les algorithmes de repartitionnement
de graphe pr´esent´es dans le chapitre suivant.64 CHAPITRE 3. MOD
`ELE DE MIGRATION
1D (fig. 3.14) Matching
(fig. 3.22)
GreedyD
(fig. 3.26)
Greedy
(fig. 3.28)
LP (fig. 3.32)
Cas 8 × 12
TotalV 4000 4000 4000 4000 3960
MaxV 1000 1000 1000 1000 900
TotalZ 8 8 8 8 8
MaxZ 2 2 2 2 2
Cas 12 × 14
TotalV 3427 1714 1714 3426 2900
MaxV 857 857 857 857 939
TotalZ 12 12 12 12 13
MaxZ 2 6 6 2 3
Cas 16 × 21
TotalV 5239 3808 3808 5335 5606
MaxV 762 762 762 762 1150
TotalZ 20 20 20 20 20
MaxZ 2 4 4 3 3
Table 3.1 – R´esultats des diff´erentes m´ethodes dans le cas ´equilibr´e.3.4. EVALUATION DES M ´ ETHODES ET CONCLUSION ´ 65 1D (fig. 3.16) GreedyD (fig. 3.27) Greedy (fig. 3.29) LP (fig. 3.33) Cas 8 × 12 TotalV 7453 6266 7127 6299 MaxV 1871 1869 1869 1862 TotalZ 11 10 10 10 MaxZ 2 4 3 2 Cas 12 × 14 TotalV 5064 5960 5769 5261 MaxV 1311 1372 1372 2013 TotalZ 13 12 12 13 MaxZ 2 3 3 4 Cas 16 × 21 TotalV 6200 5504 6138 5858 MaxV 922 922 923 1103 TotalZ 20 18 18 19 MaxZ 2 5 3 4 Table 3.2 – R´esultats des diff´erentes m´ethodes dans le cas d´es´equilibr´e.66 CHAPITRE 3. MOD
`ELE DE MIGRATION Méthode d'appariement (Matching) Méthode de la chaîne (1D)
Méthode gloutonne (Greedy)
Méthode de partitionnement biaisé (Biased)
Méthode diffusive (Diff)
Hyper-arêtes de repartitionnement
Matrice de
migration
Graphe
quotient
Nouvelle
partition
en N
Graphe
partitionné
en M
Construction de la matrice de migration M×N
Repartitionnement M×N
Programme linéaire (LP)
Figure 3.34 – Vue d’ensemble.Chapitre 4
Repartitionnement M × N
Sommaire
4.1 Repartitionnement M×N bas´e sur le partitionnement biais´e (BIASED)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.1.1 M´ethodologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.1.2 Limitations des partitionneurs . . . . . . . . . . . . . . . . . . . . . . 71
4.2 Partitionnement k-aire direct (KGGGP) . . . . . . . . . . . . . . . 73
4.2.1 Description de l’algorithme . . . . . . . . . . . . . . . . . . . . . . . . 73
4.2.2 Crit`eres de s´election . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.2.3 Complexit´e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.2.4 Am´eliorations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2.5 Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 ´
4.3 Repartitionnement M × N bas´e sur la diffusion (DIFF) . . . . . . . 85
4.4 Partitionnement biais´e `a l’aide d’hyper-arˆetes de repartitionnement 89
4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Dans ce chapitre, nous pr´esentons nos algorithmes de repartitionnement M × N, r´esum´es en
figure 4.1. Nos m´ethodes de repartitionnement biais´e (BIASED) et diffusive (DIFF) s’inspirent
des m´ethodes de repartitionnement classiques du mˆemes noms mais sont ´etendues dans le cas
du repartitionnement avec un nombre de processeurs variable. Ces deux m´ethodes se basent
sur une matrice de migration obtenue `a l’aide d’un des algorithmes pr´esent´es dans le chapitre
pr´ec´edent. De plus, dans le cadre de notre partitionnement biais´e, nous mettons en ´evidence des
limitations de la m´ethode des bissections r´ecursives largement utilis´ee par les diff´erents outils
de partitionnement actuels, et nous proposons une m´ethode de partitionnement k-aire direct
(KGGGP) qui surmonte ces limitations.
4.1 Repartitionnement M × N bas´e sur une m´ethode de
partitionnement biais´e (BIASED)
Nous pr´esentons dans cette section une m´ethode partitionnement biais´e permettant de r´ealiser
un repartitionnement M × N en respectant un mod`ele de migration donn´e par une matrice C.
Cette m´ethode n’impose que les messages donn´es dans le mod`ele de migration et non leur volume.
N´eanmoins, les volumes sont respect´es lorsque le nombre de messages de C est minimal, comme
6768 CHAPITRE 4. REPARTITIONNEMENT M × N
Méthode de partitionnement biaisé (Biased)
Méthode diffusive (Diff)
Hyperarêtes de repartitionnement
Matrice de
migration
Nouvelle
partition
en N
Graphe
partitionné
en M
Repartitionnement M×N
Figure 4.1 – Vue d’ensemble de nos algorithmes de repartitionnement M × N d’un graphe.
nous le verrons dans la section suivante. Cette m´ethode est donc d´econseill´ee pour les mod`eles de
migration n’optimisant pas TotalZ, en particulier ceux obtenus `a l’aide du programme lin´eaire
optimisant seulement TotalV, MaxV ou MaxZ.
Cette m´ethode de partitionnement biais´e s’inspire des m´ethodes de repartitionnement utilisant
des sommets fixes [2, 8, 9] (cf. section 2.3.2). Le graphe est enrichi avec des sommets fixes et
de nouvelles arˆetes puis il est partitionn´e avec un partitionneur acceptant les sommets fixes.
4.1.1 M´ethodologie
Pour cr´eer un nouvelle partition respectant le mod`ele de communication construit grˆace aux
m´ethodes pr´esent´ees dans le chapitre 3, on utilise une m´ethode de repartitionnement `a sommet
fixes. De la mˆeme fa¸con que dans le cas du repartitionnement sans changement du nombre de
processeurs, on ajoute N sommets fixes de poids nuls repr´esentant les processeurs. Mais au lieu
de les connecter aux sommets de leur ancienne partie, ils sont connect´es aux sommets des parties
dont on accepte qu’ils re¸coivent des donn´ees, conform´ement `a la matrice C.
Plus pr´ecis´ement, pour repartitionner un graphe G de M parties vers N et obtenir une nouvelle
partition P
′
, ´etant donn´e une ancienne partition P = (Pi)i∈J1,MK et une matrice de migration
C, il faut :
1. construire un graphe enrichi G˜ = (V , ˜ E˜) `a partir de G avec :
— N sommets fixes (fj )j∈J1,NK de poids nuls, chacun fix´e dans une nouvelle partie diff´erente
j ;
— des arˆetes suppl´ementaires dont le poids est appel´e « coˆut de migration », telles que
pour chaque ´el´ement Ci,j > 0 de la matrice de migration, les sommets de l’ancienne
partie i soient connect´es au sommet fixe de la nouvelle partie j. Plus formellement,
∀i ∈ J1, MK, ∀j ∈ J1, NK, ∀v ∈ Pi
,
Ci,j 6= 0 ⇐⇒ (v, fj ) ∈ E˜
.
2. partitionner le nouveau graphe enrichi G˜ en N parties avec un partitionneur acceptant
les sommets fixes ;4.1. PARTITIONNEMENT BIAISE´ 69
3. restreindre la partition de G˜ au graphe original G pour obtenir P
′
.
Le rˆole des arˆetes ajout´ees, dites « de migration », n’est pas exactement le mˆeme que dans
les m´ethodes classiques. Elles ne servent pas, ici, `a minimiser la migration directement mais `a
imposer le sch´ema de communication choisi. Un sommet est souvent reli´e `a plusieurs sommets
fixes et au plus une de ses arˆetes de migration peut ne pas ˆetre coup´ee. Avec un poids suffisamment
´elev´e, le partitionneur laissera exactement une arˆete de migration par sommet non-coup´ee, pour
minimiser la coupe. Ainsi, en cherchant `a remplir ses objectifs habituels, le partitionneur impose
le sch´ema de migration choisi.
Un exemple de repartitionnement est propos´e en figure 4.2. En partant de l’ancienne partition
en M = 5 parties (figure 4.2a), on veut construire une nouvelle partition en N = 7 parties. A l’aide `
du graphe quotient associ´e (figure 4.2b), on construit une matrice de migration (ici repr´esent´ee
par l’hypergraphe de repartitionnement) comme indiqu´e dans le chapitre pr´ec´edent (figure 4.2c).
Les arˆetes de migration sont ajout´ees d’apr`es cet hypergraphe sur la figure 4.2d : par exemple,
le sommet fixe de la nouvelle partie 3 est reli´e `a tous les sommets des parties contenues dans
l’hyper-arˆete correspondante (les anciennes parties 3 et 4). Le partitionneur calcule ensuite une
nouvelle partition de ce graphe enrichi. La figure 4.2e montre les arˆetes de migration coup´ees
(en rouge) et internes (en vert). Enfin, la partition de G˜ est restreinte graphe G pour obtenir la
partition finale (figure 4.2f).
Cette m´ethode utilise n’importe quel outil de partitionnement classique capable de prendre
en compte le cas des sommets fixes 1
. Il est aussi possible d’utiliser des partitionneurs d’hypergraphe,
les arˆetes de migration deviennent alors des hyper-arˆetes de taille 2, la coupe de telles
hyper-arˆetes ´etant ´equivalente `a celle des arˆetes du graphe.
Les sommets fixes et les arˆetes de migration imposent le sch´ema de communication mais pas
le volume des messages ´echang´es. Affecter un sommet `a une partie de fa¸con `a engendrer un
message non autoris´e correspond `a une arˆete de migration coup´ee en plus. Un sommet est reli´e
par des arˆetes de migration `a un ou plusieurs sommets fixes chacun dans une partie diff´erente.
Au mieux une seule de ces arˆetes de migration n’est pas coup´ee (le sommet ne peut ˆetre que dans
une seule partie), alors la migration de ce sommet est autoris´e par la matrice de migration. Si
le sommet est dans une partie diff´erente de celles des sommets fixes auxquels il est connect´e, la
migration de ce sommet n’est pas autoris´ee et toutes les arˆetes de migration de ce sommets sont
coup´ees. Le partitionneur choisira donc de placer un sommet dans l’une des parties des sommets
fixes auxquels il est connect´e. La contrainte sur la taille des parties n’empˆeche pas ce choix car,
par construction de la matrice de migration, il y a toujours assez de sommets reli´es au sommet
fixe pour cr´eer la partie de la taille souhait´ee parmi ces derniers.
Bien que seul le sch´ema de communication soit impos´e, les tailles des messages sont respect´ees
lorsque le nombre de message (TotalZ) est minimal. Le partitionneur est libre de cr´eer n’importe
quelle partition induisant une matrice de migration avec les non-z´eros souhait´es. On cherche le
nombre de matrices de migration C
′ qu’il est possible d’obtenir apr`es le partitionnement. L’espace
des matrices de migration possibles peut ˆetre d´efini par un syst`eme d’´equations lin´eaires avec
autant d’inconnues, not´ees C
′
i,j , que de messages (d’une ancienne partie i vers une nouvelle partie
j). Les ´equations sont les contraintes de sommes sur les lignes et les colonnes ; il y en a M +N. Il y
a autant d’inconnues C
′
i,j que d’´el´ements Ci,j non nuls dans la matrice de migration C souhait´ee.
En notant Vi
le poids de l’ancienne partie i, V
′
j
la poids de la nouvelle partie j et W le poids
1. Il est en fait possible d’obtenir un partitionnement ´equivalent sans sommets fixes : il suffit de donner aux
sommets « fixes » un poids suffisamment grand, pour qu’il ne puisse pas y en avoir deux dans une mˆeme partie.
Les nouvelles parties sont ensuite renum´erot´ees pour que les sommets fixes soient dans les bonnes parties. Le
d´efaut de cette m´ethode est que le d´es´equilibre tol´er´e est plus important `a cause du poids de ces sommets.70 CHAPITRE 4. REPARTITIONNEMENT M × N
(a) Partition initiale de G en 5 parties.
1
2
3
4
5
(b) Graphe quotient Q de la partition initiale.
1
2
3
4
5
6
7
(c) Hypergraphe de repartitionnement
dessin´e par dessus le graphe quotient.
(d) Graphe G˜ auquel est ajout´e les sommets
fixes et arˆetes de migration.
(e) Partition de G˜ en 7 parties. Les arˆetes
de migration coup´ees sont en rouge, les
arˆetes de migration non-coup´ees en vert.
(f) Partition finale de G en 7 parties.
Figure 4.2 – Repartitionnement de 5 vers 7 parties.4.1. PARTITIONNEMENT BIAISE´ 71
total du graphe (W =
P
i
Vi =
P
j
V
′
j
), on a :
∀i ∈ J1, MK ,
X
j∈J1,NK
Ci,j>0
C
′
i,j = Vi (4.1)
∀j ∈ J1, NK ,
X
i∈J1,MK
Ci,j>0
C
′
i,j = V
′
j
(4.2)
La somme des ´equations sur les lignes (´equations 4.1) est ´equivalente `a la somme des ´equations
sur les colonnes (´equations 4.2) et donnent :
X
i∈J1,MK
j∈J1,NK
Ci,j>0
C
′
i,j = W
Ce syst`eme poss`ede donc M + N − 1 ´equations ind´ependantes 2
.
On sait que l’ensemble des solutions n’est pas vide car la matrice de migration C est une
solution. La dimension de l’espace solution est donc ´egale `a la diff´erence entre le nombre d’inconnues
(le nombre de messages dans la matrice C) et le rang du syst`eme. Si le nombre de messages
dans C n’est pas minimal (il n’atteint pas le rang du syst`eme), il existe une infinit´e de solutions
C
′ possibles. Le partitionneur peut donner une de ces matrice C
′
(´eventuellement diff´erente de
C) en minimisant la coupe du graphe enrichi. Plus le nombre de messages dans C est important
plus il y a de libert´e dans le partitionnement. La matrice de migration C
′
effectivement obtenue
apr`es repartitionnement peut ne pas ˆetre aussi bonne que la matrice C choisie. On pr´ef´erera donc
utiliser ce partitionnement biais´e avec des matrices de migration donnant un faible nombre de
messages (TotalZ).
4.1.2 Limitations des partitionneurs
Cette m´ethode partitionnement `a sommets fixes peut poser quelques probl`emes avec certains
partitionneurs, plus particuli`erement ceux utilisant des bissections r´ecursives [3].
Le premier probl`eme est que le placement et la num´erotation des nouvelles parties peut ne
pas ˆetre favorable aux bissections r´ecursives. Comme expliqu´e dans la section 3.3.1, lors d’une
bissection, chaque moiti´e regroupera plusieurs parties suivant leurs num´eros : g´en´eralement les
parties avec les plus petits num´eros sont regroup´ees dans une moiti´e et les plus grand num´eros
dans l’autre. Il est possible qu’une moiti´e regroupe des parties qu’on souhaite ´eloign´ees. Les
heuristiques peuvent avoir plus de mal `a cr´eer des parties et devoir travailler avec des graphes
non connexes.
Mais, certains cas sont encore plus graves. Mˆeme avec des bissections parfaites et un poids
tr`es important sur les arˆetes de migration, un partitionneur `a bissections r´ecursives peut ne pas
2. Il est possible de r´eduire encore le nombre d’´equations ind´ependantes lorsqu’il existe une somme partielle
de poids d’anciennes parties ´egale `a une somme partielle de poids de nouvelles parties. C’est-`a-dire que s’il existe
A ⊂ J1, MK et B ⊂ J1, NK tels que P
i∈A Vi =
P
j∈B V
′
j
et que pour tout (i, j) ∈ J1, MK × J1, NK tels que
(i ∈ A ∧ j /∈ B) ∨ (i /∈ A ∧ j ∈ B), Ci,j = 0, alors la somme des ´equations sur les lignes correspondant aux
anciennes parties de A est ´equivalente `a la somme des ´equations sur les colonnes correspondant aux nouvelles
parties de B : X
i∈A
j∈B
Ci,j>0
C
′
i,j =
X
i∈A
Vi =
X
j∈B
V
′
j72 CHAPITRE 4. REPARTITIONNEMENT M × N
1
2 3
4
(a) Partition intiale et sommets
fixes.
3 3
4
(b) Graphe quotient et hypergraphe
de repartitionnement.
(c) Partition finale k-aire direct.
1–2
3–4
(d) Premi`ere bissection.
(e) Partition finale avec bissections
r´ecursives.
Figure 4.3 – Exemple d’´echec de partitionnement avec bissections r´ecursives.
respecter le sch´ema de communication impos´e alors qu’un partitionneur k-aire direct trouverait
une solution [3, 60].
Par exemple, la figure 4.3 pr´esente un cas o`u la m´ethode des bissections r´ecursives ´echoue.
La grille est initialement partitionn´ee en 3 (figure 4.3a) et on souhaite la repartitionner en 4 en
utilisant l’hypergraphe de repartitionnement de la figure 4.3b. Un exemple de partition finale respectant
ce sch´ema est pr´esent´e sur la figure 4.3c. On essaye d’appliquer les bissections r´ecursives
sur ce graphe. Lors de la premi`ere bissection (figure 4.3d), le partitionneur regroupe les parties
1 et 2 d’un cot´e, et 3 et 4 de l’autre. La meilleure bissection possible est de coup´ee le graphe
verticalement par le milieu. Les parties 1 et 2 seront donc dans la partie gauche et les parties 3
et 4 dans la partie droite. Il n’est donc pas possible pour la partie 4 de reprendre des sommets de
l’ancienne partie 2. Chaque moiti´e est ensuite `a nouveau bipartitionn´ee pour obtenir la partition
finale pr´esent´ee sur la figure 4.3e. Sa matrice de migration est :
6 6
3 9
9 3
,4.2. PARTITIONNEMENT K-AIRE DIRECT (KGGGP) 73
alors que celle attendue, qui est celle de la partition de la figure 4.3c, est :
9 3
9 3
9 3
.
La partition de bissections r´ecursives coupent 39 arˆetes de migration alors qu’il est possible de
n’en couper seulement 36, mˆeme si on a suppos´e que les bissections ´etaient parfaites et le poids
des arˆetes de migration bien plus important que celui des arˆetes internes.
En pratique, la plupart des outils utilisent un multi-niveaux k-aire avec une partition initiale
du graphe contract´e calcul´ee par bissections r´ecursives. Dans le cas o`u les bissections r´ecursives
´echouent `a calculer une bonne partition initiale, le raffinement k-aire appliqu´e pendant la phase
d’expansion doit alors grandement modifier la partition initiale pour optimiser la coupe. Quand
l’heuristique de raffinement r´eussit `a corriger la partition initiale, ce qui est difficile comme
ces heuristiques sont souvent incr´ementales, le partitionneur est alors tr`es ralenti par la phase
d’expansion.
Pour cette raison, nous proposons une heuristique de partitionnement k-aire direct pouvant
ˆetre utilis´ee `a la place des bissections r´ecursives en tant que m´ethode de partitionnement initiale
dans un partitionneur.
4.2 Partitionnement k-aire direct (KGGGP)
L’heuristique du Greedy Graph Growing Partitioning (GGGP) est une heuristique gloutonne
largement utilis´ee dans le cadre du bipartitionnement [5, 11, 29]. En partant de deux sommets
« graines », les autres sommets sont ajout´es un `a un dans chacune des parties. Nous proposons
d’´etendre cette m´ethode dans le cas du partitionnement k-aire. Nous l’appellerons dans ce cas
KGGGP (k-way greedy graph growing partitioning).
4.2.1 Description de l’algorithme
Cette heuristique s’inspire en grande partie de celle de Fiduccia et Mattheyses [17] (abr´eg´ee
FM), `a la diff´erence que les sommets ne sont initialement dans aucune partie et sont `a distribuer
dans k parties. Cette m´ethode peut ˆetre vue comme un raffinement FM k + 1-aire o`u la partie
suppl´ementaire (que l’on num´erotera −1) contient initialement tous les sommets et doit ˆetre vide
dans la partition finale.
Pour r´ealiser cet algorithme, on consid`ere tous les d´eplacements possibles des sommets sans
parties vers une des k parties. Chaque it´eration de l’algorithme 5 place un sommet sans partie
dans une partie p. A chaque it´eration, on s´electionne le meilleur d´eplacement, d’ ` apr`es un crit`ere
de s´election bas´e sur la coupe, qui respecte l’´equilibre final (c’est-`a-dire que le poids Wp de la
partie p ne d´epassera pas la taille maximum permise avec un facteur de d´es´equilibre ǫ). Il existe
plusieurs crit`eres de s´election qui seront d´etaill´es plus loin dans cette section. Il est possible
qu’aucun sommet ne respecte la contrainte d’´equilibre, particuli`erement dans le cas d’un graphe
contract´e dans le cadre d’un algorithme multi-niveaux, o`u des sommets peuvent avoir un poids
tr`es important par rapport au poids total du graphe. Dans ce cas, l’´equilibre ne pourra pas ˆetre
respect´e et le meilleur d´eplacement est choisi ind´ependamment du poids du sommet et de la
partie cible. Une fois un sommet s´electionn´e, il est alors d´eplac´e et verrouill´e, c’est-`a-dire qu’il
ne sera plus consid´er´e pour d’autres d´eplacements.
Le crit`ere de s´election calcule le score si(u) d’un d´eplacement `a partir des parties de ses voisins
(cf. section suivante). Ainsi lorsqu’un sommet est d´eplac´e, le crit`ere de s´election de chacun de
ses voisins doit ˆetre mis `a jour.74 CHAPITRE 4. REPARTITIONNEMENT M × N
p
v
s = sp(v) = sp'(v')
déplacement
de v dans p
tableau des
scores
tableau des
déplacements
p'
v'
déplacement
de v' dans p'
...
score min
score max
Figure 4.4 – Structure de donn´ees inspir´ee de Fiduccia et Mattheyses, illustrant le cas des
d´eplacements de v dans p et de v
′ dans p
′ ayant un mˆeme score s.
L’algorithme 5 s´electionne le meilleur d´eplacement globalement. Mais il existe d’autres variantes
possibles pour s´electionner un d´eplacement afin d’obtenir une partition ´equilibr´ee [29].
Par exemple, la partie de destination du d´eplacement est choisie l’une apr`es l’autre (m´ethode
appel´ee round-robin), ou elle peut ˆetre la partie dont le poids courant est le plus faible. Dans ces
deux cas, on choisit le meilleur d´eplacement seulement vers la partie choisie.
Pour trouver rapidement le meilleur d´eplacement d’apr`es le crit`ere choisi, la structure de
donn´ees pr´esent´ee par Fiduccia et Mattheyses est utilis´ee. Cette structure de donn´ees (r´esum´ee
sur la figure 4.4) utilise un tableau `a chaque case duquel est associ´ee une valeur du score utilis´ee
comme crit`ere de s´election (le gain de coupe du d´eplacement dans le cas de FM). Chaque case
de ce tableau donne la liste doublement chain´ee des d´eplacements correspondant `a ce score. Ce
tableau des scores permet de s´electionner rapidement un d´eplacement avec un gain donn´e (ici,
le plus grand). Un autre tableau r´ef´eren¸cant les ´el´ements des listes chain´ees par leur num´ero de
sommet permet de les retrouver rapidement pour effectuer une mise `a jour du gain. Dans notre
algorithme k-aire ce tableau est ´etendu avec une seconde dimension correspondant `a la partie du
d´eplacement. Le double chainage permet d’effectuer en temps constant le changement de liste
d’un ´el´ement apr`es une mise `a jour ou son retrait quand le sommet est plac´e dans une partie.
En pratique, notre mise en œuvre de cet algorithme utilise deux tableaux de score pour classer
les d´eplacements. Initialement, le premier contient tous les d´eplacements et le second est vide.
Les d´eplacements sont recherch´es d’abord dans la premi`ere structure, lorsque qu’un d´eplacement
ne respectant pas la contrainte d’´equilibre est trouv´e, il est d´eplac´e dans la seconde. En effet,
le poids des parties ne faisant que croˆıtre, il ne respectera pas la contrainte d’´equilibre dans le
futur, il est inutile de le consid´erer `a nouveau pour ˆetre d´eplacer. Quand la premi`ere structure4.2. PARTITIONNEMENT K-AIRE DIRECT (KGGGP) 75
est vide, il n’y a plus de d´eplacements respectant la contrainte d’´equilibre, la seconde structure
est alors utilis´ee jusqu’`a la fin de l’algorithme et le poids de la partie n’est plus v´erifi´e.
Il est tr`es simple de g´erer le cas des sommets fixes avec cette m´ethode. En effet, les sommets
fixes sont simplement plac´es dans leur parties respectives initialement et ne sont pas consid´er´es
dans les d´eplacements possibles.
Algorithme 5 Heuristique de partitionnement gloutonne (KGGGP)
Entr´ee : Graphe G `a partitionner
Entr´ee : k parties ne contenant que les sommets fixes
Entr´ee : Partition o`u tout les sommets fixes sont dans leur partie respective, et les autres
sommets sont dans la partie −1
tant que il existe des sommets dans la partie −1 faire
S´electionner un sommet v sans partie dont le d´eplacement vers une partie
p a un crit`ere de s´election sp(v) maximal et tel que Wp + wv ≤ (1 + ǫ) ×
W/k
si un tel sommet n’existe pas alors
S´electionner un sommet v sans partie dont le d´eplacement vers une partie
p a un crit`ere de s´election sp(v) maximal
fin si
Placer le sommet v dans la partie p
Wp ← Wp + wv
pour tout voisin u de v faire
pour tout partie i faire
Mettre `a jour le crit`ere de s´election si(u)
fin pour
fin pour
fin tant que
retourner Partition de G en k parties
4.2.2 Crit`eres de s´election
Il existe plusieurs crit`eres pour ´evaluer la qualit´e des d´eplacements. On note sp(v), le score du
d´eplacement du sommet v vers la partie p. Les d´eplacements sont ´evalu´es en fonction des arˆetes
les connectant aux diff´erentes parties. On notera Ni(u) le poids des arˆetes connectant le sommet
u `a des voisins dans la partie i, et N−1(u) le poids des arˆetes le connectant `a des sommets sans
partie. On appelle arˆete interne, une arˆete dont les deux extr´emit´es sont dans la mˆeme partie et
on appelle arˆete externe (ou coup´ee), une arˆete dont les deux extr´emit´es sont dans des parties
diff´erentes.
Comme avec la m´ethode FM, il est possible d’utiliser la formule du gain de coupe en consid´erant
que les sommets sans parties sont dans une partie num´erot´ee −1. Le gain d’un sommet
u d´eplac´e de la partie i vers j se calcule par la diff´erence entre les arˆetes vers la nouvelle partie
j, qui ´etaient coup´ees mais ne le seront plus, et les arˆetes vers l’ancienne partie i, qui ´etaient
internes et seront coup´ees. En reprenant la formule du gain : gi→j (u) = Nj (u) − Ni(u), le crit`ere
de s´election bas´e sur le gain pour d´eplacer u dans i est si(u) = g−1→i(u) = Ni(u) − N−1(u).
Battiti et Bertossi [5] proposent d’utiliser un autre crit`ere, appel´e diff. Bien que con¸cu pour le
bipartitionnement, ce crit`ere peut ´egalement s’appliquer dans le cas du partitionnement k-aire.
Ce crit`ere ne s’int´eresse plus aux voisins sans partie, mais utilise la diff´erence entre les nouvelles
arˆetes internes (voisins dans la partie vis´ee) et les nouvelles arˆetes coup´ees (voisins dans les autres76 CHAPITRE 4. REPARTITIONNEMENT M × N
i
j
–1
u
Figure 4.5 – Diff´erentes arˆetes autour du sommet sans partie u qui se trouve `a la fronti`ere des
parties i et j.
parties) : si(u) = diffi
(u) = Ni(u) −
P
j6=i Nj (u). En effet, minimiser la coupe avec la partie −1
qui finira par disparaitre peut paraitre inutile alors que les arˆetes vers les autres parties font
partie de la coupe finale. D’autre part, en maximisant le nombre d’arˆetes internes (Ni(u)), on
esp`ere r´eduire le nombre d’arˆetes qui devront ˆetre coup´ees plus tard.
La figure 4.5 pr´esente les diff´erentes arˆetes autour du sommet u : en vert, les arˆetes correspondant
`a Ni(u) ; en rouge `a Nj (u) ; et en bleu `a N−1(u). On suppose que toutes les arˆetes de
cet exemple ont un poids unitaire. Si on consid`ere le d´eplacement de u dans la partie i, le gain
est g−1→i(u) = 0 : initialement 3 arˆetes sont coup´ees (en vert et rouge), apr`es d´eplacement 3
arˆetes sont toujours coup´ees (cette fois en bleu et rouge). Le crit`ere diff ne s’int´eresse pas aux
arˆetes avec les sommets sans partie (en bleu) mais seulement `a la diff´erence entre les futures
arˆetes internes (en vert) et les arˆetes externes avec les « vraies » parties (en rouge). On a donc
diffi
(u) = 2 − 1 = 1.
4.2.3 Complexit´e
L’algorithme de partitionnement d´eplace une fois chaque sommet libre. Il y a donc autant
d’it´erations de la boucle principale que de sommets non fixes (au plus |V |). La boucle principale
comporte les ´etapes de s´election, d´eplacement et mise `a jour des structures de donn´ees.
Lors de la s´election, chaque d´eplacement n’est consid´er´e qu’une ou deux fois : s’il n’est pas
accept´e la premi`ere fois, il est retir´e de la premi`ere liste des d´eplacements et plac´e dans la seconde ;
dans la seconde liste, un d´eplacement n’est jamais rejet´e. La complexit´e en temps totale de la
s´election est donc au pire proportionnelle au nombre de d´eplacements possibles, c’est-`a-dire
O(k|V |).
Le d´eplacement est une op´eration simple en temps constant. Cela n’est que le changement
d’une valeur dans le tableau repr´esentant la partition.
La mise `a jour des structures de donn´ees apr`es le d´eplacement d’un sommet, n´ecessite de
visiter tous les voisins du sommet d´eplac´e. Pour chaque voisin, il est n´ecessaire de mettre `a jour
le crit`ere de s´election vers chacune des k parties. Comme ces op´erations sont effectu´ees pour
chaque sommet du graphe, la complexit´e en temps totale des mises `a jour est au pire O(k|E|).
La complexit´e en temps de l’algorithme est donc au pire O(k|E|), en consid´erant que |V | est
domin´e par |E|. La complexit´e en m´emoire est principalement due au stockage des d´eplacements
possibles, elle est donc au pire O(k|V |).4.2. PARTITIONNEMENT K-AIRE DIRECT (KGGGP) 77
4.2.4 Am´eliorations
Plusieurs variantes peuvent ˆetre utilis´ees pour am´eliorer la qualit´e des partitions produites
par l’algorithme.
a) S´election al´eatoire et r´ep´etition
Lors de la s´election des sommets, plusieurs peuvent avoir le mˆeme score. Si le premier sommet
trouv´e est choisi, la s´election est biais´ee par l’ordre de parcours des sommets ou par le dernier
d´eplacement. En effet, lors de la mise `a jour, les voisins dont le score s’est am´elior´e se retrouvent
en d´ebut de liste, ce qui tend `a faire grossir la partie toujours dans la mˆeme direction. En
s´electionnant un sommet al´eatoire parmi les meilleurs, on ´evite ce biais. Cela permet d’obtenir
des partitions diff´erentes avec diff´erentes ex´ecutions de l’algorithme. Comme cet algorithme est
tr`es rapide lorsqu’il est appliqu´e dans le cadre d’un partitionnement multi-niveaux, il devient
int´eressant de le r´ep´eter plusieurs fois et de garder la meilleure partition. Cela permet aussi une
version parall`ele triviale o`u chaque nœud calcule une partition puis partage la meilleure.
b) Graines
Bien que l’algorithme puisse s’appliquer sans aucun sommet initialement dans une partie, les
crit`eres de s´election ne seront pas tr`es efficaces pour le choix des premiers sommets. Il est donc
int´eressant de choisir avant le d´ebut de l’algorithme certains sommets qui initieront les parties.
Il existe plusieurs possibilit´es pour choisir ces sommets qu’on appelle « graines ».
Graines al´eatoires. k sommets sont choisis al´eatoirement dans le graphe pour servir de graines
`a chacune des parties. Ces techniques se combinent bien avec la r´ep´etition de l’heuristique et
permettent encore plus de vari´et´e dans les tentatives pour trouver la meilleure partition possible.
Graines au centre des parties. La r´ep´etition de l’heuristique peut ´egalement ˆetre utilis´ee
pour trouver des graines de fa¸con plus intelligente. Apr`es une premi`ere passe `a l’aide de graines
choisies d’une mani`ere quelconque, les centres 3 ou des « pseudo-centres 4 » des parties sont calcul´es
et servent de graine `a l’it´eration suivante. Cette m´ethode est propos´ee par Diekmann et al.
dans le cadre du Bubble Partitioning [14].
Graines ´eloign´ees. Diekmann et al. [14] proposent ´egalement un algorithme pour optimiser
l’ensemble des graines initiales. L’algorithme 6 permet de construire un ensemble de k graines
bien ´eloign´ees les unes des autres. En partant d’un sommet quelconque, on recherche le sommet
le plus ´eloign´e `a l’aide d’un parcours en largeur. Les graines suivantes sont trouv´ees de fa¸con
similaire en initialisant le parcours en largeur avec les n graines d´ej`a trouv´ees. La seconde boucle
permet d’am´eliorer cet ensemble. On retire une `a une les graines de l’ensemble et on en cherche
une nouvelle, toujours `a l’aide d’un parcours en largeur. Cette derni`ere boucle peut ˆetre r´ep´et´ee
jusqu’`a ce que l’ensemble ne change plus ou r´ep´et´ee un nombre limit´e de fois. La complexit´e d’un
parcours en largeur ´etant O(|E|), la complexit´e de la cr´eation de l’ensemble initiale ou d’une
passe d’optimisation est O(k|E|).
3. Le centre d’un graphe est un sommet avec une excentricit´e minimale.
4. La recherche du centre d’un graphe est complexe. Nous pr´ef´erons donc chercher un « pseudo-centre » `a l’aide
d’un parcours en largeur `a partir de la fronti`ere de la partie. Le dernier sommet parcouru est le plus ´eloign´e de la
fronti`ere, il est donc s´electionn´e en tant que « pseudo-centre »78 CHAPITRE 4. REPARTITIONNEMENT M × N
Algorithme 6 Cr´eation d’un ensemble de k graines ´eloign´ees
Entr´ee : Graphe G
Entr´ee : Nombre de parties k
v ← sommet quelconque de G
graines ← {sommet le plus ´eloign´e de v dans G}
n ← 1
tant que n < k faire
v ← sommet le plus ´eloign´e des sommets dans graines
Ajouter v dans graines
n ← n + 1
fin tant que
r´ep´eter
pour tout v ∈ graines faire
u ← sommet le plus ´eloign´e des sommets dans graines \ {v}
si u est plus loin que v alors
Remplacer v par u dans graines
fin si
fin pour
jusqu’`a Aucune graine n’a ´et´e chang´ee
retourner graines
c) Raffinement `a la fin
Les derniers choix de d´eplacement lors du KGGGP sont souvent tr`es limit´es et les derniers
sommets se retrouvent plac´es dans les parties qui pouvaient encore accepter des sommets malgr´e
une tr`es mauvaise coupe. Pour corriger ces d´efauts, il est n´ecessaire d’appliquer un l´eger
raffinement de type FM `a la partition obtenue.
Bien que tr`es l´eger, ces raffinements peuvent grandement am´eliorer la coupe, il est donc
int´eressant de le prendre en compte dans la r´ep´etition de l’algorithme glouton, que ce soit pour
d´ecider la partition `a garder ou calculer de nouvelles graines `a l’aide des centres des parties.
4.2.5 Evaluation ´
Cette m´ethode de partitionnement a ´et´e mise en œuvre dans un module Scotch [48]. L’avantage
de Scotch est d’ˆetre un logiciel libre tr`es modulaire. Cela permet de r´eutiliser les autres
m´ethodes d´ej`a pr´esentes dans Scotch, en particulier l’approche multi-niveaux et les m´ethodes
de raffinement. Pour combiner ces diff´erentes strat´egies de partitionnement, Scotch utilise des
chaˆınes de strat´egies permettant de configurer l’enchainement, l’imbrication et les param`etres
des diff´erentes strat´egies. Notre strat´egie de KGGGP est document´ee dans l’annexe B.
Pour ´evaluer le KGGGP, notre m´ethode est compar´ee `a la strat´egie de bissections r´ecursives
de Scotch. La strat´egie utilis´ee pour les bissections r´ecursives (RB) dans les exp´eriences suivantes
est celle utilis´ee par d´efaut dans Scotch, elle est donn´ee par la chaˆıne de strat´egie suivante :
r{job=t,map=t,poli=S,bal=0.01,sep=
m{vert=120,low=h{pass=10}f{bal=0.01,move=120},
asc=b{bnd=f{bal=0.01,move=120},org=f{bal=0.01,move=120}}}|
m{vert=120,low=h{pass=10}f{bal=0.01,move=120},
asc=b{bnd=f{bal=0.01,move=120},org=f{bal=0.01,move=120}}}|
m{vert=120,low=h{pass=10}f{bal=0.01,move=120},4.2. PARTITIONNEMENT K-AIRE DIRECT (KGGGP) 79
Graphe Description |V | |E| d
grid3d32 Grille 3D r´eguli`ere 32 768 95 232 5,81
grid3d100 Grille 3D r´eguli`ere 1 000 000 2 970 000 5,94
cfd2 M´ecanique des fluides num´eriques (CFD) 123 440 1 482 229 24,02
crankseg 2 Probl`eme structurel 63 838 7 042 510 220,64
thermal2 Probl`eme thermique 1 228 045 3 676 134 5,99
brack2 Probl`eme 2D/3D 62 631 366 559 11,71
wave Probl`eme 2D/3D 156 317 1 059 331 13,55
cage12 Electrophor`ese d’ADN ´ 130 228 951 154 14,61
Table 4.1 – Description des graphes utilis´es pour nos exp´eriences. d est le degr´e moyen du graphe
qui vaut 2×|E|
|V |
.
asc=b{bnd=f{bal=0.01,move=120},org=f{bal=0.01,move=120}}}
}
C’est-`a-dire que, pour chaque bissection, trois partitionnements multi-niveaux (m) sont calcul´es
et la meilleure partition est retenue. Ces partitionnements multi-niveaux pour les bissections sont
utilis´es en plus du multi-niveaux principal dans lequel cette strat´egie de bissections r´ecursives
est ´eventuellement utilis´ee. Ils utilisent comme strat´egie de partitionnement initial une m´ethode
de greedy graph growing (h) d´ej`a pr´esente dans Scotch mais seulement pour les bissections, et
comme raffinement un algorithme FM (f).
Le tableau 4.1 pr´esente les diff´erents graphes utilis´es dans les exp´eriences. Les graphes grid3d32
et grid3d100 sont des grilles cubiques de tailles respectives 32 × 32 × 32 et 100 × 100 × 100. Les
autres graphes sont issus de la collection de matrices creuses de l’Universit´e de Floride [13].
a) Cas du partitionnement classique
Plusieurs configurations du KGGGP sont ´evalu´ees. Les deux crit`eres de s´election bas´es sur le
gain de coupe (type=g) et diff (type=d) sont utilis´es pour chaque cas :
— Une seule passe et sans raffinement :
g-noref-1p g{bal=0.01,type=g,pass=1,ref=}
d-noref-1p g{bal=0.01,type=d,pass=1,ref=}
— Quatre passes avec deux passes de raffinement FM chacune :
g-ref-4p g{bal=0.01,type=g,pass=4,ref=
f{bal=0.01,pass=2,move=200}}
d-ref-4p g{bal=0.01,type=d,pass=4,ref=
f{bal=0.01,pass=2,move=200}}
— Quatre passes avec deux passes de raffinement FM chacune et l’utilisation de graines
al´eatoires (seeds=r) :
g-ref-4p-rand g{bal=0.01,type=g,pass=4,seeds=r,center=n,ref=
f{bal=0.01,pass=2,move=200}}
d-ref-4p-rand g{bal=0.01,type=d,pass=4,seeds=r,center=n,ref=
f{bal=0.01,pass=2,move=200}}
— Quatre passes avec deux passes de raffinement FM chacune et l’utilisation de graines
´eloign´ees (seeds=o) pour la premi`ere passe puis des « centres » des parties (center=y)
pour les suivantes :80 CHAPITRE 4. REPARTITIONNEMENT M × N
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0 20 40 60 80 100 120 140
Temps (s)
Nombre de parties
RB
KGGGP (g-noref-1p)
Figure 4.6 – Temps du partitionnement de la grille 32×32×32 sans multi-niveaux, avec KGGGP
(une passe et sans raffinement) en comparaison avec RB suivant le nombre de parties.
g-ref-4p-opt g{bal=0.01,type=g,pass=4,seeds=o,center=y,ref=
f{bal=0.01,pass=2,move=200}}
g-ref-4p-opt g{bal=0.01,type=d,pass=4,seeds=o,center=y,ref=
f{bal=0.01,pass=2,move=200}}
La figure 4.7 pr´esente la coupe et la figure 4.8 pr´esente le temps obtenus pour le partitionnement
des diff´erents graphes avec la m´ethode KGGGP relativement `a la m´ethode des bissections
r´ecursives (RB), toutes sans utiliser de multi-niveaux. Les deux premi`eres strat´egies ne faisant
qu’une passe et n’utilisant pas de raffinement donnent une coupe beaucoup plus ´elev´ee. En effet,
le KGGGP a g´en´eralement du mal `a bien placer les derniers sommets, le raffinement FM
permet de corriger les mauvais choix faits par l’algorithme glouton. Le temps d’ex´ecution de ces
strat´egies est ´evidement plus rapide que celles faisant plusieurs passes et utilisant un raffinement.
On remarque ´egalement que, parmi les deux types de crit`ere de s´election utilis´es, celui bas´e
sur le gain de coupe donne toujours de meilleurs r´esultats que le diff. L’utilisation de graines
a g´en´eralement peu d’influence sur la coupe, bien qu’on remarque une l´eg`ere am´elioration sur
quelques cas.
La coupe des meilleures strat´egies KGGGP est ´egale ou sup´erieure (jusqu’`a 20 % plus ´elev´ee)
`a celle des bissections. Le KGGGP est ´egalement plus lent : en effet, sa complexit´e en temps
est O(k|E|) alors que celle des bissections r´ecursives est O(log(k)|E|). La figure 4.6 donne les
temps d’ex´ecution des bissections r´ecursives et du KGGGP (avec 1 passe et sans raffinement).
Les courbes sans multi-niveaux correspondent bien aux complexit´es attendues.
Mais, en pratique, ces strat´egies sont utilis´ees syst´ematiquement avec une m´ethode multiniveaux.
Les figures 4.9 et 4.10 montrent les r´esultats dans le mˆeme cas que les figures pr´ec´edentes
mais en utilisant les strat´egies (RB et KGGGP) dans une approche multi-niveaux utilisant un4.2. PARTITIONNEMENT
K-AIRE DIRECT (KGGGP
) 81 0.8 1 1.2
1.4
1.6
1.8
2
2.2
2.4
brack2cage12cfd2 crankseg_2 grid3d32thermal2wave
Coupe
g-noref-1p
g-ref-4p
g-ref-4p-rand
g-ref-4p-opt
d-noref-1p
d-ref-4p
d-ref-4p-rand
d-ref-4p-opt
RB
Figure 4.7 – Coupe de partitions en 32 parties sans multi-niveaux.82 CHAPITRE 4. REPARTITIONNEMENT
M
×
N
0
2
4
6
8
10
12
14
16
18
brack2cage12cfd2 crankseg_2 grid3d32thermal2wave
Temps
g-noref-1p
g-ref-4p
g-ref-4p-rand
g-ref-4p-opt
d-noref-1p
d-ref-4p
d-ref-4p-rand
d-ref-4p-opt
RB
Figure 4.8 – Temps de partitionnement en 32 parties sans multi-niveaux.4.2. PARTITIONNEMENT
K-AIRE DIRECT (KGGGP
) 83 0.95 1
1.05
1.1
1.15
1.2
brack2cage12cfd2 crankseg_2 grid3d100 thermal2wave
Coupe
g-noref-1p
g-ref-4p
g-ref-4p-rand
g-ref-4p-opt
d-noref-1p
d-ref-4p
d-ref-4p-rand
d-ref-4p-opt
RB
Figure 4.9 – Coupe de partitions en 32 parties avec un m´ethode multi-niveaux.84 CHAPITRE 4. REPARTITIONNEMENT
M
×
N
0.8
1
1.2
1.4
1.6
1.8
2
2.2
2.4
brack2cage12cfd2 crankseg_2 grid3d100 thermal2wave
Temps
g-noref-1p
g-ref-4p
g-ref-4p-rand
g-ref-4p-opt
d-noref-1p
d-ref-4p
d-ref-4p-rand
d-ref-4p-opt
RB
Figure 4.10 – Temps de partitionnement en 32 parties avec un m´ethode multi-niveaux.4.3. REPARTITIONNEMENT M × N BASE SUR LA DIFFUSION ( ´ DIFF) 85
raffinement FM k-aire. Les r´esultats en coupe et temps sont beaucoup plus proches : les phases
de contraction et de raffinement prennent le plus de temps alors que la le partitionnement initial
est plus rapide comme il s’applique sur un graphe de petite taille ; la coupe finale est largement
due au raffinement du multi-niveaux, le partitionnement initial ne lui sert que d’initialisation.
L’absence de raffinement n’a plus autant d’importance, le raffinement utilis´e lors de la phase
d’expansion corrige d´ej`a la plupart des d´efauts du partitionnement initial. Le type de crit`ere
de s´election a toujours un impact significatif sur la coupe finale. Dans le cas de grid3d100, les
bissections r´ecursives sont capables de trouver une bonne partition directement grˆace `a la nature
r´eguli`ere du graphe. La phase de raffinement est donc plus plus courte. Le partitionnement RB
est donc dans ce cas beaucoup plus rapide que le KGGGP qui profite moins de la r´egularit´e du
graphe. La coupe obtenue avec les strat´egies KGGGP (en utilisant le crit`ere de s´election bas´e
sur le gain) est tr`es proche des bissections r´ecursives : entre −5 % et +5 %.
Notre algorithme de partitionnement KGGGP offre des partitions de qualit´e similaire au partitionnement
utilisant des bissections r´ecursives. Mais cette m´ethode de partitionnement souffre
d’une complexit´e plus importante par rapport au nombre de parties.
b) Partitionnement avec sommets fixes
Dans la section 4.1.2, nous avons mis en ´evidence les difficult´es des partitionneurs utilisant
des bissections r´ecursives `a partitionner les graphes construits dans le cadre de notre partitionnement
biais´e avec sommets fixes. Nous ´evaluons donc notre m´ethode de partitionnement KGGGP
appliqu´ee sur les graphes d´ej`a pr´esent´es mais modifi´es selon la m´ethode de la section 4.1. Les
graphes sont enrichis pour un repartitionnement 16×21 avec un poids 1 pour les arˆetes du graphe
original et un poids 10 pour les arˆetes de migration.
Les figures 4.11 et 4.12 donnent les coupes et temps obtenus pour partitionner ces graphes
enrichis. Nous utilisons un partitionnement multi-niveaux avec KGGGP en 4 passes avec raf-
finement relativement aux bissections r´ecursives. Dans tous les cas, la coupe du KGGGP est
inf´erieure `a celle des bissections r´ecursives, parfois de fa¸con tr`es importante (plus de 40% de
r´eduction dans les meilleurs cas). Comme les arˆetes de migration ont un poids beaucoup plus
important, les valeurs de coupes donn´ees concernent principalement les arˆetes des migration. Les
temps de partitionnement sont g´en´eralement plus ´elev´es qu’avec les bissections r´ecursives mais
restent du mˆeme ordre de grandeur.
Bien que notre algorithme KGGGP ne donnait pas des meilleurs r´esultats que les bissections
r´ecursives pour des partitionnements de graphes classiques, les r´esultats sont bien meilleurs dans
le cas de graphes modifi´es avec des sommets fixes et des arˆetes de migration. Cela confirme les
inconv´enients d’utiliser des bissections r´ecursives pour partitionner des tels graphes.
4.3 Repartitionnement M ×N bas´e sur la diffusion (DIFF)
Nous proposons dans cette section une autre approche pour repartitionner un graphe en se
basant sur une matrice de migration donn´ee. Cette approche s’inspire des m´ethodes de repartitionnement
diffusives d´ej`a utilis´ees dans le cas du repartitionnement classique.
La m´ethode de repartitionnement biais´e n’impose pas correctement les messages choisis
lorsque ceux-ci sont trop nombreux. Cela peut poser probl`eme dans le cas o`u on veut utiliser
une matrice de migration avec un nombre de messages plus ´elev´e, en particulier les matrices
de migration obtenues `a l’aide de programmes lin´eaires ne minimisant pas TotalZ. Le repartitionnement
bas´e sur la diffusion r`egle ce probl`eme en migrant exactement le nombre de sommets
souhait´e.86 CHAPITRE 4. REPARTITIONNEMENT M × N
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
brack2
cage12
cfd2
crankseg_2
grid3d32
thermal2
wave
Coupe
g-ref-4p
RB
Figure 4.11 – Coupe de partitionnement en 21 parties (avec une m´ethode multi-niveaux) des
graphes enrichis pour un repartitionnement 16 × 21.
0.5
1
1.5
2
2.5
3
3.5
brack2
cage12
cfd2
crankseg_2
grid3d32
thermal2
wave
Temps
g-ref-4p
RB
Figure 4.12 – Temps de partitionnement en 21 parties (avec une m´ethode multi-niveaux) des
graphes enrichis pour un repartitionnement 16 × 21.4.3. REPARTITIONNEMENT DIFFUSIF 87
Le repartitionnement classique bas´e sur la diffusion [55] modifie l’ancienne partition en migrant
des sommets d’une partie `a l’autre en se basant sur une matrice de migration C donn´ee.
Pour chaque ´el´ement Ci,j de la matrice migration, exactement Ci,j sommets de la partie i sont
d´eplac´es dans la partie j. Les sommets `a migrer sont choisis d’une fa¸con similaire `a l’heuristique
FM mais en arrˆetant les d´eplacements quand le poids souhait´e (d’apr`es la matrice de migration)
a ´et´e d´eplac´e, au lieu de s’arrˆeter lorsque la coupe optimale est atteinte. Cette heuristique fonctionne
bien quand il est n´ecessaire de d´eplacer peu de sommets le long d’une fronti`ere s´eparant
deux parties.
Dans le cas du repartitionnement avec changement du nombre de parties, cette heuristique
rencontre quelques probl`emes. D’une part, certaines parties connaissent une migration importante
: les parties cr´ees ou supprim´ees au cours du repartitionnement. D’autre part, certaines
migrations de sommets doivent ˆetre d´ecid´ees alors qu’il n’existe initialement aucune fronti`ere.
C’est le cas des parties initialement vides lorsque le nombre de parties augmente (N > M).
Si une partie ne poss`ede initialement aucun sommet, une heuristique choisissant les sommets
suivant leur gain de coupe, commencera par s´electionner les sommets de plus petit degr´e parmi
ceux des parties qui doivent donner des sommets `a la nouvelle. Ces sommets peuvent ˆetre ´eloign´es
les uns des autres, ce qui va cr´eer une partie en petits morceaux dispers´es. Un tel cas est visible
sur la figure 4.13. La partition initiale en 5 parties (figure 4.13a) est ´equilibr´ee permettant ainsi
de se concentrer sur l’ajout des nouvelles parties. Dans ce cas, il n’y a pas d’´echanges de sommets
entre les anciennes parties. Les deux nouvelles parties prennent chacune des sommets depuis trois
anciennes parties : bleu fonc´e, gris clair et orange pour la partie vert fonc´e et bleu fonc´e, bleu
clair et rouge pour la partie vert clair. La figure 4.13b montre un exemple de repartitionnement
o`u l’heuristique a construit les nouvelles parties aux mauvais endroits : les parties ajout´ees (en
vert) sont d´ecoup´ees en plusieurs bouts, augmentant ainsi la taille de la fronti`ere.
Pour r´egler ce probl`eme de parties initialement vides, il est n´ecessaire d’ajouter quelques
sommets qui permettront d’initier la cr´eation de la nouvelle partie. Le choix de ces graines doit
se faire `a l’aide d’une m´ethode plus globale, id´ealement au centre de la future partie et ayant
des voisins parmi toutes les anciennes parties intervenant dans la migration de la nouvelle partie
`a cr´eer. Trouver de telles sommets peut demander des algorithmes complexes. Une m´ethode
na¨ıve est de rechercher les sommets ayant des voisins parmi les autres anciennes parties voulues
et d’en prendre un au hasard. De telles sommets n’existent pas toujours comme il n’est pas
toujours possibles de cr´eer des parties connexes pour certaines matrices de migration choisies. La
figure 4.13d montre un repartitionnement obtenu `a l’aide de graines ajout´ees `a la fronti`ere des
trois anciennes parties donnant des sommets `a une mˆeme nouvelle partie comme indiqu´e sur la
figure 4.13c.
Que la migration soit faite par paire de parties ´emettrice–r´eceptrice ou globalement, l’ordre
dans lequel sont effectu´es les d´eplacements de sommets a une grande influence sur le r´esultat
final. En effet, les sommets peuvent g´en´eralement ˆetre d´eplac´es vers plusieurs autres parties et il
faut donc choisir dans quel ordre consid´erer ces parties. Schloegel et al. [58] ´etudie se probl`eme
dans le cas de repartitionnement classique. Les solutions les plus simples sont un ordre al´eatoire
ou de consid´erer en priorit´e les parties ´emettrices qui ont d´ej`a re¸cu tous les sommets dont elles
ont besoin. Si ce dernier ordonnancement est choisi, cela peut poser probl`eme lors de la cr´eation
de nouvelles parties. Ces nouvelles parties seraient alors traiter en dernier car elles ne sont que
r´eceptrices. Mais les d´eplacements pr´ec´edents changent les fronti`eres et ´eventuellement la forme
du graphe quotient qui a ´et´e utilis´e pour choisir l’emplacement de ces nouvelles parties. Les
anciennes parties donnant `a une mˆeme nouvelle partie peuvent ne plus ˆetre proches quand arrive
le moment de construire cette nouvelle partie.
Notre r´ealisation pr´eliminaire du repartitionnement diffusif utilise le graphe entier sans approche
multi-niveaux et sans utiliser de raffinement, ce qui limite la qualit´e de la coupe finalement88 CHAPITRE 4. REPARTITIONNEMENT M × N
(a) Ancienne partition en 5 parties. (b) Nouvelle partition en 7 parties sans utiliser
de graines.
(c) Ajout de graines sur l’ancienne partition. (d) Nouvelle partition en 7 parties en utilisant
des graines.
Figure 4.13 – Exemple d’ajout de deux nouvelles parties prenant des sommets depuis trois
anciennes chacune `a l’aide de la diffusion.4.4. REPARTITIONNEMENT AVEC HYPER-ARETES ˆ 89
obtenue. Les migrations sont effectu´ees par paires de parties en commen¸cant par les parties initialement
vides (les processeurs ajout´es) puis les paires d’anciennes parties en commen¸cant par
celles o`u les parties ´emettrices ont d´ej`a re¸cu tous leurs sommets.
4.4 Partitionnement biais´e `a l’aide d’hyper-arˆetes de repartitionnement
En utilisant un mod`ele hypergraphe (plutˆot que graphe) et la coupe connectivit´e − 1 (not´ee
λ − 1), il est possible d’optimiser le nombre de messages lors du repartitionnement avec une
nouvelle approche. Cette m´ethode optimise directement la migration lors du repartitionnement
et ne n´ecessite pas de matrice de migration en entr´ee, comme le sugg`ere la figure 4.1.
En ajoutant, pour chaque ancienne partie, une hyper-arˆete regroupant tous les sommets de
cette partie, le crit`ere de coupe sera modifi´e pour prendre en compte le nombre de messages. En
effet, ces hyper-arˆetes seront coup´ees par λ parties qui prendront des sommets de cette ancienne
partie. Chaque nouvelle partie qui coupe une de ces hyper-arˆetes induit un message de migration
avec l’ancienne partie associ´ee `a cette hyper-arˆete. On note λi
, le nombre de parties qui coupent
l’hyper-arˆete correspondant `a l’ancienne partie i et wmsg le poids de ces hyper-arˆetes. λi est ´egale
au nombre de non-z´eros sur la ligne i de la matrice de migration C. Comme le poids de chaque
hyper-arˆete est compt´e λi − 1 fois, la coupe totale de toutes ces hyper-arˆetes ajout´ees est :
X
i∈J1,MK
(λi − 1) × wmsg =
X
i∈J1,MK
λi − M
× wmsg
= (nnz(C) − M) × wmsg
o`u nnz(C) est le nombre de non-z´eros dans la matrice de migration C.
En notant G l’hypergraphe initial et G′
l’hypergraphe enrichi des hyper-arˆetes de poids wmsg,
on obtient :
cut(G
′
) = cut(G) + wmsg × (nnz(C) − M)
≈ cut(G) + wmsg × TotalZ
Remarquons que nnz(C) − M est `a peu pr`es le nombre total de messages. TotalZ est
le nombre d’´el´ements non nuls hors diagonale de la matrice de migration. Dans le cas o`u la
diagonale ne poss`ede aucun ´el´ement nul, on a TotalZ = nnz(C) − min(M, N).
Ainsi en minimisant la coupe du graphe enrichi, le partitionneur minimise donc un compromis
entre la coupe du graphe initial et le nombre de messages. Si le poids wmsg de ces arˆetes est
suffisamment grand, cela revient `a minimiser le nombre de messages dans un premier temps puis
`a minimiser la coupe dans un second temps.
Par ailleurs, cette m´ethode optimisant TotalZ peut ˆetre combin´ee avec une strat´egie de
partitionnement biais´e optimisant le volume de migration TotalV. Pour cela, on reprend la
m´ethode de repartitionnement `a sommets fixes [2, 9] : on construit l’hypergraphe enrichi G′′ en
ajoutant un sommet fixe pour chaque ancienne partie, et des hyper-arˆetes de taille 2 reliant les
sommets fixes aux autres sommets appartenant `a l’ancienne partie correspondante avec un poids
wmig. La coupe du nouveau graphe G′′ devient alors :
cut(G
′′) = cut(G
′
) + wmig × TotalV
≈ cut(G) + wmsg × TotalZ + wmig × TotalV90 CHAPITRE 4. REPARTITIONNEMENT M × N
Bien que cette m´ethode soit capable de bien mod´eliser les objectifs du repartitionnement,
l’application `a l’aide d’un partitionneur d’hypergraphe ne donne pas de bons r´esultats.
Partitionner un tel graphe enrichi `a la fois avec de grandes hyper-arˆetes et les sommets
fixes connect´es `a de nombreux sommets est effectivement tr`es complexe. Comme il a d´ej`a ´et´e
expliqu´e dans la section 4.1.2, les strat´egies de bissections r´ecursives couramment utilis´ees par les
partitionneurs peuvent avoir du mal `a trouver de bonnes partitions pour certains types de graphes
ou d’hypergraphes. Dans le cas des hypergraphes, en plus des probl`emes avec les sommets fixes,
les bissections optimisent moins bien la coupe connectivit´e−1 des grandes hyper-arˆetes. Il serait
n´eanmoins possible d’am´eliorer le partitionnement `a l’aide d’un algorithme k-aire direct adapt´e
aux hypergraphes [3] 5
. Mais mˆeme avec un partitionnement k-aire, la phase de contraction dans
un partitionnement multi-niveaux peut aussi ˆetre perturb´ee par ces grandes hyper-arˆetes : il peut
ˆetre d´ecid´e de fusionner des sommets tr`es ´eloign´es s’ils appartiennent `a la mˆeme hyper-arˆete. Il
donc important d’utiliser un algorithme de contraction adapt´e qui donnerait moins d’importance,
voire ignorerait, ces grandes hyper-arˆetes malgr´e leur poids important.
4.5 Conclusion
Dans ce chapitre, nous avons pr´esent´e trois m´ethodes de repartitionnement M × N. Notre
partitionnement biais´e (BIASED) permet d’obtenir un bon partitionnement (´equilibre et coupe
faible) tout en imposant un sch´ema de communication donn´e, mais cette m´ethode n’impose
pas toujours la matrice de migration souhait´ee. Notre partitionnement diffusif (DIFF) permet
d’appliquer strictement une matrice de communication mais la coupe est moins bien optimis´ee,
en particulier pour les nouvelles parties, qui induisent d’importantes migrations. Nous avons
aussi pr´esent´e une m´ethode de partitionnement biais´e bas´e sur des hyper-arˆetes permettant de
minimiser directement TotalZ et TotalV sans utiliser de matrice de migration en entr´ee. Mais
cette derni`ere m´ethode ne donne pas de bonne partition avec les outils actuels et ne sera pas
´evalu´ee par la suite.
5. Le partitionneur kPaToH pr´esent´e par Aykanat et al. n’est malheureusement pas disponible.Chapitre 5
R´esultats
Sommaire
5.1 M´ethodologie exp´erimentale . . . . . . . . . . . . . . . . . . . . . . . 91
5.2 Influence du coˆut de migration et du facteur de repartitionnement 94
5.3 Influence du nouveau nombre de processeurs . . . . . . . . . . . . . 97
5.4 Comparaison sur des graphes complexes . . . . . . . . . . . . . . . 101
5.5 Etude de la complexit´e en temps . . . . . . . . . . . . . . . . . . . . 110 ´
Dans ce chapitre, nous pr´esentons plusieurs exp´eriences permettant d’´evaluer nos m´ethodes
de repartitionnement en les comparant aux partitionneurs actuels.
5.1 M´ethodologie exp´erimentale
Pour rappel, les objectifs du repartitionnement M × N sont :
— ´equilibrer la charge des diff´erentes parties ;
— minimiser la coupe du graphe ;
— calculer rapidement la nouvelle partition ;
— optimiser la migration.
Le premier objectif, l’´equilibrage, est toujours atteint par les partitionneurs : dans les ´evaluations
suivantes la tol´erance au d´es´equilibre est de 1%, c’est-`a-dire que la plus grosse partie ne d´epassera
pas de plus de 1% la taille moyenne des parties. Pour les trois autres objectifs, des m´etriques sont
utilis´es : la coupe ; TotalV, MaxV, TotalZ, MaxZ pour la migration ; et le temps d’ex´ecution
du partitionneur.
Dans ce chapitre, nous ´evaluons les m´ethodes de repartitionnement M × N Biased et Diff
que nous avons propos´es, dans deux variantes chacunes.
La premi`ere m´ethode combine la construction de la matrice de migration `a l’aide de l’algorithme
glouton (plus pr´ecis´ement l’algorithme Greedy2 optimisant le nombre de messages) et le
partitionnement biais´e utilisant les sommets fixes. L’algorithme glouton peut optimiser ou non la
diagonale de la matrice de migration. Dans le chapitre 3, il a ´et´e montr´e que ces deux variantes
permettent d’obtenir un TotalZ bas. L’optimisation de la diagonale permet de minimiser TotalV
mais en augmentant MaxZ. Ces deux strat´egies seront appel´ees BiasedGreedyD pour la
variante optimisant la diagonale, BiasedGreedy sinon. Le partitionnement biais´e est r´ealis´e `a
l’aide de Scotch et de la m´ethode de partitionnement k-aire direct pr´esent´ees dans la section 4.2
9192 CHAPITRE 5. RESULTATS ´
et int´egr´ee `a Scotch. Notons que le partitionnement est biais´e en modifiant le graphe fourni au
partitionneur et non en utilisant les fonctionnalit´es de repartitionnement disponibles dans Scotch.
La seconde m´ethode construit la matrice de migration `a l’aide du programme lin´eaire minimisant
soit TotalV, soit MaxV. Cette construction de la matrice de migration ne donne pas
un TotalZ minimal (mais garantit un MaxZ faible), il est donc pr´ef´erable d’utiliser la m´ethode
diffusive pour repartitionner le graphe d’apr`es ces matrices de migration. On nommera DiffTV
la strat´egie minimisant TotalV et DiffMV la strat´egie minimisant MaxV.
Ces m´ethodes seront compar´ees `a des m´ethodes de repartitionnement classiques :
— une m´ethode de Scratch-Remap ;
— la m´ethode de repartitionnement de Zoltan ;
— celle de ParMetis ;
— et celle de Scotch.
La m´ethode de Scratch-Remap est mise en œuvre `a l’aide du partitionnement from scratch
(sans repartitionnement) de Scotch et de l’algorithme 1 de remapping.
Il est important de noter que les partitionneurs Zoltan, ParMetis et Scotch n’ont pas ´et´e
d´evelopp´es pour le repartitionnement M × N mais il est tout de mˆeme possible des les utiliser
dans ce cas. Cela revient `a un repartitionnement N × N o`u certaines parties sont initialement
vides lorsque le nombre de processeurs augmente (M < N) ou certains sommets sont sans partie
lorsque le nombre de processeurs diminue (M > N).
Zoltan est un partitionneur d’hypergraphe 1 poss´edant une m´ethode de repartitionnement
biais´ee `a l’aide de sommets fixes. Le poids des arˆetes de migration choisi est 1 comme celui
des arˆetes du graphe `a partitionner. Cela permet d’obtenir un bon compromis entre coupe et
migration. Bien que Zoltan soit un partitionneur parall`ele, il est utilis´e avec un seul processus
dans nos exp´eriences.
ParMetis utilise une m´ethode de repartitionnement hybride choisissant le meilleur r´esultat
entre un repartitionnement diffusif et un Scratch-Remap pour le partitionnement initial d’un
repartitionnement multi-niveaux [58]. Le raffinement utilis´e est biais´e pour prendre en compte
un compromis entre coupe et volume de migration. ParMetis prend en compte un rapport de
coˆut entre la coupe et le volume de migration. Comme avec Zoltan, ce param`etre est fix´e `a 1.
ParMetis est un partitionneur parall`ele qui ne peut pas ˆetre utilis´e avec moins de deux processus.
Dans les exp´eriences suivantes, ParMetis profite donc de deux processus, alors que les autres
partitionneurs sont utilis´es en s´equentiel.
Scotch est capable de repartitionner `a l’aide d’une m´ethode de partitionnement biais´e. La strat´egie
de partitionnement de Scotch peut ˆetre choisie en d´etail `a l’aide d’une chaˆıne de strat´egie.
Mais dans le cas du repartitionnement, nous laissons Scotch construire la chaˆıne de strat´egie pour
obtenir une partition ´equilibr´ee (SCOTCH_STRATBALANCE), de qualit´e (SCOTCH_STRATQUALITY) et
adapt´ee au repartitionnement (SCOTCH_STRATREMAP). Scotch permet aussi de choisir l’importance
relative de la coupe et de la migration. La valeur choisie pour ce param`etre est encore 1.
Pour ´evaluer ces m´ethodes de repartitionnement, nous avons besoin de cr´eer des partitions
initiales d´es´equilibr´ees. Les anciennes partitions utilis´ees dans les repartitionnements suivants
sont cr´e´ees `a partir de partitions ´equilibr´ees dont le poids des sommets, valant initialement 1,
est modifi´e pour simuler un raffinement du maillage. En parcourant les parties dans un ordre
al´eatoire, la charge de la premi`ere partie n’est pas modifi´ee, la charge de la seconde est augment´ee
d’une certaine quantit´e, celle de la troisi`eme de deux fois cette quantit´e, etc., la charge de la
derni`ere partie augmente de M − 1 fois cette quantit´e. L’augmentation de la charge est choisie
1. Il est utilis´e ici pour partitionner des graphes. Un graphe n’est qu’un hypergraphe particulier ne poss´edant
que des hyper-arˆetes de taille 2. La coupe connectivit´e − 1 ´equivalent `a la coupe du graphe pour les hyper-arˆetes
de taille 2.5.1. METHODOLOGIE EXP ´ ERIMENTALE ´ 93
(a) Partition en 12 parties. (b) Modification du poids des sommets.
Figure 5.1 – Exemple de d´es´equilibrage d’une partie en 12.
de fa¸con `a ce que l’augmentation totale de la charge soient proportionnelle `a l’augmentation du
nombre de ressources. Par exemple, en partant d’une ancienne partition ´equilibr´ee en M = 8
parties, si la charge totale augmente de 50 %, l’ancienne partition (poss´edant maintenant un
d´es´equilibre de 33 %) est repartitionn´ee en N = 12 parties.
Pour augmenter la charge d’une partie, des sommets sont choisies al´eatoirement pour avoir
un poids plus ´elev´e. Pour chaque partie, ce nouveau poids est choisi pour ˆetre minimal. Par
exemple, si la charge augmente mais sans doubler la charge de la partie, le nouveau poids sera
2 ; si la charge augmente plus que le double, il n’est plus possible d’atteindre la charge d´esir´ee, le
nouveau poids est donc 3 voire plus. Dans une partie donn´ee, les poids des sommets sont alors 1
ou le nouveau poids choisi pour cette partie.
Un exemple d’un tel d´es´equilibrage est pr´esent´e sur la figure 5.1. Une grille d’´el´ements carr´e
est initialement partitionn´ee en 12 parties ´equilibr´ees (figure 5.1a). Les poids des sommets sont
ensuite modifi´es comme indiqu´e sur la figure 5.1b : en noir, les sommets qui ont gard´e un poids de
1 ; en gris, les sommets qui ont un poids 2 ; et en blanc un poids 3. La densit´e des poids dans une
mˆeme partie est `a peu pr`es uniforme. Mais la charge de chaque partie augmente d’une quantit´e
diff´erente : de celle ne contenant que des sommets de poids 1 `a celle contenant les sommets de
poids 3.
Les exp´eriences suivantes sont r´ep´et´ees plusieurs fois : 10 fois pour toutes les exp´eriences
sauf celles sur la complexit´e en temps (le nombre d’it´erations varie suivant le cas). A chaque `
repartitionnement le d´es´equilibre est diff´erent : l’ordre des parties utilis´e lors du d´es´equilibrage
et les sommets dont les poids sont modifi´es sont tir´es al´eatoirement `a chaque fois mais la variation
de la charge totale est toujours la mˆeme et identique `a la variation du nombre de processeurs.94 CHAPITRE 5. RESULTATS ´
5.2 Influence du coˆut de migration et du facteur de repartitionnement
Comme il a ´et´e dit dans le chapitre 4, il est important de bien choisir le poids des arˆetes de
migration ajout´ees dans le graphe original. Comme les partitionneurs utilisent g´en´eralement des
poids entiers pour les arˆetes, il n’est pas possible d’avoir un poids inf´erieur `a 1. Pour pouvoir
appliqu´e un poids moins important aux arˆetes de migration, nous r´eutilisons la m´ethode utilis´ee
par Zoltan : les poids de toutes les arˆetes du graphe original sont multipli´es par le facteur
de repartitionnement (repart multiplier). Ainsi le poids des arˆetes de migration devient moins
important relativement aux autres arˆetes. Dans cette section, nous ´etudions le comportement de
notre m´ethode de repartitionnement M × N biais´ee en fonction du rapport du poids des arˆetes
« normales » par rapport `a celui des arˆetes de migration repartmult
migcost .
Les exp´eriences pr´esent´ees dans cette section correspondent au repartitionnement d’une grille
3D 100 × 100 × 100 (1 000 000 sommets et 2 970 000 arˆetes, ce qui donne un degr´e moyen de
5, 94). Nous ´etudions le cas 8 × 10 o`u la charge augment de +25 % (le d´es´equilibre est 17 %).
Quelque graphiques pour le cas 8 × 12 o`u la charge augment de +50 % (le d´es´equilibre est 33 %)
sont pr´esent´ees dans l’annexe C.1. Les valeurs donn´ees sont les r´esultats moyens et les barres
d’erreurs donnent les r´esultats minimums et maximums. Le coˆut de migration et le facteur de
repartitionnement ne concerne que le partitionnement biais´e mais les valeurs moyennes de la
strat´egie Scratch-Remap sont donn´ees comme rep`eres.
Comme le repartitionnement biais´e impose le sch´ema de communication, un moyen simple
de v´erifier son efficacit´e et de regarder les valeurs de TotalZ effectivement obtenues apr`es le
repartitionnement. Les figures C.1 et 5.2 pr´esentent les valeurs de TotalZ dans deux cas de
repartitionnement, respectivement 8 × 12 et 8 × 10. Comme il a d´ej`a ´et´e d´ecrit au chapitre 3,
l’optimisation de la diagonale (GreedyD) cr´ee de trop grande hyper-arˆetes (une nouvelle partie
re¸coit des sommets d’un trop grand nombre d’anciennes parties). On v´erifie ici que cela rend le
partitionnement plus difficile : un coˆut de migration de 4 ne suffit plus `a imposer le sch´ema de
communication pour cette strat´egie. On voit sur la figure 5.2 que TotalZ est minimis´e `a partir
d’un coˆut de migration 4 fois sup´erieur pour la m´ethode BiasedGreedy. Ce seuil est un peu plus
´elev´e pour BiasedGreedyD. Un rapport repartmult
migcost de 1 offre un nombre de message bas, sans ˆetre
optimale alors qu’avec un facteur de repartitionnement plus important le nombre de messages
augmente tr`es rapidement. Dans le cas du repartitionnement 8 × 12 (figure C.1), la strat´egie
GreedyD cr´ee de moins grande hyper-arˆetes et la diff´erence entre biasedGreedy et BiasedGreedyD
s’estompe.
Le coˆut de migration et le facteur de repartitionnement permettent de param´etrer le compromis
entre migration et coupe. En effet, la coupe, donn´ee sur la figure 5.3, est l´eg`erement plus basse
avec un coˆut de migration faible et un facteur de repartitionnement important. Cette variation
est plus marqu´ee avec la m´ethode BiasedGreedyD car le partitionnement est plus difficile. Cette
diff´erence de coupe reste assez faible et devient mˆeme n´egligeable dans des cas plus favorable
comme le repartitionnement 8 × 12 (figure C.2).
Sur la figure 5.4, le volume total de migration TotalV ´evolue dans le sens contraire de la
coupe : un coˆut de migration important minimise le volume de migration, alors qu’un facteur de
repartitionnement plus important donne un volume ´equivalent au Scratch-Remap. La variation
plus importante de la coupe avec la m´ethode BiasedGreedyD s’explique par son optimisation
plus agressive de la migration. Contrairement `a la coupe, la variation de TotalV est bien plus
importante.
Le coˆut de migration et le facteur de repartitionnement influencent ´egalement le temps de
partitionnement. La figure 5.5 montre que le temps de partitionnement augmente avec un coˆut5.2. COUT DE MIGRATION ET FACTEUR DE REPARTITIONNEMENT ˆ 95
15
20
25
30
35
40
45
50
1/64 1/16 1/4 1/1 4/1 16/1 64/1
TotalZ
facteur de repartitionnement / cout de migration
BiasedGreedy
BiasedGreedyD
Scratch-Remap
Figure 5.2 – TotalZ 8 × 10 suivant repartmult/migcost.
40000
42000
44000
46000
48000
50000
52000
54000
56000
58000
1/64 1/16 1/4 1/1 4/1 16/1 64/1
Coupe
facteur de repartitionnement / cout de migration
BiasedGreedy
BiasedGreedyD
Scratch-Remap
Figure 5.3 – Coupe 8 × 10 suivant repartmult/migcost.96 CHAPITRE 5. RESULTATS ´
150000
200000
250000
300000
350000
400000
450000
500000
550000
600000
1/64 1/16 1/4 1/1 4/1 16/1 64/1
TotalV
facteur de repartitionnement / cout de migration
BiasedGreedy
BiasedGreedyD
Scratch-Remap
Figure 5.4 – TotalV 8 × 10 suivant repartmult/migcost.
0
5
10
15
20
25
1/64 1/16 1/4 1/1 4/1 16/1 64/1
Temps (s)
facteur de repartitionnement / cout de migration
BiasedGreedy
BiasedGreedyD
Scratch-Remap
Figure 5.5 – Temps 8 × 10 suivant repartmult/migcost.5.3. INFLUENCE DU NOUVEAU NOMBRE DE PROCESSEURS 97
de migration ou un facteur de repartitionnement plus important. Les poids plus important affect´es
aux arˆetes ralentissent les algorithmes de partitionnement, en particulier, les algorithmes de
raffinement de type FM, o`u il faut s´electionner un d´eplacement dans un intervalle de gain plus
important.
Il est donc n´ecessaire de choisir un coˆut de migration suffisamment ´elev´e pour obtenir une
bonne migration mais sans le prendre plus haut que n´ecessaire pour ´eviter un ralentissement du
partitionnement. Utiliser un facteur de repartitionnement important n’a pas d’int´erˆet : TotalZ
et TotalV sont alors ´equivalents, au Scratch-Remap mais la coupe et le temps de repartitionnement
sont plus importants. Dans les exp´eriences suivantes, le coˆut de migration utilis´e sera fix´e
`a 10 pour un facteur de repartitionnement de 1. Cela permettra d’obtenir une bonne migration
au prix d’une l´eg`ere augmentation du temps de partitionnement et de la coupe.
5.3 Influence du nouveau nombre de processeurs
La prochaine s´erie d’exp´erience ´etudie l’influence du nouveau nombre de processeurs. Une
grille 3D 100×100×100 est repartitionn´ee depuis 8 anciennes parties vers un nombre variable N de
nouvelles parties. Dans chaque cas, la charge est augment´ee proportionnellement `a l’augmentation
de ressources, soit N
8
.
La figure 5.6 pr´esente la coupe obtenue pour les diff´erents repartitionneurs. La m´ethode
Scratch-Remap offre la meilleure coupe comme on pouvait s’y attendre : c’est son seul objectif
en dehors de l’´equilibrage. Nos m´ethodes de repartitionnement donnent une coupe un peu plus
´elev´ee que le Scratch-Remap mais globalement meilleure que ParMetis et Zoltan. En particulier,
les m´ethodes BiasedGreedy et BiasedGreedyD donnent une bonne coupe comme celle du
repartitionneur Scotch.
Il est ´egalement int´eressant de remarquer que, bien que g´en´eralement tr`es proches, les m´ethodes
BisaedGreedy et BiasedGreedyD donnent une coupe diff´erente pour les petites valeurs de
N (8 × 9 et 8 × 10) : en effet, la m´ethode BiasedGreedyD donne de trop grandes hyper-arˆetes
pour les petites variations du nombre de processeur ce qui rend le repartitionnement plus difficile
et d´egrade en cons´equence la coupe pour cette m´ethode.
Les m´ethodes diffusives (DiffTV et DiffMV) donnent une coupe plus ´elev´ee que nos m´ethodes
biais´es mais meilleures que Zoltan et ParMetis. La diffusion est r´ealis´ee en une seule passe sans
profiter d’un partitionnement multi-niveaux complet. La partition obtenue est donc de moins
bonne qualit´e.
Le volume total de migration TotalV est donn´e sur la figure 5.7. La m´ethode Scratch-Remap
donne le volume de migration le plus ´elev´e mais celui-ci varie peu et il est asymptotiquement
rejoint par les autres m´ethodes de repartitionnement quand N devient tr`es grand compar´e `a M =
8. La strat´egie BiasedGreedyD donne le meilleur volume de migration quelle que soit la valeur de
N. Sa variante sans optimisation de la diagonale de la matrice de migration BiasedGreedy donne
un TotalV plus ´elev´e, surtout quand N et M sont proches et donne mˆeme la plus importante
migration (hors Scratch-Remap) dans le cas 8 × 9.
La m´ethode diffusive DiffTV optimisant TotalV donne ´egalement un volume de migration
tr`es bas. Il n’est pas toujours aussi bas que BiasedGreedyD `a cause du choix du graphe quotient
augment´e limitant les possibilit´es de migration. La variante DiffMV optimisant MaxV donne
un volume de migration total un peu plus ´elev´e, mais celui reste assez bas.
Les autres partitionneurs, en particulier ParMetis et Scotch donnent aussi un volume de
migration tr`es bas, alors que Zoltan se comporte un peu moins bien.
La figure 5.8 donne le volume de migration maximal par partie MaxV. Plusieurs courbes98 CHAPITRE 5. R
´ESULTATS
30000
40000
50000
60000
70000
80000
90000
100000
8 10 12 14 16 18 20 22 24 26 28
Coupe
Nouveau nombre de parties
Scratch-Remap
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Figure 5.6 – Coupe suivant N pour un repartitionnement 8 × N.5.3. INFLUENCE DU NOUVEAU NOMBRE DE PROCESSEURS 99 100000 200000 300000 400000 500000 600000 700000 800000 8 10 12 14 16 18 20 22 24 26 28
TotalV
Nouveau nombre de parties
Scratch-Remap
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Figure 5.7 – TotalV suivant N pour un repartitionnement 8 × N.100 CHAPITRE 5. R
´ESULTATS
100000
200000
300000
400000
500000
600000
700000
800000
900000
8 10 12 14 16 18 20 22 24 26 28
MaxV
Nouveau nombre de parties
Scratch-Remap
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Figure 5.8 – MaxV suivant N pour un repartitionnement 8 × N.5.4. COMPARAISON SUR DES GRAPHES COMPLEXES 101
sont confondues et donnent le MaxV le plus bas : BiasedGreedy, BiasedGreedyD, DiffMV et
ParMetis. Il apparait ici que MaxV est une m´etrique minimis´ee par ParMetis mais pas par les
autres repartitionneurs Zoltan et Scotch. La strat´egie DiffTV donne un MaxV l´eg`erement plus
´elev´e. Il apparait que les m´etriques TotalV et MaxV ne peuvent pas ˆetre minimis´ees en mˆeme
temps mais minimiser l’une suffit pour maintenir l’autre tr`es basse.
Quand N est grand compar´e `a M, les valeurs optimales de MaxV augmentent lin´eairement
`a la mˆeme vitesse que les pires (la strat´egie Scratch-Remap). La diff´erence relative devient donc
moins importante quand N est tr`es grand.
Les figures 5.9 et 5.10 montrent respectivement le nombre de messages total (TotalZ) et par
partie (MaxZ). Le nombre de messages est une m´etrique qui n’est pas habituellement prise en
compte par les repartitionneurs. Toutes nos m´ethodes donnent un nombre de messages tr`es bas
alors que Zoltan et le Scratch-Remap donnent le nombre de message le plus ´elev´e. ParMetis et
Scotch donnent des r´esultats interm´ediaires.
Les m´ethodes BiasedGreedy et BiasedGreedyD donnent le TotalZ le plus bas. En effet ces
m´ethodes essayent de minimiser ce crit`ere par construction `a l’aide de la recherche des sousensembles
(cf. section 3.3.3). L’optimisation de la diagonale n’influe pas sur ce crit`ere. Bien que
cette m´etrique n’est pas minimis´ee par la m´ethode DiffTV, la minimisation de TotalV semble
´egalement minimiser TotalZ dans la plupart des cas. Le nombre de messages pour DiffMV est
plus ´elev´e mais reste inf´erieur aux m´ethodes classiques de repartitionnement.
Le nombre maximal de messages par partie MaxZ fait apparaitre la diff´erence entre BiasedGreedy
et BiasedGreedyD : quand N et M sont proches, BiasedGreedyD donne un plus grand
nombre de messages par partie. En particulier, dans le cas 8 × 9, MaxZ devient tr`es ´elev´e pour
BiasedGreedyD et d´epasse les repartitionneurs classiques. A partir du cas 8 ` × 15, les deux m´ethodes
deviennent quasiment identiques.
Nous avons vu que nos m´ethodes permettent une meilleure migration selon les m´etriques TotalV,
MaxV, TotalZ et MaxZ mais avec une coupe l´eg`erement plus ´elev´ee. Le gain en terme
de volume de migration se r´eduit quand N devient grand devant M mais la diff´erence de coupe
reste la mˆeme. Nos m´ethodes sont donc plus int´eressantes quand l’´ecart entre l’ancien nombre de
processeurs et le nouveau n’est pas trop grand. Malgr´e cela, nos m´ethodes de repartitionnement
garde l’avantage d’un faible nombre de messages dans tous les cas.
La diff´erence entre les deux variantes de notre repartitionnement biais´e BiasedGreedy et
BiasedGreedyD se r´eduit avec l’augmentation du nombre de nouvelles parties : sauf lorsque la
variation du nombre de processeurs est tr`es petite, ces m´ethodes sont quasiment identiques.
5.4 Comparaison sur des graphes complexes
Pour valider nos approches de repartitionnement, nous pr´esentons dans cette section, des
r´esultats obtenus pour des graphes issus d’applications vari´ees. Ces graphes, pr´esent´es dans le
tableau 5.1, sont disponibles dans la collection de matrice creuse de l’universit´e de Floride [13],
`a l’exception de grid3d100 qui est une grille cubique r´eguli`ere de 100 × 100 × 100. Les mesures
des diff´erentes m´etriques sont donn´ees relativement au Scratch-Remap.
On ´etudie plus particuli`erement le cas 8×12, la charge de la partition initiale a ´et´e augment´ee
de 50 %, ce qui donne un d´es´equilibre de 33 %. Les r´esultats dans le cas du repartitionnement 8×10
(augmentation de la charge de 25 % et d´es´equilibre de 17 %)sont disponibles dans l’annexe C.2.
La figure 5.11 donne les coupes obtenues avec les diff´erents repartitionneurs relativement `a
celle du Scratch-Remap. Les repartitionneurs classiques, Zoltan, ParMetis et Scotch, donnent une
coupe g´en´eralement l´eg`erement sup´erieure `a celle du Scratch-Remap, parfois ´egale. Dans le cas de102 CHAPITRE 5. R
´ESULTATS
10
20
30
40
50
60
70
80
90
8 10 12 14 16 18 20 22 24 26 28
TotalZ
Nouveau nombre de parties
Scratch-Remap
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Figure 5.9 – TotalZ suivant N pour un repartitionnement 8 × N.5.4. COMPARAISON SUR DES GRAPHES COMPLEXES 103 0 5 10 15 20 25 8 10 12 14 16 18 20 22 24 26 28
MaxZ
Nouveau nombre de parties
Scratch-Remap
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Figure 5.10 – MaxZ suivant N pour un repartitionnement 8 × N.104 CHAPITRE 5. R
´ESULTATS
0.8
1
1.2
1.4
1.6
1.8
2
2.2
2.4
2.6
2.8
brack2cage12cfd2 crankseg_2 grid3d100 thermal2wave
Coupe
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Scratch-Remap
Figure 5.11 – Coupe relative au Scratch-Remap pour un repartitionnement 8 × 12.5.4. COMPARAISON SUR DES GRAPHES COMPLEXES 105
Graphe Description |V | |E| d
grid3d100 Grille 3D r´eguli`ere 1 000 000 2 970 000 5,94
cfd2 M´ecanique des fluides num´eriques (CFD) 123 440 1 482 229 24,02
crankseg 2 Probl`eme structurel 63 838 7 042 510 220,64
thermal2 Probl`eme thermique 1 228 045 3 676 134 5,99
brack2 Probl`eme 2D/3D 62 631 366 559 11,71
wave Probl`eme 2D/3D 156 317 1 059 331 13,55
cage12 Electrophor`ese d’ADN ´ 130 228 951 154 14,61
Table 5.1 – Description des graphes utilis´es pour nos exp´eriences. Le degr´e moyen d est calcul´e
`a l’aide de la formule 2×|E|
|V |
.
thermal2, Zoltan ne trouve pas de bonne partition. Les strat´egies BiasedGreedy et BiasedGreedyD
donnent une coupe comparable `a ces partitionneurs classiques. Les m´ethodes diffusives (DiffTV et
DiffMV ), ne profitant pas d’un partitionneur multi-niveaux complet, donnent une coupe souvent
plus ´elev´ee.
Comme on peut le voir sur la figure 5.12, toutes nos m´ethodes donnent un nombre de messages
TotalZ bien inf´erieur aux autres repartitionneurs. Les deux strat´egies Greedy donnent un
TotalZ `a peu pr`es ´equivalent et l´eg`erement inf´erieur aux m´ethode diffusives. Bien que cette
m´etrique ne soit pas minimis´ee par les programmes lin´eaires utilis´es, le TotalZ obtenu est bas.
C’est un effet de bord de la minimisation de TotalV ou MaxV par le programme lin´eaire :
en minimisant le volume de migration, beaucoup de communications possibles, d’apr`es le graphe
quotient enrichi choisi Q˜, sont de volume nul. Le petit nombre d’arˆetes ajout´ees dans Q˜ pour les
nouvelles parties favorise ´egalement un nombre de messages bas.
Pour le graphe crankseg 2, on remarque que le nombre de messages pour les strat´egies biais´ees
est anormalement ´elev´e. Le partitionneur n’a pas trouv´e de partition respectant le sch´ema de
communication impos´e par les sommets fixes. Malgr´e l’utilisation d’un algorithme de partitionnement
k-aire direct, les heuristiques utilis´ees ne permettent pas toujours de trouver une bonne
solution. Cette ´echec est sˆurement dˆu au degr´e ´elev´e de ce graphe qui rend le partitionnement
plus difficile. Les m´ethodes diffusives appliquent strictement la matrice de migration et n’ont
pas ce probl`eme. Seule la coupe peut ˆetre d´egrad´ee avec ces m´ethodes diffusives, si l’heuristique
choisissant les sommets `a migrer fonctionne mal.
Les volumes totaux de migrations TotalV sont pr´esent´es sur la figure 5.13. A l’exception de `
crankseg 2 pour lequel les m´ethodes biais´ees ´echouent, BiasedGreedyD donne toujours le volume
de migration total le plus bas et aussi le plus stable (d’apr`es les barres d’erreur). Comme on l’a
d´ej`a vu, DiffTV est contraint par le graphe quotient enrichi utilis´e et ne peut pas autant r´eduire
le volume de migration que BiasedGreedyD.
Concernant MaxV (figure 5.14), la comparaison entre DiffTV et DiffMV est invers´ee par
rapport `a TotalV. Les minimisations de TotalV et de MaxV ne sont pas li´ees. Minimiser l’un
ne suffit pas `a avoir l’autre minimal. Les deux m´ethodes Greedy donnent ´egalement un MaxV
tr`es bas. Parmi les autres repartitionneurs, seul ParMetis semble minimiser ce crit`ere. Zoltan,
Scotch et le Scratch-Remap donnent des volumes de migrations par partie (MaxV) beaucoup
plus ´elev´es.
Toutes nos m´ethodes de repartitionnement donnent un nombre de messages par partie (MaxZ)
plus faible que les autres repartitionneurs (figure 5.15). La m´ethode BiasedGreedy donne g´en´eralement
les meilleurs MaxZ bien que les heuristiques peuvent mal fonctionner dans certains
cas (cage12 et crankseg 2). La m´ethode BiasedGreedyD donne un MaxZ l´eg`erement plus ´elev´e
que BiasedGreedy : dans le cas 8 × 12, les anciens et nouveaux nombres de parties ne sont pas106 CHAPITRE 5. R
´ESULTATS
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1.1
1.2
brack2cage12cfd2 crankseg_2 grid3d100 thermal2wave
TotalZ
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Scratch-Remap
Figure 5.12 – TotalZ relatif au Scratch-Remap pour un repartitionnement 8 × 12.5.4. COMPARAISON SUR DES GRAPHES COMPLEXES 107 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 brack2cage12cfd2 crankseg_2 grid3d100 thermal2wave
TotalV
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Scratch-Remap
Figure 5.13 – TotalV relatif au Scratch-Remap pour un repartitionnement 8 × 12.108 CHAPITRE 5. R
´ESULTATS
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1.1
brack2cage12cfd2 crankseg_2 grid3d100 thermal2wave
MaxV
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Scratch-Remap
Figure 5.14 – MaxV relatif au Scratch-Remap pour un repartitionnement 8 × 12.5.4. COMPARAISON SUR DES GRAPHES COMPLEXES 109 0 0.2 0.4 0.6 0.8 1 1.2 brack2cage12cfd2 crankseg_2 grid3d100 thermal2wave
MaxZ
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Scratch-Remap
Figure 5.15 – MaxZ relatif au Scratch-Remap pour un repartitionnement 8 × 12.110 CHAPITRE 5. RESULTATS ´
trop proches. La distinction entre BiasedGreedy et BiasedGreedyD est plus significative quand le
nombre de parties change peu, par exemple dans le cas 8×10 (figure C.7). Les m´ethodes DiffTV
et DiffMV ont ´egalement un MaxZ bas. En effet, MaxZ est limit´e par le degr´e du graphe
quotient enrichi utilis´e par le programme lin´eaire et celui-ci est construit de fa¸con `a garder un
degr´e faible (au plus 3 arˆetes pour chaque partie ajout´ee).
Le cas 8×10 pr´esent´e dans l’annexe C.2, donne des r´esultats similaires mais la diff´erence entre
BiasedGreedy et BiasedGreedyD est plus marqu´e par rapport aux crit`eres TotalV et MaxZ.
Les r´esultats dans le cas 8 × 10 sont assez similaires mais avec une diff´erence plus marqu´ee
entre BiasedGreedy et BiasedGreedyD sur les crit`eres TotalV et MaxV.
Ces exp´eriences valident nos algorithmes de repartitionnement M × N sur des graphes complexes
pour une augmentation de charge de 50 % (8 × 12) ou de 25 % (8 × 10). Nos m´ethodes
sont capables de mieux optimiser les diff´erentes m´etriques li´ees `a la migration (TotalV, MaxV,
TotalZ et MaxZ) que les autre repartitionneurs, en obtenant une coupe l´eg`erement sup´erieure
`a une m´ethode Scratch-Remap et comparable aux autres repartitionneurs.
Les m´ethodes utilisant le partitionnement biais´e donnent les meilleurs r´esultats mais manquent
de fiabilit´e. Le partitionnement est biais´e pour pr´ef´erer appliquer une matrice de migration donn´ee
mais les heuristiques de partitionnement peuvent faire des mauvais choix (par exemple dans
le cas de crankseg 2.
Les m´ethodes diffusives sont plus fiables : la matrice de migration est strictement appliqu´ee
mais les r´esultats sont de moins bonne qualit´e. La migration peut ˆetre mal optimis´ee `a cause
d’un mauvais choix du graphe quotient enrichi. De plus, notre mise en œuvre rudimentaire de
repartitionnement diffusif ne profite pas d’une approche multi-niveaux et se fait en une seule
passe ; la coupe n’est donc pas tr`es bien minimis´ee.
5.5 Etude de la complexit´e en temps ´
Dans cette section, nous ´etudions le temps d’ex´ecution du partitionnement biais´e et des
repartitionneurs classiques. Les m´ethodes diffusives ne sont pas ´evalu´es car leur mise en œuvre
actuelle n’est que pr´eliminaire 2
.
Les deux param`etres importants conditionnant la complexit´e du repartitionnement sont la
taille du graphe (|V | et |E|) et le nombre de parties finales (N).
Pour ´etudier l’influence du nombre de parties (figure 5.16), nous repartitionnons la grille 3D
100×100×100 dans le cas M ×N avec M et N variables mais en gardant le rapport N/M = 3/2
fixe.
Alors que la m´ethode de Scratch-Remap et les autres repartitionneurs ont une complexit´e en
temps logarithmique par rapport au nombre de parties grˆace `a la m´ethode des bissections r´ecursives,
notre partitionnement biais´e est tr`es rapidement ralenti avec l’augmentation du nombre de
parties.
Lorsque le nombre de parties est petit, le temps d’ex´ecution de notre partitionnement biais´e
est l´eg`erement sup´erieur au repartitionneur de Scotch mais suit la mˆeme progression. Notre
partitionnement biais´e et le repartitionnement de Scotch se basent sur le mˆeme partitionneur
(ils utilisent les mˆemes algorithmes de contraction et de raffinement du graphe) mais notre
2. En effet, l’heuristique de type FM utilis´ee pour migrer le sommets de chaque message, ne profite pas d’une
approche multi-niveaux et chaque message est trait´ee comme un partitionnement complet.5.5. ETUDE DE LA COMPLEXIT ´ E EN TEMPS ´ 111 0 10 20 30 40 50 60 70 80 90 100 0 20 40 60 80 100 120 140
Temps (s)
N
Scratch-Remap
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
Figure 5.16 – Temps d’ex´ecution du repartitionnement M × N suivant le nouveau nombre de parties N avec M = 23N.112 CHAPITRE 5. RESULTATS ´
partitionnement biais´e utilise un graphe enrichi qui poss`ede plus d’arˆetes (chaque message ajoute
autant d’arˆetes qu’il y a de sommets dans une ancienne partie).
Quand le nombre de parties est plus important, le partitionnement biais´e ralentit beaucoup
plus rapidement. Le KGGGP utilis´e en tant que partitionnement initial dans l’algorithme multiniveaux
devient pr´edominant par rapport aux phases de contraction et d’expansion, `a cause de
sa complexit´e lin´eaire par rapport au nombre de parties (cf. section 4.2.3).
Dans une seconde exp´erience, nous g´en´erons des grilles 3D cubiques de tailles variables qui
sont repartitionn´ees dans le cas 8×12. La figure 5.17 donne les temps d’ex´ecution en fonction du
nombre de sommets |V | qui est `a peu pr`es proportionnel au nombre d’arˆetes |E| (il y a environ
3 arˆetes pour chaque sommet). Comme les autres m´ethodes, notre partitionnement biais´e a une
complexit´e en temps lin´eaire par rapport `a la taille du graphe.5.5. ETUDE DE LA COMPLEXIT ´ E EN TEMPS ´ 113 0 5 10 15 20 0 500000 1e+06 1.5e+06 2e+06
Temps (s)
|V|
Scratch-Remap
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
Figure 5.17 – Temps d’ex´ecution du repartitionnement 8 × 12 suivant la taille du graphe (|V |).114 CHAPITRE 5. RESULTATS ´Chapitre 6
Conclusion et Perspectives
6.1 Conclusion
Nous avons pr´esent´e dans cette th`ese plusieurs m´ethodes de r´e´equilibrage dynamique avec un
nombre variable de processeurs, bas´ees sur le repartitionnement de graphe. Les objectifs de ce
repartitionnement sont de r´e´equilibrer la partition et de minimiser la coupe tout en optimisant
la migration caract´eris´ee par les m´etriques TotalV (le volume total de migration), MaxV (le
volume maximal de migration par partie), TotalZ (le nombre total de messages) et MaxZ (le
nombre maximal de messages par partie).
Notre m´ethode se d´ecompose en deux grandes ´etapes : d’abord une matrice de migration
est construite pour optimiser les diff´erentes m´etriques de migration ; puis un algorithme de repartitionnement
calcule une nouvelle partition du graphe en prenant en compte la matrice de
migration pr´ec´edemment construite.
Une ´etude th´eorique du repartitionnement dans le cas o`u l’ancienne partition est ´equilibr´ee
nous a permis de trouver les valeurs optimales pour TotalV et TotalZ. Plusieurs algorithmes
ont ´et´e pr´esent´es pour essayer de construire des matrices de migration optimales. Les m´ethodes
1D, Matching, Greedy et GreedyD permettent d’obtenir une nombre de messages TotalZ quasi
optimal. De plus, les m´ethodes Matching et GreedyD minimisent TotalV mais au coˆut d’un
MaxZ parfois tr`es ´elev´e. Les m´ethodes 1D et Greedy gardent un MaxZ faible, mais donnent un
TotalV l´eg`erement plus ´elev´e. La m´ethode Matching n’est utilisable que dans le cas ´equilibr´e
ou quasiment ´equilibr´e, ce qui limite son int´erˆet en pratique.
Nous avons ´egalement pr´esent´e un programme lin´eaire (PL) permettant d’optimiser une des
diff´erentes m´etriques TotalV, MaxV, TotalZ ou MaxZ, ou combinaison lin´eaire de celles-ci,
´etant donn´e un graphe quotient enrichi indiquant les messages autoris´es. Un mauvais choix du
graphe quotient enrichi limite la qualit´e des r´esultats de cette m´ethode.
Nous avons ensuite propos´e deux m´ethodes de repartitionnement de graphe (Biased et Diff )
se basant sur une matrice de migration construite `a l’´etape pr´ec´edente. Le partitionnement
biais´e utilisant des sommets fixes permet d’obtenir une nouvelle partition de qualit´e offrant
une bonne coupe mais rend le partitionnement plus difficile et donc plus lent. Cette m´ethode a
aussi l’inconv´enient de n´ecessiter une nombre de message TotalZ minimal. On pr´ef´erera donc
l’utiliser conjointement avec les m´ethodes de construction de matrice minimisant cette m´etrique.
Le partitionnement diffusif permet d’appliquer strictement une matrice de migration quel que
soit son nombre de messages. Mais notre mise œuvre pr´eliminaire n’utilise qu’une passe sans
115116 CHAPITRE 6. CONCLUSION ET PERSPECTIVES
multi-niveaux et donne par cons´equent une coupe plus ´elev´ee.
Nous avons aussi montr´e qu’il est possible de mod´eliser le nombre de messages TotalZ et
le volume de migration total TotalV `a l’aide de la coupe d’un hypergraphe enrichi. Il est ainsi
possible de repartitionner sans calculer une matrice de migration `a l’avance. Mais l’hypergraphe
ainsi cr´e´e est tr`es complexe et tr`es difficile `a partitionner avec les outils actuels.
Dans le cadre de notre m´ethode de partitionnement biais´e, nous avons mis en ´evidence des
limitations du partitionnement bas´e sur les bissections r´ecursives. Nous avons donc r´ealis´e une
m´ethode de partitionnement k-aire direct int´egr´ee dans le partitionneur Scotch. Cette m´ethode
de KGGGP (k-way greedy graph growing partitioning) permet de mieux appliquer notre m´ethode
de partitionnement biais´e mais poss`ede une complexit´e par rapport au nombre de parties plus
importante que les m´ethodes de bissections r´ecursives.
Les m´ethodes de repartitionnement biais´e et diffusif ont ´et´e ´evalu´ees par une suite d’exp´eriences.
Nous avons vu que ces approches sont plus int´eressantes quand le nombre de processeurs
varie peu. Quand le nombre de processeurs varie beaucoup, une m´ethode Scratch-Remap donne
un volume de migration ´equivalent mais une meilleure coupe, tout en ´etant plus simple `a r´ealiser.
N´eanmoins, mˆeme dans ce cas, nos m´ethodes permettent d’obtenir un nombre de messages bien
plus faible. Nous avons valid´e ces m´ethodes sur une s´erie de graphes complexes issus d’applications
r´eelles. Le partitionnement biais´e offre de bons r´esultats mais il ralentit rapidement avec
l’augmentation du nombre de parties. Les r´esultats obtenus `a l’aide du partitionnement diffusif
sont encourageants mais laissent place `a des am´eliorations. L’´etat de la mise en œuvre du
partitionnement diffusif ne nous permet pas actuellement de conclure sur sa rapidit´e d’ex´ecution.
La mise en œuvre de ces algorithmes et les modifications apport´ees `a Scotch pour le KGGGP
sont int´egr´ees dans la biblioth`eque LBC2 [16] dont le code source est disponible `a l’adresse :
https://gforge.inria.fr/frs/download.php/33277/lbc2-r1844.tar.gz.
6.2 Perspectives
En vue d’am´eliorer les diff´erents algorithmes pr´esent´es dans cette th`ese, plusieurs pistes sont
envisag´ees.
Nous avons vu que la qualit´e de la matrice de migration obtenue par le programme lin´eaire
est limit´ee par le choix du graphe quotient enrichi. Un meilleur algorithme d’enrichissement
du graphe quotient devrait ˆetre d´evelopp´e pour pouvoir effectivement atteindre des volumes de
migration minimaux. De plus, l’algorithme pr´esent´e dans cette th`ese ne permet pas de traiter le
cas o`u le nombre de processeurs diminue.
Le programme lin´eaire construisant la matrice de migration permet de minimiser une combinaison
lin´eaire des m´etriques de migration. Cet objectif m´elange des m´etriques de natures tr`es
diff´erentes. La recherche des coefficients permettant d’obtenir un bon compromis est un probl`eme
complexe qui m´eriterait d’ˆetre ´etudi´e.
Pour am´eliorer `a la fois la qualit´e de la coupe et le temps d’ex´ecution de notre m´ethode diffusive,
il faudrait utiliser celle-ci avec une approche multi-niveaux. Ce repartitionnement serait alors
une m´ethode hybride utilisant un algorithme de local matching [58] pour la phase de contraction
(permettant ainsi de garder l’information de l’ancienne partition sur le graphe contract´e), le partitionnement
diffusif lors du partitionnement initial, puis une m´ethode de raffinement biais´e lors
de l’expansion.6.2. PERSPECTIVES 117
Le principal probl`eme de notre m´ethode de partitionnement biais´e est son temps d’ex´ecution.
Celui-ci est principalement dˆu `a notre partitionnement KGGGP en O(k|E|). Pour r´eduire sa
complexit´e, il faudrait ne pas consid´erer pour chaque sommet tous les d´eplacements vers les
k parties, mais par exemple seulement vers les parties voisines ou en s’inspirant de certaines
m´ethodes de raffinement k-aire ayant une bonne complexit´e en O(|E|) [35].
Une autre cause de ralentissement du partitionnement biais´e est l’ajout d’un grand nombre
d’arˆetes. Une solution serait l’utilisation d’arˆetes virtuelles : au lieu d’ajouter des sommets fixes
et des arˆetes de migration, les heuristiques de partitionnement sont modifi´ees pour prendre directement
en compte le repartitionnement M × N. C’est, par exemple, l’approche d´ej`a utilis´ee
dans Scotch [18].
Pour pouvoir appliquer ces m´ethodes dans le cadre d’applications r´eelles, il serait n´ecessaire
de rendre nos algorithmes parall`eles. Pour parall´eliser le repartitionnement, il est possible de
r´eutiliser les partitionneurs parall`eles (PT-Scotch, Zoltan, ParMetis, ...). Pour parall´eliser la m´ethode
KGGGP, comme celle-ci est utilis´ee sur un petit graphe contract´e grˆace au multi-niveaux,
une m´ethode na¨ıve serait de profiter de l’al´eatoire pour calculer des partitions diff´erentes sur
chaque processeur, puis de diffuser la meilleure partition obtenue [9, 50].
Le repartitionnement M × N pourrait aussi trouver une application dans l’optimisation des
communications entre des codes coupl´es. Actuellement chaque code est partitionn´e ind´ependamment
de l’autre alors que les processeurs des diff´erents codes communiquent r´eguli`erement entre
eux. Pour optimiser ces communications, il faudrait utiliser une m´ethode de co-partitionnement.
Une approche consisterait `a commencer par partitionner l’un des codes, puis de partitionner
le second code en prenant en compte la partition de l’autre (comme dans un repartitionnement).
Dans ce contexte, il n’est pas n´ecessaire de minimiser le volume total de migration TotalV, car
toutes les donn´ees de couplage sont syst´ematiquement ´echang´ees lors de cette ´etape. En revanche,
il est toujours possible d’optimiser le nombre de messages (TotalZ ou MaxZ) ainsi que la taille
de chacun (MaxV).118 CHAPITRE 6. CONCLUSION ET PERSPECTIVESAnnexe A
Programmes lin´eaires pour
optimiser les diff´erentes m´etriques
Dans chaque programme, les entr´ees sont :
— la variation de charge di
id´eale pour chaque processeur i (la diff´erence entre la nouvelle
charge ´equilibr´ee pour la partition en N parties et l’ancienne charge dans la partition
d´es´equilibr´ee en M parties) ;
— une tol´erance au d´es´equilibre ub qui correspond `a la surcharge maximale autoris´ee.
On cherche `a calculer les valeurs optimales des eij qui est la quantit´e de donn´ees envoy´ees du
processeur i vers le processeurs j.
A.1 Minimisation de TotalV
minimiser X
i,j
eij
Contraintes lin´eaires :
∀i ∈ V, vi =
X
j
(eji − eij )
Bornes :
∀i ∈ V, vi ≤ di + ub
∀(i, j) ∈ E, 0 ≤ eij
119120 ANNEXE A. PROGRAMMES LINEAIRES ´
A.2 Minimisation de MaxV
minimiser v
Contraintes lin´eaires :
∀i ∈ V, vi =
X
j
(eji − eij )
∀i ∈ V, v′
i =
X
j
(eji + eij ) − v
Bornes :
∀i ∈ V, vi ≤ di + ub
∀i ∈ V, v′
i ≤ 0
∀(i, j) ∈ E, 0 ≤ eij
0 ≤ v
A.3 Minimisation de TotalZ
xij et eij entiers.
minimiser X
ij
xij
Contraintes lin´eaires :
∀i ∈ V, vi =
X
j
(eji − eij )
∀(i, j) ∈ E, aij = eij − xij
∀(i, j) ∈ E, bij = eij − W xij
Bornes :
∀i ∈ V, vi ≤ di + ub
∀i ∈ V, 0 ≤ aij
∀i ∈ V, bij ≤ 0
∀(i, j) ∈ E, 0 ≤ eij
∀(i, j) ∈ E, 0 ≤ xij≤ 1A.4. MINIMISATION DE MAXZ 121
A.4 Minimisation de MaxZ
xij et eij entiers.
minimiser z
Contraintes lin´eaires :
∀i ∈ V, vi =
X
j
(eji − eji)
∀(i, j) ∈ E, aij = eij − xij
∀(i, j) ∈ E, bij = eij − W xij
∀i ∈ V, zi =
X
j
(xij + xji) − z
Bornes :
∀i ∈ V, vi ≤ di + ub
∀i ∈ V, 0 ≤ aij
∀i ∈ V, bij ≤ 0
∀i ∈ V, zi ≤ 0
∀(i, j) ∈ E, 0 ≤ eij
∀(i, j) ∈ E, 0 ≤ xij≤ 1
0 ≤ z122 ANNEXE A. PROGRAMMES LINEAIRES ´Annexe B
Documentation du KGGGP dans
Scotch
Notre m´ethode de partitionnement KGGGP a ´et´e r´ealis´ee en modifiant Scotch 6.0. Cette
m´ethode est indiqu´ee dans les chaˆınes de strat´egie par la lettre g.
Cette strat´egie accepte les param`etres suivants :
— bal indique la tol´erance au d´es´equilibre utilis´ee. La valeur par d´efaut est 0.05 (5 %).
— type indique le crit`ere de s´election utilis´e. Les valeurs accept´ees sont :
— g pour le gain de coupe (par d´efaut) ;
— d pour le crit`ere diff.
— seed indique le type de graines `a utiliser :
— n pour n’utiliser aucune graine (par d´efaut) ;
— r pour utiliser des graines al´eatoire ;
— o pour utiliser des graines ´eloign´ees.
Les graines r et o ne sont pas compatibles avec le partitionnement `a sommets fixes.
— pass indique le nombre de passes `a effectuer. La meilleure partition est retenue.
— center indique s’il faut utiliser les centres des parties comme graines `a la passe suivante.
Les valeurs possibles sont y pour les utiliser ou n pour ne pas les utiliser (par d´efaut). Si
les centres sont utilis´es comme graines, le type de graine donn´e par seed n’est utilis´e que
pour la premi`ere passe.
— ref donne la strat´egie de raffinement `a appliquer apr`es chaque passe. Aucune strat´egie de
raffinement n’est utilis´ee par d´efaut.
Plus de d´etails sur les chaˆınes de strat´egies en g´en´eral peuvent ˆetre trouv´es dans le manuel
de Scotch 6.0 [51].
123124 ANNEXE B. DOCUMENTATION DU KGGGP DANS SCOTCHAnnexe C
R´esultats suppl´ementaires
C.1 Influence du coˆut de migration et du facteur de repartitionnement
15
20
25
30
35
40
45
50
55
1/64 1/16 1/4 1/1 4/1 16/1 64/1
TotalZ
facteur de repartitionnement / cout de migration
BiasedGreedy
BiasedGreedyD
Scratch-Remap
Figure C.1 – TotalZ 8 × 12 suivant repartmult/migcost.
125126 ANNEXE C. RESULTATS SUPPL ´ EMENTAIRES ´
44000
46000
48000
50000
52000
54000
56000
58000
60000
1/64 1/16 1/4 1/1 4/1 16/1 64/1
Coupe
facteur de repartitionnement / cout de migration
BiasedGreedy
BiasedGreedyD
Scratch-Remap
Figure C.2 – Coupe 8 × 12 suivant repartmult/migcost.
C.2 Comparaison sur des graphes complexesC.2. COMPARAISON SUR DES GRAPHES COMPLEXES 127 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 brack2cage12cfd2 crankseg_2 grid3d100 thermal2wave
Coupe
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Scratch-Remap
Figure C.3 – Coupe relative au Scratch-Remap pour un repartitionnement 8 × 10128 ANNEXE C. R
´ESULTATS SUPPL
´EMENTAIRES
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1.1
1.2
brack2cage12cfd2 crankseg_2 grid3d100 thermal2wave
TotalV
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Scratch-Remap
Figure C.4 – TotalV relatif au Scratch-Remap pour un repartitionnement 8 × 10C.2. COMPARAISON SUR DES GRAPHES COMPLEXES 129 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 brack2cage12cfd2 crankseg_2 grid3d100 thermal2wave
TotalZ
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Scratch-Remap
Figure C.5 – TotalZ relatif au Scratch-Remap pour un repartitionnement 8 × 10130 ANNEXE C. R
´ESULTATS SUPPL
´EMENTAIRES
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1.1
brack2cage12cfd2 crankseg_2 grid3d100 thermal2wave
MaxV
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Scratch-Remap
Figure C.6 – MaxV relatif au Scratch-Remap pour un repartitionnement 8 × 10C.2. COMPARAISON SUR DES GRAPHES COMPLEXES 131 0 0.2 0.4 0.6 0.8 1 1.2 1.4 brack2cage12cfd2 crankseg_2 grid3d100 thermal2wave
MaxZ
Zoltan
Parmetis
Scotch
BiasedGreedy
BiasedGreedyD
DiffTV
DiffMV
Scratch-Remap
Figure C.7 – MaxZ relatif au Scratch-Remap pour un repartitionnement 8 × 10132 ANNEXE C. RESULTATS SUPPL ´ EMENTAIRES ´Bibliographie
[1] Zoltan : Parallel partitioning, load balancing and data-management services. http://www.
cs.sandia.gov/Zoltan/Zoltan.html.
[2] Cevdet Aykanat, B. Barla Cambazoglu, Ferit Findik et Tahsin Kurc : Adaptive decomposition
and remapping algorithms for object-space-parallel direct volume rendering of
unstructured grids. J. Parallel Distrib. Comput., 67:77–99, janvier 2007.
[3] Cevdet Aykanat, B. Barla Cambazoglu et Bora U¸car : Multi-level direct k-way hypergraph
partitioning with multiple constraints and fixed vertices. J. Parallel Distrib. Comput.,
68:609–625, mai 2008.
[4] Stephen T Barnard et Horst D Simon : Fast multilevel implementation of recursive spectral
bisection for partitioning unstructured problems. Concurrency : Practice and Experience,
6(2):101–117, 1994.
[5] Roberto Battiti et Alan Bertossi : Differential greedy for the 0-1 equicut problem. In
in Proceedings of the DIMACS Workshop on Network Design : Connectivity and Facilities
Location, pages 3–21. American Mathematical Society, 1997.
[6] Roberto Battiti et Alan Bertossi : Greedy, prohibition, and reactive heuristics for graph
partitioning. IEEE Transactions on Computers, 48:361–385, 1998.
[7] Andrew E Caldwell, Andrew B Kahng et Igor L Markov : Hypergraph partitioning
with fixed vertices. In Proceedings of the 36th annual ACM/IEEE Design Automation
Conference, pages 355–359. ACM, 1999.
[8] U. V. ¸Catalyurek ¨ , E. G. Boman, K. D. Devine, D. Bozdag˘, R. Heaphy, et L. A. Fisk :
Hypergraph-based dynamic load balancing for adaptive scientific computations. Proceedings
of 21st International Parallel and Distributed Processing Sympsosium (IPDPS), 2007.
[9] Umit V. ¸Catalyurek ¨ , Erik G. Boman, Karen D. Devine, Doruk Bozdag˘, Robert T. Heaphy
et Lee Ann Riesen : A repartitioning hypergraph model for dynamic load balancing.
J. Parallel Distrib. Comput., 69(8):711–724, 2009.
[10] C´edric Chevalier et Fran¸cois Pellegrini : Improvement of the efficiency of genetic algorithms
for scalable parallel graph partitioning in a multi-level framework. In Euro-Par 2006
Parallel Processing, volume 4128, pages 243–252, Dresden, septembre 2006. Springer.
[11] Jr. Ciarlet, P. et F. Lamour : On the validity of a front-oriented approach to partitioning
large sparse graphs with a connectivity constraint. Numerical Algorithms, 12(1):193–214,
1996.
[12] G. Cybenko : Dynamic load balancing for distributed memory multiprocessors. Journal of
Parallel and Distributed Computing, 7(2):279–301, octobre 1989.
[13] Timothy A. Davis et Yifan Hu : The university of Florida sparse matrix collection. ACM
Trans. Math. Softw., 38(1):1 :1–1 :25, d´ecembre 2011.
133134 BIBLIOGRAPHIE
[14] Ralf Diekmann, Robert Preis, Frank Schlimbach et Chris Walshaw : Shape-optimized
mesh partitioning and load balancing for parallel adaptive FEM. Parallel Computing, 26(12):
1555–1581, 2000.
[15] Olivier Duchenne, Francis R. Bach, In-So Kweon et Jean Ponce : A tensor-based
algorithm for high-order graph matching. In CVPR, pages 1980–1987. IEEE, 2009.
[16] Aur´elien Esnard et Cl´ement Vuchener : Library for Balancing Code Coupling. http:
//gforge.inria.fr/projects/mpicpl/.
[17] C. M. Fiduccia et R. M. Mattheyses : A linear-time heuristic for improving network
partitions. 19th Design Automation Conference, pages 175–181, 1982.
[18] S´ebastien Fourestier : Redistribution dynamique parall`ele efficace de la charge pour les
probl`emes num´eriques de tr`es grande taille. Th`ese de doctorat, Universit´e Bordeaux 1, juin
2013.
[19] S´ebastien Fourestier et Fran¸cois Pellegrini : Adaptation au repartitionnement de
graphes d’une m´ethode d’optimisation globale par diffusion. In Proc. RenPar’20, SaintMalo,
France, mai 2011.
[20] Michael R. Garey et David S. Johnson : Computers and Intractibility : A Guide to the
Theory of NP-Completeness. W. H. Freeman, 1979.
[21] Norman E. Gibbs, William G. Poole, Jr. et Paul K. Stockmeyer : An algorithm for
reducing the bandwidth and profile of a sparse matrix. SIAM Journal on Numerical Analysis,
13(2):236–250, 1976.
[22] B. Hendrickson et R. Leland : A multilevel algorithm for partitioning graphs. In Proceedings
of 1995 ACM/IEEE conference on Supercomputing, 1995.
[23] Bruce Hendrickson, Robert W. Leland et Rafael Van Driessche : Skewed graph partitioning.
In Eighth SIAM Conf. Parallel Processing for Scientific Computing, 1997.
[24] Bruce Hendrickson et Tobert Leland : Chaco : Software for partitioning graphs. http:
//www.sandia.gov/~bahendr/chaco.html.
[25] Roger A. Horn et Charles R. Johnson : Matrix Analysis. Cambridge University Press,
1985.
[26] Y. F. Hu et R. J. Blake : An optimal dynamic load balancing algorithm. Rapport technique,
Daresbury Laboratory, 1995.
[27] Saeed Iqbal et Graham F. Carey : Performance analysis of dynamic load balancing algorithms
with variable number of processors. Journal of Parallel and Distributed Computing,
65(8):934 – 948, 2005.
[28] Saeed Iqbal et Graham F. Carey : Performance of parallel computations with dynamic
processor allocation. Engineering with Computers, 24:135–143, 2008.
[29] Sachin Jain, Chaitanya Swamy et K. Balaji : Greedy algorithms for k-way graph partitioning.
In the 6th international conference on advanced computing, 1998.
[30] George Karypis : hMETIS. http://glaros.dtc.umn.edu/gkhome/metis/hmetis/
overview.
[31] George Karypis : METIS. http://glaros.dtc.umn.edu/gkhome/metis/metis/
overview.
[32] George Karypis : PARMETIS. http://glaros.dtc.umn.edu/gkhome/metis/parmetis/
overview.135
[33] George Karypis, Rajat Aggarwal, Vipin Kumar et Shashi Shekhar : Multilevel hypergraph
partitioning : Applications in VLSI domain. IEEE Transactions on VLSI Systems,
7(1):69–79, 1999.
[34] George Karypis et Vipin Kumar : A fast and high quality multilevel scheme for partitioning
irregular graphs. In International Conference on Parallel Processing, pages 113–122, 1995.
[35] George Karypis et Vipin Kumar : Multilevel k-way partitioning scheme for irregular
graphs. Journal of Parallel and Distributed Computing, 48:96–129, 1998.
[36] George Karypis et Vipin Kumar : A fast and high quality multilevel scheme for partitioning
irregular graphs. SIAM Journal on Scientific Computing, 20(1), 1999.
[37] George Karypis et Vipin Kumar : Parallel multilevel k-way partitioning scheme for irregular
graphs. SIAM Review, 41(2):278–300, 1999.
[38] George Karypis et Vipin Kumar : Multilevel k-way hypergraph partitioning. VLSI Design,
11(3):285–300, 2000.
[39] B. W. Kernighan et S. Lin : An efficient heuristic procedure for partitioning graphs. Bell
System Technical Journal, 49:291–307, f´evrier 1970.
[40] Scott Kirkpatrick, C. D. Gelatt et Mario P. Vecchi : Optimization by simmulated
annealing. science, 220(4598):671–680, mai 1983.
[41] Marius Leordeanu et Martial Hebert : A spectral technique for correspondence problems
using pairwise constraints. In Proceedings of the Tenth IEEE International Conference on
Computer Vision - Volume 2, ICCV ’05, pages 1482–1489, Washington, DC, USA, 2005.
IEEE Computer Society.
[42] Henning Meyerhenke, Burkhard Monien et Stefan Schamberger : Graph partitioning
and disturbed diffusion. Parallel Comput., 35(10-11):544–569, octobre 2009.
[43] Katta G. Murty : Linear programming. John Wiley & Sons, 1983.
[44] Leonid Oliker et Rupak Biswas : Efficient load balancing and data remapping for adaptive
grid calculations. In 9th ACM Symposium on Parallel Algorithms and Architectures, pages
33–42, 1997.
[45] Leonid Oliker et Rupak Biswas : PLUM : parallel load balancing for adaptive unstructured
meshes. J. Parallel Distrib. Comput., 52:150–177, aoˆut 1998.
[46] Chao-Wei Ou et Sanjay Ranka : Parallel incremental graph partitioning using linear programming.
In Proceedings Supercomputing ’94, pages 458–467, 1994.
[47] David A. Papa et Igor L. Markov : Hypergraph partitioning and clustering. In In Approximation
Algorithms and Metaheuristics, 2007.
[48] Fran¸cois Pellegrini : SCOTCH. http://www.labri.fr/perso/pelegrin/scotch/.
[49] Fran¸cois Pellegrini : A parallelisable multi-level banded diffusion scheme for computing
balanced partitions with smooth boundaries. In T. Priol A.-M. Kermarrec, L. Boug´e,
´editeur : Euro-Par 2007 Parallel Processing, volume 4641 de Lecture Notes in Computer
Science, pages 195–204, Rennes, France, aoˆut 2007. Springer.
[50] Fran¸cois Pellegrini : PT-Scotch and libPTScotch 6.0 user’s guide, 2012.
[51] Fran¸cois Pellegrini : Scotch and libScotch 6.0 user’s guide, 2012.
[52] J.R. Pilkington et S.B. Baden : Dynamic partitioning of non-uniform structured workloads
with spacefilling curves. Parallel and Distributed Systems, IEEE Transactions on,
7(3):288 –300, mars 1996.136 BIBLIOGRAPHIE
[53] Alex Pothen, Horst D. Simon et Kan-Pu Liou : Partitioning sparse matrices with eigenvectors
of graphs. SIAM J. Matrix Anal. Appl., 11(3):430–452, mai 1990.
[54] Hans Sagan : Space-Filling Curves. Springer-Verlag, 1994.
[55] Kirk Schloegel, George Karypis et Vipin Kumar : Multilevel diffusion schemes for
repartitioning of adaptive meshes. Journal of Parallel and Distributed Computing, 47(2):109
– 124, 1997.
[56] Kirk Schloegel, George Karypis et Vipin Kumar : Parallel multilevel diffusion algorithms
for repartitioning of adaptive meshes. Rapport technique, University of Minnesota,
Department of Computer Science and Army HPC Center, 1997.
[57] Kirk Schloegel, George Karypis et Vipin Kumar : A unified algorithm for load-balancing
adaptive scientific simulations. In Proceedings of the 2000 ACM/IEEE conference on Supercomputing
(CDROM), Supercomputing ’00, Washington, DC, USA, 2000. IEEE Computer
Society.
[58] Kirk Schloegel, George Karypis et Vipin Kumar : Wavefront diffusion and LMSR :
Algorithms for dynamic repartitioning of adaptive meshes. IEEE Trans. Parallel Distrib.
Syst., 12(5):451–466, mai 2001.
[59] Daniel G Schweikert et Brian W Kernighan : A proper model for the partitioning of
electrical circuits. In Proceedings of the 9th Design Automation Workshop, pages 57–62.
ACM, 1972.
[60] Horst D. Simon et Shang-Hua Teng : How good is recursive bisection ? SIAM J. Sci.
Comput, 18:1436–1445, 1995.
[61] Aleksandar Trifunovic et William J. Knottenbelt : Parkway 2.0 : A parallel multilevel
hypergraph partitioning tool. In in Proc. 19th International Symposium on Computer and
Information Sciences, pages 789–800. Springer, 2004.
[62] Brendan Vastenhouw et Rob H. Bisseling : A two-dimensional data distribution method
for parallel sparse matrix-vector multiplication. SIAM Review, 47(1):67–95, 2005.
[63] Umit V. ¸Catalyurek ¨ et Cevdet Aykanat : Hypergraph-partitioning based decomposition
for parallel sparse-matrix vector multiplication. IEEE Transactions on Parallel and
Distributed Systems, 10(7):673–693, juillet 1999.
[64] Umit ¨ V. ¸Catalyurek ¨ et C. Aykanat : PaToH : A Multilevel Hypergraph Partitioning
Tool. http://bmi.osu.edu/~umit/software.html#patoh, 1999.Liste des publications
[65] Cl´ement Vuchener et Aur´elien Esnard : Repartitionnement d’un graphe de M vers N
processeurs : application pour l’´equilibrage dynamique de charge. In 20`eme Rencontres
francophones du parall´elisme (RenPar’20), page 8, Saint-Malo, France, 2011.
[66] Cl´ement Vuchener et Aur´elien Esnard : Dynamic Load-Balancing with Variable Number
of Processors based on Graph Repartitioning. In Proceedings of High Performance Computing
(HiPC 2012), pages 1–9, Pune, Inde, 2012. 9 pages.
[67] Cl´ement Vuchener et Aur´elien Esnard : Equilibrage dynamique avec nombre variable ´
de processeurs par une m´ethode de repartitionnement de graphe. Technique et Science
Informatiques (TSI), 31(8-9-10/2012):1251–1271, juin 2012.
[68] Cl´ement Vuchener et Aur´elien Esnard : Graph Repartitioning with both Dynamic Load
and Dynamic Processor Allocation. In International Conference on Parallel Computing -
ParCo2013, Advances of Parallel Computing, Munchen, Allemagne, 2013. ¨
137
Addition formulae on hyperelliptic curves : applications
to cryptography
Christophe Tran
To cite this version:
Christophe Tran. Addition formulae on hyperelliptic curves : applications to cryptography.
Cryptography and Security. Universit´e de Rennes 1, 2014. French.
HAL Id: tel-01096316
https://tel.archives-ouvertes.fr/tel-01096316
Submitted on 17 Dec 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific
research documents, whether they are published
or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.N
o d’ordre : 00000 ANNÉE 2014
THÈSE / UNIVERSITÉ DE RENNES 1
sous le sceau de l’Université Européenne de Bretagne
pour le grade de
DOCTEUR DE L’UNIVERSITÉ DE RENNES 1
Mention : Mathématiques et applications
École doctorale Matisse
présentée par
Christophe TRAN
préparée à l’unité de recherche 6625 CNRS - IRMAR
Institut de Recherche de Mathématiques de Rennes U.F.R. de
Mathématiques
Formules d’addition
sur les jacobiennes
de courbes hyperelliptiques
: applications à
la cryptographie
Thèse soutenue à Rennes
le 1er décembre 2014
devant le jury composé de :
David KOHEL
Professeur, Université d’Aix-Marseille / Rapporteur
Pierrick GAUDRY
Directeur de recherche, CNRS / Rapporteur
Christophe RITZENTHALER
Professeur, Université de Rennes 1 / Examinateur
David LUBICZ
Ingénieur, DGA-MI / Examinateur
Damien ROBERT
Chargé de recherche, INRIA Bordeaux /
Examinateur
Sylvain DUQUESNE
Professeur, Université de Rennes 1 /
Directeur de thèseRemerciements
A tous :
Salut, merci, et bonne lecture.
12 RemerciementsTable des matières
Introduction 7
0.1 Histoire des courbes elliptiques . . . . . . . . . . . . . . . . . . . 7
0.1.1 Le début de l’histoire avec Diophante . . . . . . . . . . . . 7
0.1.2 Ellipses et intégrales elliptiques . . . . . . . . . . . . . . . 8
0.1.3 Des intégrales aux fonctions elliptiques . . . . . . . . . . . 9
0.1.4 Des fonctions aux courbes elliptiques . . . . . . . . . . . . 10
0.2 Les courbes elliptiques en cryptographie . . . . . . . . . . . . . . 11
0.3 Quatre articles à la genèse d’une thèse en deux parties . . . . . . 13
0.4 Résumé du document . . . . . . . . . . . . . . . . . . . . . . . . . 15
Notations 17
1 Préliminaires 19
1.1 Arithmétique des courbes . . . . . . . . . . . . . . . . . . . . . . 19
1.2 Couplages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2.2 Exemples d’utilisation . . . . . . . . . . . . . . . . . . . . 23
1.2.2.1 Le protocole de Joux [25] . . . . . . . . . . . . . 24
1.2.2.2 Le chiffrement de Boneh et Franklin [6] . . . . . . 24
1.2.2.3 La signature courte de Boneh Lynn et Shacham [7] 25
1.2.3 Le couplage de Tate . . . . . . . . . . . . . . . . . . . . . 25
1.2.4 Une variante : le couplage ate . . . . . . . . . . . . . . . . 27
1.3 Fonctions thêta . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.3.1 Le cas elliptique . . . . . . . . . . . . . . . . . . . . . . . . 28
1.3.1.1 Définition et premières propriétés . . . . . . . . . 28
1.3.1.2 Arithmétique des fonctions thêta . . . . . . . . . 31
1.3.2 Fonctions thêta en tout genre . . . . . . . . . . . . . . . . 35
1.4 La théorie des hyperelliptic nets . . . . . . . . . . . . . . . . . . . 39
1.4.1 Le cas elliptique . . . . . . . . . . . . . . . . . . . . . . . . 39
1.4.2 Le cas hyperelliptique . . . . . . . . . . . . . . . . . . . . 41
34 Table des matières
2 Deux méthodes de calculs de couplages 43
2.1 Couplages et fonctions thêta . . . . . . . . . . . . . . . . . . . . . 43
2.2 Couplages et nets . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.2.1 Le cas g ≡ 1, 2 (mod 4) . . . . . . . . . . . . . . . . . . . 46
2.2.2 Le cas g ≡ 0, 3 (mod 4) . . . . . . . . . . . . . . . . . . . 51
2.2.3 Un exemple en genre 3 . . . . . . . . . . . . . . . . . . . . 53
2.2.4 Analyse théorique de coûts . . . . . . . . . . . . . . . . . . 55
2.3 Résultats en genre 1 . . . . . . . . . . . . . . . . . . . . . . . . . 57
3 Unification de ces deux méthodes 59
3.1 Réécriture des elliptic nets . . . . . . . . . . . . . . . . . . . . . . 59
3.2 Fonctions de niveau 2 et elliptic nets . . . . . . . . . . . . . . . . 61
3.3 Fonctions de niveau l (pair) et elliptic nets . . . . . . . . . . . . . 63
3.4 Fonctions de niveau l (toujours pair) et hypelliptic nets . . . . . . 64
3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4 Polynômes de sommation 67
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.2 Rappels sur les travaux de Gaudry et Semaev . . . . . . . . . . . 68
4.2.1 Cadre général : le calcul d’index . . . . . . . . . . . . . . . 68
4.2.2 L’algorithme dans le cas des courbes elliptiques et hyperelliptiques
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.3 Polynômes de Semaev . . . . . . . . . . . . . . . . . . . . 70
4.3 Nouvelle construction des polynômes de sommation en genre 1 . . 71
4.3.1 Deux théorèmes fondamentaux . . . . . . . . . . . . . . . 71
4.3.2 Construction . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.4 Extension aux courbes hyperelliptiques . . . . . . . . . . . . . . . 78
4.4.1 Enoncé des deux théorèmes pour tout genre . . . . . . . . 79
4.4.2 Polynômes de sommation hyperelliptiques . . . . . . . . . 81
4.4.3 Utilisation pour le calcul d’index . . . . . . . . . . . . . . 84
4.4.4 Un exemple en genre 2 . . . . . . . . . . . . . . . . . . . . 85
4.4.5 Complexité . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.5 Constructions alternatives . . . . . . . . . . . . . . . . . . . . . . 88
4.5.1 Peut-on utiliser moins de fonctions ∆n,g ? . . . . . . . . . . 89
4.5.2 Cas elliptique : peut on utiliser un autre automorphisme
que [−1] ? . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.5.2.1 Quels automorphismes ? . . . . . . . . . . . . . . 91
4.5.2.2 Le cas j = 1728 . . . . . . . . . . . . . . . . . . . 92
4.5.2.3 Le cas j = 0 . . . . . . . . . . . . . . . . . . . . . 95
4.5.2.4 Théorème final avant de passer au cas hyperelliptique
. . . . . . . . . . . . . . . . . . . . . . . . . 100
4.5.3 Le cas général . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.5.4 Analyse et comparaisons . . . . . . . . . . . . . . . . . . . 105Table des matières 5
4.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Bibliographie 1076 Table des matièresIntroduction
Cette thèse s’intéresse aux courbes elliptiques et hyperelliptiques et à leur
utilisation en cryptographie. Je rappellerai donc dans cette introduction leurs
places dans l’histoire des mathématiques, avant de les resituer dans un contexte
cryptographique. Ceci fait, j’évoquerai les principaux articles qui m’ont poussé à
choisir mes axes de recherche. Enfin, je donnerai un plan détaillé de ce document.
0.1 Histoire des courbes elliptiques
0.1.1 Le début de l’histoire avec Diophante
Les courbes elliptiques sont de vieux objets d’étude mathématique. Outre la
géométrie algébrique d’où elles proviennent, ces courbes apparaissent aussi bien
en théorie des nombres qu’en analyse. On verra dans cette thèse quelques applications
de leur loi de groupe en cryptographie, mais on peut noter qu’elles
interviennent également en mécanique des fluides, science des matériaux ou électrostatique.
Pour résumer la riche histoire de ces courbes, je me suis basé sur [24],
[46], [8], [40].
La première apparition de ces courbes se trouve dans l’oeuvre la plus importante
du mathématicien grec du IIIième siècle Diophante : les Arithmétiques.
Cette somme en 13 livres ne sera "redécouverte" en occident qu’après la chute
de Constantinople. Après plus de 1000 ans d’absence, cet ouvrage influencera
énormément les savants de la Renaissance et du siècle des Lumières, faisant par
exemple réfléchir Newton ou Euler. Fermat travailla beaucoup sur les problèmes
posés par Diophante : c’est d’ailleurs dans une traduction latine de ces Arithmétiques
que Fermat livrera en annotations son fameux dernier théorème. Mais
n’allons pas trop vite, et revenons à Diophante.
Diophante étudia à la Bibliothèque d’Alexandrie les mathématiques de son époque :
géométrie, trigonométrie, mécanique. Il s’intéressa à trouver des méthodes de
construction (aujourd’hui on dirait des algorithmes) de solutions rationnelles à
des équations algébriques à plusieurs variables.
78 INTRODUCTION
C’est dans ce cadre qu’il inventa, sans le savoir, la méthode "corde-et-tangente"
pour l’addition sur une courbe. Pour comprendre ce coup de force, prenons
d’abord l’exemple des équations quadratiques. C’est un problème bien plus vieux
que Diophante : les babyloniens par exemple connaissaient déjà les triplets pythagoriciens
1
. Diophante fit pourtant une découverte importante :
Proposition 0.1.1. Soit f(x, y) ∈ Q[x, y] un polynôme quadratique. Si l’équation
f(x, y) = 0 admet au moins une solution rationnelle, alors elle en admet une
infinité.
En effet, si on note P cette solution initiale, alors toute droite de pente rationnelle
coupe la courbe d’équation f(x, y) = 0 en une autre solution rationnelle.
Diophante appliqua cette même méthode aux cubiques. Plus précisément, le problème
24 du livre IV de ses Arithmétiques se réécrit de façon moderne ainsi :
Étant donné un paramètre a, trouver les solutions rationnelles à l’équation
y(a − y) = x
3 − x.
Diophante traite le cas a = 6 en faisant le changement de variable x = 3y − 1 :
autrement dit, Diophante a regardé l’intersection entre la courbe et sa tangente
au point (−1, 0). C’est bien la méthode de doublement d’un point sur une courbe
elliptique.
Par la suite, il faudra attendre le XVIIième siècle pour que Fermat donne en
toute généralité les formules algébriques pour l’addition et le doublement ; puis
ce sera Newton qui donnera l’interprétation géométrique (corde-et-tangente) de
ces formules.
0.1.2 Ellipses et intégrales elliptiques
La seconde partie de l’histoire débute au XVIIième avec Wallis (qui le premier
parla d’intégrales elliptiques) pour finir au XIXième siècle avec Jacobi, Abel,
Weierstrass et Eisenstein. Commençons par introduire la définition suivante :
Définition 0.1.2. Soit R ∈ C(x, y) une fonction rationnelle et f ∈ C[t] sans
facteur carré. La différentielle R(t, q
f(t))dt est dite hyperelliptique. Elle est dite
elliptique si f est de degré 3 ou 4.
1. Pythagore vécut au VIième siècle av. JC, les Babyloniens environ 3000 ans avant cela.Histoire des courbes elliptiques 9
Ces quantités apparaissent naturellement dans les problèmes de rectification d’une
courbe, c’est-à-dire de calcul de longueur d’arc. Ainsi, si y = f(x) est une courbe
C
1
sur un intervalle [a, b], alors la longueur d’arc est donnée par la formule
L
b
a =
Z b
a
q
1 + f
0
(x)
2dx.
On comprend maintenant pourquoi Wallis parla d’intégrales elliptiques : il voulait
dire par là intégrales dont le calcul permet de calculer la longueur d’arc d’une
ellipse. Voyons rapidement leur histoire.
Au bout de 40 ans de travail, Legendre publia entre 1825 et 1828 un traité en
trois volumes 2 dans lequel il conclut notamment que toute intégrale provenant de
la rectification d’une ellipse peut s’exprimer comme une des trois types suivants,
qu’il appela naturellement intégrales elliptiques de première, seconde et troisième
espèce :
F(x) = Z x
0
dt
q
(1 − t
2
)(1 − k
2
t
2
)
,
G(x) = Z x
0
(1 − k
2x
2
)dt
q
(1 − t
2
)(1 − k
2
t
2
)
,
Π(x) = Z x
0
dt
(1 + nx2
)
q
(1 − t
2
)(1 − k
2
t
2
)
.
0.1.3 Des intégrales aux fonctions elliptiques
Par la suite, Abel réalisa que plutôt que d’essayer de calculer ces intégrales, par
exemple u = F(x), il était bien plus intéressant de regarder les fonctions inverses :
x = f(u). Cette idée provient de la trigonométrie : ainsi, si la fonction
x 7→
Z x
0
dt
√
1 − t
2
est importante, son inverse, la fonction sinus, est elle fondamentale. Il appela
ainsi fonctions elliptiques les inverses des intégrales elliptiques.
Jacobi partit de cette idée et trouva le résultat suivant :
Théorème 0.1.3. Aucune fonction méromorphe ne peut avoir plus de deux pé-
riodes indépendantes.
Les fonctions méromorphes doublement périodiques sont exactement les fonctions
elliptiques.
2. Traité des fonctions elliptiques et intégrales Eulériennes.10 INTRODUCTION
C’est bien là la définition moderne des fonctions elliptiques, celle que l’on retrouve
dans le livre de Silverman [42] par exemple. Il ne reste qu’une dernière étape pour
retrouver nos courbes elliptiques.
0.1.4 Des fonctions aux courbes elliptiques
Utilisant cette double périodicité, Eisenstein décrivit les fonctions elliptiques
comme des séries entières :
Théorème 0.1.4. La série suivante
y(z) = X∞
m,n=−∞
(z + mω1 + nω2)
−2 −
X∞
m,n=−∞
(mω1 + nω2)
−2
où ω1, ω2 ∈ C et ω1/ω2 ∈/ R définit une fonction elliptique.
Elle vérifie une équation différentielle de la forme
y
0
(z)
2 = p(y(z)),
pour un polynôme p de degré 3 sans facteur carré.
Finalement, en 1863, Weierstrass introduisit sa fameuse fonction ℘ :
℘(z) = z
−2 +
X∞
m,n=−∞
(m,n)6=(0,0)
[(z + mω1 + nω2)
−2 − (mω1 + nω2)
−2
].
Théorème 0.1.5. Toute fonction elliptique de double période ω1 et ω2 est une
fonction rationnelle en ℘ et ℘
0
.
Ces deux fonctions vérifient l’équation
℘
0
(z)
2 = 4℘(z)
3 − g2℘(z) − g3,
où g2 et g3 sont des constantes ne dépendant que de ω1 et ω2.
Ces courbes cubiques, on les a déjà rencontrées avec Diophante et Fermat. Newton
avait montré la méthode corde-et-tangente d’addition de points. Et Weierstrass
montra qu’effectivement ses fonctions ℘ et ℘
0 admettaient bien une formule
d’addition qui est celle des points de la courbe. Ainsi, ces courbes cubiques paramétrées
par les fonctions elliptiques prirent elles le nom de courbes elliptiques.
La boucle est bouclée.Les courbes elliptiques en cryptographie 11
0.2 Les courbes elliptiques en cryptographie
En 1976, Diffie et Hellman inventèrent la cryptographie à clef publique. Encore
appelée cryptographie asymétrique, elle repose sur l’existence supposée de
fonctions à sens unique, qui permettent de chiffrer facilement des messages, mais
dont le calcul de l’inverse doit être impossible pour qui ne connaît pas le secret.
On peut grosso modo diviser les protocoles de cryptographie asymétrique en deux
familles.
Le très célèbre RSA, inventé en 1977, fut la première réalisation pratique à clef
publique. Le protocole commence par la multiplication de deux grands nombres
premiers, et repose sur la difficulté, connaissant seulement le résultat du produit,
de retrouver les deux facteurs.
Les protocoles de la seconde famille reposent sur le problème suivant, dit du
logarithme discret : me donnant un groupe (G, ×) et deux éléments g et g
0 de ce
groupe reliés par la relation
g
0 = g
x
,
comment puis je retrouver x ?
Il est par exemple à la base du protocole d’échange de clefs Diffie-Hellman (1976)
ou du chiffrement Elgamal (1989). Dans les implémentations originales de ces
protocoles, le groupe utilisé est le groupe multiplicatif d’un corps fini F
∗
p
, pour un
grand premier p.
En 1985, Koblitz et Miller proposèrent tous deux de façon indépendante d’utiliser
un autre groupe : celui des points d’une courbe elliptique définie sur un corps
fini. La raison à cela est l’absence d’algorithme en temps sous-exponentiel pour
attaquer le problème du logarithme discret sur ces groupes (plus de détails sont
donnés dans le chapitre 4). Ainsi, à niveau de sécurité égal, la taille du groupe de
points d’une courbe elliptique à utiliser est plus petite que celle du groupe multiplicatif
d’un corps fini. En pratique, cela signifie de plus petites tailles de clefs
et de messages chiffrés échangés. Ces avantages sont particulièrement significatifs
dans le domaine des systèmes embarqués qui sont très restreints en capacité de
mémoire et de borne passante.
Comme rappelé dans [26], la cryptographie basée sur courbes elliptiques 3 divisa
d’abord les cryptographes : du fait de son exotisme (les courbes elliptiques étant
alors peu connues et peu étudiées par les cryptographes), elle suscita chez certains
enthousiasme et curiosité, et chez d’autres scepticisme et méfiance. Ces derniers
arguèrent que les problèmes de la factorisation et du logarithme discret sur corps
finis avaient été à ce moment là déjà intensivement étudiés, et qu’il faudrait at-
3. en anglais, ECC pour elliptic curve cryptography.12 INTRODUCTION
tendre un certain temps avant que la communauté cryptographique s’empare et
comprenne vraiment la nature des courbes elliptiques.
Ainsi, ECDSA (Elliptic Curve Digital Signature Algorithm), proposé en 1992
([51]), ne fut finalement unanimement accepté et inclus dans les standards que
presque 10 ans plus tard (en 2000 par la NSA : [37]).
Finalement, juste quand l’utilisation des courbes elliptiques en cryptographie fut
bien acceptée, apparurent les premiers protocoles basés sur les couplages 4
. Vieil
outil mathématique, le couplage de Weil n’était pas à ce moment là inconnu des
cryptographes, puisque Menezes, Okamoto et Vanstone dans [32] en 1993 avaient
déjà montré comment transporter le problème du logarithme discret des points
d’une courbe elliptique vers un groupe F
∗
q
k (ici k est le degré de plongement, notion
définie dans le chapitre 1). Cet article avait d’ailleurs à l’époque jeté un peu
plus la suspicion sur les courbes elliptiques, notamment celles de petit degré de
plongement.
Ces nouveaux protocoles ([25], [6] et [7], présentés plus en détail au chapitre
1) marquèrent les esprits en répondant de façon simple et élégante à de vieilles
questions cryptographiques. Ainsi, les schémas d’échange de clef Diffie-Helman
étaient bien connus et étudiés avant Joux ([25]), mais ils nécessitaient tous plus
d’un tour d’échanges de données. Quant au chiffrement basé sur l’identité, c’est
une vielle question posée par Shamir en 1984 à laquelle Boneh et Franklin ([6])
répondirent pour la première fois.
Ces articles ouvrirent une décennie de recherches actives sur les couplages :
constructions de nouvelles primitives cryptographiques, impossibles sans l’utilisation
de couplages, nouvelles techniques pour accélérer le calcul de couplages,
nouvelles méthodes de sélections de courbes adaptées aux couplages (au passage,
les courbes admettant un petit degré de plongement furent à cette occasion ré-
habilitées)...
En 1989, soit quelques années seulement après l’introduction des courbes elliptiques
en cryptographie, Koblitz suggéra pour la première fois dans [27] d’utiliser
leurs généralisations aux genres plus élevés : les courbes hyperelliptiques. Contrairement
à la situation dans le cas elliptique, l’ensemble des points de ces courbes
ne forme pas un groupe. Par contre, on peut toujours associer à chacune de ces
courbes un groupe algébrique : sa jacobienne (la définition précise, et plus de
détails seront donnés dans le chapitre 1). L’intérêt de considérer ces nouveaux
groupes réside dans leur cardinal : en effet, une courbe hyperelliptique de genre
g définie sur un corps fini Fq admet une jacobienne de cardinal environ q
g
. Ainsi,
utiliser une courbe de grand genre permet, à niveau de sécurité comparable, de
travailler sur des corps finis plus petits, et ainsi de diminuer la taille des clefs et
4. pairing en anglais.Quatre articles à la genèse d’une thèse en deux parties 13
des messages chiffrés.
Pour savoir si un groupe est utilisable en cryptographie, un critère majeur à
considérer est l’efficacité de sa représentation et de son arithmétique. Et malheureusement,
pendant longtemps, les courbes hyperelliptiques futrent considérées
comme inutilisables en cryptographie en pratique à cause de la grande difficulté
de leur arithmétique (voir par exemple [44]). Le premier algorithme pour calculer
dans la jacobienne d’une courbe hyperelliptique fut proposé par Cantor ([11]).
Comme on le verra dans le chapitre 1, cet algorithme repose sur la représentation
dite de Mumford des éléments de la jacobienne. Des améliorations de cet algorithme
furent progressivement obtenus en étudiant les formules explicites pour
un genre fixé (voir par exemple [29] pour le cas g = 2). Dans [21], Gaudry utilisa
les fonctions thêta au lieu de la représentation de Mumford pour donner un
algorithme très compétitif pour calculer sur les jacobiennes des courbes de genre 2.
Il nous faut maintenant évoquer la sécurité des courbes hyperelliptiques en cryptographie,
c’est-à-dire la difficulté du problème du logarithme discret dans leur
jacobienne. Pour résoudre ce problème, il y a deux familles d’algorithmes : les
algorithmes dits génériques, parce qu’ils fonctionnent dans n’importe quel autre
groupe, dont la complexité est exponentielle ; et les algorithmes de type calcul
d’index, de complexité sous-exponentielle, qui exploitent l’arithmétique particulière
des courbes hyperelliptiques. Le principe de ces algorithmes sera rappelé
dans le chapitre 4. Ces algorithmes firent leur apparition pour la première fois en
1994 dans [1], mais n’étaient valables que quand le genre était suffisamment grand
par rapport à la taille du corps de définition. Depuis, de nombreuses variantes et
améliorations de ces algorithmes furent publiées : aujourd’hui, les algorithmes de
type calcul d’index sont plus efficaces que les algorithmes génériques dès lors que
le genre vaut au moins 3.
Ainsi, aujourd’hui, comme le souligne [2], tant la sécurité que les performances
arithmétiques des courbes hyperelliptiques de genre 2 en font une alternative
solide aux courbes elliptiques.
0.3 Quatre articles à la genèse d’une thèse en
deux parties
Je venais tout juste de débuter ma thèse lorsque je trouvai deux articles ([45]
et [30]) proposant deux nouvelles méthodes de calcul de couplages, originales
car totalement indépendantes du traditionnel algorithme de Miller. Après une
lecture même superficielle, une chose frappe très nettement : la similitude entre
les formules de calcul de couplages introduites dans ces articles. Pourtant, ces14 INTRODUCTION
deux travaux semblaient totalement déconnectés, et n’utilisaient pas les mêmes
objets : alors que David Lubicz et Damien Robert parlent de fonctions thêta
et de formules d’addition, Katherine Stange, elle, introduit des elliptic nets 5
,
qu’elle inscrit très clairement dans la théorie des suites récurrentes, les reliant
par exemple aux elliptic divisibility sequences.
Trois mois plus tard, à l’heure de faire un premier bilan de mon travail, voilà où
j’en étais arrivé :
— En réalité, les fonctions thêta d’une courbe elliptique E ne sont pas des
fonctions proprement définies sur E : on ne peut pas les évaluer individuellement
sur un point P ∈ E, il faut ou bien effectuer un quotient
de fonctions thêta pour obtenir une véritable fonction elliptique, ou bien
considérer ensemble tout un paquet de fonctions thêta bien choisies (on
parle alors de coordonnées thêta). Pour schématiser, la première méthode
est utilisée dans [45], et la seconde dans [30].
— Les fonctions thêta d’une courbe elliptique vérifient toute une série de formules
d’addition, dérivées des relations de Riemann, qui traduisent l’arithmétique
de la courbe. Ce sont ces formules d’addition qui sont à la base
de l’algorithme donné dans [30], qui permet par un double-and-add de
calculer les coordonnées thêta d’un point Q + rP, pour un grand entier r.
— La fonction σ de Weierstrass est une fonction thêta particulière, qui permet
de construire tous les elliptic nets. Or, il se trouve que la relation de
récurrence définissant les elliptic nets est une conséquence des formules
d’addition vérifiées par cette fonction thêta. Quant aux autres fonctions
thêta, ce sont presque des elliptic nets : elles vérifient une relation de
récurrence assez similaire à celles des elliptic nets, mais un peu plus compliquée.
Ceci explique la similitude relevée plus haut entre les formules de
couplages données dans les deux articles [45] et [30].
— Une autre application des elliptic nets est mise en avant dans [41] : il
s’agit d’attaquer le problème du logarithme discret sur une courbe elliptique.
Plus précisément, il s’agit de décider quand un ensemble de n points
P1, . . . , Pn d’une courbe vérifie une relation du type
P1 ± · · · ± Pn = O.
Ces relations se détectaient en pratique via les polynômes de Semaev
([43]) : le but de [41] est justement de relier elliptic nets et polynômes
de Semaev.
Ces notions se généralisent aux genres supérieurs : le travail de [30] concerne
d’ailleurs les variétés abéliennes en toute généralité, tandis que [50], paru au
5. aucune traduction française de ce terme ne sera proposé dans ce document.Résumé du document 15
printemps 2012, généralise la notion d’elliptic nets aux courbes hyperelliptiques.
Ainsi, en partant de ces quatre articles [30], [45], [50] et [41], j’avais mes deux
thèmes de recherche pour ma thèse : travailler sur les couplages d’une part, et sur
la recherche de relations pour les algorithmes de type calcul d’index attaquant le
logarithme discret.
0.4 Résumé du document
Cette thèse s’organise en quatre chapitres : un premier chapitre de rappels,
et trois autres dans lesquels je donne mes résultats.
Chapitre 1
Dans ce chapitre je rappelle les notions mathématiques nécessaires à la
lecture du manuscrit. Je commence par donner la définition des courbes
hyperelliptiques et de leur jacobienne, ainsi que la représentation de Mumford
des diviseurs. Je rappelle ensuite la définition des fonctions de Miller,
et leur utilisation pour le calcul de couplages. Enfin, je rappelle la théorie
des fonctions thêta, et celle des elliptic (et hyperelliptic) nets.
Chapitre 2
Ce chapitre traite de calcul de couplages. Après avoir rappelé la méthode
de calcul de couplages via les fonctions thêta donnée dans [30], je donne
l’algorithme basé sur [45] permettant de calculer les couplages sur une
courbe hyperelliptique avec les hyperelliptic nets. Cet algorithme est le
premier résultat neuf énoncé dans cette thèse. Il admet deux variantes, selon
que le genre de la courbe vérifie g ≡ 1, 2 (mod 4) ou g ≡ 0, 3 (mod 4).
Ces deux variantes sont énoncées respectivement dans les sections 2.2.1 et
2.2.2. Je donne une analyse des coûts de ces deux variantes dans la section
2.2.4. Enfin, ce chapitre se termine par une comparaison des coûts pour
l’utilisation des elliptic nets et celle des fonctions thêta en genre 1 (section
2.3).
Chapitre 3
Jusqu’à présent, les méthodes de calcul de couplages par les fonctions thêta
([30]) et par les nets ([45] et [50]) étaient traitées comme si elles étaient
indépendantes. Le chapitre 3 est dédié à leur réunification. Je mets ainsi
en évidence le fait que tout système de coordonnées de niveau l pair admet
une loi d’addition (théorème 3.4.1), et que ces formules d’addition ont pour16 INTRODUCTION
conséquence une relation de récurrence (théorème 3.4.2), que j’appelle ré-
currence des hyperelliptic nets généralisés (en particulier, pour l = 2 on
retombe sur la récurrence des hyperelliptic nets classiques).
Chapitre 4
Dans ce chapitre, je passe à ma deuxième thématique de recherches : la
recherche de relations dans l’algorithme de calcul d’index. Contrairement
à [41], je ne réécris pas les polynômes de Semaev en fonction des elliptic
nets, mais directement avec la fonction sigma de Weierstrass : je montre
en effet que c’est bien la loi d’addition vérifiée par cette fonction qui lui
permet de détecter des relations. Je construis ainsi des polynômes avec la
fonction sigma dans le lemme 4.3.4 puis le théorème 4.3.5. Puis je montre
que ces polynômes sont bien les polynômes de Semaev dans la proposition
4.3.8 et le corollaire 4.3.9. A partir de ce travail préparatoire en genre 1,
je généralise la notion de polynômes de sommation aux genres supérieurs
(théorème 4.4.7), ce qui n’avait pas été fait jusque là. J’étudie ensuite
l’impact de ces nouveaux polynômes dans la complexité de l’algorithme
de calcul d’index (section 4.4.5). Je termine le chapitre par la construction
de polynômes de sommation alternatifs (section 4.5), toujours basés sur
la fonction sigma et ses lois d’addition. En effet, ma construction originelle
des polynômes de sommation était dictée par les choix et le travail
de Semaev dans [43]. Il s’agit alors pour moi de discuter de la pertinence
de ces choix. Hormis dans un cas particulier, ces polynômes alternatifs ne
semblent pas être plus efficaces que les originaux.Notations
Dans l’ensemble de cette thèse :
— K est un corps, dont K dénote une clôture algébrique ;
— Fq le corps fini à q éléments ; sa caractéristique sera notée p ;
— E désignera toujours une courbe elliptique, C une courbe hyperelliptique
et J la jacobienne d’une courbe ;
— les courbes considérées seront toujours dans le modèle imaginaire (voir
définition 1.1.1) ; ∞ désigne le point à l’infini de la courbe, et O l’élément
neutre de J ;
— si f : C → C0
est une application rationnelle non constante entre deux
courbes définies sur un corps K, on note f
∗
: K(C
0
) → K(C) son pullback
défini par
f
∗
(r
0
) = r
0
◦ f;
— avec les mêmes notations, est également défini l’homomorphisme
f
∗
: Div(C
0
) → Div(C)
(Q) 7→
X
P ∈C
f(P)=Q
ef (P)(P),
où ef (P) est l’index de ramification de f en P ;
— un homomorphisme classique qui sera utilisé dans cette thèse est le morphisme
de translation ; si P ∈ E est un point de la courbe elliptique E,
alors τP : E → E est le morphisme défini par
τP (Q) = P + Q;
— a ∈R A signifie que l’on doit choisir un élément a uniformément aléatoirement
dans l’ensemble fini A ;
— {0, 1}
∗ désigne l’ensemble des chaînes de bits de longueur finie ;
— pour un entier n et un point P ∈ E, la multiplication scalaire de n et P
est notée [n]P :
[n]P = P + P + · · · + P | {z }
n
;
1718 Notations
— pour un entier n, J [n] est la n-torsion de J , i.e.
J [n] = {D ∈ J | [n]D = O}.Chapitre 1
Préliminaires
Dans cette partie, je commencerai par rappeler des notions basiques sur
l’arithmétique des courbes. Je consacrerai ensuite une section aux couplages,
avant de rappeler les résultats de [30] sur le calcul de couplages via les fonctions
thêta d’une part, et de [45] et [50] sur leur calcul par les (hyper)elliptic nets
d’autre part.
1.1 Arithmétique des courbes
Cette section est volontairement succincte. Plus de détails seront trouvés dans
les références classiques que sont par exemple le chapitre 4 de [3], [18] ou les deux
premiers chapitres de [42].
Définition 1.1.1. Une courbe hyperelliptique C de genre g sur un corps K est
une courbe non singulière donnée par une équation du type
C : y
2 + H(x)y = F(x),
avec H et F ∈ K[x], 2g + 1 ≤ deg(F) ≤ 2g + 2, deg(H) ≤ g + 1.
Je ne considérerai que les courbes hyperelliptiques imaginaires 1
, c’est à dire avec
F de degré 2g + 1 et deg(H) ≤ g. Dans ce cas, C a un point à l’infini, noté ∞.
Remarque 1.1.2. Si on travaille sur un corps de caractéristique différente de
2, via la transformation y 7→ y + H(x)/2, la courbe C donnée dans 1.1.1 est
isomorphe à
y
2 = F
0
(x)
avec deg(F
0
) = 2g + 1.
1. Plus précisément, les cryptographes ne considèrent généralement que les courbes imaginaires.
La raison à cela est que l’arithmétique de ces courbes est plus rapide.
1920 Préliminaires
À chacune de ces courbes, est associé un groupe abélien : sa jacobienne. Je commence
par rappeler la notion de diviseur.
Définition 1.1.3. Soit C/K une courbe hyperelliptique. Un diviseur D de C est
une somme formelle finie de points de C :
D =
X
Pi∈C
ni(Pi),
où les ni sont des entiers relatifs presque tous nuls.
L’ensemble des diviseurs muni de la somme formelle de points est un groupe
commutatif noté Div(C).
Définition 1.1.4. Le degré d’un diviseur est la somme de ses coefficients :
deg
X
Pi∈C
ni(Pi)
=
Xni
.
L’ensemble des diviseurs de degré 0 forme un sous groupe Div0
(C) de Div(C).
Parmi les diviseurs de degré zéro, on distingue les diviseurs principaux :
Définition 1.1.5. Si f ∈ K(C), on lui associe un diviseur de degré 0 :
div(f) = X
PiC
ordPi
(f)(Pi).
Un diviseur D de C est dit principal s’il existe une fonction f ∈ K(C) tel que
D = div(f).
L’ensemble P rinc(C) des diviseurs principaux forme un sous groupe de Div0
(C).
Finalement, voici la jacobienne de C :
Définition 1.1.6. La jacobienne J de C est le groupe des diviseurs de degré zéro
quotienté par le groupe des diviseurs principaux :
J = Div0
(C)/P rinc(C).
L’élément neutre de J est noté O.
Deux diviseurs D et D0
sont dits linéairement équivalents s’ils sont dans la même
classe modulo P rinc(C). On note alors
D ∼ D
0
.Arithmétique des courbes 21
Le théorème de Riemann Roch est un outil essentiel pour l’étude des courbes
algébriques. Pour le moment, il va nous servir à énoncer la représentation de
Mumford. Avant l’énoncé de ce théorème, il faut rappeler deux définitions.
Définition 1.1.7. Un diviseur D est dit effectif si tous ses coefficients sont
positifs. On note D ≥ 0.
Plus généralement, pour deux diviseurs D et D0
, on note D ≥ D0
si le diviseur
D − D0
est effectif.
Définition 1.1.8. Soit D un diviseur de C. L’espace de Riemann Roch associé
à D est l’espace vectoriel
L(D) = {f ∈ K(C)
∗
| div(f) ≥ −D} ∪ {0}.
C’est un K-espace vectoriel de dimension finie, sa dimension est notée l(D).
Exemple 1.1.9 ([42]).
— Si D < 0, alors L(D) = {0}.
— Si D ∼ D0
, alors L(D) ' L(D0
).
Théorème 1.1.10 (Riemann-Roch). Il existe un diviseur KC de C appelé diviseur
canonique tel que pour tout D ∈ Div(C),
l(D) − l(KC − D) = deg(D) − g + 1.
Si deg(D) > 2g − 2, alors
l(D) = deg(D) − g + 1.
Munis de ce théorème, nous avons le résultat suivant :
Proposition 1.1.11. Toute classe D ∈ J admet un représentant unique de la
forme
D ∼
Xr
i=1
(Pi) − r(∞)
avec r ≤ g et pour tout i 6= j, Pi 6= −Pj
.
Définition 1.1.12. Une telle écriture de D est appelée forme réduite de D. Elle
sera notée ρ(D).
Corollaire 1.1.13. Tout D ∈ J se représente de façon unique par une paire de
polynômes u, v ∈ K[x] tels que
— u est unitaire ;
— deg(v) < deg(u) ≤ g ;
— u|v
2 + vh − f.22 Préliminaires
En pratique, cela signifie que pour
D ∼
Xr
i=1
(Pi) − r(∞),
où pour tout i, Pi = (xi
, yi), on a
— u(x) = Q
i
(x − xi) et
— pour tout i, v(xi) = yi
.
Définition 1.1.14. Une telle paire de polynômes (u, v) est la représentation de
Mumford de D.
Dans [11], Cantor donne un algorithme prenant en entrée deux diviseurs réduits
D1 et D2 pour donner en sortie la représentation réduite de D1 + D2.
J’aurai besoin dans la suite de la notation suivante :
Définition 1.1.15. Pour D =
P
Pi
ni(Pi) ∈ J , on note (D) la partie effective
de D, c’est-à-dire
(D) = X
Pi
ni>0
ni(Pi).
Exemple 1.1.16. Si D est réduit, alors D =
Pr
i=1(Pi) − r(∞) pour un r ≤ g, et
alors on a simplement
(D) = Xr
i=1
(Pi).
Enfin, un dernier objet à définir ici : le diviseur Θ.
Définition 1.1.17. Le diviseur Θ ⊂ J est l’ensemble des diviseurs dont la forme
réduite admet r < g points. Ainsi,
J \Θ = {D ∼ (P1) + · · · + (Pg) − g(∞)|∀i 6= j, Pi 6= −Pj}.
On note également pour i < g, les sous ensembles
Θ
[i] = {D ∼
X
j
k=1
(Pk) − r(∞) | j ≤ i}.
On a donc
{O} = Θ[0] ⊂ Θ
[1] = {(P) − (∞)} ⊂ · · · ⊂ Θ = Θ[g−1]
.Couplages 23
Exemple 1.1.18. Les courbes qu’on étudiera le plus ici sont les courbes elliptiques
et les courbes hyperelliptiques de genre 2.
Pour g = 1, on a Θ = {O}.
Pour g = 2,
Θ
[1] = {O} ⊂ Θ = {(P) − (∞) | P ∈ C},
tandis que
J \ Θ = {(P1) + (P2) − 2(∞) | P1 6= −P2}.
1.2 Couplages
Je commence par rappeler ce qu’est un couplage 2
en cryptographie, et par
donner quelques brefs exemples de protocoles les utilisant.
J’expliquerai ensuite comment sont calculés ces couplages en pratique. Il existe
plusieurs résumés récents de l’état de l’art sur les couplages, tel que [4] et [19]
par exemple.
1.2.1 Définition
Définition 1.2.1. En cryptographie, un couplage est une application bilinéaire
non dégénérée
e : G1 × G2 → GT ,
où (G1, +), (G2, +) et (GT , ×) sont trois groupes.
Remarque 1.2.2. En pratique, ces groupes seront supposés cryptographiques,
c’est-à-dire dont l’arithmétique soit assez rapide pour permettre les calculs, mais
sur lesquels le problème du logarithme discret soit difficile.
1.2.2 Exemples d’utilisation
En 2000, Joux ([25]) présenta le premier protocole cryptographique utilisant
les couplages. Depuis, des centaines d’articles 3 ont démontré l’utilité de cet outil.
Ici, je présenterai rapidement, outre l’échange de clef tripartite à un tour de
Joux, le chiffrement basé sur l’identité de Boneh et Franklin ([6]) et le schéma de
signature courte de Boneh, Lynn et Shacham ([7]). Ces protocoles sont en effet
les plus souvent cités dans les articles résumant la cryptographie basée sur les
couplages.
Dans tous ces exemples, r sera un grand nombre premier, et le cardinal des trois
groupes G1, G2 et GT . Le point P ∈ G1 sera un générateur du groupe.
2. en anglais, pairing.
3. le chapitre 10 de [5] en recensait 28 mi-2002 et environ 100 début 2004.24 Préliminaires
1.2.2.1 Le protocole de Joux [25]
Dans ce protocole, on suppose que G1 = G2. Trois parties A1, A2, et A3
ont chacune une clef secrète ai ∈ Z/rZ, et une clef publique correspondante
[ai
]P ∈ G1.
Durant le tour d’échange, chaque participant envoie simplement sa clef publique
aux deux autres participants.
Chaque participant Ai ayant reçu les deux autres clefs publiques [aj
]P et [ak]P
est alors en mesure de calculer avec sa propre clef secrète la clef commune :
e([aj
]P, [ak]P)
ai = e(P, P)
aiajak
.
1.2.2.2 Le chiffrement de Boneh et Franklin [6]
Dans un schéma de chiffrement basé sur l’identité, la clef publique de chaque
utilisateur est dérivée de son identité (typiquement, de son adresse mail), ce qui
règle le problème de la distribution des clefs.
Dans un schéma de chiffrement basé sur l’identité, si Alice veut envoyer un message
à Bob, elle chiffre son message avec l’identité de Bob. Recevant le message,
ce dernier s’authentifie auprès d’une autorité de confiance, le PKG (private key
generator), qui lui remet sa clef privée.
Voici le premier protocole de chiffrement basé sur l’identité, proposé par Boneh
et Franklin :
Setup On suppose que G1 = G2. On se donne un point P ∈ G1. Soient s ∈R
Z/rZ, et Ppub = [s]P. On se donne également deux fonctions de hachage
H1 : {0, 1}
∗ → G1 et H2 : GT → {0, 1}
n
,
où n est la taille des messages. La clef maîtresse est s, et la clef publique
globale est Ppub.
Extraction Étant donnée une identité (publique) Bob ∈ {0, 1}
∗
, la clef publique
se calcule par QBob = H1(Bob) ∈ G1, et la clef privée par SBob = [s]QBob.
Chiffrement Alice commence par calculer
gBob = e(QBob, Ppub)
Soit k ∈R Z/rZ, le message M se chiffre en
C = h[k]P, M ⊕ H2(g
k
Bob)i.Couplages 25
D´echiffrement Bob reçoit C = hU, V i de la part d’Alice. Il calcule alors
V ⊕ H2(e(SBob, U))
pour retrouver le message M.
1.2.2.3 La signature courte de Boneh Lynn et Shacham [7]
G´en´eration On se donne une fonction de hachage H : {0, 1}
∗ → G2, une clef
secrète s ∈R Z/rZ, et une clef publique Ppub = [s]P ∈ G1.
Signature Étant donné le secret s et le message m ∈ {0, 1}
∗
, la signature se
calcule simplement par
σ = [s]H(m).
V´erification Bob reçoit le couple hm, σi. Il accepte la signature si et seulement
si l’égalité
e(P, σ) = e(Ppub, H(m))
est vérifiée.
1.2.3 Le couplage de Tate
Les couplages sont des outils mathématiques importants pour l’étude de la
théorie des courbes. Ainsi, Weil introduisit son couplage en 1940 ([55]), et en
1985, Miller ([33]) publia son algorithme pour le calculer, et montra comment
l’utiliser pour réduire le problème du logarithme discret sur la courbe elliptique
au même problème sur le groupe multiplicatif d’un corps fini.
Les couplages utilisés en cryptographie sont le couplage de Tate et ses avatars
(ate, ate-i, Rate...), dont voici la définition :
Définition 1.2.3. Soit C une courbe hyperelliptique de genre g définie sur le
corps Fq, et J sa jacobienne. Soit r un grand diviseur premier de ]J (Fq). On
suppose que r est premier à q.
Le degré de plongement 4
est le plus petit entier k tel que r|(q
k − 1). Cela signifie
que Fq
k est la plus petite extension de Fq à contenir les racines r-ièmes de l’unité
µr.
On avait supposé que r|]J (Fq), on doit maintenant également demander que
r
2
- ]J (Fq) : ceci permet d’identifier J (Fq
k )[r] et J (Fq
k )/rJ (Fq
k ).
Alors, pour D1 ∈ J (Fq
k )[r], on note fr,D1
la fonction 5 de diviseur
div(fr,D1
) = rD1.
4. en anglais, embedding degree.
5. fr,D1
est uniquement définie à constante multiplicative près.26 Préliminaires
Soit D2 ∈ J (Fq
k )[r]. On suppose que supp(D1)∩supp(D2) = ∅. Alors la quantité
(fr,D1
(D2))
q
k−1
r =
Y
P
fr,D1
(P)
vP (D2)
!q
k−1
r
définit une application bilinéaire non dégénérée
t : J (Fq
k )[r] × J (Fq
k )[r] → µr.
Comme noté dans [20], si D1 est correctement choisi, on a l’amélioration suivante :
Lemme 1.2.4 ( [20]). On suppose que k > 1, et que D1 ∈ J (Fq)[r]. Alors
t(D1, D2) = fr,D1
((D2)) q
k−1
r .
Ainsi, pour des raisons d’efficacité, le domaine de définition du couplage de Tate
est réduit à G1 × G2, où les groupes G1 et G2 sont définis de la façon suivante :
Définition 1.2.5. On note π le morphisme de Frobenius π : C → C donné par
π(x, y) = (x
q
, yq
), qui se prolonge naturellement sur J .
Les groupes notés G1 et G2 sont alors :
G1 = J [r] ∩ Ker(π − [1]) = J (Fq)[r] et G2 = J (Fq
k )[r] ∩ Ker(π − [q]).
Ainsi, G1 6= G2 sont deux Z/rZ espaces vectoriels de dimension au moins 1, et
G1 × G2 ⊂ J (Fq
k ) est au moins de dimension 2.
Dans la suite, G1 et G2 désigneront toujours les groupes introduits dans la défi-
nition 1.2.5, et on aura toujours D1 ∈ G1 et D2 ∈ G2.
Voyons maintenant l’algorithme de Miller ([33]) pour calculer fr,D1
(D2).
Définition 1.2.6. Pour tout i ∈ N, notons Di = ρ(iD). Par définition, Di ∼ iD,
et la i-ième fonction de Miller fi,D est définie par
div(fi,D) = iD − Di
.
Le but est alors de calculer fr,D, ce qui se fait par un algorithme double-and-add,
via la relation
fi+j,D = fi,D · fj,D · hDi,Dj
,
où hDi,Dj
est la fonction apparaissant dans l’addition de Di et Dj
:
div(hDi,Dj
) = Di + Dj − ρ(Di + Dj ).Couplages 27
1.2.4 Une variante : le couplage ate
Il s’agit d’une variante, plus rapide à calculer, du couplage de Tate. Avant
de la présenter, il faut commencer par évoquer la normalisation des fonctions de
Miller.
Définition 1.2.7. Soit f ∈ K(C) avec v∞(f) = −n. Soit u∞ une uniformisante
en ∞.
6
Le coefficient dominant de f en ∞ est
lc∞(f) = (u
n
∞f)(∞).
Ainsi, si f est définie en ∞, on a simplement lc∞(f) = f(∞).
Alors la normalisation de f est le multiple de f
f
norm = f/lc∞(f)
qui a pour coefficient dominant 1 en l’infini.
Muni de cette définition, voici le couplage ate :
Théorème 1.2.8. L’application
a : G2 × G1 → µr
(D2, D1) 7→ f
norm
q,ρ(D2)
((D1))
est un couplage bilinéaire non dégénéré. .
Dans le cas malheureux où
supp((D1)) ∩ supp(ρ(D2)) 6= ∅,
on est obligé de remplacer (D1) par un autre diviseur D0 ∼ D1.
Définition 1.2.9. Ce couplage a(D2, D1) est appelé couplage ate.
Voyez les deux grandes différences entre Tate et ate : dans le premier couplage, il
faut calculer fr,D, tandis que dans le second on ne va que jusqu’à fq,D. Je rappelle
que r|]J (Fq) ≈ q
g
, ainsi la boucle de Miller est de l’ordre de g fois plus courte
pour le calcul de ate que pour le calcul de Tate.
Ensuite, on remarquera qu’il n’y a pas d’exponentiation finale pour le calcul de
ate.
Remarque 1.2.10. Toujours dans l’optique de diminuer la taille de la boucle de
Miller, d’autres variantes de Tate et ate ont été introduit, tels que les couplages
R-ate, ou ate-i. Je ne le présente pas ici : quel que soit le couplage choisi, il est
nécessaire de calculer une quantité du type
fs,D(D
0
).
6. par exemple, on peut prendre u∞ = x
2g/y.28 Préliminaires
1.3 Fonctions thêta
On a vu précédemment que l’algorithme de Miller est le moyen traditionnel
de calcul de couplages. Je présente maintenant la théorie des fonctions thêta, qui
est à la base de la méthode alternative introduite par Lubicz et Robert dans [30].
Pour plus de clarté, je présente d’abord ces outils en genre 1, avant de généraliser
à g quelconque. La référence classique est [34].
1.3.1 Le cas elliptique
1.3.1.1 Définition et premières propriétés
Provisoirement, je me place sur une courbe elliptique E définie sur le corps
des complexes C. Je rappelle que cela signifie qu’il y a un réseau Λ ⊂ C tel que
E ∼= C/Λ.
Concrètement, Λ est défini par :
Λ = (Z + τZ),
où τ ∈ C est traditionnellement choisi avec Im(τ ) > 0.
Pour z ∈ C, z (mod Λ) est le représentant de z dans le parallélogramme fondamental,
c’est-à-dire celui engendré par 1 et τ .
Proposition 1.3.1. Soit a, b ∈ Q. La série
θ
"
a
b
#
(z, τ ) = X
n∈Z
exp
πi(a + n)
2
τ + 2πi(n + a)(z + b)
définit une fonction holomorphe sur C.
Définition 1.3.2. Cette fonction est appelée fonction thêta avec caractéristiques
a et b.
L’évaluation d’une fonction thêta en z = 0 est appelée une constante thêta.
Remarque 1.3.3.
— Si a = b = 0, θ
"
0
0
#
est simplement noté θ.
— En pratique, on considérera a, b ∈ {0,
1
2
}, c’est-à-dire les fonctions thêta
avec caractéristiques semi entières.
Parmi les fonctions thêta, il y en a une particulière qu’on utilisera souvent : la
fonction sigma, dont voici la définition :Fonctions thêta 29
Définition 1.3.4. Le produit infini
z
Y
ω∈Λ
ω6=0
1 −
z
ω
e
(z/ω)+ 1
2
(z/ω)
2
définit une fonction holomorphe sur tout C appelée fonction σ de Weierstrass
(attachée à E).
C’est une fonction θ dans le sens où il existe des constantes (que je ne précise
pas) C et K telles que :
σ(z) = C.exp
K.z2
θ
"
1/2
1/2
#
(z, τ ).
L’importance de cette fonction vient du fait qu’elle permet de construire n’importe
quel fonction elliptique. Plus de détails sur σ pourront être trouvées dans
[42], chapitre 6.
Proposition 1.3.5. Pour tout n ∈ Z,
θ
"
a
b
#
(z + n, τ ) = exp(2πian) θ
"
a
b
#
(z, τ ),
et
θ
"
a
b
#
(z + nτ, τ ) = exp
−2πibn − πin2
τ − 2πinz
θ
"
a
b
#
(z, τ ).
Définition 1.3.6. Toute fonction vérifiant les égalités de la proposition 1.3.5 est
dite quasi périodique modulo Λ.
En particulier, cette proposition signifie que les fonctions θ ne sont pas des fonctions
elliptiques :
si z ≡ z
0
(mod Λ), on n’a pas θ
"
a
b
#
(z, τ ) = θ
"
a
b
#
(z
0
, τ ), parce que ces deux termes
diffèrent d’un terme exponentiel.
Par contre, ce terme exponentiel n’empêche pas leur lieu d’annulation d’être bien
défini sur E :
Proposition 1.3.7. On fixe les caractéristiques a et b.
Alors, dans le parallélogramme fondamental, θ
"
a
b
#
(z, τ ) admet comme seul zéro
le point (a +
1
2
) + (b +
1
2
)τ .30 Préliminaires
Remarque 1.3.8. En particulier, θ
"
1/2
1/2
#
(et donc la fonction σ) admet un zéro
simple en chaque point du réseau Λ et nulle part ailleurs.
Chacune des trois autres θ
"
a
b
#
avec a, b ∈ {0,
1
2
} semi entières s’annule sur un des
trois autres points de 2-torsion de E.
Pour P ∈ E, comme la quantité θ
"
a
b
#
(P) seule n’a pas de sens, la stratégie de
[30] est alors de calculer ensembles plusieurs évaluations de fonctions thêta bien
choisies.
Définition 1.3.9. Soit l ∈ N. Une fonction f sur C est quasi Λ-périodique de
niveau l si, pour tout z ∈ C et n ∈ Z,
f(z + n) = f(z), and f(z + nτ ) = exp
−πiln2
τ − 2πilnz
f(z).
L’ensemble de ces fonctions est un espace vectoriel de dimension finie noté Rτ
l
.
Les fonctions thêta avec caractéristiques nous donnent des bases de ces espaces :
Proposition 1.3.10. [[34] p. 124] On fixe un niveau l ∈ N.
— Les ensembles
(
θ
"
a/l
0
#
(lz, lτ ) | 0 ≤ a ≤ l − 1
)
et (
θ
"
0
b/l#
z, l−1
τ
| 0 ≤ b ≤ l − 1
)
sont deux bases de Rτ
l
.
— Si 2|l, alors l’ensemble
θ
"
0
b/l#
(z, 2τ/l)
!2
| 0 ≤ b ≤ l − 1
est une autre base de Rτ
l
.
— Enfin, si l = k
2
est un carré, alors une base alternative de Rτ
l
est :
(
θ
"
a/k
b/k#
(kz, τ ) | 0 ≤ a, b ≤ k − 1
)
.
Remarque 1.3.11. Pour faire le lien avec ce qui a été rappelé en 1.1, notons
que Rτ
l
est isomorphe à l’espace de Riemann-Roch L(lO).
J’ai dit avant la définition 1.3.9 qu’il allait nous falloir évaluer plusieurs fonctions
thêta d’un coup en un point de la courbe. La proposition suivante nous explique
comment :Fonctions thêta 31
Proposition 1.3.12. [[34] p. 127] On fixe un niveau l ∈ N. Soit φ
(l)
1
, . . . , φ(l)
l une
base de Rτ
l
. Alors la fonction suivante est bien définie :
Φl
: C/Λ → P
l−1
z 7→
φ
(l)
1
(z), . . . , φ(l)
l
(z)
.
Si l ≥ 3, Φl est un plongement.
Ce n’est pas tout à fait le cas pour l = 2 : Φ2 est en fait un plongement de K vers
P
1
, où K désigne la variété de Kummer associée à E, i.e. K ∼= E/{±1}.
En pratique, on utilise les fonctions thêta de niveau 2 et 4. Les relations de
Riemann (voir [34] p.20) nous donnent alors des formules d’addition satisfaites par
les fonctions thêta avec caractéristiques semi entières. On a aussi la proposition
suivante :
Proposition 1.3.13. Soit z1, z2 ∈ C. Pour tout b ∈ {0, 1/2},
θ
"
0
b
#
(z1 + z2; τ )θ
"
0
b
#
(z1 − z2; τ ) = X
a∈{0,1/2}
(−1)4abθ
"
a
0
#
z1;
τ
2
θ
"
a
0
#
z2;
τ
2
.
Résumons ce que l’on a énoncé sur les fonctions thêta.
Soit P, Q ∈ E. La proposition 1.3.12 nous explique que ces points peuvent être
représentés par l’évaluation de certaines fonctions thêta bien choisies en eux.
La proposition 1.3.13 nous explique comment représenter le point P +Q, dès lors
qu’on a la représentation des points P, Q et P − Q via les fonctions thêta.
Avant de rappeler le calcul de couplages expliqué dans [30], je donne quelques
formules pour expliciter mon propos.
Remarque 1.3.14. On aura remarqué que j’ai présenté ici la théorie classique
des fonctions thêta, définies sur C. Evidemment, pour une utilisation cryptographique,
il est nécessaire de la transposer aux corps finis. Cela se fait via le principe
de Lefschetz. Ainsi, les propositions 1.3.10, 1.3.12 et 1.3.13 restent vraies pour
une courbe E définie sur un corps fini. Comment se calculent alors les fonctions
thêta ? C’est ce que j’énonce dans la proposition suivante 1.3.15.
1.3.1.2 Arithmétique des fonctions thêta
Dans cette section, on travaille sur un corps fini Fq. On supposera toujours
que la caractéristique p de Fq est différente de 2.
Tout d’abord, voyons comment faire le passage entre la représentation de Weierstrass
usuelle d’une courbe et sa représentation par les fonctions thêta. La proposition
suivante est le cas g = 1 du théorème 7.6 de [35] (p. 3.113).32 Préliminaires
Proposition 1.3.15. Soit E/Fq une courbe elliptique. On suppose que E est
donnée par une équation de Weierstrass
y
2 = (x − a1)(x − a2)(x − a3).
Si tous les aj − ai, 1 ≤ i < j ≤ 3 sont des carrés dans Fq, alors on a :
— si P ∈ E\O :
θ
"
0
0
#
(P, τ )
θ
"
1/2
1/2
#
(P, τ )
2
=
xP − a2
q
(a2 − a1)(a3 − a2)
,
θ
"
1/2
0
#
(P, τ )
θ
"
1/2
1/2
#
(P, τ )
2
=
xP − a3
q
(a3 − a1)(a3 − a2)
,
θ
"
0
1/2
#
(P, τ )
θ
"
1/2
1/2
#
, τ )
2
=
xP − a1
q
(a3 − a1)(a2 − a1)
;
— si P = O :
θ
"
0
0
#
O, τ )
θ
"
1/2
0
#
(O, τ )
2
=
√
a3 − a1
√
a2 − a1
,
θ
"
0
1/2
#
(O, τ )
θ
"
1/2
0
#
(O, τ )
2
=
√
a3 − a2
√
a2 − a1
,
θ
"
1/2
1/2
#
(O, τ ) = 0.
Les bases décrites dans la proposition 1.3.10 de niveau deux seront désignées
ainsi :
— [uP : vP ] = "
θ
"
0
0
#
(P, τ )
2
: θ
"
1/2
0
#
(P, τ )
2
#
,
— [u
0
P
: v
0
P
] = "
θ
"
0
0
#
(2P, 2τ ) : θ
"
1/2
0
#
(2P, 2τ )
#
,Fonctions thêta 33
— [˜uP : ˜vP ] = "
θ
"
0
0
#
(P, τ/2) : θ
"
0
1/2
#
(P, τ/2)#
,
Et les constantes thêta ainsi :
— a = θ
"
0
0
#
(O, τ/2), b = θ
"
0
1/2
#
(O, τ/2);
— α = θ
"
0
0
#
(O, 2τ ), β = θ
"
1/2
0
#
(O, 2τ );
En niveau 4, la même proposition 1.3.10 nous donne la base suivante :
[XP : YP : ZP : TP ] = "
θ
"
0
0
#
(2P, Ω) : θ
"
1/2
0
#
(2P, Ω) : θ
"
0
1/2
#
(2P, Ω) : θ
"
1/2
1/2
#
(2P, Ω)#
.
Les constantes thêta sont désignées ainsi :
A = θ
"
0
0
#
(O, Ω),
B = θ
"
1/2
0
#
(O, Ω),
C = θ
"
0
1/2
#
(O, Ω).
Remarque 1.3.16. Notons que θ
"
1/2
1/2
#
(O, Ω) = 0.
La proposition 1.3.13 nous donne les formules de changement de bases suivantes :
Proposition 1.3.17. Pour tout point P ∈ E,
— uP =
1
2
(au˜P + bv˜P ), vP =
1
2
(au˜P − bv˜P );
— u
0
P =
1
2
(˜uP + ˜vP ), v
0
P =
1
2
(˜uP − v˜P ).
En particulier, en prenant P = O, on obtient les relations entre les constantes
thêta.
Les formules d’addition que vérifient les bases de niveau 2 décrivent l’arithmétique
de K :
Proposition 1.3.18. Soient P et Q ∈ E.
— pour la base (u, v), on a :
uP +QuP −Q =
(uP + vP )(uQ + vQ) + α
2
β
2
(uP − vP )(uQ − vQ)
!2
,
vP +QvP −Q =
(uP + vP )(uQ + vQ) −
α
2
β
2
(uP − vP )(uQ − vQ)
!2
;34 Préliminaires
— pour (u
0
, v0
) :
u
0
P +Qu
0
P −Q = (u
02
P + v
02
P
)(u
02
Q + v
02
Q) + A2
B2
(u
02
P − v
02
P
)(u
02
Q − v
02
Q),
v
0
P +Qv
0
P −Q = (u
02
P + v
02
P
)(u
02
Q + v
02
Q) −
A2
B2
(u
02
P − v
02
P
)(u
02
Q − v
02
Q);
— enfin, pour (˜u, v˜) :
u˜P +Qu˜P −Q = (˜u
2
P + ˜v
2
P
)(˜u
2
Q + ˜v
2
Q) + A2
B2
(˜u
2
P − v˜
2
P
)(˜u
2
Q − v˜
2
Q),
v˜P +Qv˜P −Q = (˜u
2
P + ˜v
2
P
)(˜u
2
Q + ˜v
2
Q) −
A2
B2
(˜u
2
P − v˜
2
P
)(˜u
2
Q − u˜
2
Q).
Regardons maintenant ce qui se passe en niveau 4 :
La courbe E peut alors être décrite avec les fonctions de niveau 4 par le théorème
suivant :
Théorème 1.3.19. On reprend notre courbe E d’équation y
2 = (x − a1)(x −
a2)(x − a3). On demande maintenant à ce que les aj − ai soient des puissances
quatrièmes dans Fq. Alors, l’application
E → T
P = [xP : yP ] 7→ [XP : YP : ZP : TP ]
O 7→ [A : B : C : 0]
établit une équivalence birationnelle entre E et la courbe
T :
(
X2A2 = Z
2C
2 + Y
2B2
T
2A2 = Z
2B2 − Y
2C
2
Explicitement, ce morphisme est :
XP = (xP − a2)
2 + (a2 − a1)(a3 − a2),
YP = (xP − a1)
2 + (a3 − a2)(a3 − a1),
ZP = (xP − a3)
2 + (a3 − a1)(a2 − a1),
TP =
((a3 − a1)(a3 − a2)(a2 − a1))
1
4
2
yP .
Proposition 1.3.20. Les formules d’addition sur T sont données par les relations
de Riemann :
XP +QXP −QA
2 = X
2
P X
2
Q + T
2
P T
2
Q
YP +QYP −QB
2 = X
2
P X
2
Q − Z
2
P Z
2
QFonctions thêta 35
ZP +QZP −QC
2 = X
2
P X
2
Q − Y
2
P Y
2
Q
TP +QTP −QA
2 = T
2
P X
2
Q − X
2
P T
2
Q
Pour le doublement, si on remplace Q par P dans la dernière équation, on n’obtient
rien d’autre que 0 = 0. À la place, il faut utiliser la formule suivante :
T2PABC = 2XP YP ZP TP
Remarque 1.3.21.
— Sur T , l’opposé du point [X : Y : Z : T] est [X : Y : Z : −T].
— Le lien entre niveau 2 et niveau 4 peut se faire via les relations de Riemann
: par exemple
XA3 =u
2 + t
2 = v
2 + w
2
Y B3 =u
2 − w
2 = v
2 − t
2
ZC3 =u
2 − v
2 = w
2 − t
2
T A2B
2C
2 =4uvwt.
L’application [X : Y : Z : T] 7→ [u : v] est donc bien 2 : 1, et la fibre au
dessus de chaque point [u : v] consiste en un couple
{[X : Y : Z : T], [X : Y : Z : −T]}.
1.3.2 Fonctions thêta en tout genre
Après cette longue introduction en genre 1, il va être plus simple de comprendre
la généralisation au cas hyperelliptique. Le parcours est le même : je
commence par rappeler ce que sont les fonctions thêta, j’évoque ensuite les fonctions
de niveau l, et finalement j’explique les coordonnées thêta, c’est-à-dire le
plongement projectif de la jacobienne (ou de la kummer) donné par les fonctions
thêta. Encore une fois, plus de détails se trouveront dans [34].
Comme en genre 1, on commence par travailler sur C avant de revenir à nos corps
finis. Ainsi, soit C/C une courbe hyperelliptique de genre g. Alors
J ∼= C
g
/ (Z
g + ΩZ
g
),
où Ω est une matrice symétrique de taille g, que l’on choisit avec Im(Ω) définie
positive. Le réseau Z
g + ΩZ
g
est noté Λ.
Définition 1.3.22. Soient a, b ∈ Qg
. La fonction thêta de caractéristiques rationnelles
(a, b) est la fonction analytique sur C
g définie par la série :
θ
"
a
b
#
(z; Ω) = X
n∈Zg
exp
πit
(a + n)Ω(n + a) + 2πit
(n + a)(z + b)
.36 Préliminaires
Exemple 1.3.23. En genre 1, il y avait 4 fonctions thêta avec caractéristiques
semi entières. En genre 2, on voit qu’il y en a maintenant 16.
Toujours comme en genre 1, ces fonctions nous donnent des bases des espaces de
fonctions de niveau l (c’est l’équivalent de la proposition 1.3.10) :
Définition 1.3.24. Soit l ∈ N. Une fonction f sur C
g
est quasi Λ-périodique de
niveau l si, pour tout z ∈ C
g
et m, m0 ∈ Z
g
,
f (z + m + Ωm0
) = f(z)exp
−πiltm0Ωm0 − 2πilt
zm0
.
Proposition 1.3.25 ([34] p. 124). L’ensemble des fonctions de niveau l forme
un espace vectoriel de dimension l
g noté RΩ
l
.
Fixons un niveau l. Les fonctions thêta nous donnent plusieurs bases de RΩ
l
. On
a par exemple les bases suivantes :
—
(
θ
"
a
0
#
(lz, lΩ) | a ∈
1
l
Z
g/Z
g
)
,
—
(
θ
"
0
b
#
(z, l−1Ω) | b ∈
1
l
Z
g/Z
g
)
,
— si 2|l,
(
θ
"
a
b
#
2z, 4Ω
l
| a ∈
1
2
Z
g/Z
g
, b ∈
2
l
Z
g/Z
g
)
,
— si l = k
2
,
(
θ
"
a
b
#
(kz, Ω) | a, b ∈
1
k
Z
g/Z
g
)
.
Remarque 1.3.26. Pour g = 1, on avait vu le lien entre les fonctions de niveau
l et les espaces de Riemann Roch. Pour g quelconque, ce lien demeure :
R
Ω
l = L(lΘ).
Voici maintenant l’équivalent de la proposition 1.3.12 : le plongement projectif
induit par les fonctions thêta.
Proposition 1.3.27 ([34] p. 127). On fixe un niveau l ∈ N. Soit φ
(l)
1
, . . . , φ(l)
l
g
une base de RΩ
l
. Alors la fonction suivante est bien définie :
Φl
: C
g
/Λ → P
l
g−1
z 7→
φ
(l)
1
(z), . . . , φ(l)
l
g (z)
.
Si l ≥ 3, Φl est un plongement.
Ce n’est pas le cas pour l = 2 : Φ2 est en fait un plongement de K vers P
2
g−1
, où
K est la variété de Kummer associée à J :
K ' J /{±1}.Fonctions thêta 37
Exemple 1.3.28. Les formules d’addition vérifiées par les fonctions thêta en
genre 2, et les algorithmes dérivés se trouvent par exemple dans [21].
Enfin, faisons le lien entre les fonctions θ et le diviseur Θ :
Proposition 1.3.29 ([35] pp. 3.80-3.82). Soit
δ =
t
1
2
, . . . ,
1
2
, δ0 =
t
g
2
,
g − 1
2
, . . . ,
1
2
∈ Q
g
.
On note
θ
"
δ
δ
0
#
.
Alors
div(θ
0
) = Θ
Exemple 1.3.30. Pour g = 1, on a θ
0 = θ
"
1/2
1/2
#
, et on retrouve le fait que θ
0
admet un unique zéro simple en O.
Je rappelle que quand on étudiait le cas g = 1, on avait spécifié une fonction
thêta spéciale : la fonction sigma de Weierstrass.
Quand g > 1, son équivalent s’appelle fonction sigma de Klein. Comme pour
g = 1, elle est reliée à θ
0
:
Définition 1.3.31 ([39]). Pour définir sigma, on a besoin des différentielles suivantes
: pour 1 ≤ j ≤ g
ηj =
1
2y
2
X
g−j
k=j
(k + 1 − j)fk+1+jx
k
dx,
où les fi sont les coefficients de l’équation de C :
y
2 = f(x) = x
2g+1 + f2gx
2g + · · · + f0.
On réunit ces différentielles dans un vecteur : η = (ηj )1≤j≤g. Alors, il y a une
constante c telle que la fonction sigma hyperelliptique soit la fonction de C
g
définie par :
σ(z) = cexp(
1
2
t
zηz)θ
"
δ
δ
0
#
(z; Ω).
Une dernière proposition utile à garder en tête est la suivante :38 Préliminaires
Proposition 1.3.32 ([34] proposition 3.14 p.167).
La fonction θ
"
a
b
#
est paire ou impaire si et seulement si ses caractéristiques a et
b sont semi entières.
Elle est alors de la parité de 4
tab.
En particulier, σ est impaire pour g ≡ 1, 2 (mod 4), et paire dans les deux autres
cas. Étudions encore un peu σ avant d’aller plus loin :
Définition 1.3.33. Pour i, j, k ∈ {1, 2, . . . , g} et u ∈ C
g
, les ℘−fonctions hyperelliptiques
sont définies de la façon suivante :
℘ij (u) = −
∂
2
∂ui∂uj
logσ(u), ℘ijk(u) = −
∂
3
∂ui∂uj∂uk
logσ(u).
Ce sont des fonctions bien définies sur J ' C
g/Λ.
Proposition 1.3.34. [10]
Soit D1, D2 ∈ J . Il existe des polynômes
Fg(D1, D2) et Gg(D1) ∈ Z[℘ij (D1), ℘ijk(D1), ℘ij (D2), ℘ijk(D2)]
tels que
σ(D1 + D2)σ(D1 − D2)
σ(D1)
2σ(D2)
2
= Fg(D1, D2).
σ(2D1)
σ(D1)
4
= Gg(D1).
Remarque 1.3.35.
• Les ℘ fonctions sont un moyen alternatif de représenter les éléments de J . Elles
sont reliées à la représentation de Mumford via
u = x
g −
X
g
l=1
℘lg(D)x
l−1
, v =
X
g
l=1
℘lgg(D)
2
x
l−1
.
Plus de détails se trouveront dans [9].
• En réalité, cette propriété n’est pas simplement une propriété d’existence : les
polynômes Fg sont bien construits. Comme je n’ai pas besoin de leurs valeurs
exactes, je ne les donne pas ici. Elles se trouvent par exemple dans [10].
Le corollaire suivant est à la base de la théorie des hyperelliptic nets :
Corollaire 1.3.36. [50] Soit m > 2
g un entier. On se donne m points u
(1), . . . , u(m) ∈ C
g
.
La matrice
σ(u
(i) + u
(j)
)σ(u
(i) − u
(j)
)
1≤i,j≤m
est de déterminant nul.La théorie des hyperelliptic nets 39
1.4 La théorie des hyperelliptic nets
Dans cette section, je rappelle une autre théorie permettant le calcul des
couplages : celle des hyperelliptic nets 7
. Comme je l’ai fait pour les fonctions
thêta, je commencerai par présenter le cas elliptique avant sa généralisation aux
genres supérieurs.
1.4.1 Le cas elliptique
Cette section rappelle les résultats de Stange dans [45].
Définition 1.4.1. Soit G un groupe abélien libre de type fini, et A un anneau
intègre. Une fonction W : G → A est appelé elliptic net si pour tout quadruplet
(a, b, c, d) ∈ G4
:
W(a + b)W(a − b)W(c + d)W(c − d)
+ W(a + c)W(a − c)W(d + b)W(d − b)
+ W(a + d)W(a − d)W(b + c)W(b − c) = 0.
Remarque 1.4.2. On notera pour faire le lien avec le cas hyperelliptique que
ceci est équivalent à demander à ce que pour tout quadruplet (u1, . . . , u4) ∈ G4
,
on ait
det (W(ui + uj )W(ui − uj ))1≤i,j≤4 = 0.
Dans un cadre cryptographique, et dans le but de calculer des couplages, G sera
Z
2
et A le corps sur lequel l’on travaille : C dans un premier temps pour mettre
en place la théorie, un corps fini Fq
k ensuite pour faire les calculs en pratique.
Soit donc E une courbe elliptique, que je suppose pour le moment définie sur
C. Utilisant la fonction σ de Weierstrass, Stange commence par construire un
premier elliptic net :
Proposition 1.4.3 ([45]). Pour tout couple v = (v1, v2) ∈ Z
2
,
Ψv(z1, z2) = σ(v1z1 + v2z2)
σ(z1)
v
2
1−v1v2 σ(z1 + z2)
v1v2 σ(z2)
v
2
2−v1v2
est une fonction bien définie E × E.
7. dans ce document, le terme hyperelliptic nets regroupera les cas g = 1 et g > 1.40 Préliminaires
Remarque 1.4.4.
• Je précise le sens de cette proposition : à priori σ (comme les autres
fonctions theta) est définie sur C, et quasi Λ-périodique. Cette proposition
signifie qu’en prenant un quotient bien choisi de fonctions sigma, on
construit une fonction bien définie sur E, c’est-a-dire qui soit vraiment
Λ-périodique.
• Dans son article [45], Stange définit des nets sur Z
n
en toute généralité.
Mais comme je l’ai signalé précédemment, pour le calcul de pairings, nous
n’aurons besoin que du cas n = 2.
Ainsi, dans la proposition précédente, le couple v = (v1, v2) ∈ Z
2
est fixé pour
construire une fonction Ψv sur E × E. L’idée maintenant est d’inverser les rôles
des zi et des vi
:
Proposition 1.4.5 ([45]). Fixons donc z1 et z2 ∈ C, avec z1, z2 et z1 + z2 ∈/ Λ.
La fonction
W : Z
2 → C
v 7→ Ψv(z1, z2)
est un elliptic net.
Remarque 1.4.6. Remarquons dès à présent qu’elle vérifie :
W(1, 0) = W(0, 1) = W(1, 1) = 1.
Je rappelle que σ admet un zéro simple en O. Cette information permet d’avoir
facilement le diviseur de Ψv :
Théorème 1.4.7 ([45]). Soit s : E
2 → E et, pour i = 1 or 2, pi
: E
2 → E respectivement
la somme des composantes et la projection sur la i-ième composante.
Leurs pullbacks sont notés s
∗
et p
∗
i
. Avec ces notations, le diviseur de Ψv est :
DE,v = (([v1] × [v2])∗
s
∗O) − v1v2 (s
∗O) − (v
2
1 − v1v2)p
∗
1O − (v
2
2 − v1v2)p
∗
2O.
Remarque 1.4.8. En langage humain, ce théorème signifie en particulier que
pour (z1, z2) ∈ C correspondant aux points (P1, P2) ∈ E,
W(v1, v2) = 0 ⇔ [v1]P1 + [v2]P2 = O.La théorie des hyperelliptic nets 41
Ce théorème a des conséquences importantes. D’abord, Stange établit le théorème
de transport de C vers les autres corps (et notamment les corps finis) suivant :
Théorème 1.4.9 ([45]). Soit E une courbe elliptique défini sur un corps K quelconque.
Soient P1 et P2 deux points de E. Il existe un elliptic net
WE,(P1,P2)
: Z
2 → K
avec les propriétés suivantes :
— WE,(P1,P2)(0, 1) = WE,(P1,P2)(1, 0) = WE,(P1,P2)(1, 1) = 1 ;
— WE,(P1,P2)(v1, v2) = 0 ⇔ [v1]P1 + [v2]P2 = O sur la courbe E.
Définition 1.4.10. Un elliptic net vérifiant les propriétés du théorème 1.4.9 est
dit associé à la courbe E et aux points P1 and P2.
Ensuite, elle montra comment calculer les couplages avec ces nets. Je rappellerai
ce théorème dans le chapitre 2, justement dédié aux couplages.
Passons maintenant à la généralisation de cette théorie aux genres plus grands.
1.4.2 Le cas hyperelliptique
Ici, je rappelle les résultats qu’Uchida et Uchiyama ont énoncé dans [50]. Le
point de départ de leur article est de généraliser la proposition 1.4.3. Comme
dans le travail de Stange, la théorie débute sur C :
Proposition 1.4.11. Soit C/C une courbe hyperelliptique de genre g.
Pour v = (v1, v2) ∈ Z
2
,
Ψv(z1, z2) = σ(v1z1 + v2z2)
σ(z1)
v
2
1−v1v2 σ(z1 + z2)
v1v2 σ(z2)
v
2
2−v1v2
est une fonction bien définie sur J × J .
Remarque 1.4.12. Les mêmes remarques que pour le genre 1 sont ici valables.
Vient ensuite la généralisation du théorème 1.4.7 :
Théorème 1.4.13. Soient s : J
2 → J et, pour i = 1 et 2, pi
: J
2 → J
respectivement la somme de toutes les composantes et les projections sur la iième
composante. Pour v 6= 0 ∈ Z
2
, le diviseur de Ψv est :
DC,v = (([v1] × [v2])∗
s
∗Θ)−v1v2 ((p
∗
1 × p
∗
2
)s
∗Θ)−(v
2
1 −v1v2)p
∗
1Θ−(v
2
2 −v1v2)p
∗
2Θ.42 Préliminaires
Enfin, voici le théorème de transport (équivalent du théorème 1.4.9)
Théorème 1.4.14. Soit C/K une courbe hyperelliptique définie sur un corps
quelconque K, et D1et D2 deux diviseurs de C. Alors il existe une application
WC,(D1,D2)
: Z
2 → K vérifiant les deux propriétés suivantes :
— WC,(D1,D2) = 0 ⇔ [v1]D1 + [v2]D2 ∈ Θ.
— Soit m > 2
g un entier. On se donne v1, . . . vm, et w1, . . . wm dans 1/2Z
tels que pour tout i et j, vi ± vj et wi ± wj ∈ Z. Alors, la matrice
WC,(D1,D2)(vi + vj
, wi + wj )WC,(D1,D2)(vi − vj
, wi − wj )
1≤i,j≤m
est de déterminant nul.
Définition 1.4.15. La fonction WC,(D1,D2) établie dans le théorème précédent
1.4.14 est appelée hyperelliptic net associé à C et (D1, D2).
Exemple 1.4.16. Pour g = 1 et m = 4, on retrouve la définition initiale des
elliptic nets.
Le fait que v 7→ Ψv soit un hyperelliptic net est une conséquence du corollaire
1.3.36. Plus précisément, et comme dans la proposition 1.4.5 en genre 1 :
Théorème 1.4.17. Fixons z1 et z2 ∈ C
g
. La fonction
W : Z
2 → C
v 7→ Ψv(z1, z2)
est un hypelliptic net.Chapitre 2
Deux méthodes de calculs de
couplages
Dans le chapitre précédent, j’ai rappelé les théories des fonctions thêta et des
hyperelliptic nets, sous-jacentes respectivement à [30] et [50]. Ici, je m’intéresse
maintenant aux méthodes de calculs de couplages qui y sont exposées. Après avoir
rappelé les résultats déjà existants (théorèmes 2.1.1 et 2.2.1 1
), je donnerai mes
propres résultats : l’algorithme de calcul de couplages en tout genre utilisant les
hyperelliptic nets. Enfin, je ferai une comparaison des coûts théoriques en genre
1.
De prime abord, cette juxtaposition de deux théories à priori indépendantes
pourra sembler décousue, mais ce sera justement l’objet du troisième chapitre
d’expliquer les liens profonds les unissant.
2.1 Couplages et fonctions thêta
Maintenant que les définitions et propriétés des fonctions thêta ont été rappelées,
voici le résultat principal de [30] :
Théorème 2.1.1 ([30], théorème 2). On se replace dans la situation de la défi-
nition 1.2.3 : C est une courbe hyperelliptique de genre g définie sur le corps Fq,
et J sa jacobienne ; r est un grand diviseur premier de ]J (Fq) premier à q ; k
est le degré de plongement ; D1 est un élément de J (Fq
k )[r].
On se donne θ
"
a
b
#
de niveau l, où l et r sont premiers entre eux. Alors on a la
1. en fait, comme expliqué plus bas, 2.2.1 est ma version améliorée du théorème énoncé dans
[50].
4344 Deux méthodes de calculs de couplages
formule suivante pour le couplage de Tate de D1 et D2 :
(t(D1, D2))l =
θ
"
a
b
#
(D2 + rD1)
θ
"
a
b
#
(D2)
θ
"
a
b
#
(0)
θ
"
a
b
#
(D1 + D2)
.
Ainsi, dans [30], la stratégie pour calculer le couplage de D1 et D2 avec la
formule 2.1.1 est de chercher les coordonnées thêta du point D2 + rD1.
Remarque 2.1.2. Rappelons que les fonctions thêta ne sont pas Λ-périodiques.
Ainsi, même si D1 est dans la r-torsion de J , nous n’avons pas forcément
θ
"
a
b
#
(D2 + rD1) = θ
"
a
b
#
(D2)
Cela se fait par une échelle de Montgomery construite avec les formules d’addition
satisfaites par les fonctions thêta : à chaque étape, connaissant les coordonnées
de jD1, (j+1)D1 et jD1+D2, on va chercher les coordonnées de 2jD1, (2j+1)D1
et 2jD1 +D2 ou celles des points (2j + 1)D1, (2j + 2)D1 et (2j + 1)D1 +D2, selon
la décomposition binaire de r. En pratique, les fonctions thêta les plus efficaces
sont celles de niveau 2 et 4, c’est-à-dire celles qui ont été exposées dans la seconde
partie de la section 1.3.1.1.
2.2 Couplages et nets
Grâce au théorème 1.4.13, Uchida et Uchiyma ([50]) ont exprimé les couplages
en fonction des hyperelliptic nets, généralisant par là le travail de Stange :
Théorème 2.2.1. On reste dans la situation de la définition 1.2.3. Soit W l’hyperelliptic
net associé à D1 ∈ G1 et D2 ∈ G2 défini dans le théorème 1.4.17
(c’est-à-dire issu de la fonction Ψ définie dans la proposition 1.4.11). Le couplage
de Tate de D1 et D2 peut se calculer grâce à W :
t(D1, D2) =
W(r + 1, 1)
W(1, 1) !q
k−1
r
.
Ceci est une légère amélioration du théorème donné dans [50] : en effet, la formule
initiale est
fr,D1
(D2) = W(r + 1, 1)W(1, 0)
W(r + 1, 0)W(1, 1).
Pour simplifier cette formule, j’utilise le lemme suivant :Couplages et nets 45
Lemme 2.2.2. Dans les conditions du théorème, en particulier avec W l’hyperelliptic
net associé à D1 ∈ G1 et D2 ∈ G2 défini dans le théorème 1.4.17, le fait
que D1 soit dans J (Fq) nous assure que, pour tout i ∈ N, W(i, 0) ∈ Fq.
Démonstration. Grâce à la proposition 1.3.34, pour tout a, b ∈ Z :
W(a + b, 0)W(a − b, 0)
W(a, 0)2W(b, 0)2
= Fg([a]D1, [b]D1),
W(2a, 0)
W(a, 0)4
= Gg([a]D1).
Or, comme
Fg(D1, D2), Gg(D1) ∈ Z[℘ij (D1), ℘ijk(D1), ℘ij (D2), ℘ijk(D2)],
si D1 ∈ J (Fq) , alors Fg([a]D1, [b]D1) ∈ Fq.
Enfin, dans le théorème 1.4.14 définissant les nets, je peux choisir W(1, 0) ∈ Fq
(en pratique, on prendra même W(1, 0) = 1) pour s’assurer par récurrence qu’on
ait bien tous les W(i, 0) dans Fq.
Ainsi, avec ce lemme et l’exponentiation finale, j’obtiens la formule donnée dans
le théorème 2.2.1.
Maintenant que le lien entre couplages et nets est établi, il faut expliquer comment
construire les algorithmes exploitant ce théorème. Ils sont dérivés de la formule
définissant les nets :
det(W(vi + vj
, wi + wj )W(vi − vj
, wi − wj ))1≤i,j≤m = 0. (2.1)
Ce travail a été fait en genre 1 par Stange dans [45], et en genre 2 par Uchida et
Uchiyama dans [50]. J’ai par la suite généralisé pour tout genre dans [48], ce que
j’expose maintenant.
Soient D1 et D2 les deux diviseurs dont je veux calculer le couplage. L’hyperelliptic
net associé à ces deux diviseurs est noté W. L’algorithme se déroule en deux
phases :
Initialisation Dans cette phase, on utilise les polynômes Fg et Gg pour calculer
un certain nombre (je préciserai plus loin) de valeurs W(a, 0) et W(a, 1),
via :
W(a + b, 0)W(a − b, 0)
W(a, 0)2W(b, 0)2
= Fg([a]D1, [b]D1),
W(2a, 0)
W(a, 0)4
= Gg([a]D1).46 Deux méthodes de calculs de couplages
Double − and − add Une fois cela fait, on utilise l’équation 2.1 pour obtenir
les formules qui donneront au final la quantité W(r, 1) souhaitée.
Il faut signaler ici que ces formules utilisées dans la seconde phase diffèrent selon
que g ≡ 1, 2 (mod 4) ou g ≡ 0, 3 (mod 4).
En effet, dans le premier cas, σ est impaire, donc les nets v 7→ Ψv construits dans
1.4.11 aussi. Ainsi, la matrice apparaissant dans l’équation 2.1 est antisymétrique.
Cela implique deux choses : d’abord, si on choisit une taille m de matrice impaire,
la seule équation que l’on obtient est 0 = 0 (une matrice antisymétrique de taille
impaire est toujours de déterminant nul). Ceci explique en particulier pourquoi
dans le cas g = 1, Stange a travaillé avec m = 4. D’autre part, pour m = 2n, le
déterminant d’une matrice antisymétrique A est le carré d’un polynôme de degré
n, son pfaffien, noté Pf(A) :
Pf(A) = 1
2
nn!
X
σ∈S2n
sgn(σ)
Yn
i=1
aσ(2i−1),σ2i
,
où S2n est le groupe symétrique et sgn(σ) est la signature de σ.
Dans le cas g ≡ 0, 3 (mod 4) au contraire σ est paire, la matrice de 2.1 est
symétrique, et il faudra trouver d’autres formules.
2.2.1 Le cas g ≡ 1, 2 (mod 4)
Avant de donner les théorèmes formels, j’explique le type de formules qu’on
utilisera. Notons A la matrice apparaissant dans l’équation 2.1 :
A = (W(vi + vj
, wi + wj )W(vi − vj
, wi − wj ))1≤i,j≤m
.
Comme signalé plus haut, la taille m de la matrice doit vérifier deux propriétés :
m est paire et m > 2
g
. Evidemment, pour avoir les formules les plus simples
possibles, on prend la valeur m = 2g + 2 minimale.
Choisissons les familles d’indices (vi) et (wi) de façon à rendre l’équation
Pf(A) = 0
intéressante. Par exemple, pour a un entier, on choisit :
• pour tout i, wi = 0 ;
• v1 = a + 1, v2 = a − 1 ;
• pour tous les autres i /∈ {1, 2}, vi = m − i.
Je l’ai déjà signalé plus haut : A est antisymétrique. En particulier, ses termes
diagonaux sont nuls, et ses autres coefficients valentCouplages et nets 47
• A12 = W(2a, 0)W(2, 0), et pour i ≥ 3,
A1i = W(a + 1 + m − i, 0)W(a + 1 − m + i, 0);
• A21 = −A12, et pour i ≥ 3,
A2i = W(a + m − i − 1, 0)W(a − m + i − 1, 0);
• enfin, pour i et j ∈ {3, . . . , m}, les autres Aij valent
Aij = W(2m − i − j, 0)W(j − i, 0).
Autrement dit, l’équation Pf(A) = 0 est une relation polynomiale permettant de
calculer W(2a, 0) à partir
• des W(a + i, 0), pour −(m − 2) ≤ i ≤ m − 2 ;
• des W(j, 0), pour 1 ≤ j ≤ m − 3
2
.
On voit donc se dégager l’idée de l’algorithme : c’est bien un double-and-add,
mais il faut faire attention au fait que W(2a, 0) ne s’obtient pas à partir de seulement
W(a, 0) et de quelques valeurs initiales. On a également besoin de termes
autour de W(a, 0).
Par ailleurs, je rappelle que pour le calcul de couplage je dois calculer le terme
W(r + 1, 1). Autrement dit, il faut que je donne les formules permettant de calculer
des termes du type W(2a, 1) ou W(2a + 1, 1). Cela se fait naturellement
avec d’autres choix d’indices vi et wi que j’expliciterai plus loin. Pour le moment,
il me suffira de dire que le même phénomène observé intervient : on n’aura pas
seulement besoin de W(a, 0) ou W(a, 1), mais également de tout un tas d’autres
valeurs de W autour de (a, 0).
Muni de cette observation, définissons comme l’ont fait Stange, puis Uchida et
Uchiyama respectivement pour les genres 1 et 2 la notion de bloc centré autour
d’un entier a :
Définition 2.2.3. Les termes dits initiaux du net W sont :
— les 2m − 7 termes {W(i, 0) | 1 ≤ i ≤ 2m − 7} (ou dans le cas g = 1 et
m = 4, les deux termes W(1, 0) and W(2, 0)),
— les 2m − 2 termes {W(i, 1) | 1 − m ≤ i ≤ m − 2}.
Soit a ∈ N, le bloc centré autour de a est formé des
— 4m − 8 termes {W(k + i, 0) | − 2m + 4 ≤ i ≤ 2m − 5},
2. Je rappelle que W est impaire : W(−j, 0) = −W(j, 0).48 Deux méthodes de calculs de couplages
— 2m − 5 termes {W(k + i, 1) | 3 − m ≤ i ≤ m − 3}.
Remarque 2.2.4.
• Dans mon exemple, j’avais décomposé 2a en (a+1)+ (a−1). On pourrait
se demander s’il n’aurait pas été plus simple de tout simplement écrire
2a = a + a, autrement dit de faire le choix (v1, w1) = (v2, w2) = (a, 0). En
réalité, un tel choix est impossible, et ce pour deux raisons : tout d’abord,
parce qu’en faisant ainsi, on aurait eu les deux premières lignes de ma
matrice A égales, et donc en calculant son pfaffien, on n’aurait pas obtenu
d’autre équation que 0 = 0 ; et de toute manière, on aurait eu A12 =
W(2a, 0)W(0, 0), et je rappelle que W(0, 0) = 0 : ainsi, le terme W(2a, 0)
ne serait en réalité pas apparu dans l’équation.
• Toujours dans l’exemple, on peut observer que j’ai arbitrairement placé le
terme intéressant à calculer dans la case A12 de ma matrice ; que les autres
coefficients des deux premières lignes sont formés de termes qui sont dans
le bloc calculé à l’étape précédente du double-and-add ; et que les autres
coefficients de la matrice sont des termes initiaux.
• Ces termes initiaux sont apparus du fait de mon choix
∀3 ≤ i ≤ m, vi = m − i.
De façon triviale, on peut dire que les deux indices vraiment intéressants
sont v1 et v2, puisque ce sont avec eux que j’obtiens le terme à calculer
W(2a, 0). Les autres vi ne sont en somme que du remplissage, et je rappelle
qu’il ne m’est pas possible de prendre pour deux indices i et j différents
(vi
, wi) = (vj
, wj ), ce qui explique mon choix pour ces valeurs de vi : j’ai
pris les m − 2 plus petits entiers.
• Une remarque sur la définition maintenant. On remarquera qu’un bloc
est constitué de deux niveaux : le niveau 0, constitué des termes du type
W(i, 0), et le niveau 1 avec tous les termes du type W(i, 1). Les termes
W(i, 0) ne dépendent que de D1 et des coefficients de la courbe C, et vivent
donc dans le corps de base Fq, tandis que les W(i, 1) dépendent de D1 et
de D2, et seront donc des éléments de Fq
k . Ainsi, le calcul d’un bloc se
déroulera en deux temps : d’abord on calculera les termes de niveau 0, et
ces opérations seront peu couteuses puisque dans Fq ; puis on réglera le
compte du niveau 1, et pour cela il faudra payer un peu plus, puisqu’on
évoluera dans Fq
k .
• Enfin, on remarquera qu’avec g = 1 et 2, ma définition de bloc coïncide
bien avec celles de [45] et [50].
Définition 2.2.5 (Paramétrages). Voici les différents choix des paramètres vi et
wi qu’on va utiliser dans notre algorithme.Couplages et nets 49
Pour le niveau 0, c’est-à-dire pour le calcul des termes W(2a + c, 0), 4 − 2m ≤
c ≤ 2m − 4, on utilise le choix suivant :
— pour tout 1 ≤ i ≤ m, wi = 0,
— v1 = l + l
0 + 1,
— v2 = l − 1,
— pour tout 3 ≤ i ≤ m, vi = m − i,
où
l = a +
c
2
et l
0 =
(
0 si c est pair.
− 1 sinon.
Un tel choix sera désormais appelé param´etrage (l, l
0
, 0), et vérifie
a − (m − 2) ≤ l ≤ a + (m − 2).
Pour le niveau 1 maintenant, on calcule W(2a + c, 1) (−(m − 3) ≤ c ≤ m − 2)
avec le choix suivant :
— w1 = 1 et tous les autres wi valent 0 ;
— v1 = a ;
— v2 = a + c ;
— for 3 ≤ i ≤ m, vi = m − i.
Un tel choix est appelé param´etrage (a, c, 1).
Regardons maintenant précisément les formules que l’on obtient avec ces différents
paramétrages.
Je note Aˆ
ij la matrice carrée de taille m − 2 obtenue en retirant les lignes et
colonnes numéro i et j de A. De même, Aˆ
ijkl est la matrice de taille m − 4
obtenue en retirant les 4 lignes et 4 colonnes numéro i, j, k et l de A. Le pfaffien
de A se développe alors de la façon suivante :
Pf(A) = A12Pf(Aˆ
12) + Xm
i=3
(−1)iA1iPf(Aˆ
1i)
= A12Pf(Aˆ
12) + Xm
i=3
X
j6=i
3≤j≤m
(−1)i+jA1iA2jPf(Aˆ
12ij ).
Or, on remarquera que dans tous les paramétrages (l, l0
, 0) et (a, c, 1), les lignes
3 à m de A sont identiques (seules les 2 premières varient). Ainsi, les coefficients
Pf(Aˆ
12) et Pf(Aˆ
12ij ) de nos équations sont constants tout le long de l’algorithme :
il faudra les précalculer.
Finalement, les formules obtenues sont les suivantes :50 Deux méthodes de calculs de couplages
Définition 2.2.6 (Formules).
— Pour −m + 2 ≤ b ≤ m − 2,
W(2a + 2b, 0) = X
j6=i
3≤i,j≤m
(−1)i+j+1Pf
Aˆ
12ij
Pf
Aˆ
12
W(2, 0)
A1iA2j
avec A1i = W(a + b + m + 1 − i, 0)W(a + b + 1 + i − m, 0) et
A2j = W(a + b + m − 1 − j, 0)W(a + b − 1 + j − m, 0);
— pour −m + 3 ≤ b ≤ m − 2,
W(2a + 2b + 1, 0) = X
j6=i
3≤i,j≤m
(−1)i+j+1Pf
Aˆ
12ij
Pf
Aˆ
12
W(1, 0)
A1iA2j
avec A1i = W(a + b + m + 1 − i, 0)W(a + b + 1 + i − m, 0) et
A2j = W(a + b + m − j, 0)W(a + b + j − m, 0);
— pour −m + 3 ≤ b ≤ m − 2,
W(2a + b, 1) = X
j6=i
3≤i,j≤m
(−1)i+j+1Pf
Aˆ
12ij
Pf
Aˆ
12
W(−b, 1)
A1iA2j
avec A1i = W(a + m − i, 1)W(a + i − m, 1) et
A2j = W(a + b + m − j, 0)W(a + b + j − m, 0).
A partir de ces formules, on obtient notre algorithme de type double-and-add,
ce qu’énonce le théorème suivant :
Théorème 2.2.7. Soit a un entier. On suppose qu’aucun des termes suivants
n’est nul :
— W(1, 0) et W(2, 0);
— W(b, 1), pour −m + 2 ≤ b ≤ m − 3 ;
— Pf
Aˆ
12
.
Dans ces conditions, si on dispose des termes initiaux de W et du bloc centré en
a, alors on est en mesure de calculer le bloc centré en 2a et celui centré en 2a+1.
Démonstration. Les conditions du théorème permettent de s’assurer que les dé-
nominateurs des formules énoncées ne s’annulent pas. Une fois ces précautions
prises, il ne reste alors plus qu’à vérifier que les termes apparaissant dans les
membres de droite des différentes formules sont bien tous ou bien initiaux, ou
bien dans le bloc centré en a.Couplages et nets 51
Remarque 2.2.8.
— Comme signalé dans la preuve du lemme 2.2.2, en pratique on aura
W(1, 0) = W(0, 1) = 1.
— Pour g = 1 et m = 4, on a tous les Pf
Aˆ
12ij
égaux à 1, ce qui nous
redonne les équations de [45].
Enfin, remarquons que parmi tous ces coefficients A1j et A2j dont on a besoin,
certains sont redondants :
— les A1j du paramétrage (l + 1, −1, 0) sont les mêmes que ceux du paramé-
trage (l, 0, 0),
— les A2j du paramétrage (l, −1, 0) sont les mêmes que ceux du paramétrage
(l, 0, 0),
— les A2j du paramétrage (l + 2, −1, 0) sont les A1j du paramétrage (l, 0, 0),
— les A1j du paramétrage (k, c, 1) sont indépendants de c,
— les A2j du paramétrage (a, c, 1) sont les mêmes que ceux du paramétrage
(a + c + 1, 0, 0).
Ainsi, les seuls coefficients à calculer sont :
— les A1j
, 3 ≤ j ≤ m, pour les 2m − 4 paramétrages (l, 0, 0);
— les A2j
, 3 ≤ j ≤ m, pour les paramétrages (a−m+2, 0, 0) et (a−m+3, 0, 0),
ou (a − m + 3, 0, 0) et (a − m + 4, 0, 0);
— les A1j
, 3 ≤ j ≤ m, du paramétrage (a, −m + 3, 1).
2.2.2 Le cas g ≡ 0, 3 (mod 4)
La stratégie est la même que précédemment : étant donné un bloc centré en
a, on désire calculer le bloc centré en 2a ou celui centré en 2a + 1, de façon à
finalement sortir W(r + 1, 1).
Les différences avec le cas g ≡ 1, 2 (mod 4) sont les suivantes :
— la matrice A est maintenant symétrique ;
— on n’a plus besoin de prendre m pair, donc je peux prendre m = 2g + 1 ;
— malheureusement, on ne dispose plus du pfaffien, mais seulement du dé-
terminant. Ceci va alourdir les équations qu’on obtiendra.
La nouvelle définition de termes initiaux et de bloc est la suivante :
Définition 2.2.9. Les termes initiaux sont les
— 2m − 3 termes {W(i, 0) | 0 ≤ i ≤ 2m − 4},
— 2m − 2 termes {W(i, 1) | 0 ≤ i ≤ 2m − 3}.
Pour a un entier, le bloc centré en a est constitué des
— 4m − 6 valeurs {W(a + i, 0) | − 2m + 4 ≤ i ≤ 2m − 3},52 Deux méthodes de calculs de couplages
— 2m − 2 valeurs {W(a + i, 1) | 0 ≤ i ≤ 2m − 3}.
On donne maintenant la définition des paramétrages choisis :
Définition 2.2.10 (Paramétrages).
Pour calculer W(2a + 2b, ), on prend
— pour tout 1 ≤ i ≤ m, wi = /2,
— v1 = a + b,
— pour 2 ≤ i ≤ m, vi = m − i.
Ce réglage sera noté (b, 0, ), pour = 0, 1, et −m + 2 ≤ b ≤ m − 1 si = 0, ou
0 ≤ b ≤ m − 1 si = 1.
Pour calculer W(2a + 2b + 1, ), où = 0, 1, et −m + 2 ≤ b ≤ m − 2 si = 0, ou
0 ≤ b ≤ m − 2 si = 1, on prend le réglage (b, 1, ), à savoir :
— pour tout 1 ≤ i ≤ m, wi = /2,
— v1 = a + b + 1/2,
— pour 2 ≤ i ≤ m, vi = m − i + 1/2.
Comme pour g ≡ 1, 2 (mod 4), il faut maintenant donner les formules précises
qui découlent de ces réglages.
Je note Aˆ
i,j la matrice carrée de taille m − 1 obtenue en ôtant la i-ième ligne et
la j-ième colonne de A. De même, j’obtiens Aˆ
ij,kl en retirant les lignes numéro i
et j et les colonnes k et l de A.
Je développe alors le déterminant de A de la façon suivante :
0 = A11det
Aˆ
1,1
+
X
1≤i,j≤m
(−1)i+jA1iA1jdet
Aˆ
1i,1j
.
Les coefficients det
Aˆ
1,1
et det
Aˆ
1i,1j
sont précalculés.
Malheureusement, et contrairement au cas g ≡ 1, 2 (mod 4), ces déterminants
diffèrent selon le réglage utilisé. Je les noterai donc respectivement par les lettres
B, C, D et E pour les réglages (b, 0, 0), (b, 1, 0), (b, 0, 1) and (b, 1, 1).
Les formules obtenues sont alors les suivantes :
Définition 2.2.11 (Formules).
— Pour −m + 2 ≤ b ≤ m − 1,
W(2a + 2b, 0) = X
2≤i,j≤m
(−1)i+j+1det
Bˆ
1j,1i
det
Bˆ
1,1
W(0, 0)
A1iA1j
avec A1i = W(a + b + m − i, 0)W(a + b + i − m, 0);Couplages et nets 53
— pour −m + 2 ≤ b ≤ m − 2,
W(2a + 2b + 1, 0) = X
2≤i,j≤m
(−1)i+j+1det
Cˆ
1j,1i
det
Cˆ
1,1
W(0, 0)
A1iA1j
avec A1i = W(a + b + m + 1 − i, 0)W(a + b + i − m, 0);
— pour 0 ≤ l ≤ m − 1,
W(2k + 2l, 1) = X
2≤i,j≤m
(−1)i+j+1det
Dˆ
1j,1i
det
Dˆ
1,1
W(0, 0)
A1iA1j
avec A1i = W(a + b + m − i, 1)W(a + b + i − m, 0);
— pour 0 ≤ l ≤ m − 2,
W(2k + 2l + 1, 1) = X
2≤i,j≤m
(−1)i+j+1det
Eˆ
1j,1i
det
Eˆ
1,1
W(0, 0)
A1iA1j
avec A1i = W(a + b + m + 1 − i, 1)W(a + b + i − m, 0).
Alors, avec le même raisonnement que dans le cas g ≡ 1, 2 (mod 4), on obtient à
partir de ces formules notre algorithme en double-and-add :
Théorème 2.2.12. Si aucune des valeurs det
Bˆ
1,1
, det
Cˆ
1,1
, det
Dˆ
1,1
et
det
Eˆ
1,1
ne s’annule, alors, à partir des termes initiaux et du bloc centré en a,
on est en mesure de calculer le bloc centré en 2a et celui centré en 2a + 1.
Hélas, une autre différence pénible avec le cas g ≡ 1, 2 (mod 4) apparaît : il n’y a
aucune redondance parmi les coefficients A1i et A2j
, et il faudra tous les calculer.
2.2.3 Un exemple en genre 3
En genre 3, notre courbe a pour équation
C : y
2 = x
7 + λ6x
6 + · · · + λ0.
La représentation de Mumford d’un diviseur D ∈ J \Θ est
D = [U, V ] avec U = x
3 + U2x
2 + U1x + U0, V = V2x
2 + V1x + V0.
On se donne une courbe C et deux diviseurs D1 et D2 dont on veut calculer le
couplage. Comme expliqué plus haut, on commence par la phase d’initialisation,54 Deux méthodes de calculs de couplages
c’est-à-dire par le calcul des {W(i, 0) | i = 0, . . . , 14} et {W(i, 1) | i = 0, . . . , 15}.
Pour cela, on prend W(1, 0) = W(0, 1) = 1, et on obtient les autres avec les
polynômes F3 et G3 (voir proposition 1.3.34) :
∀a, b, i ∈ Z,
W(a + b, i)W(a − b, i)
W(a, i)
2W(b, 0)2
= F3([a]D1 + [i]D2, [b]D1),
W(2a, 0)
W(a, 0)4
= G3([a]D1).
Les valeurs de F3 et G3 se trouvent par exemple dans [10] et [49] :
F3(u, v) = (℘31(v) − ℘31(u))(℘22(v) − ℘22(u)) − (℘31(v) − ℘31(u))2
+ (℘32(v) − ℘32(u))(℘21(v) − ℘21(u)) + (℘33(v) − ℘33(u))(℘11(v) − ℘11(u)),
G3(u) = ℘113(u)℘223(u) + ℘133(u)℘122(u) − 2℘133(u)℘113(u)
− ℘123(u)
2 − ℘233(u)℘112(u) + ℘133(u)℘113(u) + ℘333(u)℘111(u).
Je rappelle que les ℘i3 et ℘i33, 1 ≤ i ≤ 3 d’un diviseur D se lisent directement sur
ses coordonnées de Mumford. Les autres évaluations des ℘ fonctions s’obtiennent
à partir des formules se trouvant dans l’appendice C de [13]. Plus précisément, on
utilise les trois premières formules pour calculer successivement ℘22, ℘12 et ℘11.
Puis on utilise les formules de poids (−18) de ce même document pour obtenir
les sept produits ℘ijk℘lmn intervenant dans le calcul de G3.
Par exemple, considérons la courbe C d’équation
y
2 = x
7 + 3x
6 + 2x
5 + 10x
4 + 9x
3 + 3x
2 + 11
définie sur F29. Avec r = 41, le degré de plongement est 40, donc l’exponentiation
finale est
e =
2940 − 1
41
= 764075121631975351615803381072559018207546756758889888800.
Soit a ∈ F29 une racine de
X
40 + X
5 + 4 ∈ F29[X],
alors F2940 ' F29(a).
Soit D1 ∈ J (F29)[41] donné par sa représentation de Mumford :
[x
3 + 2x
2 + 9x + 24, 23x
2 + 24x + 4].Couplages et nets 55
Soit D2 ∈ J (F2940 ) donné par :
U =x
3 + (27a
5 + 27a
2 + 28a + 16)x
2 + (4a
7 + 2a
6 + 21a
5 + 2a
3 + 21a
2 + 5a + 10)x+
25a
8 + 26a
7 + 24a
6 + 18a
5 + 24a
3 + 18a
2 + a + 8
V =(26a
39 + 16a
38 + 14a
37 + 7a
36 + 27a
35 + 19a
34 + 7a
33 + 19a
32 + 15a
31 + a
30+
21a
29 + 2a
28 + 5a
27 + 22a
26 + 27a
25 + 21a
24 + 4a
23 + 5a
22 + 6a
21 + 27a
20 + 6a
19+
27a
18 + 13a
17 + 12a
16 + 15a
15 + 10a
14 + 23a
13 + 23a
12 + 25a
11 + 2a
10 + 4a
9 + 14a
8+
a
26 + 21a
25 + 26a
24 + 28a
23 + 10a
22 + 14a
21 + 3a
20 + 23a
19 + 14a
18 + 26a
17 + 7a
16+
23a
7 + 3a
6 + 28a
5 + 2a
4 + 26a
3 + 12a
2 + 27a + 4)x
2 + (a
39 + 15a
38 + 6a
37 + 13a
36+
20a
35 + 5a
34 + 23a
33 + 28a
32 + 8a
31 + 20a
30 + 16a
29 + a
28 + 12a
27 + 13a
15 + 28a
14+
15a
13 + 25a
12 + a
11 + 19a
10 + 11a
9 + 17a
8 + 21a
7 + 11a
6 + 12a
5 + 16a
4 + 8a
2 + 21a+
22)x + 15a
39 + 14a
38 + 23a
37 + 25a
36 + 27a
35 + 14a
34 + 13a
33 + 10a
31 + 3a
30+
14a
29 + 13a
28 + 27a
27 + 14a
26 + 21a
25 + 13a
24 + 8a
23 + 25a
22 + 27a
21 + 23a
19+
24a
18 + 11a
17 + 6a
16 + a
15 + 3a
14 + 18a
13 + a
12 + 21a
11 + 2a
10 + 26a
9+
26a
8 + 11a
7 + 4a
6 + 18a
5 + 9a
4 + 28a
3 + 5a
2 + 4a + 6.
On trouve alors que
(WD1,D2(42, 1))e = 4a
39 + 14a
38 + 21a
37 + · · · + 5a
2 + 4a + 16.
On peut vérifier que
τ : J (Fq)[r] × J (Fq
k )/rJ (Fq
k ) → µr
(D1, D2) 7→ (WD1,D2
(r + 1, 1))e
est bien bilinéaire :
— on prend D3 ∈R J (Fq
k ) et vérifie que
(WD1,D2+rD3
(r + 1, 1))e = (WD1,D2
(r + 1, 1))e
;
— on prend deux entiers aléatoires m and n et vérifie que
(WmD1,nD2
(r + 1, 1))e = (WD1,D2
(r + 1, 1))emn
.
2.2.4 Analyse théorique de coûts
Comptons le nombre d’opérations effectuées à chaque itération de notre doubleand-add.
Il faudra distinguer les opérations faisant intervenir uniquement les coordonnées
de P ∈ J (Fq) et ceux faisant également intervenir Q ∈ J (Fq
k ). Ainsi, je note M
et S les coûts respectifs d’une multiplication et d’une mise au carré dans Fq
k , M56 Deux méthodes de calculs de couplages
et S les coûts de ces opérations dans Fq, et Mk le coût d’une multiplication mixte,
c’est-à-dire entre un terme dans Fq
k et un autre dans Fq. Le coût des additions
sera négligé.
Je rappelle qu’à chaque itération il faudra calculer tous les termes d’un bloc. Ce
bloc est constitué de termes de la forme W(a, 0) ∈ Fq et de termes de la forme
W(a, 1) ∈ Fq
k . Ces termes se calculent avec les formules données dans les sous
sections 2.2.1 et 2.2.1.
Ces formules sont toutes de la forme
W(a, b) = XKijA1iA2j
avec
• W(a, b) le terme à calculer ;
• les coefficients Kij ∈ Fq si b = 0 et Fq
k si b = 1 ;
• dans le cas où g ≡ 1, 2 (mod 4), ces Kij sont précalculés avant de rentrer
dans la boucle du double-and-add ; dans l’autre cas, il faudra les recalculer
à chaque fois ;
• enfin, les éléments A1i et A2j de la matrice sont dans Fq si b = 0 ; certains
d’entre eux sont dans Fq
k sinon.
L’analyse tiendra ainsi compte du coût de calcul des termes Kij , A1i et A2j des
équations, puis du coût des opérations à effectuer entre ces termes. Je rappelle
que dans le cas où g ≡ 1, 2 (mod 4) il y aura moins de termes A1i et A2j à calculer
que dans le cas où g ≡ 0, 3 (mod 4).
On obtient finalement le nombre suivants d’opérations :
— 8 · 2
3g − 9 · 2
2g + 5 · 2
g − 2 M,
— 2
g+1 + 2 S,
— 2
g
(2g − 1)(2g+1 − 1) + 2 Mk,
— 2
g+1 + 2g − 4 M,
— 1 S
si g ≡ 1, 2 (mod 4); et
— (4m3 − 8m2 + 4m − 4) M,
— 2(m − 1)2 Mk,
— (2m3 − 6m2 + 8m − 4) M,
— 2(m − 1)2 S
si g ≡ 0, 3 (mod 4).Résultats en genre 1 57
2.3 Résultats en genre 1
Ici, je compare les coûts des algorithmes basés respectivement sur les fonctions
thêta ([30]) et sur les nets ([45]) pour le genre 1.
Dans le premier cas, je rappelle que les bases de fonctions de niveau 2 introduites
dans la partie 1.3.1.1 sont les suivantes :
— [uP : vP ] = "
θ
"
0
0
#
(P, Ω)2
: θ
"
1/2
0
#
(P, Ω)2
#
,
— [u
0
P
: v
0
P
] = "
θ
"
0
0
#
(2P, 2Ω) : θ
"
1/2
0
#
(2P, 2Ω)#
,
— [˜uP : ˜vP ] = "
θ
"
0
0
#
(P, Ω/2) : θ
"
0
1/2
#
(P, Ω/2)#
.
La stratégie a été rappelée dans la section 2.1 : c’est un double-and-add, et, à
chaque itération, à partir des coordonnées de jD1, (j + 1)D1 et jD1 + D2, on va
chercher les coordonnées de 2jD1, (2j + 1)D1 et 2jD1 + D2 ou celles des points
(2j + 1)D1, (2j + 2)D1 et (2j + 1)D1 + D2, selon la décomposition binaire de r.
Ainsi, à chaque itération, on utilise toujours les formules données dans la proposition
1.3.18 pour effectuer deux additions et un doublement. En étudiant ces
formules, on remarque que les coûts de l’arithmétique des coordonnées (u
0
, v0
)
sont les mêmes que ceux pour les coordonnées (˜u, v˜).
Avec les notations de la section précédente, nous avons donc les coûts suivants
pour une itération :
Coordonnées (u, v) (u
0
, v0
) ou (˜u, v˜)
Coûts 2S + 1M + 3Mk + 6S + 6M 2S + 1M + 2Mk + 10S + 7M
Du côté elliptic net, dans [45], le coût d’une étape est de 1S + 2M + 6Mk + 6S +
26M.
Pour comparer ces coûts, plusieurs approximations sont faites. Ainsi, en pratique,
on considère généralement que 1Mk ' kM.
De plus, en cryptographie, le corps Fq
k est construit à partir de Fq comme une
tour d’extensions. On prendra volontiers k comme un entier de la forme 2
i3
j
, et
ainsi Fq
k s’obtient grâce à une succession d’extensions quadratiques et cubiques.
Grâce aux méthodes de Karatsuba et Toom-Cook, on a donc M ' 3
i6
jM et
S ' 2
iM5
jS (voir par exemple [12] pour plus de détails). Si finalement on admet
l’approximation M ' S, on obtient le tableau suivant pour les premières valeurs
de k :58 Deux méthodes de calculs de couplages
k Coordonnées (u, v) Coordonnées (u
0
, v0
) ou (˜u, v˜) Méthode Elliptic Nets
4 41M 42M 78M
6 65M 64M 108M
8 79M 76M 142M
12 143M 136M 214M
16 173M 162M 306M
18 274M 261M 406M
24 299M 280M 486M
36 644M 613M 996M
48 721M 678M 1210M
Si on compare le coût d’utilisation des coordonnées (u, v) avec celui pour les deux
autres jeux de coordonnées, on remarque qu’un petit nombre d’opérations dans
le corps de base (4S et 1M) est échangé contre une multiplication mixte. Cela
explique que pour les grandes valeurs de k, les coordonnées (u
0
, v0
) et (˜u, v˜) sont
plus efficaces que les coordonnées (u, v). Pour les petites valeurs de k par contre
la différence est négligeable.
Concernant l’algorithme des elliptic nets, le nombre prohibitif de multiplications
mixtes le rend non compétitif par rapport à l’algorithme basé sur les formules
d’addition des fonctions thêta.
Enfin, comparons les performances de ces algorithmes avec celles des méthodes
traditionnelles de calcul de couplage, basées sur l’algorithme de Miller. Selon [28],
le coût d’une étape est de 1S + 1M + 1Mk + 11M. Ainsi que noté dans [31], ces
résultats rendent les algorithmes étudiés dans ce chapitre très peu compétitifs
en genre 1. Ainsi, le coût de l’utilisation de l’algorithme de type Miller donné
dans [28] varie selon les valeurs de k entre 68 et 86% celui de l’utilisation des
coordonnées (u
0
, v0
).Chapitre 3
Unification de ces deux méthodes
Observant les théorèmes 2.1.1 et 2.2.1, on remarque une grande similitude
entre la formule de couplages fournie par les nets, et celle donnée par les fonctions
thêta. L’objet de ce chapitre est d’expliquer cette ressemblance.
Plus exactement, je montre ici que les deux théorèmes 2.1.1 et 2.2.1 sont en fait
des "sous cas" des propriétés suivantes des fonctions de niveau l (i.e. des bases
des espaces de Riemann L(lO)) :
(i) si l est pair, alors tout ensemble de coordonnées de niveau l vérifie une loi
d’addition, à partir de laquelle on peut en extraire un algorithme tel que
celui de [30] ;
(ii) si l est pair, cette loi d’addition a pour conséquence que ces coordonnées
forment ce que j’appelle des generalized hyperelliptic nets; en particulier,
si l = 2, ce sont des hyperelliptic nets au sens classique de [50] (cette dé-
finition est rappelée dans le théorème 1.4.14).
Dans ce chapitre, et comme je l’ai déjà fait plusieurs fois, je m’intéresserai d’abord
au cas elliptique. Il sera ensuite aisé de généraliser le résultat aux genres supé-
rieurs.
3.1 Réécriture des elliptic nets
Je rappelle qu’un des théorèmes fondamentaux de Stange dans [45] est le théorème
1.4.7, établissant le diviseur de sa fonction Ψ, à partir de laquelle sont bâtis
ses elliptic nets. Ainsi, ce théorème lui-a-t’il permis de reconstruire les fonctions
de Miller, puisque ceux-ci sont eux mêmes définis par leur diviseur.
Son théorème 1.4.7, elle l’a établi connaissant le diviseur de sigma : cette fonction
admet un zéro simple en O, et rien d’autre. Il est aisé de faire le même travail en
utilisant une autre fonction thêta. Ainsi, dans le théorème suivant, nous allons
étendre la construction des fonctions Ψ de Stange :
5960 Unification de ces deux méthodes
Théorème 3.1.1. Soit E une courbe elliptique, pour le moment définie sur C.
Soient a, b ∈ {0, 1/2} des caractéristiques semi-entières.
Pour v = (v1, v2) ∈ Z
2
,
Ψv(z1, z2) =
θ
"
a
b
#
(v1z1 + v2z2)
θ
"
a
b
#
(z1)
v
2
1−v1v2 θ
"
a
b
#
(z1 + z2)
v1v2 θ
"
a
b
#
(z2)
v
2
2−v1v2
est une fonction bien définie sur E × E.
Démonstration. Pour le premier point, il s’agit de montrer que pour tout couple
(N1, N2) ∈ N
2
, on a
Ψv(z1 + N1, z2 + N2) = Ψv(z1, z2) et Ψv(z1 + N1τ, z2 + N2τ ) = Ψv(z1, z2).
Etudions la première égalité. En se servant du fait que pour tout entier n,
θ
"
a
b
#
(z + n, τ ) = exp(2πian) θ
"
a
b
#
(z, τ ),
on a
Ψv(z1 + N1, z2 + N2) = exp(2πiaA)Ψv(z1, z2),
avec
A =v1N1 + v2N2 − (v
2
1 − v1v2)N1 − v1v2(N1 + N2) − (v
2
2 − v1v2)N2
=(v1 − v
2
1
)N1 + (v2 − v
2
2
)N2.
On remarque alors que A ≡ 0 (mod 2), ce qui nous permet bien de conclure que
Ψv(z1 + N1, z2 + N2) = Ψv(z1, z2).
On passe maintenant à la seconde égalité. La formule dont on doit se servir est
la suivante : pour tout entier n,
θ
"
a
b
#
(z + nτ, τ ) = exp
−2πibn − πin2
τ − 2πinz
θ
"
a
b
#
(z, τ ).
Ainsi, on a
Ψv(z1 + N1τ, z2 + N2τ ) = exp(−2πibA − πiτB − 2πiC)Ψv(z1, z2),
où A est l’entier calculé plus haut (on a donc toujours exp(−2πibA) = 0), alors
que B et C sont deux quantités qui restent à calculer, et que nous allons voirFonctions de niveau 2 et elliptic nets 61
nuls.
En effet, on a
B =(v1N1 + v2N2)
2 − (v
2
1 − v1v2)N
2
1 − v1v2(N1 + N2)
2 − (v
2
2 − v1v2)N
2
2
=0.
et
C =(v1N1 + v2N2)(v1z1 + v2z2) − (v
2
1 − v1v2)N1z1 − v1v2(N1 + N2)(z1 + z2) − (v
2
2 − v1v2)N2z2
=0.
Ainsi, on a bien
Ψv(z1 + N1τ, z2 + N2τ ) = Ψv(z1, z2),
et donc Ψv est bien une fonction bien définie sur E × E.
Il reste alors à faire le lien entre ces nouvelles fonctions Ψ et les elliptic nets :
Proposition 3.1.2. Soient a, b ∈ {0, 1/2}, et P, Q ∈ E. La fonction
W : Z
2 → C
(p, q) 7→ Ψp,q(P, Q)
définie dans le théorème précédent 3.1.1 est un elliptic net au sens de Stange.
Démonstration. Pour 1 ≤ i ≤ 4, soient ui,1 et ui,2 ∈ Z. Il faut voir que
det (W(ui,1 + uj,1, ui,2 + uj,2,)W(ui,1 − uj,1, ui,2 − uj,2,)) = 0.
En utilisant les formules de Riemann, (qui se trouvent par exemple dans [34]
p.22), cela peut se faire via un logiciel de calcul formel.
Ainsi, on a vu que les fonctions thêta de caractéristiques semi entières fournissent
des elliptic nets. On passe maintenant aux autres fonctions de niveau l, pour l
pair, en commençant par le cas l = 2.
3.2 Fonctions de niveau 2 et elliptic nets
Dans cette section et la suivante, je travaille avec E/K une courbe elliptique
définie sur un corps quelconque K. La variété de Kummer de E est notée K (je62 Unification de ces deux méthodes
rappelle que K ∼= E/{±1}).
Les deux théorèmes suivants nous donnent deux méthodes possibles en doubleand-add
pour obtenir des quantités du type κ1([r]P + Q) pour un grand premier
r. La première est d’utiliser la loi d’addition vérifiée par {κ1, κ2} :
Théorème 3.2.1. On reprend κ = [κ1 : κ2] : E → P1 un plongement projectif de
la variété de Kummer de E, avec {κ1, κ2} une base de L(2O).
Alors il existe des applications bilinéaires B11, B12 et B22 telles que, pour tous
points P et Q ∈ E, l’on ait
• κ1(P + Q)κ1(P − Q) = B11 −−−→
κ(P)2,
−−−→
κ(Q)2
,
• κ1(P + Q)κ2(P − Q) + κ1(P − Q)κ2(P + Q) = B12 −−−→
κ(P)2,
−−−→
κ(Q)2
,
• κ2(P + Q)κ2(P − Q) = B22 −−−→
κ(P)2,
−−−→
κ(Q)2
,
où
−−−→
κ(P)2 et
−−−→
κ(Q)2 désignent les vecteurs colonnes suivants :
−−−→
κ(P)2 =
κ1(P)
2
κ1(P)κ2(P)
κ2(P)
2
,
−−−→
κ(Q)2 =
κ1(Q)
2
κ1(Q)κ2(Q)
κ2(Q)
2
,
Démonstration. Si on prouve l’existence de telles Bi pour une base particulière
{v1, v2} de L(2O), alors le résultat sera vrai pour toutes les autres bases. Il se
trouve justement que la proposition 1.3.18 nous donne trois bases différentes
satisfaisant cette propriété.
La seconde est d’utiliser l’algorithme des elliptic nets :
Théorème 3.2.2. Dans le même contexte, κ1 et κ2 vérifient la récurrence des
elliptic nets :
det (κ1(xi + xj )κ1(xi − xj ))1≤i,j≤4 = det (κ2(xi + xj )κ2(xi − xj ))1≤i,j≤4 = 0.
Démonstration. Notons :
— A11 et A22 les matrices associées aux applications bilinéaires B11 et B22
établies dans le théorème précédent,
— pour 1 ≤ i ≤ 4,
−→κi =
−−−→
κ(xi)2.
On a donc, pour tout 1 ≤ i, j ≤ 4,
κ1(xi + xj )κ1(xi − xj ) = t−→κiA11
−→κj
.
κ2(xi + xj )κ2(xi − xj ) = t−→κiA22
−→κj
.
Les deux matrices (
t−→κiA11
−→κj )
1≤i,j≤4
et (
t−→κiA22
−→κj )
1≤i,j≤4
sont de rang ne dépassant
pas 3, et donc de déterminant nul.Fonctions de niveau l (pair) et elliptic nets 63
3.3 Fonctions de niveau l (pair) et elliptic nets
D’un point de vue pratique, le cas l = 2 est le plus efficace. Toutefois, il n’est
pas compliqué de généraliser les théorèmes 3.2.1 et 3.2.2 aux niveaux plus élevés.
Ce sont les deux théorèmes suivants :
Théorème 3.3.1. Soit m = l(l + 1)/2. On fixe deux indices 1 ≤ i, j ≤ l. Il existe
alors une application bilinéaire Bi,j telle que pour tous P et Q ∈ E l’on ait
κi(P + Q)κj (P − Q) + κj (P + Q)κi(P − Q) = Bi,j −−−→
κ(P)2,
−−−→
κ(Q)2
,
où
−−−→
κ(P)2 et
−−−→
κ(Q)2 sont les vecteurs colonnes m × 1 :
−−−→
κ(P)2 =
κ1(P)
2
.
.
.
κa(P)κb(P)
.
.
.
κl(P)
2
,
−−−→
κ(Q)2 =
κ1(Q)
2
.
.
.
κa(Q)κb(Q)
.
.
.
κl(Q)
2
,
Démonstration. Comme précédemment, il suffit d’établir le résultat pour un choix
particulier de bases et il sera vrai pour toutes les autres. Et, comme précédemment,
les fonctions thêta nous donnent les relations voulues : le résultat se trouve
par exemple dans le théorème 1 de [30].
Théorème 3.3.2. Avec les notations précédentes, on a pour tout n > m
det (κi(xa + xb)κi(xa − xb))1≤a,b≤n = 0.
Démonstration. C’est exactement la même preuve que pour le théorème 3.2.2.
Remarque 3.3.3.
• Si l est impair, on peut toujours calculer les fonctions de Miller avec les
fonctions de niveau l. Par contre, on ne dispose plus du théorème 3.3.1
établissant les formules d’addition pour mes fonctions de niveau l : on est
donc privé de tout moyen pour aller chercher la quantité κ1(rP + Q).
• Pour l = 2 on a m = 3 et donc, avec n > m, la matrice du théorème
3.3.2 est de taille au moins 4 : on retombe bien sur la définition des elliptic
nets. Si l > 2 par contre, on obtient un résultat moins fort, qui nécessite de
prendre des matrices de plus grande taille, et donnent donc des formules
plus compliquées à utiliser.64 Unification de ces deux méthodes
3.4 Fonctions de niveau l (toujours pair) et hypelliptic
nets
Jusqu’ici dans ce chapitre, j’ai travaillé en genre 1 : c’est la situation la plus
courante en cryptographie, et c’est la plus simple à comprendre. En réalité, les
résultats s’étendent de façon immédiate au cas hyperelliptique. J’énonce donc ici
les équivalents des théorèmes 3.3.1 et 3.3.2.
Dans cette section, je travaille donc sur une courbe C de genre g. Je me donne
un entier l ≥ 2 pair, et {κ1, . . . , κl
2 } une base de L(lΘ).
Théorème 3.4.1. On pose m = l
g
(l
g + 1)/2. On fixe deux indices 1 ≤ i, j ≤ l
g
.
Il existe une application bilinéaire Bi,j telle que pour tous D1 et D2 ∈ J on ait
κi(D1 + D2)κj (D1 − D2) + κj (D1 + D2)κi(D1 − D2) = Bi,j −−−−→
κ(D1)2,
−−−−→
κ(D2)2
,
avec
−−−−→
κ(D1)2 et
−−−−→
κ(D2)2 les vecteurs m × 1 suivants :
−−−−→
κ(D1)2 =
κ1(D1)
2
.
.
.
κa(D1)κb(D1)
.
.
.
κl
2 (D1)
2
,
−−−−→
κ(D2)2 =
κ1(D2)
2
.
.
.
κa(D2)κb(D2)
.
.
.
κl
2 (D2)
2
,
Démonstration. Les formules d’addition de Riemann montrent que les fonctions
thêta admettent bien de telles relations bilinéaires. Ainsi, par exemple, le théorème
1 de [30] montre que le théorème est vrai pour la base
(
θ
"
0
b
#
z, l−1Ω
| b ∈
1
l
Z
g
/Z
g
)
.
Comme on a démontré le résultat pour une base donnée, il est vrai pour toutes
les bases.
Théorème 3.4.2. Avec les notations du théorème précédent, κi vérifie ce que
j’appelle la récurrence des hyperelliptic nets généralisés : pour tout n > m,
det (κi(xa + xb)κi(xa − xb))1≤a,b≤n = 0.
Démonstration. Reprenons la démonstration du théorème 3.2.2, et notons :
— Aij les matrices associées aux applications bilinéaires Bij établies dans
le théorème précédent,Conclusion 65
— pour 1 ≤ a ≤ n,
−→κa le vecteur m × 1
−−−−→
κ(Da)2.
Autrement dit, pour tout couple (a, b) avec 1 ≤ a, b ≤ l
g
, et pour tout entier
1 ≤ i ≤ l, la situation est la suivante :
κi(Da + Db)κi(Da − Db) = t−→κaAii
−→κb .
Or, les matrices (
t−→κaAii
−→κb )
1≤a,b≤n
, pour tout 1 ≤ i ≤ l, sont de rang ne dépassant
pas m, et on a pris soin dans les hypothèses du théorème de prendre ces matrices
de taille n > m : leur déterminant est nul.
3.5 Conclusion
Dans ce chapitre, on a commencé par voir que la construction des hyperelliptic
nets avec la fonction sigma pouvaient se généraliser aux autres fonctions thêta de
caractéristiques semi entières. Plus encore, toutes les fonctions de niveau 2 nous
fournissent des hyperelliptic nets, tandis que les fonctions de niveau pair supé-
rieur aboutissent à une relation plus faible, appelée ici relation des hyperelliptic
nets généralisée.
Surtout, ce chapitre permet de faire le lien entre l’algorithme des fonctions thêta
pour le calcul de couplages, et celui des nets : la formule de récurrence des nets
est une conséquence directe des formules d’addition qui sont à la base de l’algorithme
des fonctions thêta.
Ainsi, pour un même outil (un ensemble de coordonnées de niveau pair), il existe
deux méthodes pour le calcul de couplages. Nous avons vu dans le chapitre pré-
cédent que, pour les fonctions thêta, les formules d’addition donnaient un algorithme
bien plus efficace que la relation des nets. Une question ouverte serait
de trouver une famille de coordonnées pour laquelle les formules d’addition sont
optimales.66 Unification de ces deux méthodesChapitre 4
Polynômes de sommation
4.1 Introduction
La sécurité de l’utilisation des courbes hyperelliptiques en cryptographie repose
sur la difficulté du problème du logarithme discret. Les algorithmes pour
traiter ce problème sur un groupe G se classent en deux catégories :
1. les algorithmes génériques, c’est-à-dire qui sont valables sur tout groupe ;
si G est un groupe cyclique d’ordre premier n, ces algorithmes ont un coût
en O(
√
n), aussi sont-ils également appelés algorithmes en racine carré ;
2. et puis il y a les algorithmes sous-exponentiels, qui utilisent la structure du
groupe étudié pour aller plus vite.
Ainsi, pour les courbes elliptiques définies sur une extension Fqn /Fq, Gaudry combina
dans [22] les polynômes de sommation de Semaev ([43]) et la descente de
Weil pour produire un algorithme de calcul d’index dont la complexité est sousexponentielle.
Dans le cas des courbes hyperelliptiques, l’idée générale de l’algorithme de Gaudry
reste valable. Malheureusement, jusqu’ici aucun équivalent des polynômes de
Semaev ne fût trouvé. Ainsi, Nagao ([36]) passa par les espaces de Riemann-Roch
pour exhiber des systèmes polynomiaux à résoudre pour la phase de recherche de
relations dans le calcul d’index.
Dans ce chapitre, je vais commencer par rappeler la construction des polynômes
de sommation par Semaev et leur utilisation par Gaudry pour le calcul d’index.
Dans le but d’étendre ces polynômes aux courbes hyperelliptiques, je vais avoir
besoin de donner une construction alternative en genre 1, utilisant la fonction
sigma de Weierstrass. Je montrerai ensuite l’impact des nouveaux polynômes
de sommation hyperelliptique sur le problème du logarithme discret. Enfin, je
discuterai de divers choix possibles de polynômes alternatifs.
6768 Polynômes de sommation
4.2 Rappels sur les travaux de Gaudry et Semaev
4.2.1 Cadre général : le calcul d’index
Je commence par rappeler le principe général du calcul d’index, avant de
considérer spécifiquement le groupe généré par un point P ∈ E(Fq
k ).
Soit G = hPi un groupe général. La loi de groupe est notée additivement et le
neutre désigné O. Soit Q ∈ G, on veut trouver un entier n tel que
Q = nP.
L’algorithme s’initialise par la construction d’un sous ensemble de G appelé base
de factorisation F = {F1, . . . , Fk}. Ce sera plus explicite par la suite, mais F est
choisi de façon à ce que
— pour tout élément R ∈ G il soit facile de décider si R peut se décomposer
R = m1F1 + · · · + mkFk, avec ∀i, mi ∈ Z (4.1)
(un tel élément est dit F-friable, ou juste friable) ;
— et, lorsque c’est le cas, il soit facile d’exhiber une telle décomposition. En
pratique, cette décomposition s’obtient par la résolution d’un système polynomial.
L’algorithme de calcul d’index en lui même se déroule en deux étapes :
(1) la recherche de relations :
On génère aléatoirement des entiers α et β ∈ N, et on construit R =
αP + βQ, jusqu’à obtenir un point R qui soit friable, et on calcule alors
sa décomposition. On répète l’opération jusqu’à obtenir k + 1 relations
∀i, Ri = αiP + βiQ =
X
k
j=1
mi,jFj
,
où k est le cardinal de F. On stocke ces relations dans une matrice
M = (mij ), qui est donc de taille (k + 1) × k.
(2) la phase d0alg`ebre lin´eaire :
À part cas exceptionnel (auquel cas on recommence l’étape 1), il y a un
vecteur non nul (γi) dans le noyau de M. Un tel vecteur nous donne
X
i
γi(αiP + βiQ) = O.Rappels sur les travaux de Gaudry et Semaev 69
Encore une fois, sauf en cas de malchance, on a P
i γiβi 6= 0, ce qui nous
permet de déduire :
Q = −
P
i γiαi
P
i γiβi
!
P,
où la quantité −
P
i P
γiαi
i
γiβi
est calculée modulo le cardinal de G.
Le coût de la construction de F et de la phase 1 dépend du groupe G et de sa
représentation. Plus précisément, l’analyse de l’algorithme prend en compte
— le coût de l’arithmétique dans G ;
— la probabilité pour un élément R aléatoire d’être friable ;
— le coût du test de friabilité ;
— le coût du calcul de la décomposition d’un élément friable.
Au contraire, la phase d’algèbre linéaire ne dépend que de k. Ainsi, quand k
augmente, les relations de la phase 1 s’obtiennent plus rapidement, tandis que la
phase 2 devient plus lente. L’idée est donc de trouver k pour équilibrer les coûts
des deux phases.
4.2.2 L’algorithme dans le cas des courbes elliptiques et
hyperelliptiques
Spécifier l’algorithme de calcul d’index pour un groupe G donné, c’est préciser
la base de factorisation F, ainsi que la phase de recherche de relations.
Dans le cas où G =< P >⊂ E(Fqn ) est généré par un point d’une courbe elliptique,
le choix de F fait par Gaudry est
F = {R ∈ E(Fqn )| x(R) ∈ Fq}.
L’algorithme s’étend aux courbes hyperelliptiques. Dans ce cas, la base de factorisation
est
F = {D ∼ (P) − (∞)| x(P) ∈ Fq}.
Il reste maintenant à expliquer comment tester une relation.
Pour le cas hyperelliptique, la solution donnée par Gaudry dans [22] est de calculer
le polynôme u de la représentation de Mumford (voir chapitre 1) du diviseur
R = αP + βQ, et de tester s’il se scinde totalement dans Fq.
Dans le cas elliptique, la méthode la plus rapide est d’utiliser les polynômes de
Semaev que j’expose à présent.70 Polynômes de sommation
4.2.3 Polynômes de Semaev
Ici, je rapporte les principaux résultats de [43] : la définition des polynômes
de sommation et leurs propriétés. On se donne E une courbe elliptique définie sur
un corps K de caractéristique différente de 2, dont l’équation de Weierstrass est
y
2 = x
3 + Ax + B.
Définition 4.2.1 ([43]). Pour tout entier n ≥ 2, le polynôme de sommation
Sn ∈ K[X1, . . . , Xn] est défini par la récurrence :
S2(X1, X2) =X1 − X2,
S3(X1, X2, X3) = (X1 − X2)
2X
2
3 − 2((X1 + X2)(X1X2 + A) + 2B)X3
+ ((X1X2 − A)
2 − 4B(X1 + X2)),
∀n ≥ 4, 1 ≤ k ≤ n − 3,
Sn(X1, . . . , Xn) = ResX(Sn−k(X1, . . . , Xn−k−1, X), Sk+2(Xn−k, . . . , Xn, X)).
L’intérêt de ces polynômes réside dans le théorème suivant :
Théorème 4.2.2 ([43]). Soit Sn le n-ième polynôme de sommation de E/K. Soit
x1, . . . , xn dans K .
Alors Sn(x1, . . . , xn) = 0 si et seulement si il existe y1, . . . , yn dans K tel que pour
tout i, Pi = (xi
, yi) soit un point de E et
P1 + · · · + Pn = O.
Remarque 4.2.3. On peut réécrire ce théorème de la façon suivante :
ayant les xi tels que Sn(x1, . . . , xn) = 0, le théorème me dit qu’il existe pour
chaque i deux choix de yi tels que (xi
, yi) soit un point de E (si yi est un de ces
choix, l’autre est évidemment −yi). Une fois les bons choix effectués, j’obtiens
des points P1, . . . , Pn tels que
P1 ± · · · ± Pn = O.
On revient à notre algorithme de calcul d’index. Soit R = (xR, yR) un point de
E(Fqn ) que l’on veut décomposer comme somme de n points de F. On veut donc
résoudre
Sn+1(xR, X1, . . . , Xn) = 0, ∀i, Xi ∈ Fq.
On décompose alors xR et chacun des coefficients de Sn+1 dans la base {1, t, . . . , tn−1}
de Fqn /Fq choisie, et on obtient donc une équation de la forme
k
X−1
i=0
S
(i)
n+1(X1, . . . , Xn)t
i = 0,
où chaque S
(i)
n+1 est dans Fq[X1, . . . , Xn], soit donc un système de n équations à
n indéterminées dans Fq.Nouvelle construction des polynômes de sommation en genre 1 71
4.3 Nouvelle construction des polynômes de sommation
en genre 1
Il est maintenant temps pour moi d’exposer mes contributions à ce problème
de logarithme discret.
Comme énoncé en introduction dans cette partie, je me suis attaché à étendre la
notion de polynôme de sommation aux courbes hyperelliptiques.
Dans le cas elliptique, Nous avons vu que les polynômes de Semaev sont définis
par récurrence via un calcul de résultant. Ceci ne sera plus le cas dans le cas
hyperelliptique, aussi ai-je été obligé de réécrire ces polynômes en genre 1 avec
d’autres formules, en utilisant la fonction sigma de Weierstrass.
La définition et les propriétés élémentaires de cette fonction ont été rappelées au
chapitre 1. Je me contenterai donc ici de seulement rapporter les deux théorèmes
sur cette fonction que j’utiliserais spécifiquement.
4.3.1 Deux théorèmes fondamentaux
Les théorèmes cités ici sont anciens : ainsi, le premier est dû à Weierstrass ([53],
[54]), tandis que le second a été énoncé en premier par Frobenius et Stickelberger
dans [17].
Théorème 4.3.1 (Loi d0addition).
Soit u1, u2 ∈ E.
En posant x1 = x(u1) et x2 = x(u2), on a
σ(u1 − u2)σ(u1 + u2)
σ
2
(u1)σ
2
(u2)
=
1 x1
1 x2
.
Je rappelle que σ admet un zéro d’ordre 1 uniquement en O.
Ce théorème est donc très facile à lire : deux points u1 et u2 vérifient u1 ±u2 = O
si et seulement si x1 = x2.
De plus, comme la fonction x admet comme seul pôle le point O (et c’est un pôle
d’ordre 2), un tel test est possible si et seulement si on a bien vérifié que u1 6= O
et u2 6= O.
Le théorème suivant est une généralisation du précédent pour n ≥ 2 points :
Théorème 4.3.2 (Frobenius-Stickelberger).
Soit n ≥ 2 un entier, et u1, . . . , un ∈ E, avec ui = (xi
, yi). On a l’égalité72 Polynômes de sommation
(−1)(n−1)(n−2)/2
σ(u1 + · · · + un)
Q
i 1. En
effet, je rappelle que la preuve de cette formule est le point (v) de la proposition
4.3.8 : j’utilisais la formule
ResX(σ
(n−k)
(X1, . . . , Xn−k−1, X), σ(k+2)(Xn−k, . . . , Xn, X))
=a
m Y
i
σ
(n−k)
(X1, . . . , Xn−k−1, αi),
où
— a = lcX(σ
(k+2)(Xn−k, . . . , Xn, X)) = σ
(k+1)(Xn−k, . . . , Xn);
— les αi sont ses racines ;
— m = degX(σ
(n−k)
(X1, . . . , Xn−k−1, X)) = 2n−k−2
;
et la définition de σ
(n)
:
σ
(n)
(u1, . . . , un) =
Q
∈En
σ( · u)
(
Qn
i=1 σ[(ui))2n−1
.
Maintenant, si j’essaye d’imiter cette preuve pour g > 1, je fais face à trois
problèmes.
Tout d’abord, je n’ai pas de jolie description des αi comme pour le genre 1 (point
(iv) de 4.3.8) ; ainsi, les racines de X 7→ σ
(n,g)
(X1, . . . , Xn−1, X) sont maintenant :
{x (P1, 2P2, . . . , nPn + Q1 + · · · + Qg−1)|Qi ∈ C};
dans le cas elliptique, le miracle g − 1 = 0 permettait d’avoir au numérateur de
Y
i
σ
(n−k)
(X1, . . . , Xn−k−1, αi) = Y
i
Q
σ(P1 + 2P2 + · · · + n−k−1Pn−k−1 + nαi)
Qn−k−1
1 σ(Pj )
σ(αi)
la quantité
Y
σ( · P).
Le second problème est que le degré de σ
(n,g) n’est plus 2
n−2
, mais 2
n−2
g.
Enfin, troisième problème : si g > 2, σ[ 6= σ.84 Polynômes de sommation
4.4.3 Utilisation pour le calcul d’index
Je rappelle que la base de factorisation ici est
F = {u = (P) − (∞) ∈ Θ
[1]|x(P) ∈ Fq}.
On a un point R = aD1 + bD2, pour des entiers a et b choisis aléatoirement, et
on veut décider de la décomposition de R dans F.
Soient P1, . . . , Pg les points intervenant dans la représentation réduite de R, avec
Pi = (xi
, yi). On considère le n + g-ième polynôme de sommation σ
(n+g,g)
, et on
veut résoudre le système
(
σ
(n+g,g)
(x1, . . . , xg, Xg+1, . . . , Xg+n) = 0,
Xg+1, . . . , Xg+n ∈ Fq.
Ici, les xi sont donnés par l’énoncé et mes inconnues sont les n variables Xi
. On
utilise alors une base de Fqn /Fq pour obtenir un système de n polynômes sur Fq
à n variables. On le résout par un calcul de base de Gröbner.
Comme Gaudry l’a remarqué pour g = 1, les nouveaux polynômes σ
(n+g,g)
sont
symétriques. On peut donc les exprimer avec les polynômes symétriques élémentaires
e1, . . . , en en Xg+1, . . . , Xg+n : on obtient ainsi des polynômes de degré
total 2
n+g−2
g.
Malheureusement, et contrairement à la situation rencontrée pour g = 1, ré-
soudre ce système n’est pas suffisant pour trouver une décomposition de R.
En effet, trouver une solution (Xg+1, . . . , Xg+n) signifie que l’on a des points
Pg+1, . . . , Pg+n ∈ F (Pi = (Xi
, Yi) pour un certain Yi) tel qu’il existe certains
points (inconnus) Q1, . . . , Qg−1 avec :
P1 ± P2 ± · · · ± Pg+n ∼ Q1 + · · · + Qg−1.
A ce point, il reste à traiter les problèmes suivants :
(i) Les relations que l’on veut en réalité sont
P1 + · · · + Pg ± Pg+1 · · · ± Pg+n ∈ Θ,
i.e. les g−1 premiers signes sont imposés comme étant positifs. Cela arrive
avec une probabilité 2
1−g
.
(ii) Même si les signes sont bons, il reste à calculer ces points Qi
: on les obtient
en calculant tous les diviseurs
P1 + · · · + Pg ± Pg+1 · · · ± Pg+n.
(iii) Enfin, il faut vérifier si, pour l’un des choix de signes effectués en (ii), l’on
a bien x(Qi) ∈ Fq pour tout i.
J’illustre maintenant la recherche de relations en genre 2.Extension aux courbes hyperelliptiques 85
4.4.4 Un exemple en genre 2
Je rappelle qu’en genre 2, Θ = {(P)−(∞)} = Θ[1], c’est-à-dire L = Θ[1] ⊂ F.
La situation est la suivante : on a un diviseur R = (P1) + (P2) − 2(∞) dont on
veut tester la friabilité.
Dans cet exemple, on travaille sur Fq
2 avec q = 1048583 et Fq
2 ' Fq(a) , a véri-
fiant a
2 + a + 1 = 0.
La courbe choisie est définie par y
2 = x
5 + (956 + 16a)x + 560.
Comme l’extension est de degré 2, on doit utiliser le g + 2 = 4-ième polynôme de
sommation σ
(4,2). Si le point que l’on souhaite décomposer est R ∼ (P1) + (P2) − 2(∞),
avec
P1 = (822466a+1019211, 208059a+779837) et P2 = (964315a+809425, 207076a+760154),
dans σ
(4,2)(x1, x2, x3, x4), on doit remplacer les inconnues x1 et x2 par les valeurs
connues x(P1) et x(P2) respectivement. On obtient alors un polynôme symétrique
en x3 et x4. Si on l’exprime en fonction des polynômes symétriques élémentaires
e1 = x3 + x4 et e2 = x3x4, on obtient quelque chose qui commence comme
e
8
1 − (86278a + 469901)e
7
1
e2 + (413036a + 304842)e
7
1 + · · · = 0.
Remarquons que le degré total de ce polynôme est bien 2
n−2
g = 8.
Comme on veut des solutions dans Fq, cette équation est équivalente au système
(
e
8
1 − 469901e
7
1
e2 + · · · = 0,
−86278e
7
1
e2 + · · · = 0.
Après calcul de la base de Gröbner de ce système, on obtient les quatre couples
de solutions
{(48993, 5391),(−890, 86741),(−72562, −313),(145643, 17928)},
et finalement, les solutions dans Fq sont
(x3, x4) ∈ {(97763, 999813),(47880, 999813),(97763, 47880),(640319, 335702)}.
On calcule les points P3 et P4 correspondants, et on voit que les trois premiers
couples nous donnent effectivement une décomposition de R :
R ∼ (47880, 467662a+247545)+(999813, 350820a+258681)+(97763, 7563a−232022),
alors que le dernier couple nous donne une décomposition de −(P1)+(P2)−2(∞),
ce dont on n’a pas besoin.86 Polynômes de sommation
4.4.5 Complexité
On retourne au cas g quelconque pour analyser le coût de la recherche de
relations avec ces polynômes de sommation hyperelliptiques.
On considère donc une courbe C de genre g définie sur un corps fini Fqn , et on
veut décomposer un élément
R ∼ (P1) + · · · + (Pg) − g(∞) ∈ J
en somme de n points de F. On doit ainsi utiliser le polynôme σ
(n+g,g) ∈ Fqn [X1, . . . , Xg+n].
Comme expliqué dans l’exemple précédent en genre 2, on remplace les g premières
variables de σ
(n+g,g) par les xi = x(Pi) fournis par R, et on obtient alors, après
symétrisation, un système de n équations polynomiales sur Fq en n variables de
degré total 2
n+g−2
g.
Dans sa thèse ([52], section 7.2.2), Vitse étudie le coût d’un test de décomposition
d’un point R en utilisant les polynômes de sommation elliptiques. En suivant son
analyse, j’obtiens le résultat suivant :
Proposition 4.4.9. En notant c(g, n, q) le coût d’un test de décomposition d’un
point R ∈ J de la jacobienne d’une courbe de genre g en la somme de n points
de la base de factorisation F, on a
c(g, n, q) = O˜(23n(n+g−2)g
3nn)
quand q → ∞.
Démonstration. En fait, c(g, n, q) correspond au coût de la résolution du système
polynomial sur Fq obtenu à partir de la relation
σ
(n+g,g)
(x1, . . . , xg, Xg+1, . . . , Xg+n) = 0.
Cette résolution se fait par un calcul de bases de Gröbner. La stratégie usuelle
est en deux temps : d’abord utiliser l’algorithme F4 de Faugère pour calculer une
base pour l’ordre degrevlex, puis appliquer l’algorithme de changement d’ordre
FGLM pour en déduire une base pour l’ordre lexicographique. Ces algorithmes
ont été proposés respectivement dans [15] et [16]. Pour estimer c(g, n, q), il faut
regarder la complexité de ces deux étapes.
Sans rentrer dans les détails, la complexité du calcul d’une base de Gröbner d’un
idéal I = hf1, . . . , fN i de dimension zéro d’un anneau de polynômes K[X1, . . . , XN ]
avec l’algorithme F4 est majorée par
O˜
N + dreg
N
!ω!
,Extension aux courbes hyperelliptiques 87
où le degré de régularité dreg est majoré par la borne de Macaulay
dreg ≤
X
i
(deg(fi) − 1) + 1,
et ω est l’exposant intervenant dans la complexité du produit matriciel.
Ici, on a N = n et la borne de Macaulay donne
dreg ≤ n2
n+g−2
g − n + 1.
Après utilisation de la formule de Stirling, on trouve finalement une complexité
en
O˜
2
n(n+g−2)g
n
e
nn
−1/2
ω
.
On passe maintenant à la complexité de l’algorithme de changement d’ordre
F GLM. Pour un idéal de degré D de polynômes à N variables, elle est de
O(ND3
). Le degré D peut s’estimer par la borne de Bézout : dans notre cas,
l’idéal est généré par n polynômes, tous de même degré 2
n+g−2
g, ce qui nous
donne la majoration suivante
D ≤ 2
n(n+g−2)g
n
.
La coût de cette étape est donc
O(23n(n+g−2)g
3nn).
Comme le coût de la seconde étape domine celui de la première, c’est lui qui
donne l’estimation de c(g, n, q).
Maintenant qu’on a obtenu le coût c(g, n, q) d’une utilisation des polynômes hyperelliptiques
de sommation, il s’agit d’estimer le coût global de la méthode de
calcul d’indice. Pour cela, il est nécessaire d’estimer :
— le cardinal de la base de factorisation (puisque le but est d’obtenir plus de
relations qu’il n’y a d’éléments dans cette base) ;
— la probabilité qu’un diviseur choisi aléatoirement se décompose dans la
base.
Pour estimer ces quantités, nous continuons de suivre la thèse de Vitse ([52],
section 7.2.3) : la base de factorisation contient environ q/2 points, quand q est88 Polynômes de sommation
suffisamment grand, tandis qu’une analyse heuristique donne une probabilité de
décomposition de l’ordre de :
]C
ng/ Sng
]F
=
1
(ng)!.
Il faut maintenant faire attention au fait que les polynômes de sommation hyperelliptiques
ne testent pas la nullité d’une somme, mais seulement sa présence
dans le diviseur Θ.
Pour plus de clarté, reprenons notre exemple de la section 4.4.3 : partant d’un diviseur
R = P1+· · ·+Pg que l’on veut décomposer, l’utilisation de σ
(n+g,g) permet
d’obtenir les abscisses xg+1, . . . , xg+n de n points Pg+1, . . . , Pg+n nous donnant la
relation
P1 + · · · + Pg+n ∈ Θ,
c’est-à-dire
P1 + · · · + Pg+n ∼ Q1 + · · · + Qg−1,
pour certains points Qi
inconnus de la courbe C.
Cela aboutit à une relation à la double condition que tous les xi soient dans Fq,
puis que tous les x(Qi) soient également dans Fq. Selon l’analyse heuristique citée
plus haut, la première condition est vérifiée avec une probabilité 1/(g + n)!.
Quant à la seconde, les g − 1 quantités x(Qi) sont à priori dans Fqn , et on leur
demande à être dans Fq : ceci arrive avec une probabilité en q
(1−n)(1−g)
.
Ainsi, pour obtenir de l’ordre de q/2 relations, il faudra résoudre en moyenne
(g+n)!(g−1)!q/2 systèmes polynomiaux provenant des polynômes de sommation,
et, finalement, le coût global de la méthode est de l’ordre de
O˜
q
(1+(n−1)(g−1))2
3n(n+g−2)g
3nn(g + n)!
quand q → ∞.
4.5 Constructions alternatives
Faisons le point : en réécrivant la théorie de Semaev, j’ai pu étendre ses polynômes
de sommation aux courbes hyperelliptiques. Ces nouveaux polynômes
méritent effectivement le nom de polynômes de sommation hyperelliptiques, en
référence aux polynômes de sommation de Semaev, car :
— comme dans le genre 1, ils permettent de trouver des relations pour l’algorithme
de calcul d’index ;
— comme dans le genre 1, ils ne dépendent que de la coordonnée x des points
de la courbe ;Constructions alternatives 89
— si on remplace g par 1 dans mes σ
(n,g)
, on retrouve bien les polynômes de
Semaev.
Dans cette section, je m’intéresse maintenant à l’étude de polynômes de sommation
alternatifs. En particulier, j’expliquerai pourquoi ces polynômes sont moins
performants que ceux que j’ai précédemment exposés.
Dans un premier temps, je m’attaque à deux défauts de mes polynômes : ils sont
chers à calculer, car ils nécessitent la multiplication de 2
n−1 déterminants de taille
n ; et ils ne détectent une relation qu’avec une probabilité 2
1−g
. En multipliant
moins de déterminants, pourrait on obtenir des polynômes de sommation plus
efficaces ?
Dans un second temps, je donne mes résultats sur une question soulevée par
Guénaël Renault lors d’un exposé à Rennes que je réécris de la façon suivante :
pour tester des égalités de type
R + P1 + · · · + Pn = O
sur une courbe E, peut on utiliser une coordonnée c et un automorphisme Ψ de
E tels que
πc(E) ∼ E/Ψ
pour obtenir des polynômes de sommation dépendant uniquement des c(Pi) ?
Ainsi, dans le cas des polynômes de Semaev, l’automorphisme Ψ est simplement
[−1] : (x, y) 7→ (x, −y) et ma coordonnée c est x.
4.5.1 Peut-on utiliser moins de fonctions ∆n,g ?
Considérons par exemple le polynôme σ
(3,2). Pour le construire, on doit multiplier
au numérateur
∆3,2(P1, P2, P3) × ∆3,2(P1, −P2, P3) × ∆3,2(P1, P2, −P3) × ∆3,2(P1, −P2, −P3).
Mais, parmi ces déterminants, seulement la moitié nous sont utiles :
∆3,2(P1, P2, P3) × ∆3,2(P1, P2, −P3) = 0 ⇔ P1 + P2 ± P3 ∈ Θ,
tandis que les deux autres nous donnent de mauvaises relations :
∆3,2(P1, −P2, P3) × ∆3,2(P1, −P2, −P3) = 0 ⇔ P1 − P2 ± P3 ∈ Θ.
Remarque 4.5.1.90 Polynômes de sommation
— Cet exemple est un peu artificiel : j’ai déjà expliqué que pour g = 2, le
premier polynôme de sommation intéressant était σ
(4,2). Pour des n plus
grands, ce sont exactement les mêmes idées qui entrent en jeu. La seule
différence est que de tels exemples sont plus longs à écrire.
— Pour g = 1, il ne se passe rien du tout : les nouveaux polynômes que je
vais construire σ˜
(n,g)
sont alors égaux à σ
(n,g)
.
Je rappelle que pour g = 1, on avait démontré le lemme de réduction 4.3.4. Pour le
cas général, ce lemme est démontré dans la preuve du théorème 4.4.7. En utilisant
ce lemme, j’obtiens la construction suivante de polynômes σ˜
(n,g) alternatifs :
Théorème 4.5.2. Soit n ∈ N, et soient P1, . . . , Pg+n ∈ C. On veut décomposer
le diviseur R = (P1) + · · · + (Pg) − g(∞) . On doit considérer séparément les cas
n = 2 et n > 2 :
• si n = 2, on considère la fonction σ˜
(g+2,g)
construite ainsi :
∆g+2,g(R, Pg+1, Pg+2)∆g+2,g(R, Pg+1, −Pg+2)∆g+2,g(R, −Pg+1, Pg+2)∆g+2,g(R, −Pg+1, −Pg+2)
∆2(Pg+1, Pg+2)
Q
i6=g+1
i6=g+2
∆2(Pg+1, Pi)∆2(Pg+2, Pi)
!2
.
C’est un polynôme en xg+1 et xg+2. Il est symétrique et est de degré 2g en
chaque variable.
• si n > 2, la fonction est
σ˜
(n+g)
(R, Pg+1, . . . , Pg+n) =
Q
∈{±1}n ∆n+g,g(P1, . . . , Pg, 1Pg+1 + · · · + nPg+n)
Q
i6=g+1 ∆2(Pg+1, Pi)
2n−1
.
C’est un polynôme en les xi (g + 1 ≤ i ≤ g + n).
Il n’est pas symétrique.
Il est de degré 2
n−1
(2g + n − 2) en chaque xi pour i ≤ g + 2, et de degré
2
n−1
g en xg+1.
Démonstration. A priori, les deux quantités évoquées dans ce théorème sont des
fonctions rationnelles en les xi et les yi
. Il faut d’abord voir que ce sont en fait des
fonctions rationnelles ne dépendant que des xi (c’est le second point du lemme),
puis que ce sont en fait des polynômes (c’est le troisième point du lemme).
Remarque 4.5.3. On ne peut pas utiliser moins de déterminants que les 2
n
impliqués
dans la construction de σ˜
(g+n,g)
. En effet, sans eux, on ne peut plus utiliser
correctement le lemme de réduction 4.3.4 afin de se débarrasser des variables yi.Constructions alternatives 91
Ainsi, sauf pour n = 2, le défaut de symétrisation des nouveaux σ˜
(g+n,g)
les rend
inutilisables. En effet, après symétrisation, les polynômes σ
(g+n,g)
sont de degré
total 2
n+g−2
g, contre 2
n−1
((2n − 1)g + (n − 2)(n − 1)) pour les σ˜
(g+n,g)
.
Pour n = 2 par contre, σ˜
(g+2,g)
est plus efficace que σ
(g+2,g)
: en effet, ils sont tous
les deux symétriques, mais le premier est de degré 2g alors que le second est de
degré 2
g
g.
4.5.2 Cas elliptique : peut on utiliser un autre automorphisme
que [−1] ?
Comme énoncé dans l’introduction de cette section, l’idée est d’utiliser une
coordonnée c et un automorphisme ξ de E tels que
πc(E) ' E/ξ.
À partir de c et ξ, je veux obtenir des polynômes de sommation σˆ
(n) alternatifs :
Définition 4.5.4. J’appelle polynômes de sommation relatifs à c des polynômes
σˆ
(n) ∈ K[C1, . . . , Cn] tels que
σˆ
(n)
(c1, . . . , cn) = 0 ⇔ ∃ Pi ∈ E tq c(Pi) = ci
,
∃ i2, . . . , in ∈ N,
P1 + [ξ
i2
]P2 + · · · + [ξ
in
]Pn = O.
Dans le cadre du calcul d’index, la base de factorisation à considérer devient
naturellement
{P ∈ E(Fq
k ) | c(P) ∈ Fq}.
Remarque 4.5.5. Cette section est basée sur les résultats de [14]. Plus précisé-
ment, dans cet article, les auteurs ont construit les polynômes que j’appelle σˆ
(2)
et σˆ
(3) de mes théorèmes 4.5.7, 4.5.11, 4.5.12 et 4.5.4 (il s’agit des propositions
5.1, 5.4 et 6.2 de [14]). La construction de σˆ
(n) pour tout n n’était pas le but de
leurs travaux, et fait donc l’objet d’un travail original de ma part.
4.5.2.1 Quels automorphismes ?
Je me place en caractéristique 6= 2, 3. Je rappelle (voir [42] par exemple) que92 Polynômes de sommation
Aut(E) '
µ2 si j 6= 0, 1728
µ4 si j = 1728
µ6 si j = 0,
avec [ξ](x, y) = (ξ
2x, ξ3
y).
Ainsi, dans le cas j 6= 0, 1728, nous n’avons rien de plus que l’automorphisme
[−1] utilisé par Semaev, avec la coordonnée c = x.
4.5.2.2 Le cas j = 1728
Le modèle de Weierstrass de E est y
2 = x
3 + Ax.
Si on fixe i racine carrée de −1, les deux nouveaux automorphismes qu’on obtient
sont (x, y) 7→ (−x, ±iy). Autrement dit, on a c = x
2
.
On considère le polynôme suivant :
f(x1, . . . , xn) = Y
σ
(n)
(x1, ±x2, . . . , ±xn).
Ce polynôme vérifie presque la définition 4.5.4 : f(x1, . . . , xn) = 0 signifie qu’il
existe des points Pi = (xi
, yi) ∈ E tels que
P1 ± [ξ]
i2P2 ± · · · ± [ξ]
in Pn = O,
où [ξ](x, y) = (−x, iy).
Remarque 4.5.6. La racine carrée de −1, i, ne devra pas être confondue avec
les entiers 0 ≤ ik ≤ 3.
Il ne manque donc plus qu’une chose à montrer pour que f rentre bien dans le
cadre de la définition : le fait que f soit un élément de K[x
2
1
, . . . , x2
n
], c’est-à-dire
que, comme fonction de x1, . . . , xn, f soit paire. Cela se fait en trois étapes :
— d’abord on montre que f est paire en tant que fonction en x2 ;
— en remarquant que f est symétrique en x2, . . . , xn, on obtient alors gratuitement
la parité en x3, . . . , xn ;
— enfin on montre séparément la parité en x1.
Pour la parité en x2, il n’y qu’à écrire :
f(x1, −x2, . . . , xn) = Y
σ
(n)
(x1, −2x2, 3x3 . . . , nxn)
=
Y
0
σ
(n)
(x1, 0
2x2, 0
3x3 . . . , 0
nxn)
= f(x1, x2, . . . , xn),Constructions alternatives 93
où = (2, . . . , n) et
0 = (−2, . . . , n).
Pour x1, on va devoir développer l’expression de f :
f(x1, x2, . . . , xn) = Y
σ
(n)
(x1, ±x2, . . . , ±xn)
=
Y
σ
(n)
(P1, [ξ]
i2P2, . . . , [ξ]
in Pn)
=
Y
ik∈{0,1}
Q
k∈{±1} ∆n(P1, 2[ξ]
i2P2, . . . , n[ξ]
in Pn)
Q
j>1
(∆2(P1, [ξ]
ijPj ))4n−2 Q
2≤k1
Y
ij∈{0,1}
∆2(P1, [ξ]
ijPj )
4
n−2
=
Y
j
1 x1
1 xj
·
1 x1
1 −xj
!4
n−2
=
Y
j
(x
2
j − x
2
1
)
4
n−2
.
En particulier, c’est bien un polynôme en c1, . . . , cn. On traite de même la seconde
partie du dénominateur :
Y
k1
∆2(P1, [ξ]
ijPj )
6
n−2 Y
2≤k1
Y
ik∈{0,1,2}
∆2(P1, [ξ]
ik Pk)
6
n−2
=
Y
k
1 x1
1 xk
·
1 x1
1 Jxk
·
1 x1
1 J
2xk
!6
n−2
=
Y
j
(x
3
j − x
3
1
)
6
n−2
=
Y
j
(y
2
j − y
2
1
)
6
n−2
car on rappelle que y
2 = x
3 + B. On effectue ensuite un travail similaire pour la
seconde moitié du dénominateur et on a notre égalité.
Ensuite, avec exactement les mêmes arguments que pour 4.5.7, on voit que cette
quantité est bien symétrique en P2, . . . , Pn, et qu’elle permet bien de tester les
égalités voulues :
P1 + [ξ
i2
]P2 + · · · + [ξ
in
]Pn = O,
pour l’automorphisme [ξ] : (x, y) 7→ (Jx, −y).
Enfin il reste à voir que c’est bien un polynôme en ci = y
2
i
. Si on note provisoirement
f(P1, . . . , Pn) = Y
0≤ik≤5
σ
(n)
(P1, [ξ]
i2P2, . . . , [ξ]
in Pn),
ceci revient à dire que
f(P1, . . . , Pn) = f([ξ]P1, . . . , Pn) = · · · = f([ξ]
5P1, . . . , Pn),
d’une part, et
f(P1, P2 . . . , Pn) = f(P1, [ξ]P2, . . . , Pn) = · · · = f(P1, [ξ]
5P2, . . . , Pn)
d’autre part : la symétrie en (P2, . . . , Pn) permettra de conclure.Constructions alternatives 97
Ceci se traite exactement comme pour 4.5.7 : la dépendance en c1 se résout en
considérant le produit
Y
k∈{±1}
0≤ik≤5
∆n(P1, 2[ξ]
i2P2, . . . , n[ξ]
in Pn)
qui apparaît au numérateur du développement de f, tandis que la dépendance
en c2 se voit directement dans l’expression
f(P1, . . . , Pn) = Y
0≤ik≤5
σ
(n)
(P1, [ξ]
i2P2, . . . , [ξ]
in Pn).
Mais il existe encore une autre construction possible de polynômes de sommation,
cette fois-ci relatifs à la variable c = y. Elle est inspirée de [14].
Théorème 4.5.12.
• Pour n = 2, on a l’égalité
σ(P + Q)σ(P + [ξ]Q)σ(P + [ξ
2
]Q)
σ(P)
3σ(Q)
3
= yP − yQ.
Ceci est le second polynôme de sommation relatif à c = y. Pour comparer
avec le second point, on pourra remarquer qu’il est de degré 3
2−2 = 1 en
yQ.
• Soit n > 2. Soient P1, . . . , Pn ∈ E de coordonnées (xi
, yi). Pour 2 ≤ k ≤
n, soit 0 ≤ ik ≤ 2 un entier. On a alors l’égalité
Q
0≤ik≤2 σ(P1 + [ξ]
i2P2 + · · · + [ξ]
in Pn)
(
Qn
i=1 σ(ui))3n−1 =
Q
0≤ik≤2 ∆n(P1, [ξ]
i2P2, · · · + [ξ]
in Pn)
Q
i1
(∆2(P1, [ξ]
ijPj ))(2r)n−2 Q
2≤k1
Y
0≤ik≤r−1
∆2(P1, [ξ]
ik Pk)
(2r)
n−2
=
Y
k
Y
ik
1 x1
1 (ξ)
2ik xk
!(2r)
n−2
=
Y
k
(x
r
k − x
r
1
)
!(2r)
n−2
=
Y
k
(c
2
j − c
2
1
)
!(2r)
n−2
On effectue ensuite un travail similaire pour la seconde moitié du dénominateur
et on a notre égalité.104 Polynômes de sommation
Maintenant que l’égalité est démontrée, il s’agit de voir que cette quantité nous
donne bien le n-ième polynôme relatif à la variable c, c’est-à-dire que c’est un
polynôme en les ci qui permet de tester les égalités
P1 ± [ξ]
i2 ± · · · ± [ξ]
in Pn ∈ Θ.
Pour le moment, notons f(P1, . . . , Pn) cette quantité.
Le fait que f permette de tester les égalités voulues provient simplement de la
définition de σ
(n,g)
.
A priori, grâce au membre de gauche de l’égalité définissant f, on sait qu’il s’agit
d’un polynôme en x1, . . . , xn. Il faut voir qu’en réalité c’est un polynôme en les
ci
.
Pour cela, montrons dans un premier temps que, vis-à-vis de P1 et de P2, f ne
dépend que des variables c1 et c2. Ceci revient à dire que
f(P1, . . . , Pn) = f([ξ]P1, . . . , Pn) = · · · = f([ξ]
2r−1P1, . . . , Pn),
d’une part, et
f(P1, P2 . . . , Pn) = f(P1, [ξ]P2, . . . , Pn) = · · · = f(P1, [ξ]
2r−1P2, . . . , Pn)
d’autre part.
La dépendance en c1 se résout en considérant le produit
Y
k∈{±1}
0≤ik≤2r−1
∆n(P1, 2[ξ]
i2P2, . . . , n[ξ]
in Pn)
qui apparaît au numérateur du développement de f, tandis que la dépendance
en c2 se voit directement dans l’expression
f(P1, . . . , Pn) = Y
0≤ik≤2r−1
σ
(n)
(P1, [ξ]
i2P2, . . . , [ξ]
in Pn).
Grâce au membre de droite de l’égalité, on voit que f est symétrique en P2, . . . , Pn.
Ceci permet de conclure que f est bien un polynôme en les ci
.
Enfin il ne reste plus qu’à démontrer le degré. Fixons un indice i. On a degxi
σ
(n,g) =
2
n−2
g. Pour construire f, il faut, d’après le terme de gauche de l’égalité, multiplier
r
n−1
tels polynômes, d’où
degxi
f = (2r)
n−2
rg.
Pour avoir le degré en ci
, il suffit de diviser cette quantité par r.Constructions alternatives 105
Remarque 4.5.21.
• Il ne semble pas y avoir d’équivalent au théorème 4.5.12 pour g > 1, ni
de résultat pour s 6= 1.
• Les deux modèles de courbes qu’on considère sont y
2 = x
2g+1 + µ1x et
y
2 = x
2g+1 + µ0.
• Si g > 1, la formule du résultant est fausse pour σˆ
(n,g)
, et ce pour les
mêmes raisons qu’elle était fausse pour σ
(n,g)
.
4.5.4 Analyse et comparaisons
Dans cette section, nous devons discuter de l’efficacité de ces polynômes de
sommation alternatifs, relatifs à d’autres choix de coordonnées c que le choix
initial c = x fait par Semaev. Il s’agit ainsi de reprendre l’analyse faite dans la
proposition 4.4.9, et de l’adapter à ces nouveaux polynômes. Dans cette proposition,
je rappelle qu’on avait noté c(g, n, q) le coût de la résolution du système
polynomial sur Fq obtenu à partir de la relation
σ
(n+g,g)
(x1, . . . , xg, Xg+1, . . . , Xg+n) = 0.
Remarque 4.5.22. Dans cette section, on prendra garde de ne pas confondre la
lettre c qui désigne une variable et la lettre gothique c qui désigne un coût.
Proposition 4.5.23. On est dans la situation et avec les notations du théorème
4.5.20. On considère donc le polynôme de sommation suivant :
σ˜
n+g,g(c2, . . . , cn+g) = Y
0≤ik≤r−1
σ
(n,g)
(P1, [ξ]
i2P2, . . . , [ξ]
in+gPn+g).
Le coût de la résolution du système polynomial sur Fq déduit de la relation
σ˜
n,g(c2, . . . , cn+g) = 0
est noté c
0
(g, n, q) et vaut O˜((2r)
3n(n+g−2)g
3nn) quand q → ∞.
Démonstration. On rappelle qu’un tel coût est directement lié au nombre de variables
(ici n : ce sont cg+1, . . . , cg+n) et au degré des polynômes du système à
résoudre (ici (2r)
g+n−2
g, soit 4
g+n−2
g
g+n−1 ou (4g+2)g+n−2
g selon la valeur de r).
Suivons maintenant les mêmes étapes que dans la démonstration de la proposition
4.4.9. On commence donc par une utiliser la borne de Macaulay pour estimer le
degré de régularité. Ici
dreg ≤ n(2r)
n+g−2
g − n + 1.
Muni de ce premier résultat, on peut estimer le coût de l’utilisation de l’algorithme
F4 pour calculer une base de Gröbner pour l’order degrevlex : ce coût est majoré
par
O˜
n + dreg
n
!ω!
.106 Polynômes de sommation
Utilisant le fait que n soit négligeable devant n + dreg et la formule de Stirling,
ce coût devient
O˜
(2r)
n(n+g−2)g
n
e
nn
−1/2
ω
.
Il s’agit maintenant d’étudier la complexité de l”algorithme de changement d’ordre
F GLM. Pour cela, on commence par utiliser la borne de Bézout pour majorer le
degré D de l’idéal polynomial que l’on souhaite étudier :
D ≤ (2r)
n(n+g−2)g
n
.
Le coût de cette étape est alors
O((2r)
3n(n+g−2)g
3nn).
Comme le coût de la seconde étape domine celui de la première, c’est lui qui
donne l’estimation de c
0
(g, n, q).
Je rappelle qu’avec les polynômes de sommation classiques, le coût était de
O˜(23n(n+g−2)g
3nn) : ainsi, l’utilisation des polynômes alternatifs aboutit à des
systèmes dont la résolution est environ r
3n(n+g−2) plus chère, avec r qui est de
l’ordre de 2g.
D’un autre côté, il faut tenir compte du fait que ces nouveaux polynômes dé-
tectent r fois plus de relations. En effet, avec les polynômes de sommation classiques,
on recherchait les relations du type
D1 ± D2 + · · · ± Dg+n ∈ Θ,
tandis que les nouveaux polynômes recherchent plus de relations :
σˆ
(n)
(c1, . . . , cg+n) = 0 ⇔ D1 + [ξ
i2
]D2 + · · · + [ξ
ig+n
]Dg+n ∈ Θ,
pour les indices ik dans {0, . . . , 2r}.
Ainsi, utiliser les polynômes alternatifs permet de devoir tester r fois moins de
relations avant d’en trouver une, mais chaque relation devient r
3n(n+g−2) fois plus
chère à tester : très clairement, ces nouveaux polynômes ne sont pas du tout
compétitifs par rapport aux polynômes de sommation classiques.Conclusion 107
Exemple 4.5.24. Regardons la situation en genre 1 sur les courbes de j invariant
1728, c’est-à-dire d’équation de Weierstrass y
2 = x
3 + Ax. Si on a un point
R ∈ E(Fqn ) de la courbe à décomposer, on peut utiliser le polynôme de Semaev
σ
n+1(xR, x1, . . . , xn), qui s’annule sur les abscisses des points Pi vérifiant
R ± P1 ± · · · ± Pn = O;
ou bien on peut utiliser le polynôme
σˆ
n+1 =
Y
σ
(n)
(x1, ±x2, . . . , ±xn),
qui détecte les relations du type
R + [ξ
i1
]P1 + [ξ
i2
]P2 + · · · + [ξ
in
]Pn = O,
avec les ik dans {0, . . . , 3}. En rappelant que
[ξ
i
]P =
P si i = 0
P
0
si i = 1
−P si i = 2
−P
0
si i = 3
avec P
0 = (−x, iy) quand P = (x, y), on voit qu’effectivement σˆ
n+1 détecte 2 fois
plus de relations que σ
n+1
.
D’un autre côté, comme σ
n+1 est de degré 2
n−1
tandis que σˆ
n+1 de degré 4
n−1
,
utiliser σˆ
n+1 entraîne un surcoût très important : chaque test de relation coûte
2
3n(n−1) fois plus.
4.6 Conclusion
Le but premier de de chapitre était la généralisation des polynômes de Semaev
aux courbes hyperelliptiques. Celle ci passe par une réécriture de ces polynômes
de sommation comme produit de déterminants. En effet, la construction initiale
de Semaev était basée sur une formule de résultants, qui n’est plus valide en genre
supérieur à 1. Une fois ces polynômes de sommation hyperelliptiques construits,
on a pu étudier leurs propriétés : symétrie, degré, impact sur le coût de la recherche
de relations.
Suite à cela, j’ai également cherché à construire des polynômes de sommation
alternatifs, non plus rattachés à l’automorphisme de degré 2 (x, y) 7→ (x, −y),
mais à d’autres automorphismes de degré 2r. L’idée sous jacente à cette recherche
est la suivante : plus le degré de l’automorphisme est élevé, plus le nombre de
relations détectés par l’égalité
σˆ
(n+g) = 0
est important. Malheureusement, l’analyse montre que finalement le trop haut
degré de ces nouveaux polynômes les rend inutilisables.108 Polynômes de sommationBibliographie
[1] J. Adleman, J.DeMarrais, et M. Huang. A subexponential algorithm for discrete
logarithms over the rational subgroup of the Jacobians of large genus
hyperelliptic curves over finite fields. Leonard M. Adleman and Ming-Deh
Huang, editors, Algorithmic Number Theory, volume 877 of Lecture Notes
in Computer Science, pp 28–40, Berlin, 1994. Springer-Verlag.
[2] R. Avanzi. Aspects of Hyperelliptic Curves over Large Prime Fields in Software
Implementations , Cryptographic Hardware and Embedded Systems
- CHES 2004, Lecture Notes in Computer Science Volume 3156, 2004, pp
148-162
[3] R. Avanzi, H. Cohen, C. Doche, G. Frey, T. Lange, K. Nguyen and F. Vercauteren.
Handbook of elliptic and hyperelliptic curve cryptography, Discrete
mathematics and its applications, 2005.
[4] J. Balakrishnan, J. Belding, S. Chisholm, K. Eisenträger, K. Stange et
E.Teske. Pairings on hyperelliptic curves, CoRR Vol. abs/0908.3731, 2009.
[5] I. Blake, G. Seroussi, N. Smart. Advances in elliptic curve cryptography.
London Mathematical Society Lecture Note Series 317, Cambridge University
press (2005), pp. 183-212.
[6] D. Boneh et M. Franklin, “Identity-based encryption from the Weil pairing,
Advances in Cryptology – CRYPTO 2001, Lecture Notes in Computer
Science, 2139 (2001), 213–229.
[7] D. Boneh, B. Lynn et H. Shacham, Short signatures from the Weil pairing,
Advances in Cryptology – ASIACRYPT 2001, Lecture Notes in Computer
Science, 2248 (2001), 514–532.
[8] E. Brown et B. T. Myers. Elliptic curves from Mordell to Diophantus and
back (se trouve à l’adresse : http://www.math.vt.edu/people/brown/doc/
dioellip.pdf).
[9] V. Buchstaber et V. Enolskii. Explicit Algebraic Description of Hyperelliptic
Jacobians on the Basis of the Klein σ-Functions, Functional Analysis and
Its Applications, Vol. 30, No. 1, 1996.
[10] V. Buchstaber, V. Enolskii, et D. Leykin, A Recursive Family of Differential
Polynomials Generated by the Sylvester Identity and Addition Theorems for
109110 Bibliographie
Hyperelliptic Kleinian Functions, Functional Analysis and Its Applications,
Vol. 31, No. 4, 1997.
[11] D. Cantor. Computing in the Jacobian of a hyperelliptic curve. Mathematics
of computation 48 (1987), no. 177, 95-101.
[12] A. Devegili, C.hEigeartaigh, M. Scott, R. Dahab. Multiplication and squaring
on pairing-friendly fields. Cryptology ePrint Archive, Report 2006/471
[13] J. Eilbeck, M. England, Y. Ônishi. Abelian functions associated with genus
three algebraic curves , LMS J. Comput. Math., vol. 14 (2011), pp.291-326.
[14] J.C. Eilbeck, S. Matsutani, Y. Onishi. Addition formulae for abelian functions
associated with specialized curves, Phil. Trans. R. Soc., A2011 369,
février 2011.
[15] J-C Faugère. A new efficient algorithm for computing Gröbner bases (F4).
Journal of Pure and Applied Algebra, 139(1–3) :61–88, June 1999.
[16] J-C Faugère, P. Gianni, D. Lazard et T. Mora. Efficient computation of
zero-dimensional Gröbner bases by change of ordering. Journal of Symbolic
Computation, 16(4) :329–344, 1993.
[17] F. Frobenius et L. Stickelberger, Zur Theorie der elliptischen Functionen, J.
reine angew. Math. 83 (1877), 175–179.
[18] W. Fulton. Algebraic curves. Math. Lec. Note Series, W. A. Benjamin Inc,
1969
[19] S. Galbraith, F. Hess et F. Vercauteren. Hyperelliptic pairings, Pairing-Based
Cryptography -Pairing 2007, Lecture Notes in Computer Science Volume
4575, 2007, pp 108-131 .
[20] R. Granger, F. Hess, R. Oyono, N. Thériault et F. Vercauteren, Ate pairing
on hyperelliptic curves, Advances in Cryptology - Eurocrypt 2007, LNCS,
vol. 4515, Springer-Verlag, 2007, pp. 419–436.
[21] P. Gaudry. Fast genus 2 arithmetic based on theta functions,
J.Math.Cryptol.1 (2007), 243–265.
[22] P. Gaudry. Index calculus for abelian varieties of small dimension and the
elliptic curve discrete logarithm problem, Journal of Symbolic Computation,
vol. 44, no. 12, pp. 1690-1702, 2009.
[23] P. Gaudry, E. Thome, N. Theriault, C. Diem. A double large prime variation
for small genus hyperelliptic index calculus, Mathematics of computation,
vol. 76, pp. 475-492, 2007.
[24] P. Hewitt. A brief history of elliptic curves, notes de cours (se
trouve à l’adresse : http://livetoad.org/Courses/Documents/132d/
Notes/history_of_elliptic_curves.pdf)
[25] A. Joux. A one round protocol for tripartite Diffie-Hellman, Algorithmic
Number Theory :4th International Symposium, ANTS-IV, Lecture Notes in
Computer Science, 1838 (2000), 385–393.Bibliographie 111
[26] A. Koblitz, N. Koblitz, A. Menezes. Elliptic curve cryptography : The serpentine
course of a paradigm shift, Journal of Number theory, vol. 131, issue
5 (2011), pp 781-814.
[27] N. Koblitz, Hyperelliptic cryptosystems, J. Cryptology, 1 (1989), pp. 139-
150.
[28] N. Koblitz, A. Menezes, Pairing-based cryptography at high security levels,
Proceedings of Cryptography and Coding 2005, volume 3796 of LNCS, pp.
13-36.
[29] T. Lange, Formulae for Arithmetic on Genus 2 Hyperelliptic Curves, Applicable
Algebra in Engineering, Communication and Computing, vol. 15
(2003), pp. 295-328.
[30] D. Lubicz, D. Robert. Efficient pairing computation with theta functions. Algorithmic
Number Theory, 9th international symposium, ANTS-IX, Nancy,
France, July 2010, Proceedings.
[31] D. Lubicz, D. Robert. A generalisation of Miller’s algorithm and applications
to pairing computations on abelian varieties. Journal of Symbolic Computation,
vol. 67, March–April 2015, pp. 68-92.
[32] A. Menezes, T. Okamoto et S. Vanstone, Reducing elliptic curve logarithms
to logarithms in a finite field, IEEE Transactions on Information Theory, 39
(1993), pp. 1639-1646.
[33] V. Miller. Short programs for functions on curves, IBM Thomas J. Watson
Research Center (se trouve à l’adresse : http://crypto.stanford.edu/
miller/miller.ps), 1986.
[34] D. Mumford. Tata Lectures on Theta I. Volume 28 of Progress in Mathematics.
Birkhäuser Boston Inc., Boston, MA, 1983. With the assistance of C.
Musili, M. Nori, E. Previato and M. Stillman.
[35] D. Mumford. Tata Lectures on Theta II. Volume 28 of Progress in Mathematics.
Birkhäuser Boston Inc., Boston, MA, 1983. With the assistance of
C. Musili, M. Nori, E. Previato and M. Stillman.
[36] K. Nagao. Decomposition attack for the jacobian of a hyperelliptic curve over
an extension field, Algorithmic number theory, Lecture notes in computer
science, vol. 6197, pp. 285-300, 2010.
[37] National Institute of Standards and Technology, “Digital Signature Standard,”
Federal Information Processing Standards Publication 186-2, 2000.
[38] N. Ogura, N. Kanayama, S. Uchiyama and E. Okamoto. Cryptographic pairings
based on elliptic nets, Advances in information and computer security
(2011), pp. 65-78.
[39] Y. Onishi. Determinant expressions for hyperelliptic functions (with an appendix
by Shigeki Matsutani), Tokyo journal of mathematics, vol. 27, n. 2,
pp. 299-312, 2007.112 Bibliographie
[40] A. Rice et E. Brown, Why Ellipses are not elliptic curves, Mathematics
Magazine, Vol. 85, No. 3 (June 2012), pp. 163-176.
[41] T. Saito, S. Yokoyama, T. Kobayashi et G. Yamamoto, Some relations between
Semaev’s summation polynomials and Stange’s elliptic nets, J. Mathfor-Ind.
3A (2011) 89-92.
[42] J. Silverman. The arithmetic of elliptic curves, Springer-Verlag, New York,
1985, pp 157-178.
[43] I. Semaev. Summation polynomials and the discrete logarithm problem on
elliptic curves, Cryptologie ePrint Archive, Report 2004/031, 2004.
[44] N. Smart. On the performance of hyperelliptic cryptosystems, Advances in
cryptology -Eurocrypt 99, Lecture notes in computer science, vol. 1892, 1999,
pp. 165–175.
[45] K. Stange. The Tate pairing via elliptic nets, Pairing based cryptographyPairing
2007, Lecture Notes in Computer Science Volume 4575, 2007, pp
329-348.
[46] P. Stevenhagen et B. de Smit. Kernvak Algebra, notes de cours (se trouve
à l’adresse : http://websites.math.leidenuniv.nl/algebra/ellcurves.
pdf)
[47] N. Theriault. Index calculus attack for hyperelliptic curves of small genus,
Advances in Cryptology- ASIACRYPT 2003, lectures notes in computer
science vol. 2894, pp. 75-92.
[48] C. Tran. Formulae for computation of Tate pairing on hyperelliptic curve
using hyperelliptic nets, Progress in Cryptology - AFRICACRYPT 2014,
Lecture Notes in Computer Science Volume 8469, 2014, pp 199-214
[49] Y. Uchida. Division polynomials and canonical local heights on hyperelliptic
Jacobians, Manuscrypta Mathematica, vol. 134, issue 3-4 (2011), pp 273-308.
[50] Y. Uchida, S. Uchiyama. The Tate-Lichtenbaum pairing on a hyperelliptic
curve via hyperelliptic nets, Pairing based cryptography-Pairing 2012, pp.
218-233
[51] S. Vanstone, Responses to NIST’s Proposal, Communications of the ACM,
35, July 1992, 50-52 (communicated by John Anderson).
[52] V. Vitse, Attaques algébriques du problème du logarithme discret sur courbes
elliptiques, dissertation de thèse, soutenue le 20 octobre 2011.
[53] K. Weierstrass Zur Theorie der Abelschen Functionen, Journ.reine angew.Math.,
47 :289–306, 1854.
[54] K. Weierstrass Gesammelte Werke, volume 4. Teu ?bner, 1902.
[55] A. Weil. Sur les fonctions algébriques à corps de constantes finis,
C.R.Acad.Sci.Paris,210 :592–594, 1940 (= Oeuvres Scientifiques, Volume I,
pp. 257–259).Résumé
Dans cette thèse, j’étudie deux aspects distincts de la cryptographie basée sur les
courbes elliptiques et hyperelliptiques.
Dans une première partie, je confronte deux méthodes de calcul de couplages, originales
car ne reposant pas sur le traditionnel algorithme de Miller. Ainsi, dans [45], K. Stange
calcula le couplage de Tate sur une courbe elliptique à partir d’un nouvel outil, les
elliptic nets. Y. Uchida et S. Uchiyama généralisèrent ces objets au cas hyperelliptique
([50]), mais ne donnèrent un algorithme pour le calcul de couplages que dans le cas des
courbes de genre 2. Mon premier travail dans cette thèse fut de donner cet algorithme
pour le cas général. De leur côté, D. Lubicz et D. Robert donnèrent dans [30] une autre
méthode de calcul de couplage, basée sur les fonctions thêta. Le second résultat de ma
thèse est de réunifier ces deux méthodes : je montre que la formule de récurrence à la
base des nets est une conséquence des formules d’addition des fonctions thêta utilisées
dans l’algorithme de Lubicz et Robert.
Dans la seconde partie de ma thèse, je me suis intéressé à l’algorithme de calcul d’index
attaquant le problème du logarithme discret sur les courbes elliptiques et hyperelliptiques.
Dans le cas elliptique, une des étapes principales de cette attaque repose sur les
polynômes de Semaev. Je donne une nouvelle construction ces polynômes en utilisant
la fonction sigma de Weierstrass, pour pouvoir ensuite les généraliser pour la première
fois au cas hyperelliptique.
Abstract
In this thesis, I study two different aspects of elliptic and hyperelliptic curves based
cryptography.
In the first part, I confront two methods of pairings computation, whose original feature
is that they are not based the traditional Miller algorithm. Therefore, in [45], K. Stange
computed Tate pairings on elliptic curves using a new tool, the elliptic nets. Y. Uchida
and S. Uchiyama generalized these objects to hyperelliptic case ([50]), but they gave an
algorithm for pairing computation only for the genus 2 case. My first work in this thesis
was to give this algorithm for the general case. Meanwhile, D. Lubicz and D. Robert
gave in [30] an other pairing computation method, based on theta functions. The second
result of my thesis is the reunification of these two methods : I show that the recurrence
equation which is the basis of nets theory is a consequence of the addition law of theta
functions used in the Lubicz and Robert’s algorithm.
In the second part, I study the index calculus algorithm attacking the elliptic and
hyperelliptic curve discrete logarithm problem. In the elliptic case, one of the main
steps of this attack requires the Semaev polynomials. I reconstruct these polynomials
using Weierstrass sigma function, with the purpose of giving their first hyperelliptic
generalization.
Qualification et am´elioration de la pr´ecision de syst`emes
de balayage laser mobiles par extraction d’arˆetes
Martyna Poreba
To cite this version:
Martyna Poreba. Qualification et am´elioration de la pr´ecision de syst`emes de balayage laser
mobiles par extraction d’arˆetes. Other. Ecole Nationale Sup´erieure des Mines de Paris, 2014.
French. .
HAL Id: pastel-01068828
https://pastel.archives-ouvertes.fr/pastel-01068828
Submitted on 26 Sep 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific
research documents, whether they are published
or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.N°: 2009 ENAM XXXX
MINES ParisTech
CAOR, Centre de Robotique – Département Mathématiques et Systèmes
60, Boulevard Saint Michel, 75272 Paris cedex 06, France
École doctorale n° 432 : Sciences des Métiers de l’Ingénieur
présentée et soutenue publiquement par
Martyna POREBA
le 18 juin 2014
Qualification et amélioration de la précision de systèmes
de balayage laser mobiles par extraction d’arêtes
~~~
Edge-based accuracy assessment and improvement
of mobile laser scanning systems
Doctorat ParisTech
T H È S E
pour obtenir le grade de docteur délivré par
l’École nationale supérieure des mines de Paris
Spécialité « Informatique temps-réel, robotique et automatique »
Directeur de thèse : François GOULETTE
T
H
È
S
E
Jury
M. Pierre GRUSSENMEYER, Professeur, INSA de Strasbourg Rapporteur
M. Nicolas PAPARODITIS Directeur de recherche, IGN Rapporteur
M. Laurent TRASSOUDAINE, Professeur, Université Blaise Pascal de Clermont-Ferrand Président du jury
M. Jean-Emmanuel DESCHAUD, Docteur, MINES ParisTech Examinateur
M. François GOULETTE, Professeur, MINES ParisTech Directeur de thèse N°: 2009 ENAM XXXX1
0
Remerciements
0. Remerciements
Je tiens tout d’abord à remercier François Goulette, mon directeur de thèse, pour toute son
aide, sa disponibilité et le suivi qu’il m’a apportés le long de ma thèse, tout en me laissant une
grande autonomie.
Mes vifs remerciements vont aux membres de jury qui ont accepté de juger mes travaux. En
particulier, je remercie chaleureusement M. Pierre Grussenmeyer et M. Nicolas Paparoditis
d'avoir rapporté mon travail de thèse. Leurs remarques précieuses m’ont permis
d’approfondir des explications sur certaines parties et d’envisager mon travail sous un autre
angle. Je remercie également M. Laurent Trassoudaine de m'avoir fait l'honneur de présider
mon jury de thèse. Enfin, je remercie M. Jean-Emmanuel Deschaud d'avoir participé à mon
jury.
Aussi, je voudrais exprimer ma sincère gratitude envers toute l’équipe du CAOR pour la
bonne ambiance et l’accueil qui m’a été réservée. Notamment, je remercie Arnaud de la
Fortelle de m’avoir donné l’opportunité d’intégrer son laboratoire et de travailler sur cette
thèse.
Une pensée particulière va à mes collègues doctorants et post-doctorants, pour
l’encouragement et les formidables moments passés ensemble. Merci à vous tous d’avoir
partagé avec moi ces moments de travail et de détente. Une spéciale dédicace à Jorge,
Olivier, Martin, Fernando, Bruno, Zhuowei, Tao-Jin, Axel, Houssem, Victor, Anne-Sophie et
Fatin.
Cette thèse n'aurait pu aboutir sans le soutien financier de l’Ambassade de France en
Pologne, facilité par l’actuel adjoint à l’attaché pour la science et la technologie M. Nicolas
Frichot-Manoury. 3
0
Résumé
0. Résumé
Au cours de ces dernières décennies, le développement de Systèmes Mobiles de
Cartographie, soutenu par un progrès technologique important, est devenu plus proéminent.
Il a été stimulé par le besoin grandissant de collecte d’informations géographiques précises
sur l’environnement. Nous considérons, au sein de cette thèse, des solutions pour
l’acquisition des nuages de points mobiles de qualité topographique (précision
centimétrique). Il s’agit, dans cette tâche, de mettre au point des méthodes de qualification
des données, et d’en améliorer les erreurs systématiques par des techniques d’étalonnage et
de recalage adéquates.
Nous décrivons une nouvelle démarche d’évaluation de l’exactitude et/ou de la précision des
relevés laser mobiles. Celle-ci repose sur l’extraction et la comparaison des entités linéaires
de la scène urbaine. La distance moyenne calculée entre les segments appariés, étant la
distance modifiée de Hausdorff, sert à noter les nuages par rapport à des références
existantes. Pour l’extraction des arêtes, nous proposons une méthode de détection
d’intersections entre segments plans retrouvés via un algorithme de RANSAC enrichi d’une
analyse de composantes connexes. Nous envisageons également une démarche de correction
de relevés laser mobiles à travers un recalage rigide fondé, lui aussi, sur les éléments
linéaires. Enfin, nous étudions la pertinence des arêtes pour en déduire les paramètres de
l’étalonnage extrinsèque du système mobile. Nous testons nos méthodes sur des données
simulées et des données réelles acquises dans le cadre du projet TerraMobilita.
Mots clés : Nuage de points, Système Mobile de Cartographie, Exactitude, Précision,
Arête, Segmentation, Évaluation, RANSAC, Recalage, Étalonnage, Mise en correspondance 4
0
Abstract
1. Abstract
Over the past few decades, the development of Mobile Mapping Systems (MMS), supported
by significant technological progress, has become more prominent. It has been motivated by
the growing need for precise geographic information about the environment. In this thesis,
we consider approaches for the acquisition of mobile point clouds with topographic quality
(centimeter-level accuracy). The aim is to develop techniques for data quality assessment and
improvement. In particular, we eliminate the systematic errors inherent to an MMS data
using appropriate calibration and registration methods.
We describe a novel approach to assess the accuracy and/or the precision of mobile laser
point clouds. It is based on the extraction and comparison of line features detected within the
urban scene. The computed average distance between corresponding pairs of line segments,
taking advantage of a modified Hausdorff distance, is used to evaluate the MMS data with
respect to a reference data set. For edge extraction, we propose a method which relies on the
intersections between planes modelled via the RANSAC algorithm refined by an analysis of
connected components. We also consider an approach to correct point clouds using a linebased
rigid registration method. Finally, we study the use of edges for estimating the
boresight angles of a land-based mobile mapping system. We apply our methods to synthetic
data and to real data acquired as part of the TerraMobilita project.
Keywords: Point Cloud, Land-based mobile mapping system (MMS), Accuracy, Precision,
Edge, Segmentation, Assessment, RANSAC, Registration, Calibration, Matching 5
0
Table des matières
1. Introduction ........................................................................................................................... 7
1.1 Contexte général ......................................................................................................................... 7
1.1.1 Projet TerraMobilita ........................................................................................................................ 8
1.1.2 Motivations ......................................................................................................................................... 9
1.2 Apports de la thèse .................................................................................................................. 12
1.3 Plan du mémoire ...................................................................................................................... 13
2. Acquisition et qualification de relevés laser ................................................................. 15
2.1 Systèmes mobiles terrestres voués à la numérisation d’environnement ....................... 16
2.1.1 Principes fondamentaux d’un système mobile de cartographie ............................................. 18
2.1.2 Description du prototype L3D2 ................................................................................................... 21
2.1.3 Autres exemples de systèmes mobiles de cartographie ........................................................... 23
2.2 Sources de données expérimentales ..................................................................................... 24
2.3 Qualification de données ........................................................................................................ 28
2.3.1 Différents types d’erreurs en topographie.................................................................................. 28
2.3.2 Critères servant à décrire la qualité de nuages mobiles .......................................................... 31
2.3.3 État de l’art sur l’évaluation de l’exactitude de relevés laser mobiles .................................. 32
2.4 Expérimentation ...................................................................................................................... 35
3. Erreurs relatives au système MMS .................................................................................. 39
3.1 Analyse des erreurs liées à la cartographie mobile ........................................................... 40
3.1.1 Erreurs causées par le système de positionnement .................................................................. 40
3.1.2 Erreurs dues au capteur laser ....................................................................................................... 41
3.2 Amélioration des relevés laser mobiles ............................................................................... 43
3.2.1 Correction de la localisation en cours d’acquisition ................................................................. 43
3.2.2 Correction en post-traitement ...................................................................................................... 46
3.3 Étalonnage extrinsèque .......................................................................................................... 47
3.3.1 État de l’art sur l’étalonnage des excentricités linéaires ......................................................... 48
3.3.2 Étalonnage des systèmes embarqués de caméras ..................................................................... 49
3.3.3 Étalonnage des systèmes dotés de scanners .............................................................................. 51
3.4 Impact d’un faux étalonnage sur la géométrie du nuage ................................................. 54
4. Extraction d’arêtes ............................................................................................................. 57
4.1 Méthode générale - vue d’ensemble ..................................................................................... 58
4.2 État de l’art sur l’extraction d’arêtes ................................................................................... 59
4.3 Segmentation en éléments plans - état de l’art .................................................................. 61
4.3.1 Segmentation par croissance de surface (régions) .................................................................... 62
4.3.2 Transformée de Hough 3D ............................................................................................................ 63
4.3.3 Algorithme de RANSAC ................................................................................................................ 65
4.4 Contribution à la détection de plans .................................................................................... 676
4.4.1 Motivation ........................................................................................................................................ 68
4.4.2 Extraction séquentielle de plans .................................................................................................. 69
4.4.3 Connectivité de plans basée sur la théorie des graphes .......................................................... 71
4.5 Méthode proposée d’extraction d’arêtes ............................................................................. 77
4.6 Exemples de résultats .............................................................................................................. 82
4.6.1 Détection de plans ........................................................................................................................... 82
4.6.2 Extraction d’arêtes .......................................................................................................................... 84
5. Qualification à partir d’entités linéaires ........................................................................ 87
5.1 Problématique ........................................................................................................................... 87
5.1.1 Comment mesurer la distance entre deux segments dans l’espace ? ................................... 88
5.1.2 Contraintes ....................................................................................................................................... 90
5.2 Mesure de distance proposée ................................................................................................. 91
5.2.1 Distance de Hausdorff ..................................................................................................................... 92
5.2.2 Matrice de similarité ....................................................................................................................... 94
5.2.3 Mise en correspondance ................................................................................................................ 96
5.3 Résultats et évaluation ............................................................................................................ 99
5.3.1 Données expérimentales ................................................................................................................ 99
5.3.2 Évaluation de l’algorithme d’appariement ............................................................................... 100
5.3.3 Exactitude et précision................................................................................................................. 105
6. Recalage à partir d’entités linéaires ............................................................................. 107
6.1 Introduction ............................................................................................................................ 108
6.2 État de l’art du recalage rigide ............................................................................................ 109
6.2.1 Mise en correspondance automatique ....................................................................................... 109
6.2.2 Classification des méthodes existantes de recalage ............................................................... 111
6.2.3 Aperçu des méthodes basées sur les entités linéaires ............................................................ 113
6.3 Recalage basé-lignes : caractérisation des méthodes ..................................................... 115
6.4 Évaluation des méthodes présentées .................................................................................. 116
6.4.1 Données pour les expérimentations .......................................................................................... 117
6.4.2 Algorithmes implémentés ........................................................................................................... 118
6.4.3 Outils d’évaluation ........................................................................................................................ 118
6.4.4 Résultats – recalage des données bruitées ............................................................................... 119
6.4.5 Impact du bruit sur la distance de Hausdorff ........................................................................... 122
6.5 Approche proposée : RLMR-FMII2.................................................................................... 124
6.5.1 Recalage grossier – principe ....................................................................................................... 126
6.5.2 Évaluation avec données simulées ............................................................................................. 127
6.5.3 Tests sur données réelles ............................................................................................................ 130
7. Perspectives et conclusion ............................................................................................. 133
7.1 Conclusion ............................................................................................................................... 133
7.2 Perspectives et futurs travaux ............................................................................................. 136
7.2.1 Étalonnage extrinsèque du système : esquisse de solution .................................................. 136
Publications ............................................................................................................................... 139
Bibliographie ............................................................................................................................. 141
Annexe A .................................................................................................................................... 153
Annexe B .................................................................................................................................... 157
Annexe C .................................................................................................................................... 161
Annexe D .................................................................................................................................... 163
Annexe E .................................................................................................................................... 169 7
CHAPITRE 1
Introduction
Sommaire :
1. Introduction ........................................................................................................................... 7
1.1 Contexte général ......................................................................................................................... 7
1.1.1 Projet TerraMobilita ........................................................................................................................ 8
1.1.2 Motivations ......................................................................................................................................... 9
1.2 Apports de la thèse .................................................................................................................. 11
1.3 Plan du mémoire ...................................................................................................................... 12
1. Introduction
1.1 Contexte général
Depuis plusieurs siècles, les instruments essentiels de l’arpenteur et le savoir-faire de
l’homme permettaient de cartographier la surface de la Terre. La technologie employée n’a
cessé d’évoluer. Durant ce temps, nous notons quelques développements remarquables qui
ont révolutionné la façon de mesurer. À ce titre, nous pouvons mentionner des mesures au
moyen d’une lunette et d’une planchette (XVIIe siècle), celles réalisées à l’aide des
photographies (XIXe siècle), des théodolites (XXe siècle), jusqu’à l'apparition de
l'électronique et l’informatique qui ont donné naissance à de nouvelles techniques de levé et
de traitement des données telles que la station totale, le positionnement par satellites et le
télémètre laser. Cette évolution tire ainsi son origine dans les besoins sans cesse croissants
d’informations tridimensionnelles, rapides et précises sur notre environnement. Cependant,
nous observons que les méthodes dites conventionnelles dénotent quelques faiblesses,
lorsqu’elles sont employées pour numériser des objets de grande dimension (au niveau des
villes) ou de forme allongée (canyon urbain). La cartographie mobile par LiDAR (Light
Detection And Ranging), intégrant ordinairement trois sous-systèmes : le télémètre laser, le
système de navigation inertielle INS (Inertial Navigation System) et le système de
positionnement par satellites GNSS (Global Navigation Satellite System), tous installés à
l’intérieur d’une plate-forme mobile, a relégué les levés traditionnels par la vitesse de collecte
de données à une toute autre place. Elle a permis d’accéder à des endroits où la réalisation
des mesures serait pratiquement impossible avec d’autres méthodes. Dès lors, il est
envisageable de produire rapidement des cartes topographiques, numériques et précises du
terrain. Les systèmes aériens, installés dans un avion ou hélicoptère, sont capables de
produire une impressionnante quantité de points 3D géo-référencés. Néanmoins, leur 8
richesse en détail restant limitée, la technologie seule ne permet pas de reconstruire des
modèles 3D complets de ville. Les systèmes mobiles terrestres embarqués sur un camion
sont alors perçus comme un compromis entre le balayage laser fixe et celui aéroporté.
Toutefois, la rapidité des acquisitions présenterait peu d’intérêt si la qualité des données
collectées n’était pas garantie. Afin de s’adapter aux nouvelles réalités, les systèmes mobiles
de cartographie doivent être concurrentiels au regard des techniques conventionnelles. Or,
nous insistons sur le fait que l’exactitude des points laser soit équivalente aux levés
traditionnels, mais avec un temps d’acquisition et de traitement nettement plus rapide.
Pour cadrer avec cet objectif, c’est-à-dire de mettre au point des systèmes mobiles de qualité
topographique, il est primordial d’être en mesure de qualifier l’exactitude et la précision des
données collectées afin d’améliorer celles-ci sur les erreurs systématiques. Ces systèmes étant
récents, et bien que cette question soit essentielle, ces aspects ont encore été peu étudiés.
1.1.1 Projet TerraMobilita
Notre travail est effectué dans le cadre du projet TerraMobilita, dont le but est de mettre au
point de nouveaux processus automatiques de création et de mises à jour des cartes 3D de
voirie urbaine, avec une précision centimétrique. Pour ce faire, des données laser et images,
issues d’un système mobile de cartographie développé, entre autres, au sein du Centre de
Robotique CAOR de MINES ParisTech, sont employées. Il s’agit alors de construire des
modèles 3D complets de l’espace public afin de pouvoir étudier minutieusement
l’encombrement de divers éléments (stationnement, poubelles, etc.), de gérer l’entretien des
voiries, de produire des Plans de Déplacement Urbain (PDU) pour les besoins de circulations
douces (piéton, vélo, rollers, poussette, chaise roulante, etc.) et de diagnostics d’accessibilité
de la voirie pour les Personnes à Mobilité Réduite (PMR). L’objectif à atteindre est de
fournir des solutions pour l’acquisition, le traitement de données 3D et la production de
cartes, plus automatisées et moins coûteuses que les méthodes actuelles. Mais, on se doit de
garder à l’esprit la contrainte de relevé couvrant plusieurs km2 de l’espace public en un temps
court, et de volume importante de données à traiter.
Figure 1.1 Diagramme de décomposition fonctionnelle du projet TerraMobilita. CHAPITRE 1. Introduction
9
1.1.2 Motivations
Le projet TerraMobilita intègre plusieurs sous-projets, répertoriés principalement en trois
catégories dont nous présentons la décomposition fonctionnelle dans la Figure 1.1. La partie
concernant nos travaux est encadrée en rouge. Il s’agit dans la tâche de ce sous-projet (SP2)
de mettre au point des techniques de numérisation 3D de qualité topographique. Ainsi, le
dessein de cette thèse est de qualifier des données laser brutes acquises en environnement
urbain, mais aussi d’améliorer, par des méthodes adéquates de recalage et d’étalonnage, la
plate-forme mobile en terme de précision.
Depuis l’avènement de la technologie laser, les géomètres sont obligés de recueillir des
données de terrain selon une autre philosophie. Le relevé laser est acquis d’un point de vue
surfacique et non plus par un choix de points caractéristiques comme c’est le cas avec un
tachéomètre. Il est donc primordial de réfléchir, à quoi le terme « exactitude » doit se référer
– à un point particulier du nuage, ou à un élément extrait à partir de nuages tel qu’une
surface plane, une arête. Aussi, en dépit des gains de résolution et de précision des scanners
laser récents, la nature des nuages de points (bruit, densité) peut toujours gêner son
traitement (Figure 1.2). Cet état de fait devrait être pris en compte lors du choix des
méthodes appropriées.
Figure 1.2 Exemple de relevés laser acquis en 2009 au sein d’une même zone de test (rue
Soufflot à Paris) par : a) LARA3D ; b) Stéréopolis ; c) Scanner laser fixe (Riegl VZ-400)
Sachant que nous avons l’intention de fournir des solutions universelles, et ce quelle que soit
la densité des données laser collectées, nous choisissons de ne pas utiliser de points de
contrôle sélectionnés du nuage. Puisque l’identification précise des cibles, due aux
caractéristiques des données laser, peut être ardue, voire impossible, nos solutions ont été
conçues pour négliger l’influence de la densité des nuages de points sur le résultat de
reconstruction des primitives. Nous avons donc posé l’hypothèse suivante : Les entités
linéaires (dont la position est connue) extraites à partir de nuages de points de scènes urbaines
numérisées par un système de balayage laser mobile, permettent de quantifier et d’améliorer
l’exactitude des données produites. Dans ce travail, nous cherchons à démontrer la validité de 10
cette affirmation. Ainsi, nous vérifierons la pertinence des arêtes de pli, représentant les
intersections entre les segments plans principaux dans le nuage de points.
Les travaux décrits au sein de ce mémoire abordent le processus d’extraction d’arêtes, par
l’intermédiaire desquelles nous pourrons ensuite qualifier les données mobiles et développer
des outils servant, à leur tour, à améliorer la précision de celles-ci. Plusieurs axes de
recherche peuvent être imaginés, à partir desquels nous listons sur la (Figure 1.3) les
questions que nous allons aborder dans ce manuscrit. Quant à l’étalonnage intrinsèque des
scanners, cette tâche ne fait pas l’objet de cette thèse, car ses paramètres, étant fournis par le
constructeur, nous les considérons comme un modèle valable. Néanmoins, il faut se rendre à
l’évidence que des unités incorrectement étalonnées propageront aussi des erreurs entachant
le nuage de points.
Figure 1.3 Principaux axes de recherche
Les éléments linéaires sont omniprésents dans les scènes urbaines ce qui les rend de fait
comme une source riche en informations. D’après [Sappa et al., 2006] et [Alshawa, 2006],
les arêtes (les points de discontinuité) peuvent être regroupées en deux catégories (Figure
1.4) :
1) Les arêtes de pli (discontinuité de la dérivée première) qui apparaissent entre deux
surfaces d’orientation différente. Elles peuvent être retrouvées par l’intersection des
plans adjacents.
2) Les arêtes de pas (discontinuité d’ordre zéro) représentées par les points aux bords
des trous et des fenêtres. Elles sont dues à la limitation du scanner laser, aux
propriétés des surfaces numérisées pouvant absorber le signal émis, ou au manque de
visibilité scanner – objet causé par des artefacts.
Dans le premier cas, il est préférable, afin de minimiser le bruit, que les deux sous-nuages
soient acquis sous un angle direct. Ce critère n’est pas toujours aisé à satisfaire. Tout en
considérant les arêtes de pas, il faut garder à l’esprit que la nature hétérogène d’un nuage de
point ne permet pas de garantir que la ligne extraite corresponde fidèlement à l’arête réelle.
Nous préférons alors utiliser les droites sous forme d’intersections, soit des arêtes de pli,
puisqu’elles peuvent être facilement extraites et décrites, même si les nuages de points sont
peu denses et assez bruités. Dans ce manuscrit, le terme « arêtes » signifiera donc une droite
d’intersection (limitée) entre deux plans voisins. CHAPITRE 1. Introduction
11
Figure 1.4 Différents types d’arêtes
1.2 Apports de la thèse
La qualité des relevés laser est un facteur clef à prendre en considération. Elle comprend
plusieurs aspects, dont l’exactitude des mesures. Le principe consiste toujours à utiliser une
référence dont l’exactitude est plus élevée que celle des données étudiées. La plupart des
travaux actuels se réalisent, soit par une analyse de coordonnées de points de contrôle, soit
par une comparaison avec d’autres types de données (nuage de points, modèle de ville 3D).
Notre première contribution est de fournir une nouvelle approche de qualification de
l’exactitude et de la précision, fondée sur les arêtes. S’agissant de la référence, nous pouvons
imaginer des éléments linéaires mieux géopositionnés qu’ils soient 2D ou 3D, acquis lors du
levé topographique, ou bien encore extraits du nuage de points statique (relevé par scanner
laser fixe) ou du plan 2D (emprise de bâtis, bordure de trottoir, etc.) (Figure 1.5).
L’éloignement des deux sous-ensembles de segments, exprimés en tant que la distance de
Hausdorff adaptée aux lignes, représentera désormais une mesure de la qualité.
Figure 1.5 Arêtes de pli : a) Données de référence – nuage statique ; b) Relevé laser mobile 12
Notre deuxième contribution se veut de proposer une méthode automatique pour
l’appariement des entités linéaires en s’appuyant sur leur similitude. Nous combinons, entre
deux nuages, les lignes les plus semblables au sens du score attribué.
En troisième lieu, nous évaluons quelques approches existantes permettant le recalage rigide
basé sur des entités linéaires, en examinant leur pertinence vis-à-vis de notre problématique.
Notre but est plutôt d’affiner les différents nuages déjà géo-référencés pour corriger le
décalage (shift) survenu lors de l’estimation de trajectoire du véhicule par un système de
navigation. C’est pourquoi nous portons un regard critique sur les méthodes actuelles qui
paraissent peu robustes au bruit. Au vu de ces éléments, nous développons une chaîne
complète, comprenant un appariement et une estimation des paramètres de pose par des
segments de droite.
La quatrième contribution réside dans la mise en évidence des arêtes afin de pouvoir en
déduire l’étalonnage extrinsèque du système intégral, c’est-à-dire la matrice de rotation
(boresight matrix) et le bras de levier (lever-arm) entre le scanner laser et la centrale inertielle,
les deux étant embarqués sur une plate-forme terrestre. Nous démontrons que ces
paramètres, ayant un impact sur les positions et orientations des lignes extraites d’une scène
urbaine, sont observables, et que par conséquent, leurs valeurs numériques peuvent être
estimées. Nous esquissons, un concept d’approche, devant être encore approfondie et testée,
permettant un étalonnage extrinsèque du système doté d’un scanner à double balayage.
Concernant l’extraction des arêtes de pli, nous employons, dans nos recherches, une méthode
amenant à déterminer des droites d’intersection entre les plans détectés auparavant à l’aide
de l’algorithme de RANSAC. Ce dernier est enrichi d’une analyse de composantes connexes.
Nous proposons une solution alternative, étant notre dernier apport, pour vérifier la
connectivité des plans, celle-ci faisant appel aux éléments de la théorie des graphes.
Ces travaux ont donné lieu à plusieurs publications listées à la page 139 du manuscrit.
1.3 Plan du mémoire
Ce mémoire de thèse est structuré en trois parties principales : l’extraction d’arêtes, la
qualification des relevés laser et l’amélioration par consolidation. En souhaitant s’affranchir
des limitations du système mobile de cartographie et pour répondre aux exigences imposées
par le projet TerraMobilita, la qualité des données laser doit être étudiée et évaluée, pour
pouvoir par la suite proposer des améliorations utiles et efficientes. Chacun des chapitres,
s’articulant autour de ces objectifs, est accompagné par un état de l’art permettant de
s’inspirer des moyens et des méthodes mis en œuvre.
Nous caractérisons, dans un premier temps (Chapitre 2), le système mobile de cartographie.
Nous commençons par décrire le principe de son fonctionnement. Nous présentons des
données avec lesquelles nous travaillons, acquises dans le cadre du projet TerraMobilita ou
d’une autre manière. Nous définissons les notions d’erreurs telles que liées au levé
topographique, et introduisons les termes d’exactitude et de précision. En outre, nous testons
quelques méthodes simples permettant d’évaluer l’exactitude relative des relevés laser
mobiles.
Ensuite (Chapitre 3), nous listons non seulement les sources d’anomalies envisageables
contribuant à l’erreur globale du système, mais aussi nous présentons des solutions récentes
pour pallier à ces difficultés. Ainsi, différentes méthodes applicables en temps réel et en posttraitement
y compris l’étalonnage extrinsèque sont discutées. Les effets du défaut
d’étalonnage précis des excentricités angulaires (boresight angles) entre les capteurs de
perception et la centrale inertielle, sur la qualité géométrique des nuages de points, sont
aussi expliqués. CHAPITRE 1. Introduction
13
Notre point de départ est l’extraction des arêtes de pli à partir de relevés laser (Chapitre 4).
Nous mettons en avant une procédure de détection des droites d’intersections via des
segments plans retrouvés. Ensuite, nous nous penchons sur les algorithmes de
reconstruction automatique des primitives planes dans un nuage, étant donné un modèle
connu a priori, notamment sur l’estimateur de RANSAC. Nous nous imposons une contrainte
de connectivité entre les points formant chaque segment plan, et résolvons cette question
grâce à la théorie des graphes, plus précisément par la structuration propre du nuage et la
décomposition Dulmage-Mendelsohn.
Ensuite (Chapitre 5), nous proposons une approche de qualification des relevés laser basée
sur des entités linéaires. Celle-ci délivre une mesure de qualité en s’appuyant sur la distance
de Hausdorff modifiée. Pour déterminer sa valeur, nous développons un algorithme de mise
en correspondance visant à repérer les entités analogues ou très proches dans deux jeux de
données. Nous appliquons cette méthode aux lignes 3D extraites au sein d’une zone de test,
et présentons les résultats obtenus.
De surcroît (Chapitre 6), nous suggérons de corriger les données laser mobiles par un
recalage rigide bénéficiant des segments de droite. Après avoir détaillé les contraintes
apportées par une paire de primitives linéaires appariées, nous expliquons, et évaluons trois
algorithmes de calcul des poses, par minimisation de ces contraintes entre deux ensembles de
segments. Par la suite, nous avançons une solution complète aboutissant à raffiner, par
consolidation, des nuages de points distincts. Nous montrons l’efficacité de notre approche,
et présentons les résultats obtenus sur quelques jeux de données simulées et réelles acquises
dans le cadre du projet TerraMobilita.
Pour terminer (Chapitre 7), nous soumettons une brève discussion relative aux conclusions
et perspectives issues de ces recherches. Nous suggérons également une approche
d’étalonnage extrinsèque, conçue pour des scanners 3D. 15
CHAPITRE 2
Acquisition et qualification de relevés laser
Sommaire :
2. Acquisition et qualification de relevés laser ................................................................. 15
2.1 Systèmes mobiles terrestres voués à la numérisation d’environnement ....................... 16
2.1.1 Principes fondamentaux d’un système mobile de cartographie ............................................. 18
2.1.2 Description du prototype L3D2 ................................................................................................... 21
2.1.3 Autres exemples de systèmes mobiles de cartographie ........................................................... 23
2.2 Sources de données expérimentales ..................................................................................... 24
2.3 Qualification de données ........................................................................................................ 28
2.3.1 Différents types d’erreurs en topographie.................................................................................. 28
2.3.2 Critères servant à décrire la qualité de nuages mobiles .......................................................... 31
2.3.3 État de l’art sur l’évaluation de l’exactitude de relevés laser mobiles .................................. 32
2.4 Expérimentation ...................................................................................................................... 35
2. Acquisition et qualification de relevés laser
Dans ce premier chapitre, nous expliquons brièvement les principes fondamentaux d’un système mobile
MLS positionné avec une navigation hybride GNSS/INS. Nous présentons quelques récentes platesformes
de cartographie. Puis, nous décrivons le prototype L3D2 développé au CAOR de MINES
ParisTech ainsi que d’autres systèmes dont les données ont été employées pour tester des approches
proposées au cours de cette thèse.
Ensuite, nous caractérisons différentes sources d’erreurs ayant un impact sur la qualité des mesures.
Aussi, les notions complémentaires d’exactitude et de précision de données sont introduites afin
d’expliciter la nature de ces erreurs. Notre objectif principal est de nous pencher sur les méthodes
récentes traitant du problème de qualification. Notamment, l’exactitude de relevés laser mobiles,
mesurée par rapport à diverses références et éléments de contrôle, est étudiée. Un aperçu de techniques
existantes dévoile que la plupart d’entre elles souffraient du manque d’automatisation.
Finalement, deux approches sont implémentées puis testées pour vérifier l’exactitude relative du nuage
de points mobile. Les données référence sont les suivantes : 1) un ensemble de points aux coordonnées
connues et mesurées à l’aide d’un tachéomètre électronique ; 2) un nuage de points statique. Les points
faibles des techniques mises en œuvre sont notés.
Résumé 16
2.1 Systèmes mobiles terrestres voués à la numérisation
d’environnement
Soutenus par un progrès constant dans le génie informatique et le traitement automatique
d’informations, les systèmes mobiles basés sur LiDAR évoluent à un rythme rapide. Leur
développement comprend des modifications technologiques importantes en termes de
capteurs, d’architecture du système et de traitement de données. De nouveaux scanners laser
offrent une large plage de fonctionnement. Les fabricants ont considérablement avancé sur
l’ergonomie des appareils en les rendant plus légers et améliorant par conséquent leur
portabilité. Alors qu’un scanner laser nécessitait auparavant une équipe de deux personnes,
une seule suffit désormais pour effectuer un balayage laser fixe. D’après les études publiées
en 2013 par la société de recherche et de conseil américaine ARC Advisory Group [Evans,
2013], le marché des scanners laser 3D va continuer à pénétrer de nouveaux secteurs
doublant ainsi les ventes sur les quatre prochaines années. Avec cette variété de capteurs
laser, une baisse massive des prix et une simplification de leur utilisation, le nombre de
systèmes mobiles aussi bien que leurs applications possibles ne cessent de croître. Dès lors,
les plates-formes mobiles aériennes ALS (Airborne Laser Scanning) et terrestres MLS (Mobile
Laser Scanning) ainsi que les systèmes portatifs (Hand-Held Mobile Mapping) sont de plus en
plus utilisés, permettant une exploitation de ce matériel dans des secteurs qui autrefois
n’auraient pas envisagé leur utilisation. En outre, avec le développement des capteurs
miniaturisés LiDAR pouvant être embarqués sur les petits drones, la prolifération des
systèmes UAV (Unmanned Aerial Vehicle)/ UAS (Unmanned Aircraft System) est devenue une
réalité.
Figure 2.1 Exemple de systèmes commerciaux : a) Lynx Mobile Mapper M1 de Chung
Hsing Surveying ; b) Garmin Corporation de Taïwan ; c) Riegl VMX-250 de SGS ; d) MMS
série X de Mitsubishi Electric CHAPITRE 2. Acquisition et qualification de relevés laser
17
Les acquisitions par l’intermédiaire d’un système MLS peuvent être réalisées, selon la façon
de combiner les données provenant des capteurs, soit en mode dynamique (On Drive) soit
Stop&Go. Le premier mode permet de numériser l’environnement en mouvement, c’est-à-dire
les informations sont intégrées en temps réel pendant le déplacement de la plate-forme.
Lorsque la seconde technique est employée, le véhicule reste immobile et le scanner effectue
un scan complet tournant sur deux axes. Après avoir fini les mesures, le système se déplace à
une autre position.
Figure 2.2 Quelques récents et « légers » systèmes mobiles de cartographie : a) ZEB1 de
3DLaserMapping ; b) BackPack Mobile Mapping System [Liao et al., 2013] ; c) Trekkeur de
Google Street View ; d) Système mobile de l’Université de Floride (FLREC Geomatics) ;
e) VERDINO2 de l’Université La Laguna de Ténérife
Dans tous les cas, une source d’alimentation, un ordinateur portable et deux modules
produisent ses fonctionnalités basiques. À bord d’une plate-forme mobile, les capteurs de
positionnement (p.ex. un récepteur GNSS, une centrale inertielle INS, un odomètre DMI
(Distance Measurement Instrument)) et les capteurs d’imagerie (scanners laser, caméras), tous
en une configuration propre à chaque constructeur, doivent trouver leur place. En revanche,
du fait de la polyvalence des systèmes, ils peuvent être déployés sur les différents types de 18
véhicules y compris le camionnette, le véhicule 4x4, le quad, le chariot, le vélo, le bateau ou la
locomotive, comme l’illustrent la Figure 2.1 et la Figure 2.2.
2.1.1 Principes fondamentaux d’un système mobile de cartographie
Puisque chaque système mobile MMS (Mobile Mapping System) intègre de nombreux
capteurs, c’est une technologie de plus en plus complexe. Tout système est capable de fournir
des données correctes, pour autant que les conditions suivantes soient remplies :
1) Les capteurs entre eux-mêmes doivent être précisément synchronisés ;
2) Le système est tenu d’être rigide, c’est-à-dire qu’il n’existe aucun déplacement relatif
entre les composantes au cours de l’acquisition ;
3) La position et l’attitude de la plate-forme doivent être déterminées avec une
précision suffisante ;
4) Les excentricités linéaires et angulaires à savoir les translations et les rotations entre
les capteurs de perception et l’IMU (Inertial Measurement Unit) doivent être connues.
Chacun des capteurs mis en place travaille avec son propre système de référence. Le Tableau
2.1 caractérise les repères pouvant être définis lors du fonctionnement d’un système mobile,
qu’il soit terrestre ou aérien.
Tableau 2.1 Repères de référence
Sigle Nom du repère Description
s Repère du capteur
(Sensor Frame)
Repère laser/caméra.
b Repère body
(Body Frame)
Repère représenté par les axes du système de navigation inertielle.
L’origine de ce système est située au centre de l’IMU. Les angles de
rotation associés sont nommés : roulis (roll), tangage (pitch), lacet
(yaw).
l Repère véhicule
(Local Level Frame)
Ce cadre est généralement utilisé comme référence pour les angles
d’orientation mesurés par le système intégré GNSS/INS.
Autrement dit, c’est un repère local terrestre mobile. Son origine
peut être définie comme l’intersection de la verticale locale,
déterminée à partir de la position actuelle du capteur, avec
l’ellipsoïde terrestre global.
e Repère de l’objet
(ECEF Frame)
Système géodésique cartésien géocentré (attaché à la Terre).
L’origine de ce système est fixée au centre de la Terre. La direction
de l'axe OX est donnée par l'intersection de l’équateur terrestre et
par le méridien de Greenwich. Quant à l'axe OY, il se situe dans le
plan de l’équateur et de l’orthogonal à OX. Pour l'axe OZ, il
correspond à l'axe de rotation de la Terre. De ce fait, le résultat du
calcul de la trajectoire est principalement fourni dans ce repère sous
forme de coordonnées géocentriques ou de coordonnées
géographiques : λ - latitude, φ - longitude, h – hauteur ellipsoïdale.
M Repère terrain
(Mapping Frame)
Ce repère est employé pour exprimer les coordonnées des points
d’un nuage/image. Il peut être aussi représenté par une surface de
référence, par projection ainsi que par le système de référence
(national, reconnu dans le pays).
Afin de générer un nuage de points, dans un repère terrain, à partir de données brutes
enregistrées par les capteurs, trois changements successifs de repère sont nécessaires (Figure CHAPITRE 2. Acquisition et qualification de relevés laser
19
2.3). D’abord, le passage distance-angle (coordonnées sphériques) aux coordonnées
cartésiennes dans le repère lié au scanner laser (s) est effectué. Ensuite, nous passons aux
coordonnées dans le repère IMU (b) défini par la centrale inertielle pour réaliser la
transformation dans le repère terrain (M). Le premier passage se fait en prenant également
en compte les paramètres d’étalonnage intrinsèque. Quant au deuxième, il exige un
étalonnage extrinsèque permettant de déterminer les excentricités linéaires ݎ/௦
et angulaires
ܴ௦
entre les capteurs de perception et la centrale inertielle. Enfin, la dernière transformation
est envisageable grâce aux données ܴ
ெሺݐሻ mesurées par la centrale inertielle.
La notation employée pour décrire la transformation d’un repère à l’autre est la suivante : ܴ
symbolise la matrice de rotation, et ݎ la translation. En outre, l’indice désigne le capteur
concerné, tandis que l’exposant (indice supérieur) indique le repère dans lequel cette
grandeur est mesurée. Par exemple, ݎ/ீேேௌ
correspond au bras de levier entre l’unité
inertielle et le récepteur GNSS, exprimé dans le repère body (b).
La formulation mathématique de géo-référencement direct d’un système équipé de scanners
laser peut être exprimée comme suit :
ݎ
ெ ൌ ݎ/ீேௌௌ
ெ ሺݐሻ ܴ
ெሺݐሻ ∙ ൫ݎ/௦
ܴ௦
ܺ௦൯ (2.1)
où :
ேௌௌீ/ݎ
ெ ሺݐሻ : position mesurée par le système intégré GNSS/INS/DMI exprimée dans le
repère terrain (M) ;
ܴ
ெሺݐሻ : matrice de rotation du repère body (b) vers le repère terrain (M). Elle peut être
représentée par trois angles : la rotation autour de l’axe X - roulis (߮), celle autour de l’axe Y
– tangage (ߠ), et celle autour de l’axe Z – lacet (߰). Toutes les trois varient au cours du
temps (t) ;
La convention utilisée pour ces trois rotations par les centrales inertielles les plus courantes
(IXSEA et Applanix) est la convention roll-pitch-yaw (2.2) :
ܴ
ெሺݐሻ ൌ ܴሺ߰ሻ ∙ ܴሺߠሻ ∙ ܴሺ߮ሻ (2.2)
où :
ܴሺ߮ሻ ൌ 10 0
0 ܿݏሺ߮ሻ െݏ݅݊ሺ߮ሻ
0 ݏ݅݊ሺ߮ሻ ܿݏሺ߮ሻ
൩ ; ܴሺߠሻ ൌ ܿݏሺߠሻ 0 ݏ݅݊ሺߠሻ
0 10
െݏ݅݊ሺߠሻ 0 ܿݏሺߠሻ
൩ ;
(2.3)
ܴሺ߰ሻ ൌ ܿݏሺ߰ሻ െݏ݅݊ሺ߰ሻ 0
ݏ݅݊ሺ߰ሻ ܿݏሺ߰ሻ 0
0 01
൩ ;
ܺ௦ : Coordonnées de points laser mesurés dans le repère scanner (b). Pour un scanner de
profil 2D (balayage plan) SICK LMS 221, le passage des données brutes au repère scanner (s)
se réalise selon la formule (2.4)
ܺ௦ ൌ ݏߩ݅݊ሺ݅ߠ ߮ሻ
ሻ߮ ߠ݅ሺݏܿߩെ
1
൩ (2.4)
où ߩ :mesure de distance objet-scanner ; ߮ : angle de début du balayage ; ߠ : résolution du
scanner ; ݅ : index du faisceau laser. 20
௦/ݎ
: excentricité linéaire (bras de levier) entre le centre du scanner et le centre de la centrale
inertielle, exprimée dans le repère de l’IMU (b). Cette valeur est supposée constante au cours
du temps (t) ;
ܴ௦
: Matrice de rotation (matrice de boresight) du repère laser (s) vers le repère body (b). Ses
angles ݁, ݁, ݁ sont constants dans le temps (t).
Nonobstant, dans le cadre des systèmes mobiles dotés de caméras, la formule (2.1) garde sa
forme initiale, sauf que la composante ܺ௦ doit être remplacée par ݎߤ
. Le caractère ߤ
symbolise le facteur d’échelle, tandis que ݎ
contient des coordonnées d’images du point dans
le repère caméra.
Figure 2.3 Concept du géo-référencement direct
Selon [Ellum et El-Sheimy, 2002], la qualité des nuages de points dépendra alors, dans la
même mesure, de la précision de l’étalonnage du système et des erreurs de mesures laser. Ils
proposent, à cet effet, d’estimer l’influence des différents composants à travers la dérivation
du premier ordre de l’équation (2.1).
ݎߜ
ெ ൌ ݎߜ/ீேௌௌ
ெ ሺݐሻ Erreur de position GNSS (2.5)
ܴߜ
ெሺݐሻ൫ݎ/௦
ܴ௦
ܺ௦൯ Erreur d’attitude IMU
ܴ
ெሺݐሻߜܴ௦
ܺ௦
Erreur sur l’excentricité
angulaire (boresight)
ܴ
ெሺݐሻݎߜ/௦
Erreur sur l’excentricité
linéaire
ܴ
ெሺݐሻܴ
௦ߜܺ௦
Erreur de mesures du
scanner laser CHAPITRE 2. Acquisition et qualification de relevés laser
21
ݐߜ ቀݒሺݐሻ ߱ሺݐሻ൫ݎ/௦
ܴ௦
ܺ௦൯ቁ Erreur de synchronisation
Il en ressort que la multitude d’éléments associés au système mobile produit plusieurs types
d’erreurs affectant les résultats d’acquisitions. Le Chapitre 3 abordera leur origine, mais il
expliquera aussi la contribution de chacune des composantes au bilan global des erreurs du
système.
2.1.2 Description du prototype L3D2
Un système mobile est développé au sein du CAOR de MINES ParisTech depuis 2002. Il
s’agit du prototype L3D2. C’est une nouvelle plate-forme de numérisation 3D, basée sur les
mêmes principes, mais plus performante que son prédécesseur appelé LARA3D (LA Route
Automatisée). Le but de ce développement en cours est, dans le cadre du projet
TerraMobilita, de rivaliser avec la précision des techniques et des méthodes topographiques
conventionnelles (tachéométrie, GPS, nivellement direct, balayage laser terrestre).
Figure 2.4 Évolution du prototype LARA3D
Figure 2.5 Prototype L3D2 (version de mai 2012)
Un tel système est configuré pour accueillir de nombreux capteurs et il a donc dû subir,
depuis sa conception, plusieurs améliorations. La Figure 2.4 présente ce prototype dans la
version de 2002, 2008, et de 2010. Le système le plus récent avec lequel nous sommes en
train de travailler est représenté par la Figure 2.5. 22
Le système de positionnement de notre prototype est composé d’un récepteur GNSS Novatel
Flexpak6, d’une centrale inertielle PHINS d’IXSEA et d’un odomètre (DMI). Les capteurs de
perception sont constitués, optionnellement, de deux scanners laser SICK LMS 221 en
balayage plan vertical à droite et à gauche du véhicule, situés dos à dos. Chaque télémètre
laser, fonctionnant à temps de vol (le temps de parcours de l’onde entre son départ et son
retour sert à déduire une mesure de distance), numérise une zone de 180 degrés. À l’heure
actuelle, notre objectif principal est de remplacer ces scanners par un Velodyne HDL-32E
(High Definition LiDAR), contenant trente-deux fibres inclinées dans un plan vertical
tournant sur lui-même. Le laser Velodyne sera installé en arrière du véhicule et penché
d’environ 60°. Par conséquent, environ 700 000 de points par seconde seront mesurés. Nous
pouvons aussi ajouter, selon les usages, un ou plusieurs autres capteurs.
Le véhicule (Citroën Jumper) est également doté d’un ordinateur embarqué avec un logiciel
robuste RTMaps v.3.4.10 permettant la synchronisation, en temps réel, des données datées
provenant de différents capteurs. La trajectoire du véhicule est calculée grâce au filtrage de
Kalman, un outil puissant servant à établir la synergie entre trois capteurs de navigation :
GNSS, INS et DMI, puisqu’il peut tirer les avantages de ces trois systèmes de localisation
distincts. Une fois le véhicule localisé, c’est-à-dire sa position et sa rotation connue dans un
repère terrain, il est possible de géo-référencer toutes les données issues des capteurs de
perception. Pour ce faire, la datation des données de cartographie est synchronisée avec celle
de la localisation, avec si nécessaire une interpolation entre deux positions successives.
Figure 2.6 Diagramme RTMaps utilisé pour la génération des nuages de points :
a) Module de localisation ; b) Module de géo-référencement ; c) Données de
cartographie
La Figure 2.6 montre le diagramme RTMaps, utilisé lors de la génération des nuages de
points, comprenant trois composants principaux de traitement :
1) Module de localisation (parseur de la sortie de centrale) – package PhinsStandard
v.1.0 CHAPITRE 2. Acquisition et qualification de relevés laser
23
2) Module de géo-référencement (reconstruction du nuage de points) – package
GeoScanSickXsea v.1.0
3) Visualiseur de nuage de points – package PointscloudViewer v.1.0
Figure 2.7 Nuage de points acquis par LARA3D – LARA3Dv2010_Orsay
2.1.3 Autres exemples de systèmes mobiles de cartographie
Dans le cadre de notre étude (extraction d’arêtes, détection de plans, qualification, recalage
rigide), nous avons utilisé différents types de relevés laser.
Figure 2.8 Stéréopolis II, système mobile de l’IGN [Paparoditis et al., 2012]
La Figure 2.8 montre le système de cartographie mobile développé par l’IGN. Son système
actuel de vision comprend des capteurs de haute résolution, notamment un ensemble de dix
caméras HD assurant une couverture horizontale complète, deux scanners laser Riegl LMSQ120i
avec une ouverture de 80 degrés et un Velodyne®HDL-64E. La partie concernant la
navigation est constituée d’un système hybride composé de deux récepteurs GNSS, d’une
centrale inertielle Applanix (POSPac / POS LV V4), et d’un odomètre. L’architecture du
couplage de capteurs est de type lâche (tightly coupled). Pour plus d’informations relatives au
système Stéréopolis II, le lecteur pourra se référer à [Paparoditis et al., 2012]. 24
Figure 2.9 Exemple de nuages de points produits par le système Stéréopolis II –
Stereopolis2009_Soufflot
Le second système mobile de cartographie terrestre, dont les données ont été exploitées, est
un système commercial de Riegl VMX-250. Il est doté de deux scanners laser de Riegl VQ-
250, de quatre caméras et de compteurs très précis de positionnement (la spécificité plus
détaillée du système se retrouve sur le site web du Riegl).
Figure 2.10 Gabarit ferroviaire numérisé par Riegl VMX-250 – Riegl2012_Slomniki
2.2 Sources de données expérimentales
Relevé laser
Nous traitons, au sein de ce travail, des nuages de points produits par des systèmes terrestres
fixes ou mobiles notamment :
1) Les relevés laser mobiles collectés par LARA3D (version 2010) (Figure 2.7) ; CHAPITRE 2. Acquisition et qualification de relevés laser
25
2) Les relevés laser mobiles produits par Stéréopolis II de l’Institut Géographique
National (IGN) (Figure 2.9) ;
3) Les relevés laser mobiles acquis par un système mobile de Riegl VMX-250 (Figure
2.10) ;
4) Les relevés laser statiques obtenus par scanner fixe Trimble®GX, Timble®VX et Leica
C10.
Les nuages de points de haute résolution (statique) servent de référence à notre étude
comparative (qualification, recalage). Le premier nuage, nommé Orsay2009_statique, a été
fourni par Trimble 3D Scanning System lors des travaux réalisés dans le cadre du projet
TerraNumerica (projet antérieur à TerraMobilita). Les acquisitions ont été faites de façon
complémentaire avec une station spatiale Trimble®VX présentant les fonctionnalités du scan
3D et un scanner Trimble®GX. Vingt-six stations, dont 10 stations de GX, ont été placées
afin d’assurer une bonne couverture des deux façades du Musée d’Orsay (nord et ouest) et
d’éviter au maximum les masques. Enfin, la résolution finale du nuage a été limitée à 2cm.
Le second nuage Sulpice2013_statique (Figure 2.11), a été collecté lors d’une acquisition de
terrain que nous avons réalisée le 14 novembre 2012 en collaboration avec l’ENSG (École
Nationale des Sciences Géographiques). La Figure 2.12 représente le schéma des
emplacements de différentes stations Leica ScanStation C10, ainsi que des stations GNSS
stationnées avec un Trimble®R8. Des scans de très haute résolution (4mm) ont été acquis et
ensuite géo-référencés dans le système Lambert-93. Le logiciel LGO (Leica Geo Office) de
Leica a été choisi pour traiter les données GNSS. Les nuages de points, grâce aux
coordonnées obtenues, ont été géopositionnés à l’aide de Leica Cyclone 7.0.2. Au final, la
précision relative des relevés laser est de l’ordre de 3mm. Concernant la précision absolue,
nous estimons qu’il existe des erreurs d’environ 3cm confirmant que notre référence est
fiable. En conséquence, nous disposons d’une base abondante de données ayant des
caractéristiques complètement différentes (taux de bruit, densité, qualité).
Figure 2.11 Nuage de points consolidé - Sulpice2013_statique26
Figure 2.12 Plan de l’acquisition statique (Croisement des rues du Vieux-Colombier et
Madame, Paris)
Levé topographique
Un levé topographique Orsay2011_topo a été réalisé le 27 février 2011 avec une TCR 803 de
Leica (Figure 2.13b). Un cheminement ouvert comportant cinq stations intermédiaires,
situées à une distance d’au maximum 30m de la façade, a été mis en place (Figure 2.13a). Le
nombre et l’emplacement de points de canevas ont été planifiés de telle manière que le
tachéomètre émette un rayonnement pour lequel l’angle d’incidence ne soit pas inférieur à
60° (voir l’information sur l’angle d’incidence dans la section 3.1.2). Cette contrainte a été
choisie pour assurer une bonne qualité de données de référence, saisies en mode sans prisme
réflecteur. D'autre part, toutes les mesures ont été géo-référencées dans un système local
établi par deux stations (St4 et St5).
Figure 2.13 a) Cheminement réalisé lors du levé topographique ; b) TCR 803 de LeicaCHAPITRE 2. Acquisition et qualification de relevés laser
27
Au total, le levé opéré dans une seule position du cercle a contenu 344 points dont 297
appartenant à une coupe horizontale prise environ 7.2m au-dessus du sol (Figure 2.14). Le
transfert des données depuis la station totale a été fait sous LGO, tandis que le traitement
(décodage, calcul de coordonnées, etc.) à l’aide du logiciel WinKalk 3.78. Toutes ces mesures
constituent une référence pour les analyses présentées dans la poursuite des travaux.
Figure 2.14 Répartition de points de contrôle (en jaune), et la coupe horizontale (en vert)
Les points de contrôle à viser ont été représentés par des détails architecturaux tels que les
coins de bâtiments, les arêtes de piliers, les intersections d’éléments caractéristiques. Les
piquets se trouvent alors sur un coin convexe ou concave dont la mesure à l’aide d’un
télémètre laser peut poser certains problèmes. Nous obtenons, suivant les cas, un arrondi ou
un congé entre deux surfaces voisines, tous deux dus à la généralisation de l’information lors
de la réception du signal de retour [Klimkowska et Wrobel, 2006]. La Figure 2.15 illustre la
situation typique rencontrée pendant le mesurage d’une bordure (edge effect) - les
coordonnées obtenues ne correspondront quasiment jamais à la vraie position d’arête. Aussi,
la distance mesurée entre l’emplacement actuel et une cible s’écarte de la valeur réelle.
Figure 2.15 Résultats de mesure : a) Coin concave ; b) Coin convexe
Étant donné que l’empreinte laser possède une certaine taille dépendant de l’ouverture du
dispositif, de la longueur de faisceau laser, mais aussi de la divergence de celui-ci, elle ne se
matérialisera jamais sous la forme d’un point. En réalité, un laser produit une lumière qui va
diverger de son origine. La cible balayée renvoie ainsi des retours multiples - une partie du
signal proviendra de l’objet lui-même et une autre sera rétrodiffusée ; selon le cas, par une
surface adjacente ou par une autre située derrière (Figure 2.16). Cependant, cette énergie ne 28
sera jamais retournée s’il n’y a pas d’autres éléments à portée du scanner. En fin de compte,
la mesure finale de la distance sera toujours la moyenne des énergies retournées. L’erreur de
mesures peut donc varier de quelques millimètres voire même de quelques centimètres. En ce
qui concerne la mesure de coins concaves, le problème est moins complexe. La distance
obtenue sera toujours plus petite que la valeur réelle. Quelle que soit l’origine de ces
imprécisions, les cibles doivent être choisies avec soin.
Figure 2.16 Empreinte du rayon laser sur les surfaces voisines
2.3 Qualification de données
La qualité de données quelconques est un facteur clef à prendre en compte. À cet égard, la
qualification devrait se fonder sur des procédures claires et précises. Son objectif se veut de
satisfaire des besoins bien déterminés : ceux des fournisseurs (entre autres les topographes)
étant obligés de valider des mesures, ainsi que ceux des futurs utilisateurs devant être au fait
pour exploiter au mieux ces données. La qualification n'est pas un élément négligeable, car
elle atteste que les données acquises permettront de créer un produit final avec une qualité
attendue. Nous observons qu'il existe deux approches traitant de cette question [Boulaassal,
2010], [Boudet, 2007]. L’une, nommée évaluation qualitative, consiste à effectuer une
analyse visuelle et à noter la qualité avec un sens sémantique, en lui attribuant des
coefficients (par exemple : faux, approché ou correct). Elle permet de constater la présence de
fautes (erreurs grossières). La seconde, quantitative, se réalise ultérieurement avec un calcul
d’indices de qualité. Elle fournit une statistique descriptive, son but étant par définition, de
décrire par des statistiques (la moyenne, l’écart, etc.) des données.
Dans cette partie, nous nous intéresserons à l’évaluation de la qualité, en termes d’exactitude
et de précision, des relevés laser acquis par un système mobile. Après avoir précisément
défini ce qui est entendu par les notions susmentionnées (2.3.2), nous examinerons l’état de
l’art des moyens actuellement disponibles pour les mesurer (2.3.3). Aussi, on se devra
d'évoquer les autres critères complétant les informations sur la qualité de nuages de points.
2.3.1 Différents types d’erreurs en topographie
Divers types de levés topographiques exigent, certes, des niveaux de précision différents.
Connaître l’exactitude des résultats nécessite une bonne maîtrise des appareils utilisés, la CHAPITRE 2. Acquisition et qualification de relevés laser
29
prise en considération de cas particuliers et de situations défavorables, mais aussi, un savoirfaire
pour les compenser. Les observations peuvent être entachées par :
1) des erreurs parasites ou des fautes – étant des incertitudes grossières dues à des
inadvertances opératoires, un oubli ou bien encore un défaut de réglage de l’appareil.
La faute est aisément repérable donc, peut et doit être supprimée. Pour déceler
d'éventuelles fautes susceptibles d'être commises, des mesures de contrôles doivent
être réalisées.
2) des erreurs systématiques, parfois appelées biais, étant une composante de l’erreur de
mesure qui, lors des mesurages répétés, demeure constante en valeur absolue et en
signe ou varie de façon prévisible. Ces erreurs sont cumulatives par voie d’addition et
dues souvent aux imprécisions de l’instrument (qualité des composants, défauts
d’étalonnage, temps de réponse, réglage de zéro, etc.) et aux contraintes de sa mise
en œuvre. Les erreurs systématiques influencent l’exactitude (ou la justesse) d’une
mesure et ne peuvent être atténuées par une augmentation du nombre de mesurages.
La distribution des mesures sera, par la suite, déplacée de la valeur réelle.
3) des erreurs accidentelles (aléatoires) – les plus fréquentes, se produisant de manière
aléatoire, en valeur et en signe, même quand les conditions de mesures sont
identiques. Or, d’une mesure à l’autre, la valeur obtenue est surévaluée ou sous-
évaluée. Les origines sont multiples : ce peut être dû à l’opérateur (par exemple :
l’exactitude avec laquelle l’œil observe), à la qualité inévitablement limitée de nos
instruments, mais aussi au milieu en lui-même (température ambiante, humidité,
etc.). Ces erreurs subsisteront et entacheront la grandeur que l’on recherche et
provoqueront une dispersion des résultats. Elles affectent essentiellement la
précision des mesures.
Dès que nous commençons à envisager la qualité des données collectées, nous souhaitons
l’interpréter comme la confiance accordée en vue de la performance des techniques mises en
œuvre et de la capacité des appareils utilisés. Partant de cette connaissance antérieure à
l’acquisition, on peut en déduire une inexactitude théorique (a priori) entachant les données.
Une fois l’acquisition achevée, des écarts empiriques (a posteriori) par rapport à une valeur
attendue ou bien encore des propriétés de distributions des mesurages (ex. la moyenne,
l’écart-type) peuvent être calculés. Ces valeurs servent à décrire l’exactitude et la précision.
Ces deux qualificatifs, par ailleurs, sont quelquefois confondus ce qui amène à les considérer
improprement comme des synonymes. Pour aller plus loin dans notre propos, on se doit de
clarifier ces deux notions en les définissant, puisqu’elles se réfèrent à deux propriétés bien
distinctes.
La précision ou la fidélité (precision) des données est l’étroitesse de l’accord entre les valeurs
mesurées ݉ෞప obtenues par des acquisitions répétées de même grandeur. Elle est quantifiable à
partir d’un seul jeu de données et permet de définir la dispersion des résultats (l’erreur
apparente ܸ). Selon les conditions, la précision peut être représentée par la répétabilité
(repeatability) ou la reproductibilité (reproducibility) d’une mesure. La répétabilité,
contrairement à la reproductibilité, est définie à travers des mesurages effectués par une même
personne, dans un même lieu, avec le même appareil et dans un laps de temps très court. En
revanche, dans le cas des nuages de points, il est quasiment impossible de remesurer un point
plusieurs fois. En effet, une estimation de la précision des données demeure complexe.
L’exactitude (accuracy) représente une concordance entre une valeur mesurée et une autre
considérée conventionnellement comme exacte. Elle n’est quantifiable que par rapport à une
véritable référence extérieure aux mesures. Son évaluation est toujours délicate puisque l’on
ne dispose jamais de valeur réelle ܯ.
Au-delà, pour des mesures multiples, la notion de justesse de mesure (trueness) définie par un
écart du barycentre de l’ensemble de mesures (moyenne arithmétique) par rapport à la valeur 30
de référence ܯ, est également employée. C’est ainsi l’erreur vraie de la moyenne
arithmétique.
Afin de caractériser la précision d’opérations de mesures, nous pouvons introduire l’Erreur
Moyenne Arithmétique ܣܯܧ correspondant à la moyenne des résidus ݁ pris en valeur
absolue, soit :
ܣܯܧ ൌ ∑ |݁| ே
ୀଵ
ܰ
(2.6)
On note alors ݁ ൌ ݉ෞെܯ ప l’erreur vraie d’une mesure (écart de la valeur observée d’une des
mesures ݉ෞ݅ par rapport à la valeur vraie ܯ), tandis que ܸ ൌ ݉ෞെܯ ప ഥ l’erreur apparente d’une
mesure (écart de la valeur observée ݉ෞ݅ par rapport à la moyenne arithmétique ܯഥ). Sur cette
base, nous définissons le carré moyen des erreurs, soit l’Erreur Quadratique Moyenne ܧܳܯ
(MSE pour Mean Square Error). C’est la moyenne arithmétique des carrés des écarts ݁ entre
les prévisions ܯ et les observations ݉ෞ݅, souvent utilisée pour comparer plusieurs estimateurs,
notamment lorsque l’un d’eux est biaisé. Nous la définissons via la formule mathématique :
ൌ ඨ1 ܯܳܧ
ܰ ሺ݁ሻଶ
ே
ୀଵ
(2.7)
Puisque la définition (2.7) exige que les erreurs vraies soient connues ce qui n’est
pratiquement jamais le cas, nous utilisons généralement à la place l’écart-type ߪ de la
distribution des valeurs de ݉ෞ݅ défini par :
σ ൌ ඨ∑ ܸ
ே ଶ
ୀଵ
ܰെ1
(2.8)
C’est la racine carré du quotient de la somme des carrées des erreurs ܸ par le nombre ܰ de
ces erreurs ou résidus, moins 1.
La Figure 2.17 contient une représentation classique des concepts de tir sur cible,
envisageant quatre configurations possibles. Elle illustre les deux termes évoqués qui seront
dorénavant utilisés dans ce mémoire pour quantifier les relevés laser mobiles. Nous
remarquons que les données peuvent être exactes sans être précises (Figure 2.17c) et
inversement (Figure 2.17b). Or, l’exactitude et la précision d’un résultat se vérifient toujours
séparément.
Figure 2.17 Exactitude vs. Précision d’une série de mesurages CHAPITRE 2. Acquisition et qualification de relevés laser
31
Les définitions ci-dessus s’inspirent du VIM (Vocabulaire International de Métrologie) [JCGM
200:2012] disponible sur le site internet du Bureau International des Poids et Mesures
(BIPM) et sont semblables à celles introduites par des éditoriaux de [Brabant, 2011]
[Newby, 2011] et [Hullo, 2013].
2.3.2 Critères servant à décrire la qualité de nuages mobiles
La problématique de l’évaluation de données laser n’étant pas triviale, nous pouvons définir
plusieurs critères fournissant des informations sur la qualité des données. Pour leur part
[Cahalane et al., 2010], affirment que la performance du système de cartographie mobile doit
être étudiée en termes de résolution, d’exactitude et de répétabilité des données acquises.
Quant à la résolution, elle se calcule en prenant en compte la répartition des points, à savoir
l’espacement entre les profils voisins, mais aussi celui entre les points appartenant au même
profil. Par le terme de répétabilité, nous exigeons que le système mobile soit capable de
produire des données de même qualité lors de chaque acquisition. Mais, il faut garder à
l’esprit que le fonctionnement du système mobile dépend fortement de la qualité du signal
GNSS. Par conséquent, le balayage effectué quelque temps après pourra être exposé aux
différentes configurations des satellites.
Une procédure semblable de validation est développée par [Yoo et al., 2010], effectuant une
analyse des relevés laser mobiles. Trois critères de qualité notamment la précision, la
résolution et la complétude sont parallèlement étudiés. Toutes ces notions servent à
attribuer une note unique synthétisant l’évaluation globale des nuages mobiles. La résolution
permet de vérifier la répartition spatiale des points et donc le niveau de détail dans la scène
numérisée. Il est évident que si les scanners fonctionnent à résolution angulaire fixe,
l’emplacement entre les points varie fortement en fonction de la distance scanner-objet. Les
zones très éloignées de la plate-forme seront donc acquises avec une résolution sousdensifiée
et celles plus proches avec une résolution sur-densifiée. Cependant, dans une
configuration optimale, les points doivent être répartis de manière homogène. Afin de bien
étudier cette problématique, deux termes sont introduits : la densité locale et la densité
moyenne. Tous deux représentent le nombre de points par m2. La densité locale (2.9)
associée à chaque point se calcule pour un voisinage local, étant incluse dans le rayon d’une
sphère (r). La distribution des points dans le nuage, d’après ce critère, sera visualisée par un
outil statistique appelé « boîtes à moustache ». Enfin, nous complétons ultérieurement les
analyses avec la densité moyenne (2.10).
݊ ൌ ܦ
ଶݎߨ
(2.9)
ܦഥ ൌ 1
்݊
ܦ
ୀଵ
(2.10)
où :
݊ – nombre de points dans le voisinage du point i
்݊ – nombre total de points dans le nuage
S'appuyant sur les calculs effectués, le Taux de Bonne Résolution (TBR) est aussi déterminé
selon l’équation (2.11). Celui-ci représente le pourcentage de zones ayant une densité
satisfaisante.
ൌ ܴܤܶ
݊
்݊
(2.11)
où :
n – nombre de points pour lesquels la densité est supérieure à la densité minimale souhaitée. 32
Le dernier critère, la complétude, interprète et mesure la surface totale couverte par les
points, puisque les acquisitions mobiles souffrent de problèmes d’occultations et de manque
de visibilité.
[Mano et al., 2012] développent un autre processus de qualification des nuages de points
mobiles. Ils regroupent quatre indicateurs décrivant : 1) la qualité du trajet dérivée à partir
du nombre de satellites visibles et du coefficient DOP ; 2) la précision ; 3) l’exactitude
absolue ; et 4) l’exactitude relative. Sachant que le système étudié est équipé de quatre
scanners laser, déployés dans une configuration spécifique, la vérification de la précision des
données consiste à comparer différents nuages de points captés indépendamment lors d’un
seul passage. L’information redondante entre les parties se chevauchant partiellement sert à
délivrer une note. Quant à l’exactitude absolue, elle peut être déterminée à l’aide des points
de contrôle mesurés au préalable. Le dernier critère, l’exactitude relative, suit le même
principe que l’étude de précision. La seule différence réside dans le fait que l’acquisition des
données est répétée au bout d’un certain temps. En assimilant les termes introduits dans la
section précédente, nous pouvons constater que cette notion correspond à la définition de
reproductibilité de données.
Tous les paramètres de qualité susnommés semblent être pertinents pour les besoins
d’évaluation des nuages de points. Néanmoins, comme le rapporte [Williams, 2012], le
comité d’ASPRS (American Society of Photogrammetry and Remote Sensing) recommande de
standardiser les procédures existantes, et de quantifier les relevés laser à l’aide seulement de
deux paramètres : la résolution et l’exactitude. Ces facteurs amènent à attribuer une note
commune (rating), tout en maintenant une distinction sur neuf niveaux de qualité (Figure
2.18). Une telle solution permettra aux utilisateurs de choisir des données satisfaisant leurs
exigences. Alors, la note 3A attribuée signifiera la densité élevée par-devers l’exactitude
faible, et cetera. Toutefois, ces données peuvent être suffisantes pour certaines applications
telles que la vérification du nombre de poteaux le long de la rue. Néanmoins, l’auteur ne
précise pas les valeurs numériques de résolution et d’exactitude prédéterminant les notes.
Figure 2.18 Niveaux de qualité définis ralliant l’exactitude et la résolution de données
2.3.3 État de l’art sur l’évaluation de l’exactitude de relevés laser mobiles
L’évaluation de l’exactitude et/ou de la précision de relevés lasers mobiles occupe une place
particulière dans les recherches actuelles. Nombreux sont les ouvrages décrivant différents
types de travaux à ce sujet. L’exactitude peut être considérée comme absolue et relative.
L’exactitude absolue est une estimation de la qualité réalisée par rapport à la véritable position
dans un cadre de référence terrestre. Elle répond à cette interrogation : Comment un nuage
de point est positionné dans un référentiel. Cependant, l’exactitude relative estime la qualité de CHAPITRE 2. Acquisition et qualification de relevés laser
33
la mesure d’un vecteur entre deux points. En la mesurant, nous recherchons l'exactitude des
points les uns par rapport aux autres, ou bien encore par rapport à l’origine du scanner laser.
Dans toutes les approches que nous allons aborder, l’exactitude sera déterminée par rapport
à des données plus précises que celles étudiées. Une référence de grande qualité, saisie par
opérateur et géo-référencée, est ordinairement employée. Celle-ci peut être établie lors d’un
levé topographique (tachéométrie, GPS), une acquisition laser statique, ou bien encore
extraite de différentes bases de données telles que : des orthoimages, des modèles de ville 3D,
des nuages LiDAR aéroporté, des bases de données topographiques ou des plans cadastraux
2D. La plupart des méthodes aboutissent à une comparaison de coordonnées de points de
contrôle homologues, distinguables dans les données étudiées. Ces éléments sont
fréquemment sélectionnés comme : 1) des sommets de marquages au sol [Gandofi et al.,
2008], [Barber et al., 2008], [Guan et al., 2013] ; 2) des poteaux et des lampadaires [Yoo,
2010], [Ridene, 2010] ; 3) des coins de bâtiments et de trottoirs [Kaartinen et al., 2012],
[Guan et al., 2013] , 4) des détails architecturaux [Poreba et Goulette, 2012] ; 5) des mires
3D spécialement conçues [Feng et al., 2008]. Certes, une telle approche souffre d’incertitude
quant aux points sélectionnés, puisque nous ne pouvons quasiment jamais indiquer deux
points homologues dans les nuages de points distincts. Ceci est causé par la nature des
données laser mobiles qui sont hétérogènes et anisotropes (leur distribution varie suivant la
direction). Ainsi, plus la densité des nuages de points est faible, plus la capacité de
sélectionner de points appropriés est limitée. Même si des cibles sont employées, il n’existe
aucune certitude que le faisceau laser balayera leurs centres. En outre, la qualité de chacun
des points laser dépend fortement de la réflectance de matériaux et de l’orientation d’objet
vers le scanner. La vérification de l’exactitude fait alors face à un certain nombre de défis.
Comme il a été explicité par [Barber et al., 2008] et [Williams, 2012], l’évaluation de
l’exactitude altimétrique est assez aisée par rapport à celle planimétrique. Ceci est dû au fait
que le calcul du biais planimétrique, contrairement à celui altimétrique, exige souvent
l’identification manuelle de points correspondants qui est ardue, malgré l’utilisation
d’informations supplémentaires telles que l’intensité (Figure 2.19).
Figure 2.19 Incertitude portant sur la mesure de l'exactitude : a) estimation de l'exactitude
verticale ; b) estimation de l'exactitude horizontale (Illustration reproduite à partir de
[Williams, 2012])
C’est pourquoi [Ray et Graham, 2008] proposent une méthode d’analyse d’exactitude
planimétrique fondée sur les primitives linéaires (des bords de marquages au sol) extraites, à
la fois, depuis des données LiDAR et des orthoimages. Mais, une telle approche paraît être
inappropriée pour évaluer les nuages de points captés par une plate-forme terrestre,
puisqu’elle est censée fournir des données de précision et de résolution beaucoup plus élevée.
Concernant l’erreur verticale, d’après [Kaartinen et al., 2012], elle peut être calculée à l’aide
d’un modèle numérique de terrain (MNT). 34
Un autre point de vue est mis en avant par [Haala et al., 2008] qui choisissent comme
référence des modèles de bâti 3D à partir desquels les surfaces planes seront isolées de
manière semi-automatique. Il existe aussi d’autres méthodes indépendantes d’extraction de
points de contrôle. Elles amènent à comparer des relevés laser entre eux. [Alshawa 2010]
confrontent les données mobiles avec les nuages statiques. Dans la même veine [Mano et al.,
2012] appliquent un algorithme nommé LS3D (Least Squares 3D) de [Gruen et Akca, 2005]
afin d’évaluer la précision et l’exactitude relative. Dès lors, le recalage rigide basé sur
différentes formes extraites depuis les données laser est réalisé. À titre d’explication, nous
observons que les trois dernières techniques considèrent l’écart résiduel calculé entre deux
nuages de points comme une mesure de qualité.
[Feng et al., 2008] élaborent une méthode comprenant l’évaluation qualitative et
quantitative des données laser. Dans un premier temps, un contrôle visuel de l’angle entre
les façades est effectué. En admettant que les murs adjacents d’un bâtiment forment un angle
droit, la qualité est notée comme faible ou élevée en fonction de la déviation observée. Plus le
nuage est déformé, plus la valeur d’angle est loin de 90°. La dernière étape vise à vérifier
l’exactitude absolue au sein d’une zone de test. À cet effet, des cibles 3D conçues pour
faciliter l’extraction de détails caractéristiques sont employées. L’exactitude est déterminée
par comparaison de coordonnées de cibles correspondantes : celles mesurées avec une station
totale avec celles extraites dans les données laser.
[Alshawa, 2010] propose une évaluation de l’exactitude par rapport à différentes références.
D’abord, un profil horizontal extrait au niveau du sol du relevé laser est comparé avec
l’emprise des bâtiments du plan CAO (plan cadastral 2D). Une autre solution envisagée
consiste à rapprocher, par recalage basé sur l’ICP (Iterative Closest Point), les données laser et
à calculer la distance résiduelle – l’indice de qualité. Deux approches possibles sont
suggérées : la comparaison mobile-statique mais aussi celle mobile-aéroporté. Néanmoins, il
est à noter que l’utilisation des données LiDAR comme référence soulève des préoccupations
bien qu’un avion soit équipé d'une centrale inertielle de haut de gamme et qu'une réception
du signal GNSS ne souffre pas trop de masques. Un nuage LiDAR, ayant souvent une
densité moins élevée, est censé avoir une précision relativement supérieure que des nuages
mobiles terrestres. Pourtant, en raison du faible recouvrement et d'une densité moins
importante de données laser aéroportées, une comparaison basée sur le calcul de distances
mutuelles est délicate à entreprendre. Afin de surmonter cet obstacle, il est possible d’ajouter
des plans aux sous-nuages afin de déterminer l’écart. Au contraire, quand on utilise un nuage
acquis en mode fixe, il est possible de calculer directement des écarts sous forme de distances
entre les points du nuage mobile et le maillage généré.
Une méthode tout à fait différente est développée par [Williams, 2012]. Elle aboutit à une
comparaison des coupes verticales 2D extraites depuis un nuage de points avec celles
mesurées à l’aide d’une station totale. Un carrefour a été choisi comme zone de test et quatre
profils en travers ont été disposés, un sur chaque aile du croisement. Puis des points
équidistants situés le long des profils ont été mesurés. Cette référence a permis de calculer et
de comparer des pentes correspondantes.
L’évaluation de l'exactitude étant fastidieuse, nous pouvons saisir pourquoi, grâce à quelques
approches mises en œuvre par les chercheurs cités ci-dessous. Il est indéniable que la
solution la plus répandue consiste à qualifier, sitôt après une acquisition, les relevés laser
mobiles. Néanmoins, la précision théorique est aussi abordée pour déterminer, par
l’intermédiaire des incertitudes, le facteur a priori affectant les nuages de points [Barber et
al., 2008], [Shaer, 2010], [Alshawa, 2010] et [Bitenc et al., 2011]. Puisque les erreurs
élémentaires de capteurs interagissent entre elles, la valeur finale suit alors la formule de
propagation d'erreurs. Comme nous l’observons dans le Chapitre 3 les sources d’erreurs liées
au fonctionnement d’un système mobile sont multiples. [Barber et al., 2008] concluent CHAPITRE 2. Acquisition et qualification de relevés laser
35
qu’elles proviennent principalement de la qualité du positionnement, mais aussi de la justesse
des scanners laser et enfin, de manière moins importante, de la synchronisation de ces
différentes données. Quant au récepteur GNSS, chaque point de la trajectoire reçoit une
estimation de qualité, caractérisant sa contribution à une erreur totale du système.
Concernant les scanners laser, à défaut de spécifications techniques suffisantes, fournies par
le constructeur et décrivant les éventuelles erreurs, il nous appartient d’opérer un
étalonnage. Dans le but de prévoir la précision des nuages de points LiDAR, un modèle de
propagation d’erreur a été proposé par [Shaer, 2010]. Il y dévoile quatorze états d’erreurs, à
savoir :
1) six erreurs de navigation – trois erreurs de positionnement en absolu, ainsi que trois
erreurs d’orientation, toutes estimées lors de la fusion GNSS/INS ;
2) six erreurs d’étalonnage – erreurs résiduelles liées à l’étalonnage de l’ensemble du
système dont trois décrivent les bras de levier et d’autres étant associées aux angles
boresight ;
3) deux erreurs internes de capteur laser – la précision des mesures d’angles et de
distances.
La transmission de toutes ces imprécisions suit la formule de géo-référencement direct (2.1)
afin de dériver la précision finale. Comme le souligne [Shaer, 2010], les études peuvent être
également complétées par une analyse d’influence de la géométrie du balayage sur la qualité
des nuages de points. Pour ce faire, nous prenons en compte deux critères : l’angle
d’incidence et la taille de l’empreinte laser. Étant donné que la qualité des relevés laser est
une accumulation d’erreurs aléatoires et systématiques propagées par le modèle de géoréférencement
et celles dues à l’analyse de géométrie, toutes ces composantes contribueront
à la valeur globale d’erreur. Cette constatation nous permet d’attribuer un indicateur de
qualité unique (nommé q-indicateur) à chaque point laser. La qualification des nuages de
points peut être désormais effectuée automatiquement durant l’acquisition (à la volée).
[Bitenc et al., 2011] cherchent, eux aussi, à vérifier la précision du système de cartographie
mobile terrestre. Leur démarche se traduit par une absence de données pouvant servir de
référence fiable, car les études ont été orientées vers la numérisation de dunes sans cesse
mouvantes. La procédure mise en œuvre, étant similaire à celle de [Shaer, 2010], fait appel
au modèle de géo-référencement direct. Nonobstant, elle se limite, telle que présentée, à
l’évaluation de la précision horizontale. Pareillement, les erreurs systématiques du système
ont été prises en compte ainsi que la géométrie de balayage performé.
2.4 Expérimentation
Comme nous venons de le constater, toutes les méthodes estimant l'exactitude, observées
dans la section précédente, visent à acquérir une référence plus précise que les données
étudiées. Cette solution prend du temps et semble être coûteuse, nécessitant aussi la
recherche de cibles suffisamment bien représentatives. Nous avons relevé ce défi en décidant
d’examiner la pertinence de quelques approches similaires à celles relevées dans la
littérature. Pour les besoins de nos analyses, nous avons voulu éviter la mise en place de
cibles et donc, nous nous sommes référés à des détails caractéristiques d’une scène conçue
par l’homme.
La zone de test a été choisie à Paris à proximité du Musée d’Orsay. La qualité du nuage de
points LARA3Dv2010_Orsay (Figure 2.7) acquis par notre plate-forme mobile pour laquelle :
la vitesse approximative était de 5km/h, la résolution des scanners SICK était de 0.25 degré
et sa fréquence de 18Hz, a été vérifiée. Comme l’affirme [Deschaud, 2010], la spécificité de
ce nuage est la suivante : la distance moyenne entre deux points voisins dans un profil est de
6.7 cm, tandis que celle entre points de profils successifs est égale à 7.4 cm. Le nuage est
alors hétérogène et localement anisotrope. En particulier, les distances d’un point à un autre 36
le plus proche varient entre 5 cm à 15 cm. Notre point de départ était l’évaluation qualitative
permettant d’observer si les relevés laser subissaient des déformations. Ensuite, l’exactitude
a été examinée à l’aide de deux références différentes : un levé topographique Orsay2011_topo,
et un nuage de points acquis en mode fixe Orsay2009_statique. Ces données ont été collectées
indépendamment après une acquisition mobile comme il a été décrit précédemment (2.2).
C'est pourquoi, dans cette section, nous détaillerons toutes les démarches effectuées, ainsi
que les avantages et inconvénients des techniques employées.
Comparaison avec le levé topographique
En raison du manque de géo-référencement – chaque jeu de données n’a pour référentiel
qu’un système local - l’estimation de qualité s’est donc limitée à l’exactitude relative. Les
levés topographiques ont été ajustés sur un nuage mobile à travers une transformation rigide
calculée à partir de trois points de contrôle observables dans les deux ensembles.
Dans un premier temps, les relevés laser mobiles ont été étudiés visuellement par rapport à
la coupe horizontale mesurée préalablement. Un profil correspondant, dont l’épaisseur était
suffisamment large pour inclure celui de référence, a été extrait du nuage de points. Nous
avons remarqué que nos données laser étaient suffisamment cohérentes même si elles étaient
localement entachées par certaines déformations ; c’est-à-dire, quelquefois étendues en
direction du véhicule, puis décalées (Figure 2.20). Cet état de fait est probablement dû aux
imperfections liées à l’implémentation du filtre de Kalman à l’étape de géo-référencement,
mais aussi aux capteurs de navigation de basse de gamme mise en place (notamment le
récepteur GPS mono-fréquence calculant la position sans corrections différentielles).
Figure 2.20 Coupe horizontale dans une superposition : levé topométrique (en rouge) –
nuage de points (en vert)
Pour compléter nos analyses, une évaluation quantitative a été faite à l’aide des points de
détails mesurés. Au lieu de nous appuyer sur les coordonnées, comme c’était ordinairement le
cas, nous avons pris en compte les distances mutuelles. La longueur de 43 tronçons reliant
les points entre eux sous différentes combinaisons était calculée. Les mêmes éléments ont été
manuellement retrouvés et mesurés dans le nuage de points mobiles. La comparaison
effectuée a démontré que l’exactitude de nos relevés laser mobiles, étant une moyenne des
différences de segments contrôlés, était de l’ordre de quelques décimètres. Les chiffres
obtenus ont révélé ainsi que les différences absolues ne dépassaient pas 20 cm pour 79% de
segments. CHAPITRE 2. Acquisition et qualification de relevés laser
37
Figure 2.21 Diagramme des différences de longueur de 43 segments de contrôle
La Figure 2.21 montre les erreurs obtenues en fonction de la longueur de segments
comparés. Leur grandeur a été différenciée par des couleurs évoluant avec un intervalle de
10cm. Nous pouvons alors constater que plus le tronçon est long, plus l’erreur mesurée est
importante, ce qui revient à dire que le nuage mobile est légèrement étiré. En dépit de cette
remarque, une différence de longueur égale ou inférieure à 10cm équivaut à une incertitude
avec laquelle nous distinguons les détails dans le nuage mobile, parce que sa résolution
moyenne était de 7cm. Quoi qu’il en soit, la sélection de points réalisée de manière interactive
demeure le point faible de cette méthode. Cette tâche est fastidieuse dans le cas de nuages de
points peu denses, et nécessite un temps de traitement conséquent. D’où aussi une source
importante d’erreurs, puisque la faible résolution de nuages de points empêche une
identification correcte de détails.
Recalage mobile-statique
En définitive, comme le suggère [Alshawa, 2010], un recalage rigide basé sur l’ICP a été
réalisé. Puisque cet algorithme ne permet pas d’aligner des nuages positionnés et orientés de
manière quelconque, comme c’est notre cas, nous avons d’abord recalé grossièrement les
deux relevés laser. Tout le traitement a été réalisé à l’aide de Cloud Compare v.2.5.1. Étant
donné que le nuage mobile étudié peut être localement déformé à cause d’une qualité
temporairement faible du système de positionnement, l’évaluation a été menée de deux
façons. Commençant par le recalage global de l’ensemble du nuage, nous avons obtenu une
distance moyenne de 18.5cm (calculée sur 26% de points) par rapport à la référence. Pour
contrôler la justesse de ce chiffre, quatre coupes transversales ont été créées à des hauteurs
différentes afin d’être visuellement vérifiées. Ainsi, une importante perte de qualité du nuage,
croissant avec la hauteur de plan sécant, a été notée. Des mesures prises manuellement ont
révélé que la distance entre deux nuages de points variait jusqu’à 28.5cm.
Figure 2.22 Sous-nuages extraits
-0,400
-0,300
-0,200
-0,100
0,000
0,100
0,200
0,300
0 20 40 60 80 100 120 140
Différence [m]
Longueur de segments [m]38
De ce fait, l’estimation itérative par morceau, ce qui ramène à découper le nuage de points en
six sous fragments comme l’illustre la Figure 2.22, a été effectuée. La comparaison, réalisée
séparément entre ces sous-nuages, a indiqué l’exactitude finale du nuage de points égale à
9.6cm (Tableau 2.2). Vu que la partie I était considérablement déformée, nous l’avons exclue
du processus de qualification.
Tableau 2.2 Distances moyennes calculées pour chaque sous-nuage
Jeu de données I II III IV V VI
Distance moyenne [cm]
pour 75% points
17.2 7.1 11.9 9.8 11.0 9.2
Moyenne [cm] 9.6
Pour conclure, l’utilisation du recalage permet d’évaluer rapidement l’exactitude relative des
données mobiles, particulièrement lorsqu'une référence précise est déjà disponible.
Néanmoins, si les nuages de points présentaient des déformations locales, dues à la dérive de
la centrale et au masquage GNSS, une application d’ICP provoquerait des déplacements
encore plus importants entre les données traitées. C'est pourquoi la valeur de distance
calculée n’exprimera correctement ni le shift entre les nuages ni l’échelle de ces déformations. 39
CHAPITRE 3
Erreurs relatives au système MMS
Sommaire :
3. Erreurs relatives au système MMS .................................................................................. 39
3.1 Analyse des erreurs liées à la cartographie mobile ........................................................... 40
3.1.1 Erreurs causées par le système de positionnement .................................................................. 40
3.1.2 Erreurs dues au capteur laser ....................................................................................................... 41
3.2 Amélioration des relevés laser mobiles ............................................................................... 43
3.2.1 Correction de la localisation en cours d’acquisition ................................................................. 43
3.2.2 Correction en post-traitement ...................................................................................................... 46
3.3 Étalonnage extrinsèque .......................................................................................................... 47
3.3.1 État de l’art sur l’étalonnage des excentricités linéaires ......................................................... 48
3.3.2 Étalonnage des systèmes embarqués de caméras ..................................................................... 49
3.3.3 Étalonnage des systèmes dotés de scanners .............................................................................. 51
3.4 Impact d’un faux étalonnage sur la géométrie du nuage ................................................. 54
3. Erreurs relatives au système MMS
Nous discutons, au sein de ce chapitre, de toutes les anomalies pouvant survenir lors du fonctionnement
d’un système MMS et entacher les données laser produites. Elles sont dues notamment aux capteurs
mal étalonnés, aux facteurs divers influençant la qualité de balayage laser et à l’étalonnage inexact de
l’ensemble du système. Il se peut aussi que le système de positionnement ne parvienne pas à acquérir une
localisation suffisante pour collecter des données précises au niveau du canyon urbain. En particulier,
les masques fréquents GNSS empêchent la bonne réception des signaux. Ces perturbations entraînent
une erreur absolue sur l’estimation de la trajectoire du véhicule qui n’est que partiellement compensée
par les informations de la centrale inertielle. De ce fait, un décalage (une dérive) entre la trajectoire
fournie par le système de positionnement et la trajectoire idéale est observé. Pour pallier cet
inconvénient, il existe un certain nombre de méthodes qui s’appliquent en temps réel ou lors de l’étape
de post-traitement. Elles visent à améliorer soit le trajet du véhicule, soit les données laser collectées.
Néanmoins, en raison du coût relativement élevé, la majorité des solutions apportées consiste à corriger
les nuages après l’acquisition, notamment par un recalage fondé sur l’ICP.
Étant donné qu’un faux étalonnage extrinsèque influencera la qualité de la localisation et par la suite
les relevés laser, nous donnons un aperçu des méthodes étalonnant le système intégral. Nous en
Résumé 40
ressortons que la plupart des approches nécessitent une zone de test adéquate, munie de cibles bien
reparties et mesurées précisément. Concernant les solutions appropriées lorsque des scanners de profil
2D sont embarqués, elles ne sont pas nombreuses et permettent surtout d’étalonner des systèmes
aéroportés ALS. Cependant, dans le cas des systèmes MLS dotés de scanners 2D placés latéralement,
nous constatons un manque de souplesse quand il s’agit de numériser un environnement plusieurs fois.
Un tel dispositif empêche le balayage multiple d’un même objet à partir de directions opposées. Par
conséquent, les méthodes conçues pour les systèmes ALS ne répondent pas aux exigences imposées par
les plates-formes terrestres. Pour combler cette lacune, les techniques appropriées doivent être avancées.
En dernier lieu, nous démontrons que les écarts d’angles boresight sont observables sur les arêtes
extraites, et donc ces dernières pourraient, en théorie, être utilisées pour étalonner le système.
3.1 Analyse des erreurs liées à la cartographie mobile
Nous venons de voir dans le chapitre précèdent que chacun des composants du système peut
contribuer à la qualité des nuages de points collectés. Parmi les erreurs les plus notables, ce
sont celles provenant du système de positionnement intégrant GNSS/INS/DMI. Les autres
sources d’anomalies, étant dans la hiérarchie sitôt après le GNSS, viennent du manque de
précision des points laser, c’est-à-dire qu’elles sont causées par des erreurs instrumentales
imputables au scanner laser lui-même, mais aussi à la nature de l’objet numérisé et à
l’environnement. Ces erreurs affectent les mesures angulaires et les distances, nous les
assimilons à celles connues par les tachéomètres. Elles peuvent être de types systématiques
et aléatoires. Enfin, de manière moins importante, les relevés laser mobiles sont entachés par
des erreurs de synchronisation de différents capteurs, et par de multiples imprécisions
survenues lors de leur étalonnage intrinsèque. L’étalonnage extrinsèque du système aussi ne
peut pas être négligé [Barber et al., 2008].
Dans cette section, les sources d’erreurs les plus fréquentes liées au fonctionnement du
système MMS, et par conséquent, pouvant empêcher la chaîne d’acquisition, vont être
présentées. Il s’agit des erreurs provoquées par le système de positionnement (3.1.1), aussi
bien que celles dues au scanner laser (3.1.2). La compréhension des relations entre
l’environnement et la grandeur d’erreur survenue est nécessaire pour quantifier la précision
des données.
3.1.1 Erreurs causées par le système de positionnement
Le système de positionnement est, parmi les autres capteurs, l’élément le plus prédisposé à
être affecté par des erreurs [Glennie et al., 2007]. Nous discuterons dans ce paragraphe des
problèmes typiques liés à son fonctionnement. La fusion multi-capteurs a pour finalité
d’optimiser la précision de la position calculée en profitant d’un capteur pour pallier aux
défauts des autres, notamment en recalant en permanence la dérivée de l’IMU par
l’information GNSS, voire de fournir une trajectoire même en l’absence de signal GNSS.
Pour mettre en évidence les erreurs propres aux capteurs, nous observerons deux
composants principaux du système : le positionnement par GNSS et la navigation inertielle
INS.
Dans le cas d’un système mobile de cartographie, le positionnement à corrections
différentielles dGPS se trouve être le plus répandu. Une telle solution permet, par défaut, de
réduire plusieurs erreurs inhérentes au système telles que celles d’horloges, d’éphémérides, la
propagation du signal dans l’ionosphère et la troposphère. Pourtant, la qualité de la position
demeure toujours fortement liée à la configuration des satellites, c’est-à-dire à leur
constellation. Des satellites uniformément répartis sont une situation préférable
contrairement à celle où ils se retrouvent tous dans la même portion du ciel. La dégradation
de la précision géométrique GDOP (Geometric Dilution Of Precision) est un indice quantifiant
cet impact. Il faut encore mentionner les problèmes des multi-trajets et ceux des masques CHAPITRE 3. Erreurs relatives au système MMS
41
GNSS, inextricablement liés à des canyons urbains. Ces derniers sont dus au blocage du
signal, engendrés par les arbres, les tunnels ou les hauts bâtiments. Tandis que les premiers
provoquent des erreurs dans la mesure de distance entre le satellite et le récepteur, pouvant
atteindre plusieurs mètres (mesures de pseudo-distance) ou quelques centimètres (mesures
de phase), les trajets multiples sont difficiles à éliminer puisque les conditions de réflexions
des signaux sur des surfaces ne sont pas les mêmes d’un site à l’autre [Abuhadrous, 2005].
La centrale inertielle sert en permanence au calcul de trajectoire. La navigation inertielle
étant un système autonome, son avantage est d’avoir une bonne précision à court terme, sans
aucune information extérieure. En revanche, ces capteurs sont peu fiables, s’il s’agit de
positionnement sur une longue période de temps. Cet état de fait est causé par trois
principales sources d’anomalies : des erreurs d’alignement initial (pour les angles roulis,
tangage et lacet), des erreurs de capteur inertiel (dérive de gyromètres, biais
d’accéléromètres) et de calcul [Titterton et Weston, 2004]. Toutefois, la question de la
précision de la centrale inertielle est bien plus complexe qu’il n’y paraît. Mais, les fabricants
n’exposent guère le modèle mathématique de calcul de la mécanisation et de la compensation
de l’INS.
En fin de compte, toutes les plates-formes mobiles se localisant grâce à des systèmes
hybrides GNSS/INS souffrent d’un biais observable entre les nuages de points redondants.
Les pertes temporaires du signal GNSS s’avèrent être la cause d’un décalage dans
l’estimation de la trajectoire du véhicule. Pareillement, les données laser récoltées avec un
système LiDAR aérien sont encombrées par des écarts planimétriques et altimétriques,
résultant, cette fois-ci, de la dérive (drift) de la centrale inertielle.
3.1.2 Erreurs dues au capteur laser
Plusieurs sources d’erreurs peuvent affecter les données acquises par un scanner laser seul.
De plus, elles varient d’un instrument à l’autre et dépendent de la qualité du dispositif et de
son étalonnage. Ce dernier ayant pour but de corriger les erreurs systématiques inhérentes
au système, l’étalonnage doit être régulièrement effectué et non seulement lors de la
première utilisation. Aussi, les spécifications techniques transmises par les constructeurs de
scanners doivent être vérifiées, puisqu’elles sont obtenues dans des conditions idéales de
mesures et ont tendance à être surestimées. Pour pouvoir estimer l’exactitude/la précision de
chaque point laser, il faut considérer l’ensemble des facteurs intervenants. [Steiger, 2005]
propose, conformément au schéma affiché par la Figure 3.1, de lister toutes les
caractéristiques importantes influençant la qualité des nuages de points. La discussion
exhaustive, concernant le principe du balayage laser terrestre, mais aussi toutes les sources
d’erreurs inhérentes au fonctionnement d’un scanner, est présentée par [Pawleta et Igielska,
2009], [Boulaassal, 2010], [Landes et Grussenmeyer, 2011] et [Landes et al., 2012].
Puisqu’un scanner laser effectue des mesures au même titre que le ferait un tachéomètre,
aussi leurs modèles s’avèrent relativement semblables. Plus précisément, il est préférable de
mettre en évidence deux caractéristiques – l’imprécision d’angles et de distance. Les deux
angles (vertical et horizontal) souffrent des erreurs typiques d’un tachéomètre comme
l’erreur de collimation horizontale, l’erreur d’index et l’inclinaison de l’axe vertical. Mais,
l’incertitude de la distance est indépendante de celle des angles, car le principe des mesures
de chaque grandeur est différent. Parmi ces erreurs, le facteur d’échelle et l’erreur de zéro
peuvent être cités. La qualification de la précision de mesure angulaire s’effectue en mesurant
de courtes distances verticales et horizontales entre les cibles déployées (p.ex. des sphères).
Celles-ci sont comparées ensuite aux mesures de référence obtenues grâce à des appareils
beaucoup plus précis. De son côté, l’exactitude de mesure des distances est aussi vérifiable.
Étant donné que le bruit affectant le nuage de points lui donne une certaine épaisseur, l’une
des façons de le mesurer consiste à balayer une cible plane orientée perpendiculairement au 42
scanner laser. L’exactitude sur la mesure de distance, exprimée en tant que l’écart-type, peut
ainsi correspondre à la dispersion des points autour du plan moyen.
Figure 3.1 Sources d’erreurs sur des mesures avec le scanner laser terrestre
*facteur valable uniquement pour le balayage laser statique
De surcroît, d’autres facteurs ayant un impact sur les points mesurés méritent d’être
également envisagés tels que la résolution spatiale, la portée (la distance minimale et
maximale à laquelle le scanner laser est capable de fournir des mesures fiables), la taille de
l’empreinte laser, l’impact de différentes propriétés des matériaux composant la surface, le
problème d’angle d’incidence et la rencontre par faisceau laser d’une arête (échos moyennés).
Plusieurs études concernant le comportement du faisceau laser sur les surfaces composées de
multiples matériaux ont été effectuées entre autres par [Boehler et al., 2003], [Hanke et al.,
2006], [Feng et al., 2008], [Hiremagalur et al., 2009], [Pawleta et Igielska, 2009] et
[Boulaassal, 2010], [Landes et al., 2012]. La caractéristique prise en compte était la couleur,
le type de matériel (papier, verre, bois, métal, crépis, pierre), son humidité et sa rugosité.
Différentes cibles ont été proposées (Figure 3.2) non seulement pour tester la performance
des scanners laser existants, mais aussi pour les comparer. Les résultats obtenus montrent
que l’élément influençant davantage la qualité est la réflectivité de l’objet à une longueur
d’onde et l’orientation de l’objet envers le capteur laser [Pesci et al., 2008]. Une source
d’erreurs significatives, à laquelle il nous faut faire attention, est la manière avec laquelle un
matériau numérisé renvoie la lumière laser. Tandis que le retour depuis les surfaces blanches
est fort, la quantité de lumière retournée par celles noires est beaucoup plus faible. Des
matériaux très réfléchissants tels que le marquage au sol, les diapositifs rétro-réfléchissants
peuvent produire aussi des effets supplémentaires comme la saturation et le flou lumineux CHAPITRE 3. Erreurs relatives au système MMS
43
(bloom effect) [Vosselman, 2010]. La saturation étant causée par un excès d’énergie renvoyée,
elle apparaît sous forme de points répartis le long de la ligne de visée. Cependant, le flou
lumineux se manifeste par un élargissement de l’objet [Williams, 2012]. Pour résumer, la
réflectance d’un objet (albédo) joue sur la quantité de lumière reçue par l’instrument après
réflexion, en lui permettant de faire la mesure. De manière générale, plus le signal
rétrodiffusé est faible (que ce soit par réflectivité faible du matériau ou bien encore par angle
d’incidence), plus l’observation sera bruitée. Les analyses de [Soudarissanane et al., 2009]
montrent que, dans un cas pratique, un angle d’incidence inférieur à 60 degrés prévaut sur la
qualité des nuages de points.
Figure 3.2 Exemple de cibles permettant de tester la performance du scanner laser
terrestre :a) Précision angulaire ; b) Angle d’incidence ; c) Échos moyennés – effet de bord
(edge effect) ; d) Résolution ; e) Réflectance [Boehler et al., 2003]
3.2 Amélioration des relevés laser mobiles
C’est sur cette base que nous observons une nécessité d’améliorer les résultats produits par
un système de cartographie terrestre MLS. Au regard des solutions apportées, conçues à cet
effet, il semble raisonnable de les élaborer en deux paragraphes. La section 3.2.1 se penchera
sur les approches visant à renforcer la précision du système de positionnement en temps réel.
Les techniques appliquées lors de l’étape de post-traitement seront discutées dans la section
3.2.2. Cependant, la problématique d’étalonnage extrinsèque est élaborée séparément (3.3).
3.2.1 Correction de la localisation en cours d’acquisition
Pseudolites (PL)
Puisque la qualité des données « mobiles » est déterminée par la précision du
positionnement, la performance de l’ensemble du système en dépendra aussi. Le système
intégré GNSS/INS joue un rôle important, mais en même temps, son fonctionnement peut
se voir affecté du fait des obstructions du signal GNSS dans un environnement urbain
(atténuations, masquages, trajets multiples). Aussi, un nombre suffisant de satellites dits
« visibles » ne peut pas être garanti partout. De plus, même si certains satellites, situés sur
l’horizon, sont censés être suivis, nous remarquons que leurs signaux sont entachés par un
bruit assez élevé. Une méthode tenant à déployer une constellation locale de satellites grâce
à une augmentation des niveaux de signaux GNSS a été mise au point. Son but est
d’améliorer la précision de la localisation, mais aussi de rendre accessible le signal GNSS en
intérieur (localisation en indoor). Il s’agit des pseudolites (pseudo-satellites), à savoir des
émetteurs terrestres de signaux dont le format est identique ou similaire à ceux émis par les
satellites. La portée de ces signaux est variable - elle dépend de leur puissance et de leur
utilisation. Le principe est de mettre en place, dans une zone dite de « contraintes » non
couverte par le GNSS, des transmetteurs permettant à un récepteur d’acquérir un nombre
suffisant de signaux et de calculer sa position 3D. Autrement dit, les émetteurs jouent
localement le rôle des satellites et leurs signaux sont traités de la même manière que ceux
des satellites. La Figure 3.3 illustre le principe de positionnement avec un réseau de
pseudolites (ܲܵ). 44
Figure 3.3 Positionnement des pseudolites en : a) indoor (Image reproduite à partir de
[Vervisch-Picois, 2010]) ; b) outdoor
Plusieurs équipes à travers le monde travaillent sur la localisation avec les pseudolites.
Parmi les derniers travaux concernant la localisation en indoor, nous pouvons citer ceux
présentés par [Vervisch-Picois, 2010], [Selmi, 2013]. Néanmoins, l’efficacité d’une telle
solution, c’est-à-dire la fusion GNSS/PL/IMU pour les besoins du système mobile terrestre
MMS a été aussi testée par [Wang et al., 2001], [Babu et Wang, 2009] et [GrejnerBrzezinska
et al., 2010]. Le concept de la mise en œuvre des pseudolites est toujours en cours
de développement, mais les résultats obtenus montrent déjà leur potentiel. [Ning et al.,
2007] affirment que les mesures effectuées à l’aide de pseudolites ont un facteur DOP
(Dilution of precision) réduit d’au moins 35%. En revanche, comme l’explique [Selmi, 2013],
la nécessité de synchroniser les pseudolites constitue la phase la plus coûteuse et la plus
complexe de cette technique.
Terrain Referenced Navigation (TRN)
Le Terrain Referenced Navigation System (TRN) sert à calculer la position de la plate-forme
en mouvement (avion, UAV, véhicule), en comparant sa position actuelle par rapport au sol,
sans recourir au GNSS dont le signal peut être brouillé par l’ennemi (application militaire),
ou voire tout simplement indisponible. Dans ce cas, il nous faut fournir des outils de
navigation alternative, lorsque le système GNSS n’est plus joignable. En l’absence de
données GNSS, la localisation d’un véhicule est habituellement réalisée en utilisant une
combinaison d’odométrie roue (DMI) et de capteurs inertiels. Par contre, une telle solution a
deux limitations principales : les centrales inertielles sont sujettes, au fil du temps, à la
dérive, et le DMI reste sensible aux dérapages et aux glissements de roues. De plus,
l’odométrie roue ne donne qu’une information 2D dans le plan de la route.
Grâce au TRN, la position et l’attitude sont déterminées, toutes deux étant un support à la
navigation inertielle. L’idée consiste donc à combiner la navigation inertielle avec les
informations provenant directement du terrain. La performance d’un tel système dépendra
de la qualité du capteur INS employé. Plus il est exact, plus précise sera la position calculée.
Il existe plusieurs approches permettant d’établir la navigation TRN y compris le filtre de
Kalman étendu (EKF), le filtre de Kalman inodore (UKF) ou le filtre particulaire [Lee et al.,
2013]. Des informations de la scène provenant des images/nuages de points sont employées CHAPITRE 3. Erreurs relatives au système MMS
45
afin d’estimer la trajectoire du véhicule, tout en se référant à des méthodes de l’odométrie
visuelle. Or, le déplacement relatif d’un capteur optique (caméra, télémètre laser) entre deux
points de vue sera déterminé à travers une analyse des images successives. Les méthodes
existantes visent à identifier les « features » (amers) sous forme de points, lignes ou surfaces
pour les mettre ensuite en correspondance. Cette tâche n’étant pas triviale, il existe plusieurs
techniques susceptibles d’être appliquées. Dans le cas de l’odométrie basée vision, le
mouvement est estimé à partir d’une séquence d’images après la mise en correspondance
robuste de points d’intérêts du type Harris [Harris et Stephens, 1988], SIFT (Scale-Invariant
FeatureTransform) [Lowe, 2004], ou SURF (Speeded Up RobustFeature). Aussi, l’algorithme
d’ICP (Iterative Closest Point) permettant de recaler toute sorte d’entités géométriques entre
elles (2D et 3D) peut être utilisé. Pour plus d’informations concernant l’odométrie 3D basée
LiDAR et vision, le lecteur pourra se référer à [Frémont, 2009]. Néanmoins, comme le
constatent [Toth et al., 2009], le rapport du TRN avec les applications de la cartographie
mobile est double :
1) La localisation précise en position et en orientation (en temps réel) se base sur
l’extraction de caractéristiques et elle dépend tout particulièrement de la capacité de
la procédure d’isolement des objets mobiles parmi ceux étant statiques. En effet, dans
un environnement routier, plusieurs objets sont en mouvement (piétons,
automobiles, cyclistes, motos, etc.) et conjointement avec la dynamique propre du
véhicule (accélération, décélération), ils constituent un challenge supplémentaire,
pouvant altérer la perception.
2) L’utilisation de données déjà existantes telles que des modèles numériques de terrain
(MNT), des données vectorielles et du SIG (Système d’Information Géographique) peut
indubitablement soutenir les processus d’extraction de caractéristiques.
D’après [Toth et al., 2009], l’utilisation du TRN présente plusieurs intérêts. Mais, il y a des
défis à relever pour rendre cette navigation opérationnelle dans des environnements
complexes de cartographie mobile. Tout d’abord, la grande quantité de données à traiter (Big
Data) reste un objet certain de préoccupation. Ensuite, le traitement en temps réel pose un
vrai problème tant en terme de capacité que de complexité d’espace numérisé contenant une
variété d’objets provenant de dynamiques différentes.
Toutefois, une solution semblable est aussi proposée par [Narayana, 2011]. Il emploie,
comme outil complémentaire à la localisation, des scanners laser de profil 2D. Son approche
peut être assimilée à la solution conçue pour la localisation en intérieur d’un robot ou d’un
véhicule autonome - connue sous le nom de cartographie et de localisation simultanées
(SLAM). L’ensemble des démarches mises en œuvre fait appel à l’odométrie basée laser,
puisque le déplacement relatif est mesuré par rapport à des propriétés invariables de
l’environnement balayé par scanner. Notamment les surfaces planes fortement présentes
dans les environnements aménagés par l’homme, sont utilisées pour en déduire un
mouvement en 3D.
Autres solutions moins complexes
Nous venons d’observer un exemple de solutions à l’aide de localisation qui s’avèrent assez
complexes lors de l’étape de l’implémentation. Alternativement [Zampa et Confortie, 2009],
font appel à une technique couramment utilisée. Il s’agit d’augmenter la précision de la
trajectoire à travers des stations de référence GNSS supplémentaires mises en place. De plus,
des points de contrôle déployés tous les 50 à 80 mètres le long du trajet servent
ultérieurement à corriger les relevés laser. Une approche tout à fait similaire a été aussi
décrite par [Gandofi et al., 2008], sauf que la position optimale des stations GNSS a été
retrouvée grâce à des « pré-acquisitions » réalisées quelques jours auparavant. En dépit de 46
tous les avantages de cette solution, l’emplacement des stations de contrôle au sol s’avère
très coûteux.
3.2.2 Correction en post-traitement
Le second groupe de techniques d’amélioration de performance de système mobile contient
des outils permettant la correction de données en post-traitement.
Les travaux de [Tournaire et al., 2006], [Ridene, 2010] et [Monnier et al., 2013] s’appuient
sur un recalage entre les données mobiles et les bases de données géographiques mieux géopositionnées
mais beaucoup moins détaillées. [Tournaire et al., 2006] améliorent l’étape de
géo-référencement du véhicule à l’aide de l’imagerie aérienne (résolution d’au moins 20cm).
Les informations 3D extraites des stéréos – paires sont fusionnées avec celles des
orthoimages. À cet égard, des marquages au sol, à savoir les passages piétons, ont été
détectés et reconstruits à partir de ces deux types de données image. Ensuite, les
coordonnées 3D des points extraits du marquage au sol ont été incorporées lors de la
triangulation photogrammétrique (Photogrammetry Bundle Adjustment) afin de corriger la
localisation absolue des images terrestres. [Ridene, 2010], quant à lui, examine des solutions
permettant de mettre en cohérence différents types de données. Il propose certains scénarios
de corrections de relevés laser mobiles par rapport à des données externes au système de
cartographie mobile (p.ex. nuage de points statique, modèle numérique de surface). Il s’agit
du recalage rigide de la famille ICP des données 3D. Enfin, le processus de [Monnier et al.,
2013] se base sur un recalage non rigide fondé, lui aussi, sur le principe d’ICP d’un point à
un plan. L’hypothèse que l’erreur de positionnement varie lentement, au fil du temps, de
façon non linéaire a été faite. Dès lors, la trajectoire de la plate-forme est déformée
itérativement, morceau par morceau, afin de minimiser la distance des points du nuage
mobile aux primitives planes du modèle. Ce dernier constitue une base de données
géographiques (2D ou 3D) composée de primitives ponctuelles (poteaux, repères de
nivellement, sommets d’objets polyédriques), linéaires (arêtes, cadastre, limites de trottoirs)
ou bien encore surfaciques (faces d’objets).
Nous pouvons aussi nous confronter aux méthodes semblables à celles de l’odométrie
visuelle, mais cette fois-ci, appliquées après les acquisitions. [Cazzaniga et al., 2007]
développent une solution s’inspirant de la photogrammétrie, particulièrement de la
stéréovision. Leur approche est assez limpide. Il s’agit de comparer la position de la caméra
calculée à partir des images stéréoscopiques avec celle prévue par le système de
positionnement GNSS/INS. Plus précisément, le but est d’évaluer les éléments d’orientation
externe (EOZ) déterminés indépendamment pour identifier et corriger les interruptions
temporaires dans la réception du signal GNSS. De même [Shi, 2008] suggère d’effectuer la
triangulation des images à partir des points de contrôle précis, extraits, cette fois-ci, à partir
des données fusionnées images/laser - afin d’améliorer la position et l’orientation de la
caméra.
[Yousif et al., 2010] étudient la validité de théorie de l’assimilation de [Reichle, 2008] pour
renforcer le positionnement du véhicule. Selon cette théorie, le processus mis en œuvre vise à
s’appuyer sur la corrélation existante entre deux observations différentes d’un phénomène de
manière à obtenir la meilleure estimation de l’état réel. C’est pourquoi deux nuages de points
acquis lors d’un trajet aller-retour au sein de la même zone sont intégrés.
[Alshawa, 2010] envisage une méthode radicalement différente. Un récepteur GPS de
« haute sensibilité » (HSGPS) est utilisé simultanément avec un GPS différentiel (dGPS). Ce
premier étant moins précis, il fournit, contrairement au dGPS, des informations en continu
sur la trajectoire. Pour pouvoir traiter une telle configuration, les trajets déterminés
indépendamment par deux récepteurs sont comparés. D’abord, l’écart entre ces échantillons
est réduit en appliquant, à des données moins précises, une transformation permettant de les CHAPITRE 3. Erreurs relatives au système MMS
47
faire coïncider avec celles ayant la précision plus élevée. Une fois les trajectoires fusionnées,
une courbe ajustant au mieux ces données, est retrouvée. La dernière étape nous amène à
interpoler des points du trajet.
Autre possibilité [Narayana, 2011] présente une méthode visant à corriger, par lissage des
données, la trajectoire enregistrée, puisqu’elle souffre de certaines erreurs provoquées par
des limitations de capteurs de positionnement. Il en conclut qu’une telle solution étant
insuffisante pour surmonter les problèmes dus aux lacunes GNSS, que celle-ci peut être
toutefois très utile pour corriger les sauts d'altitude et les anomalies d'azimut (lacet) de la
trajectoire enregistrée.
3.3 Étalonnage extrinsèque
L’étalonnage géométrique des systèmes mobiles basés sur LiDAR revient à estimer et à
éliminer les erreurs systématiques qui affectent les nuages de points collectés. Ces erreurs
sont causées par les biais de paramètres du système, notamment le biais des paramètres de
montage de capteurs (relations spatiales entre les modules), ainsi que par les incertitudes des
mesures d’angles et de distance inhérentes aux composantes du scanner utilisé [Habib et al.,
2011]. L’étalonnage dans le contexte des systèmes mobiles désigne alors deux pistes à
suivre : 1) l’étalonnage de chaque scanner laser (étalonnage intrinsèque) ; 2) l’étalonnage du
système intégral (étalonnage extrinsèque).
L’étalonnage extrinsèque contient des procédures nécessaires pour estimer les constantes de
calcul, à savoir la position et l’orientation des capteurs de perception (caméra, laser) dans le
repère lié à la centrale inertielle (b). Nous les exprimons par : trois composantes de
translation ݎ/௦
(excentricité linéaire entre le centre de l’unité inertielle IMU et le centre du
scanner), et trois en rotation ܴ௦
(matrice de boresight). Au-delà, nous pouvons mentionner
d’autres excentricités linéaires (bras de levier) entre les capteurs de localisation, à savoir la
distance ݎ/ீேேௌ
entre le centre de phase de l’antenne GNSS et le centre de masse de l’IMU,
et la distance ݎ/ெூ
entre le centre de l’IMU et l’odomètre. Lors de l’étape de géo –
référencement direct (formule 2.1), ces deux paramètres servent à calculer la trajectoire de la
plate-forme dans le repère local (M). L’étalonnage réalisé avec beaucoup de soin, est alors
indispensable pour, d’une part rendre le système opérationnel, d’autre part pour fournir des
données de qualité élevée. Sinon, chaque erreur commise dans l’étalonnage du système
intégral influencera la qualité de la localisation, et par suite les relevés laser.
Cette section donnera un aperçu des méthodes récentes d’étalonnage extrinsèque d’un
système mobile de cartographie, et expliquera brièvement leurs principes. Puisque les
translations peuvent être souvent déterminées par des mesures conventionnelles, nous
présentons l’une des solutions envisageables. Concernant les composantes en
rotation ൫݁ݔ, ݁ݕ, ݁ݖ൯ formant la matrice de boresight ܴ௦
, celles-ci doivent être déterminées
indirectement. Cette résultante est due au fait qu’il s’avère impossible de les mesurer en
utilisant des instruments employés habituellement pour les levés topographiques et
géodésiques. Il existe plusieurs approches permettant d’estimer des excentricités angulaires,
mais la majorité nécessite une zone de test munie de cibles uniformément réparties et
mesurées. Nous aborderons, au sein de cette section, les techniques existantes en les
regroupant en deux catégories : 1) celles dédiées aux systèmes basés sur les caméras (3.3.2) ;
2) celles appropriées aux systèmes embarqués des scanners laser (3.3.3). Ensuite (3.4), nous
présenterons une étude d’impact d’un étalonnage imprécis sur la géométrie des arêtes
extraites. Les notations employées ont été précédemment expliquées avec la Figure 2.3, dans
le Chapitre 2. 48
3.3.1 État de l’art sur l’étalonnage des excentricités linéaires
L’une des manières de connaître les excentricités linéaires est de les mesurer tout
simplement à l’aide des techniques traditionnelles (tachéomètre, récepteur GNSS, etc.). Une
seule condition requise est de pouvoir mener une observation directe des points
caractéristiques. Les deux cibles visées doivent alors être visibles et identifiables. Autrement,
l’étalonnage demeure assez compliqué à effectuer et les grandeurs ne pourront pas être
déterminées avec une précision suffisante.
La Figure 3.4 illustre une procédure concevable pour mesurer le bras de levier entre
l’antenne GNSS et la centrale inertielle. C’est une adaptation de l’approche discutée par
[Shear, 2010] et utilisée, par défaut, lors de l’étalonnage des systèmes aériens ALS.
Figure 3.4 Procédure pour déterminer le bras de levier entre les capteurs de localisation
Après avoir fait des mesures GNSS et tachéométriques, les translations ݎ/ீேேௌ
se calculent
comme suit :
ேேௌீ/ݎ
ൌ ܽோாி
െ ܴ
ܴெ
ேௌௌீ/ݎ
ெ (3.1)
où :
ܽோாி
: offset fourni par le constructeur en raison de l’impossibilité d’observer le centre de
l’IMU
ேேௌீ/ݎ
ெ : position de l’antenne GNSS déterminée dans le repère terrain (M) CHAPITRE 3. Erreurs relatives au système MMS
49
ܴ
: matrice de passage du repère lié à l’IMU (b) vers le repère véhicule (l), définie par trois
angles (roulis, tangage et lacet)
ܴெ
: matrice de rotation permettant un changement du repère véhicule (l) au repère terrain
(M), calculée selon la formule ܴெ
ൌ ሺܴ
ሻ௧ܴெ
Également, toutes les excentricités linéaires notamment ݎ/௦
et ݎ/ெூ
peuvent être spécifiées
à travers une telle procédure. Comme l’affirment [Ellum et El-Sheimy, 2002], [Shear, 2010]
et [Li-Chee-Ming et al., 2011], la principale limite de cette méthode est l’impossibilité à
observer directement les centres de capteurs. De ce fait, les bras de levier seront connus avec
une précision centimétrique. C’est pourquoi cette approche peut être parfois insuffisante et le
calcul des paramètres doit se faire d’une autre manière.
3.3.2 Étalonnage des systèmes embarqués de caméras
Les premiers systèmes mobiles de cartographie étaient conçus pour recueillir des
informations sur un environnement en se servant des images. Leur principe consistait à
adapter des algorithmes bien connus dans le domaine de photogrammétrie. Il s’agissait alors
de mettre en pratique une stéréoscopie permettant de reconstituer le relief de la scène à
partir d’images prises sous différents points de vue de l’objet. En conséquence, la question de
l’étalonnage des systèmes basés sur des caméras était largement discutée dans la littérature.
Excentricités angulaires
Afin d’identifier les excentricités angulaires, deux méthodes semblent être le plus souvent
évoquées [El-Sheimy, 2011]. La première possibilité nommée « 1-step » amène à incorporer
les trois paramètres de rotation ൫݁௫, ݁௬, ݁௭൯ (3.2) comme inconnues supplémentaires, dans un
ajustement par faisceaux, ou dans une compensation par moindres carrés.
ܴ௦
ൌ ܴ௭ሺ݁௭ሻܴ൫݁௬൯ܴሺ݁௫ሻ (3.2)
Une autre solution, plus répandue, est le procédé « 2-step ». Il comprend deux étapes
principales. Dans un premier temps, nous déterminons, pour chacune des images, deux
matrices de rotation :
1) ܴ
ெ du repère lié à la centrale inertielle (b) vers le repère terrain (M). Elle représente
les mesures de l’IMU effectuées lors de l’acquisition.
2) ܴ௦
ெ du cadre capteur (s) vers le repère terrain (M). Ses composants sont calculés par
une terra-triangulation assistée par GNSS.
Ensuite, les deux matrices, c’est-à-dire, celle dérivée de l’IMU et celle déterminée par
photogrammétrie, sont comparées selon la formule :
ܴ௦
ൌ ൫ܴ
ெሺݐሻ൯
ିଵܴ௦
ெ (3.3)
Pour chaque image prise, il en découle une matrice de boresight ܴ௦
. La moyenne de ses
éléments individuels correspond aux excentricités angulaires recherchées. Néanmoins, il faut
noter qu’il apparaît impossible de prendre la moyenne directement puisque la matrice de
rotation n’est probablement pas orthogonale. Elle doit être d’abord représentée par les
angles eulériens ou par les quaternions afin de pouvoir reconstruire la matrice de boresight
finale. 50
Bras de levier
Le classement des méthodes étalonnant les excentricités linéaires entre les caméras et le
centre de navigation ressemble à celui évoqué pour les excentricités angulaires. Se référant à
des techniques indirectes, ces paramètres sont calculés soit pendant l’ajustement :
௦/ݎ
ൌ ሺݔ௦
ெ, ݕ௦
ெ, ݖ௦
ெሻ் (3.4)
soit, pour chaque image ; la position dérivée par système intégré GNSS/INS/DMI sera
comparée avec celle fournie par la terra-triangulation :
௦/ݎ
ൌ ሺܴ௦
ெሻିଵ ∙ ൫ݎ/ீேௌௌ
ெ ሺݐሻ െ ݎ௦
ெ൯ (3.5)
Enfin, la moyenne de tous les paramètres obtenus décrira l’excentricité linéaire ݎ/௦
.
Aperçu des méthodes
Le Tableau 3.1 récapitule quelques approches récentes traitant du sujet de l’étalonnage. Leur
exactitude dépendra fortement de la zone de test qui doit être appropriée en vue d’utiliser
simultanément le positionnement par GNSS et la photogrammétrie.
Pour pallier le problème de blocage du signal GNSS, [Hassan et El-Sheimy., 2008]
suggèrent de placer sur un véhicule un prisme réflecteur et de le suivre avec une station
totale en utilisant le mode continu de mesure (tracking). Cette information constituera un
support au système de navigation inertielle travaillant de façon automne.
Tableau 3.1 Exemple de travaux étalonnant indirectement les deux types d’excentricités :
caméra/IMU
Auteurs Zone de test
Excentricité
linéaire
Excentricités
angulaires
[Li-Chee-Ming et al., 2011] Amers naturels Procédé « 2-step »
[Rau et al., 2011a] 67 cibles Nouveau procédé « 1-step » pour
l’étalonnage des systèmes multicaméras
[Rau et al., 2011b] Cibles déployées
sur les façades
Procédé « 2-step »
[Chen et al., 2013] Deux zones de
test, chacune
munie de points
de contrôle
Indoor-et-outdoor étalonnage
(procédé 2-step)
Les études comparatives entre les techniques existantes ont été effectuées par [Ellum et ElSheimy,
2003] et [Rau et al., 2011a]. Le Tableau 3.2 résume leurs observations, en
juxtaposant les avantages et les inconvénients propres à chaque méthode. CHAPITRE 3. Erreurs relatives au système MMS
51
Tableau 3.2 Synthèse des approches d’étalonnage
Méthode Avantage Inconvénient
Mesures conventionnelles
(bras de levier uniquement)
Indépendant de
l’ajustement
Observation ardue du centre
de capteurs
« 2-step »
prendre la moyenne des
résultats obtenus
simultanément par le système
hybride GNSS/INS et la
photogrammétrie
Conception simple, sans
modifications apportées au
modèle d’ajustement
Zone de test munie de cibles
précises et uniformément
réparties
« 1-step »
insérer des paramètres
d’étalonnage comme des
inconnus supplémentaires
dans un ajustement
Matrice de covariance
contenant une information
complète
La corrélation avec d’autres
paramètres implique que les
résultats peuvent ne pas être
fiables. Modifications
indispensables au niveau du
modèle mathématique.
L’étalonnage du système multi-caméras est aussi abordé par [Cannelle et al., 2012]. Leur
objectif est d’estimer, à la fois, les excentricités entre les caméras mises en place, ainsi que
celles existantes par rapport au système de positionnement GNSS/IMU. À cet effet, deux
méthodes sont discutées et comparées. La première, nommée « OFF-line », consiste à
étalonner séparément chaque caméra. Pour ce faire, une zone de test équipée de cibles 3D
dont les coordonnées sont connues avec la précision submillimétrique, servira de référence.
Ensuite, les paramètres pourront être déterminés en adaptant une méthode similaire à
l’ajustement par faisceaux. L’autre démarche est l’étalonnage « ON-line » qui s’avère une
solution entièrement automatique, ne nécessitant plus de points de contrôle. Il est fondé sur
les images prises durant l’acquisition à partir desquelles les points d’intérêt sont extraits et
appariés (p.ex. à l’aide de l’algorithme SIFT). Les tests effectués par les auteurs montrent
que les deux approches fournissent des résultats assez similaires. L’étalonnage dit « ONline
» est exact et efficace. Mais, il peut être peu fiable lorsqu’il est employé dans un
environnement empêchant une extraction de points d’intérêt (forêt, etc.).
3.3.3 Étalonnage des systèmes dotés de scanners
Les approches dédiées à l’étalonnage des systèmes dotés d’un LiDAR (MLS et ALS) peuvent
être appropriées, en fonction du type de scanner embarqué, soit pour un scanner à double
balayage (3D), soit pour un scanner de profil 2D. Cette section esquissera quelques travaux
se rapportant à ce sujet.
Tandis que les techniques conçues pour les scanners 3D s’inspirent de celles développées
pour les systèmes basés sur des caméras, la problématique d’étalonnage d’une plate-forme
MLS équipée des scanners 2D est assimilée à celle d’étalonnage d’un ALS. C’est dans cet
esprit que [Talaya et al., 2004] déploient des cibles réfléchissantes dont les coordonnées sont
connues. Ensuite, ils adaptent la technique similaire au procédé « 1-step » afin de déterminer
les excentricités linéaires et angulaires entre le scanner laser 3D et le système de
positionnement.
D’après [Chan et al., 2013], les techniques récentes d’étalonnage des excentricités angulaires
൫݁௫, ݁௬, ݁௭൯ peuvent être classifiées, compte tenu du principe d’estimation, en deux catégories :
1) l’estimation au sens des moindres carrés, fondée sur les primitives planaires introduisant 52
des contraintes lors de l’ajustement [Filin, 2003], [Skaloud et Lichti, 2006], [AtanacioJiménez
et al., 2011], [Glennie, 2012], [Chan et al., 2013] ; 2) le recalage par ICP
minimisant l’écart entre les points d’une surface (plane ou non plane) extraite à partir de
données laser redondantes [Rieger, 2010], [Habib et al., 2010], [Kumari, 2011]. Une autre
classification, répandue au sein de la communauté LiDAR, est donnée par [Habib et al.,
2011]. Ainsi, deux procédures sont distinguées : 1) system-driven (étalonnage) ; 2) data-driven
(ajustement des bandes). L’approche « system-driven » se réfère au modèle physique de
capteurs permettant d’effectuer des liens entre les mesures des dispositifs individuels d’un
système et les coordonnées terrain (M) des nuages de points générés. Vu que l’accès à des
données brutes peut être limité, le développement des méthodes « data-driven » utilisant
uniquement des coordonnées XYZ du nuage, est devenu nécessaire. Or, les effets des erreurs
systématiques sont modélisées par une transformation arbitraire entre les bandes LiDAR et
le repère de référence.
[Habib et al., 2010] et [Habib et al., 2011] proposent deux solutions alternatives pour
l’étalonnage des systèmes ALS. Elles étaient nommées respectivement : 1) Simplified Method ;
2) Quasi-rigorous Method. La première, étant une approche dite « data driven », requiert des
bandes parallèles LiDAR acquises au sein d’une zone avec un faible dénivelé. En revanche, la
seconde procédure, ne nécessitant plus le strict respect des plans de vol (bandes non
parallèles autorisées), exige des nuages de points horodatés, ainsi que des données de
navigation (uniquement la position de la trajectoire). Cependant, les deux algorithmes
minimisent les écarts entre les primitives correspondantes point/maillage triangulaire TIN
(Triangulated Irregular Network) afin de déterminer les paramètres d’étalonnage.
De son côté [Kumari, 2011], suggère une approche d’ajustement des bandes LiDAR
adjacentes, appropriée à des big data (données volumineuses) où les structures créées par
l’homme ne sont pas présentes. L’algorithme a besoin de données d’entrée (nuage de points
et trajectoire) et fournit des paramètres de transformation rigide en sortie. Pour ce faire, un
échantillon de points d’une bande LiDAR est mis en correspondance avec la surface de
l’autre la plus proche. L’ajustement des scans consécutifs se réalise à l’aide d’une méthode
similaire à l’algorithme ICP point à plan.
L’étalonnage d’un ALS est aussi une tâche entreprise par [Skaloud et Lichti, 2006]. Une
méthode rigoureuse basée sur des surfaces planes telles qu’un terrain de football, des toits
inclinés de bâtiments, est discutée. L’idée est d’estimer simultanément des excentricités
angulaires et des paramètres de plans à partir des primitives choisies, en ayant seulement une
connaissance a priori de leur forme (aucune information ni sur leur position, ni orientation
n’est demandée).
[Rieger et al., 2010] de Riegl GmbH présentent, pour étalonner un MLS, une procédure
basée sur l’algorithme d’ICP appliqué sur des primitives planaires extraites automatiquement
de nuages distincts. Il s’agit alors de choisir une zone de test contenant un nombre important
de surfaces planes (comme les façades de bâtiments) orientées diversement les unes par
rapport aux autres. Elles seront balayées plusieurs fois par un scanner à double balayage
(Riegl VZ-400). La direction de déplacement du véhicule aussi bien que l’angle de balayage
laser changent après chaque passage. L’extraction des angles ൫݁௫, ݁௬, ݁௭൯ s’effectue avec la
procédure appelée « boresight alignement and scan data adjustment », connue pour les
applications d’un ALS. Son principe repose sur le fait que les nuages collectés doivent
coïncider lors des acquisitions répétées d’un même objet, si les deux étalonnages extrinsèque
et intrinsèque sont justes. En supposant que les erreurs dues au scanner sont compensées,
nous constatons que plus la matrice de boresight est exacte, plus la différence entre ces nuages
est petite. Un faux étalonnage extrinsèque devrait donc entraîner un décalage entre les
surfaces balayées depuis les directions opposées de la plate-forme terrestre. Les tests réalisés
dévoilent que la méthode proposée requiert des nuages collectés sous de bonnes conditions CHAPITRE 3. Erreurs relatives au système MMS
53
de réception GNSS, car le résultat de l’estimation en dépendra. Par contre, l’applicabilité de
la méthode au regard des systèmes dotés d’un scanner 2D n’a pas encore été publiée. En
choisissant cette approche, il nous faudra aussi trouver une solution pour déterminer le bras
de levier ݎ/௦
.
Les démarches de [Chan et al., 2013] consistent à employer différentes primitives pour les
besoins de l’auto-étalonnage (self-calibration) d’un système MLS équipé de quatre scanners de
profil 2D (Riegl LMS-Q120i). Pour améliorer la procédure de l’estimation, ils suggèrent de
prendre en compte, en plus des plans, le modèle 3D de courbe caténaire. Ainsi, la formule
classique de géo-référencement et les modèles géométriques respectifs élaborent un modèle
fonctionnel d’étalonnage. Les trois composantes en rotation ൫݁௫, ݁௬, ݁௭൯, trois en translation
ሺ∆ݔ, ∆ݕ, ∆ݖሻ, aussi bien que les paramètres de modèles (quatre pour un plan, et trois pour une
caténaire) participent à l’ajustement fondé sur le modèle de Gauss-Helmert.
Cependant, il existe plusieurs travaux portant sur l’étalonnage d’une plate-forme équipée
d’un Velodyne [Atanacio-Jiménez et al., 2011], [Levinson, 2011], [Glennie, 2012], [Chan
et Lichti, 2013], [Zhu et Liu, 2013], [Wiart, 2013], [Elsberg et al., 2013]. Le Velodyne est
un scanner qui, selon le modèle, possède 32 ou 64 fibres laser alignées le long d’un axe. Un
tel dispositif positionné sur un système mobile permet une acquisition à 360° de l’espace.
[Atanacio-Jiménez et al., 2011] et [Glennie, 2012] apportent des méthodes d’étalonnage
extrinsèque et intrinsèque du Velodyne HDL-64E. L’ajustement, par la méthode des
moindres carrés, des primitives planaires fournit alors les valeurs recherchées.
Figure 3.5 a) Nuage de points captés par un Velodyne HDL-32E : a) faux étalonnage
extrinsèque ; b) après l’étalonnage extrinsèque [Wiart, 2013]
Dans la même veine [Wiart, 2013] discute des solutions appropriées lorsqu’un Velodyne
HDL-32E est monté sur un véhicule terrestre. Plusieurs méthodes automatiques de
recherche d’étalonnage extrinsèque, toutes faites par itération multi-échelle, ont été
analysées. Il s’agit de la méthode de Levinson [Levinson, 2011], et de deux nouvelles
approches développées par l’auteur : 1) l’algorithme de planéité qui amène à vérifier la
planéité locale dans un petit voisinage d’un point ; 2) l’algorithme Local – ICP Point-to-Plan
qui s’inspire de l’ICP. Ce genre de techniques ne nécessite ni cibles spéciales, ni de mesures
manuelles, évitant ainsi une tâche très fastidieuse. La démarche de Levinson utilise la
redondance d’information pour calculer la compacité du nuage de points, et ensuite
améliorer, par optimisation, l’étalonnage extrinsèque. Nous observons que plus l’étalonnage
extrinsèque est faux, plus le désordre (entropie) au sein du nuage de points est important 54
(Figure 3.5). L’hypothèse que le nuage de points d'une fibre forme, à condition que
l’étalonnage intrinsèque soit juste, des surfaces planes sur des objets plans, est devenue le
point de départ de la méthode de Levinson. Les tests effectués par [Wiart, 2013] ont montré
l’efficacité de cette approche, mais les résultats optimaux ont été obtenus pour des nuages
possédant certaines caractéristiques (p.ex. acquisition dans un virage). Deux autres
méthodes, c’est-à-dire l’algorithme de planéité et l’algorithme Local-ICP Point-to-Plan
permettent aussi d’estimer précisément les excentricités angulaires. En revanche, les
translations, comme avec la méthode de Levinson, sont très peu observables et doivent être
déjà connues. L’inconvénient majeur de ces solutions est le temps d’exécution qui empêche
l’étalonnage« ON-line ».
Enfin [Elsberg et al., 2013] mettent en avant une méthode permettant d’effectuer
simultanément un étalonnage intrinsèque et extrinsèque d’un scanner à double balayage
(Riegl VZ-400) positionné dans un SLAM. Leur approche n’exige pas non plus de mesures à
la main des points de contrôle ni de zone de test conçue à cet effet. Au contraire, ils
s’appuient sur une métrique de qualité calculée à partir de données laser, et sur la méthode de
Powell comme l’algorithme d’optimisation. Les points du nuage sont modélisés par une
fonction de répartition de probabilité ݀ሺ݈ሻ représentant la probabilité que l’emplacement ait
été déjà mesuré. Les erreurs d’étalonnage entraînent donc des surfaces apparaissant à
plusieurs positions. Étant la mesure de qualité, l’entropie de la probabilité ݀ሺ݈ሻ, augmente
avec ces erreurs et diminue considérablement lorsque le nuage est compact.
3.4 Impact d’un faux étalonnage sur la géométrie du nuage
Étant donné qu’un faux étalonnage extrinsèque introduit certaines déformations et que leur
impact est observable (Figure 3.6), il paraît intéressant de déduire, par l’analyse de la
structure des relevés laser, de vrais paramètres d’étalonnage. Nous examinons alors la
pertinence des lignes à étalonner le système intégral basé sur des scanners, qu’ils soient 2D
et 3D.
Figure 3.6 Impact de chacune des excentricités angulaires sur un profil laser : a) lacet ݁ݖ ; b)
tangage ݁ݕ ; c) roulis ݁ݔ (en vert - nuage généré pour l’un des angles faux ; en rouge - nuage
correct)
Pour comprendre l’impact des excentricités angulaires ܴ
௦ entre le capteur laser et la centrale
inertielle, nous régénérons des nuages acquis auparavant par notre prototype L3D2 équipé
de deux scanners SICK LMS 221. Nous introduisons de faux paramètres d’étalonnage
extrinsèque. La simulation est faite à l’aide du logiciel RTMaps. L’un de ses avantages CHAPITRE 3. Erreurs relatives au système MMS
55
principaux est certes la possibilité d’enregistrer des données datées et synchronisées de
manière à pouvoir effectuer un rejeu (replay) de ces dernières pendant des tests « hors
lignes ». En effet, cinq nuages de points sont obtenus après avoir modifié des angles
eulériens de la matrice de boresight selon les valeurs du Tableau 3.3. Les relevés laser ainsi que
les segments extraits (à la main sous MicroStation v8i SSE2 pour éviter des erreurs
possibles), au sein d’un petit fragment de la scène balayée, sont visualisés par la Figure 3.7.
Nous remarquons que les excentricités angulaires erronées ont une grande influence sur la
géométrie du nuage, et donc sur la qualité. De plus, si un seul angle boresight est incorrect,
l’écart de cet angle est aisé à observer. Une analyse plus approfondie nous permet de
retrouver ces valeurs numériques, en examinant des angles entre les arêtes correspondantes
(Figure 3.8).
Figure 3.7 Impact de faux étalonnage extrinsèque sur le nuage : a) Nuage correct ;
b)c)d)e) Nuages respectivement N1,N2,N3,N4 obtenus en prenant en compte les valeurs du
Tableau 3.3 56
Tableau 3.3 Angles d’Euler formant la matrice de boresight, prise en compte pour générer des
nuages de points
Nuage ݁௭ (lacet) [°] ݁௬ (tangage) [°] ݁௫ (roulis) [°]
Réf* -90.0000 0.0000 0.0000
N1 -90.0000 0.0000 10.0000
N2 -90.0000 10.0000 0.0000
N3 -80.0000 0.0000 0.0000
N4 -80.0000 10.0000 10.0000
*Nuage correct
En se basant sur les études effectuées, nous concluons que :
1) L’écart de lacet est visible sur les arêtes horizontales et à la fois perpendiculaires à la
direction de déplacement du système ;
2) L’écart de tangage est notable non seulement sur les segments verticaux, mais aussi
sur ceux horizontaux et perpendiculaires à la direction de la plate-forme ;
3) L’écart de roulis est identifiable dans les lignes verticales.
En revanche, si tous les angles sont biaisés, il faut trouver une façon de quantifier l’écart de
chacun des angles ൫݁௫, ݁௬, ݁௭൯.
Figure 3.8 Étude de l’impact des écarts d’excentricités angulaires sur la géométrie des lignes
En conclusion, l’utilisation d’arêtes extraites dans les nuages de points devrait permettre
l’étalonnage du système. 57
CHAPITRE 4
Extraction d’arêtes
Sommaire :
9. Extraction d’arêtes ............................................................................................................. 57
4.1 Méthode générale - vue d’ensemble ..................................................................................... 58
4.2 État de l’art sur l’extraction d’arêtes ................................................................................... 59
4.3 Segmentation en éléments plans - état de l’art .................................................................. 61
4.3.1 Segmentation par croissance de surface (régions) .................................................................... 62
4.3.2 Transformée de Hough 3D ............................................................................................................ 63
4.3.3 Algorithme de RANSAC ................................................................................................................ 65
4.4 Contribution à la détection de plans .................................................................................... 67
4.4.1 Motivation ......................................................................................................................................... 68
4.4.2 Extraction séquentielle de plans .................................................................................................. 69
4.4.3 Connectivité de plans basée sur la théorie des graphes ........................................................... 71
4.5 Méthode proposée d’extraction d’arêtes ............................................................................. 77
4.6 Exemples de résultats ............................................................................................................. 82
4.6.1 Détection de plans ........................................................................................................................... 82
4.6.2 Extraction d’arêtes .......................................................................................................................... 84
9. Extraction d’arêtes
Dans ce chapitre un état de l’art des algorithmes récents d’extraction d’arêtes et de détection de plans
dans le nuage de points est présenté. Pour satisfaire à nos exigences, à savoir, celles de recueillir des
éléments linéaires (arêtes de bâtiments) pouvant remplacer les points de contrôle employés
ordinairement, une méthode de détection des plis est proposée. Son idée repose sur l’intersection des
plans principaux extraits dans le nuage. La recherche des plans sécants consiste avant tout à analyser
l’angle d’intersection, ainsi que la distance réciproque entre toutes les combinaisons possibles de
segments plans. Enfin, seules les entités linéaires dont la longueur est supérieure à un seuil prédéfini
sont retenues.
Concernant la segmentation en éléments plans, qui est une phase déterminante, nous utilisons
l’estimateur de RANSAC pour détecter précisément les plans principaux de la scène. Mais, malgré tous
ses avantages, l’algorithme de RANSAC seul peut parfois donner des résultats erronés. Plus
précisément, il cherche « le meilleur plan » sans tenir compte de la particularité de l’objet. Par
Résumé 58
conséquent, les relations topologiques sont omises et les segments plans détectés ne coïncident pas
toujours avec la scène réelle du point de vue sémantique. C’est pourquoi nous avons renforcé
l’algorithme de RANSAC par une analyse des composantes connexes. Pour résoudre le problème de
connectivité de plan, une approche innovante basée sur la théorie des graphes est proposée. Nous
suggérons de systématiser, au sein du nuage, les relations entre les points en tenant compte de
l’information sur leur voisinage local. Le nuage est désormais considéré comme un graphe non orienté
défini par un ensemble de sommets ܸ et d’arêtes ܧ. Ensuite, la recherche des composantes connexes se
résume à déterminer tous ses sous-graphes connexes. Nous nous référons, au lieu d’employer l’un des
algorithmes récursifs d’exploration du graphe, à une décomposition de Dulmage-Mendelsohn. Enfin,
des résultats d’extraction d’arêtes sur quelques jeux de données sont illustrés.
4.1 Méthode générale - vue d’ensemble
En vision par ordinateur et tout particulièrement en traitement d’image, la détection de
différentes caractéristiques y compris des contours demeure un champ de recherche souvent
abordé. La représentation d’une image par des contours peut significativement réduire la
quantité des données et permet d’éliminer les informations jugées moins pertinentes, tout en
préservant les propriétés structurelles de l’objet. Il existe un grand nombre d’algorithmes de
détection, applicables à des images. Cependant, lorsqu’ il s’agit des nuages de points 3D, les
travaux relatifs à ce sujet ne sont pas nombreux, même si l’extraction des arêtes reste une
étape primordiale dans la modélisation tridimensionnelle.
Concernant l’extraction des arêtes, nous proposons une méthode de détection de plis, conçue
afin de diminuer l’influence de la densité de nuages de points sur le résultat final. Les
intersections réalisées entre les plans principaux, à savoir, entre les façades elles-mêmes,
mais aussi entre les façades et le sol, devraient répondre à nos besoins – fournir des entités
linéaires précises, servant, à leur tour, à la qualification des données laser, au recalage ou bien
encore à l’étalonnage. Du fait du manque, à notre connaissance, de description exhaustive de
ce genre d’algorithmes, nous expliquons, dans ce chapitre, toutes les démarches effectuées,
permettant d’extraire des droites d’intersection à partir de nuage de points.
Figure 9.1 Organigramme de l’approche d’extraction d’arêtes proposée
L’approche proposée comporte deux étapes cruciales, comme illustré par la Figure 9.1. Dans
un premier temps, le nuage est segmenté en éléments plans avec l’algorithme de RANSAC.
Nous procédons ensuite à une analyse des composantes connexes pour vérifier, de façon
robuste et précise, la connectivité et la sémantique des points formant chaque segment plan. CHAPITRE 4. Extraction d’arêtes
59
Nous obtenons alors un ensemble de segments plans ∏ accompagnés par les paramètres du
plan ajustant au mieux ces points. Nous entendons par le terme « segment plan » un
ensemble de points coplanaires à une tolérance près, et avec des limites bien définies.
Autrement dit, c’est un plan limité possédant une certaine épaisseur. Nous étudions ensuite
les relations de voisinage entre tous les segments plans détectés. Leur analyse va nous
amener à la reconstruction des arêtes ayant une longueur supérieure à une tolérance admise
ܶ௦.
Nos travaux se concentrent, dans un premier temps, sur la détection de plans indispensables
dans le processus d’extraction d’arêtes. Ce chapitre est structuré de la manière suivante.
Nous commençons par présenter l’état de l’art traitant de l’extraction d’arêtes (4.2) et de la
reconnaissance de plans (4.3) dans les nuages de points. Nous caractériserons quelques
méthodes, les plus souvent utilisées pour la segmentation des nuages 3D. En second lieu
(4.4), nous détaillerons notre approche de segmentation basée sur l’algorithme de RANSAC.
Comme la réalité n’est pas toujours compatible avec le modèle mathématique, nous
proposons d’intégrer une contrainte de connectivité entre les points constituant chaque sousnuage
(segment plan) extrait. Cette problématique étant déjà connue, nous développons une
solution alternative ne nécessitant plus de conversion d’un nuage 3D en une image 2D.
Ainsi, la perte possible d’information lors de la transformation du nuage, causée
habituellement par le nombre impropre de pixels par unité de longueur (résolution pix/m),
ne se produira jamais. De cette façon, les erreurs apparaissant quand différents objets
architecturaux de la scène se trouvent sur le même plan mathématique peuvent être
corrigées et les plans détectés correspondront aux façades réelles. Ensuite (4.5), nous
décrivons l’étape de recherche des intersections entre les segments plans. Par la suite (4.6),
nous montrerons l’efficacité de notre algorithme en illustrant les résultats obtenus sur
quelques nuages de points mobiles. Nous finirons par une brève discussion concernant les
points forts et faibles d’une telle approche.
4.2 État de l’art sur l’extraction d’arêtes
La majorité des méthodes visant à indiquer les zones contenant « des points candidats »,
c’est-à-dire les points situés à l’intersection de deux surfaces, consiste à calculer la normale
au point. Alternativement, il est possible de construire un maillage pour ensuite étudier la
normale de chaque triangle. Dès qu’un changement important dans la direction des normales
s’opère, l’existence d’une arête est perçue [Alshawa, 2006], [Demarsin, 2007].
Figure 9.2 Exemple de résultats intermédiaires d’extraction d’arêtes :a) façade triangulée ;
b) points de contours [Boulaassal, 2010] 60
Les travaux de [Boulaassal, 2010] visent à extraire des points de contour représentant les
deux types d’arêtes (Figure 9.2b). Dans son approche, quatre étapes essentielles se
distinguent : 1) la détection des plans ; 2) la triangulation de Delaunay ; 3) l’analyse de la
longueur des côtés des triangles ; 4) la vectorisation des contours. Les sommets, reliant les
côtés longs des triangles (marqués par un cercle vert dans la Figure 9.2a) dont la longueur
change brusquement, et est à la fois supérieure à un seuil fixé, seront considérés comme des
points de contour.
L’algorithme de [Wang et al., 2011] permet de détecter automatiquement, dans le nuage de
point mobile, des ouvertures sous forme de fenêtre et de porte. Il s’appuie, lui aussi, sur la
détection préalable des façades de bâtiments. Ensuite, le voisinage local de chaque point du
nuage est examiné suivant deux directions : verticale et horizontale. Pour faciliter cette
tâche, un paramètre connu a priori, notamment celui de l’écartement entre deux fenêtres
voisines, est pris en compte.
Dans le même contexte [Tuttas et Stilla, 2011] détectent des fenêtres dans les nuages acquis
par un système mobile aéroporté ALS. Ces données d’entrée se caractérisent par une faible
densité (seulement 5 points par m2). Leur approche est basée sur deux hypothèses :
1) Le faisceau laser passe toujours à travers les vitres des fenêtres. C’est pourquoi la
présence des fenêtres peut être assimilée à des points se trouvant derrière la façade
principale ;
2) Toutes les fenêtres sont disposées de manière régulière.
Afin d’extraire des points notablement éloignés et situés derrière la façade, les distances
entre tous les points du nuage et le plan approximant sont calculées. La dernière phase
consistera à faire une corrélation entre deux images : celle créée à partir des points détectés
lors de l’étape précédente et un marqueur (motif linéaire) horizontal ou vertical.
Cependant [Soria-Medina et al., 2011] cherchent à extraire des éléments d’une façade en
s’appuyant non seulement sur l’information géométrique, mais aussi sur l’intensité. Les
démarches proposées font référence à des outils dédiés au traitement d’image 2D. Ils
proposent alors une solution intégrant l’algorithme des K-moyennes (K-means) et les
opérateurs de la morphologie mathématique afin d’extraire des contours.
Un autre point de vue est envisagé par [Bienert, 2008]. Une méthode de détection des arêtes
dans un nuage de points dense est proposée. Son idée repose sur le lissage du nuage avec un
élément structurant. En effet, la position de chaque point est recalculée à partir de son
voisinage. Ensuite, tous les points englobés par cet élément structurant participeront à
l’ajustement d’une droite.
Nous venons de voir que la plupart des algorithmes d’extraction de segments, dédiés au
nuage de points, permettent de détecter des points de contour appartenant potentiellement à
l’arête. Néanmoins, il faut souligner qu’une telle entité linéaire peut être loin de la
représentation de l’arête réelle. Les points du nuage seront d’autant plus proches de l’arête
que la résolution du balayage effectué est petite. Mais, les tests des télémètres laser
démontrent qu’il est très difficile, voire impossible, de mesurer précisément des bordures
d’un objet, en raison de la diffraction subie par le faisceau laser à cet endroit [Kilmkowska et
Wrobel, 2006]. L’une des pistes d’amélioration du processus d’extraction s’oriente vers la
fusion des informations liées aux points 3D avec celles des images. L’utilisation conjointe de
ces deux types de données est examinée entre autres par [Yong et Huayi, 2008], [Wang et
al., 2013] et [Wang et al., 2014]. Les résultats obtenus mettent en évidence les avantages de
cette solution. CHAPITRE 4. Extraction d’arêtes
61
4.3 Segmentation en éléments plans - état de l’art
Le traitement des relevés laser en vue de leur reconstruction fait l’objet de très nombreux
travaux. La reconnaissance de différentes surfaces est considérée comme un problème de
segmentation. Son objet est de séparer des formes de l’environnement en fonction de leur
homogénéité, étant vérifiée au regard de la position des points, de la courbure, de la planéité
ou de la direction de normale. Elle constitue également l’une des premières étapes de la
modélisation tridimensionnelle puisque son but est de faciliter l’interprétation ultérieure des
données.
Les méthodes existantes de la segmentation des nuages 3D s’inspirent, en général, des
approches largement connues en vision par ordinateur. Le problème se réduit souvent à
l’analyse de l’image de profondeur obtenue par la projection de nuage de points sur un plan
image, où la valeur du pixel correspond à la distance du point au plan [Hernandez et
Marcotegui, 2008], [Serna et Marcotegui, 2013]. D’après [Boulaassal, 2010], les
algorithmes de segmentation dédiés aux relevés laser peuvent être regroupés en deux
catégories. La première famille, bénéficiant des relations de proximités et de similitude,
comprend des approches fondées sur la fusion notamment la segmentation par croissance de
surface, la segmentation par division-fusion (split-and-merge), ou bien encore la segmentation
par profils de balayage. Le second groupe adapte les techniques de reconnaissance
automatique de formes. Celles-ci étant plus robustes, elles ne peuvent être employées qu’afin
de subdiviser le nuage en primitives géométriques définies par l’ensemble de paramètres. Il
s’agit des modèles 3D a priori tels que la sphère, le plan, le cône, ou le tore. Les techniques
les plus utilisées font appel à la transformée de Hough [Hough, 1962] ou à l’algorithme de
RANSAC (RANdom SAmple Consensus) de [Fischler et Bolles, 1981]. Les deux approches
s’avèrent particulièrement robustes au bruit, entachant les nuages de points.
La détection de plans ou l’approximation par un plan s’avère un problème spécifique de la
segmentation de données 3D permettant de séparer une scène complexe en deux parties : les
zones planes et non planes. Durant ces dernières années, plusieurs méthodes d’extraction de
plans ont été proposées. Un aperçu de quelques techniques est donné par [Vosselman et al.,
2004].
Les travaux de [Bauer, 2005] et [Boulaassal, 2010] s’appuient sur l’utilisation de
l’algorithme de RANSAC dans le but de détecter les façades de bâtiments à partir du nuage
de points dense. Cependant, plusieurs améliorations de cet estimateur ont été apportées afin
de l’optimiser et de le rendre encore plus efficace et fiable. [Delmerico et al., 2011] et
[Awwad et al., 2011] proposent de prendre en compte des normales en chaque point. De
même [Bretar et Roux, 2005] détectent les plans de toits dans les nuages de points aériens à
l’aide de l’algorithme ND-RANSAC (Normal Driven RANSAC). À cet effet, ils calculent les
normales au point. Puis, le tirage aléatoire d’un échantillon minimal composé de trois points
ayant les vecteurs normaux d’orientation identique est effectué. L’approche de [Yang et al.,
2010] consiste à diviser un nuage de points en petits blocs. Ensuite, une méthode combinant
l’algorithme de RANSAC avec la longueur de description minimale MDL (Minimum
Description Length) est exécutée au sein de chaque sous-nuage de points. La tâche de ce
dernier est de vérifier le nombre de plans retrouvés, étant entendu que ce nombre varie, d’un
bloc à l’autre, de zéro à trois plans. En même temps [Gallo et al., 2010] développent un
algorithme appelé CC-RANSAC dont l’idée repose sur la recherche de la composante
connexe la plus grande dans l’image de profondeur.
De leur côté [Tasha-Kurdi et al., 2007], [Borrmann et al., 2011] et [Borowiec, 2012]
emploient la transformée de Hough 3D comme un outil de détection des plans.
Les méthodes de [Deschaud, 2010], [Jarzabek-Rychard et Borkowski, 2010] et [Tuttas et
Stilla, 2010] sont fondées sur un algorithme de croissance de surface. L’idée consiste
toujours à identifier tout d’abord des régions graines et de les faire croître selon certaines 62
conditions comme nous l’expliquerons dans le paragraphe 4.3.1. Son avantage principal est
d’être rapide lorsqu’il y a de nombreux petits plans à extraire. Sinon, lors de détection des
plans grands (par exemple les plans de taille d’une façade) l’algorithme tend à être plus en
plus lent [Deschaud, 2010].
Parmi les travaux portant sur la détection des toits de bâtiment dans les données laser
aéroportées, nous pouvons remarquer un certain nombre d’études comparatives. [JarzabekRychard
et Borkowski, 2010] analysent les résultats obtenus avec la croissance de surface et
l’algorithme de RANSAC. Ils en concluent que ce dernier est plus efficace pour la
segmentation de modèles peu compliqués. En revanche, il est plus susceptible d’unir des
points situés sur le même plan mathématique, mais appartenant, en réalité, à différentes
structures architecturales. Dans ce même contexte [Tarsha-Kurdi, 2008] améliore
l’algorithme de RANSAC pour le comparer, par la suite, avec la transformée de Hough. Il
constate que l’algorithme de RANSAC est plus adapté aux données 3D, tant en termes de
traitement que d’insensibilité au bruit.
Pour tirer profit des deux méthodes de segmentation, [Tuttas et Stilla, 2013] proposent une
approche de détection de façades en deux étapes : le traitement grossier et fin. Dans un
premier temps, la segmentation par croissance de surface basée sur deux critères (seuil de
normale et de distance) est effectuée. Ensuite, chaque plan est analysé afin de vérifier s’il doit
être subdivisé en plusieurs segments plans. Le plan final est retrouvé avec l’algorithme de
RANSAC. Pareillement [Oehler et al., 2011], emploient la transformée de Hough combiné
avec l’algorithme de RANSAC. D’abord, les normales sont calculées et la pré-segmentation
est réalisée avec la transformée de Hough. Puis, l’algorithme de RANSAC est directement
employé sur les segments plans détectés auparavant.
Finalement [Borowiec, 2008], s’appuie, afin de détecter de toits, sur une approche basée sur
l’algorithme de division-fusion.
L’étude des travaux actuels révèle que la majorité des approches optent pour la détection de
plans dans le nuage de points à l’aide de l’algorithme de RANSAC, de la transformée de
Hough, ou éventuellement de la croissance de surface. C’est pourquoi nous détaillerons dans
cette section les principes de fonctionnement propres aux techniques susmentionnées.
4.3.1 Segmentation par croissance de surface (régions)
La segmentation par croissance de surface est conceptuellement une adaptation, dans l’espace
Թଷ, d’une méthode de croissance de régions. Son objectif est d’isoler des zones les plus
homogènes possibles, tout en respectant des conditions arbitraires imposées. Nous
distinguons deux étapes principales de l’algorithme :
1) Trouver les points de départ – régions graines (seed) ;
2) Rassembler des points/pixels voisins entre eux suivant les critères prédéfinis
Or, cette méthode consiste à faire progressivement grossir les régions autour de leurs points
de départ. Les zones grandissent alors par incorporation des points les plus similaires.
L'agglomération des points n'exploite aucune connaissance a priori du nuage ou du bruit qui
le dégrade. La décision d’intégrer à la région un point voisin repose sur un seul voire deux
critères tels que la proximité des points (seulement les points proches peuvent être ajoutés),
la planéité locale (la distance orthogonale du point au plan doit être inférieure à un seuil
fixé), le champ de vecteurs normaux (les angles entre la normale du plan et les normales de
tous les points voisins appartenant au plan doivent être inférieurs à un seuil choisi)
[Vosselman et al., 2004]. Par conséquent, les variantes se distinguent surtout par la manière
de sélectionner des plans initiaux et par les critères de croissance définis. Le choix des
régions graines est la phase la plus critique de l’algorithme puisqu’elle joue sur la qualité des
résultats obtenus et sur le temps de calcul. CHAPITRE 4. Extraction d’arêtes
63
4.3.2 Transformée de Hough 3D
La transformée de Hough [Hough, 1962] est un outil de reconnaissance de formes basé sur
une connaissance a priori. Cette méthode fait partie de la famille des algorithmes de votes.
Elle est souvent utilisée dans la détection de lignes 2D (en analyse d’images). Mais,
l’extension à d’autres primitives géométriques représentées par une fonction mathématique
simple (par exemple plan, cercle, ellipse) ou à des espaces de dimension quelconque est aussi
possible.
Cas 2D - ligne
Afin d’expliquer le principe de la transformée de Hough, nous commençons par un exemple
typique – une ligne 2D.
Figure 9.3 Correspondance géométrique entre l’espace cartésien (à gauche) et l’espace
paramétrique de Hough (à droite) (Illustration reproduite à partir de [Poncelet et Cornet,
2010])
Étant donné une droite notée ݕ ൌ ݉ݔ ܾ (où m : coefficient directeur et b : ordonnée à
l’origine) dans l’espace Euclidien, il nous faut, conformément à l’idée de Hough, changer
l’espace de représentation de cette droite et l’exprimer désormais par ܾ ൌ െ݉ݔ ݕ. Nous
obtenons l’équation d’une droite passant par un point ሺ݉, ሻ dans l’espace de paramètres
(l’espace de Hough). Cette forme la plus classique, servant à représenter la droite, n’est
cependant pas sans problème, car les droites verticales et horizontales auront des valeurs
infinies pour m et b. Pour pallier cet inconvénient, il est donc préférable d’exploiter les
coordonnées polaires (l’équation normale) d’une droite au lieu de sa formulation cartésienne
(9.1) [Duda et Hart, 1971]. 64
(9.1) ߠ݊݅ݏݕ ߠݏܿݔ ൌ ߩ
où :
ߩ : distance de la ligne à l’origine
ߠ : angle (l’orientation du vecteur normal de la droite depuis l’origine)
Cas 3D - plan
Le même principe s’applique à la détection de plans. Chaque plan de l’espace Euclidien est
défini par la formulation normale donnée par :
(9.2) ߮݊݅ݏݖ ߮ݏܿߠ݊݅ݏݕ ߮݊݅ݏߠݏܿݔ ൌ ߩ
La Figure 9.4 explique la notation employée dans l’équation (9.2).
Figure 9.4 Formulation normale d’une droite
De manière analogue, les trois paramètres ሺߠ, ߮, ߩሻ définissent l’espace de paramètres.
Chaque point ሺߠ, ߮, ߩሻ de cet espace correspondra à un plan de l’espace cartésien et vice
versa. Étant donné un point quelconque du plan ∏, tous les plans auxquels ce point
appartient doivent être trouvés.
Figure 9.5 Espace de paramètres : a) Sinusoïde 3D calculée à partir d’un point de l’espace
cartésien ; b) Transformée de Hough de trois points et le point d’intersection (carré noir)
[Borrmann et al., 2011] CHAPITRE 4. Extraction d’arêtes
65
En traçant ces points dans l’espace de Hough, une courbe sous forme d’une sinusoïde 3D est
obtenue (Figure 9.5a). Par conséquent, un plan passant par ܰ points est, dans l’espace de
paramètres, le point d’intersection de ܰ sinusoïdes (Figure 9.5b). Finalement, le pic de
l’accumulateur correspond à un maximum de points dans un même alignement. Plus des
courbes se coupent en un même point de l’espace de paramètres, plus des points
appartiennent au plan détecté. La transformée de Hough cherche à trouver le meilleur plan
qui est perçu comme celui contenant un nombre maximal de points. De ce fait, le plan
optimal n’est pas calculé au sens des moindres carrés.
4.3.3 Algorithme de RANSAC
L’algorithme de RANSAC [Fischler et Bolles, 1981] est très largement utilisé dans le
domaine de la vision par ordinateur pour l’estimation des paramètres. Son avantage est d’être
robuste et rapide, même en présence d’observations aberrantes. L’une de ses applications est
la détection, de manière interactive, de plans. [Zuliani, 2012] rapporte que cet estimateur
résiste très bien à la présence de données non valables (outliers) en supportant jusqu’à 50%
d’erreurs grossières. Cette marge rend, de ce fait, la méthode particulièrement intéressante
pour traiter les nuages de points contenant pourtant des mesures bruitées.
Son principe est simple : il s’agit toujours de sélectionner au hasard un nombre minimum de
données afin de calculer les paramètres d’un modèle mathématique, puis d’identifier parmi
toutes les données, celles ayant une chance raisonnable d’appartenir à ce modèle. Le
processus étant itératif, il s’arrête lorsque l’on trouve un sous-ensemble de points le plus
nombreux.
Deux phases essentielles de l’algorithme de RANSAC peuvent être distinguées. La première
nommée « Initialisation » consiste à tirer aléatoirement un nombre minimum de points (un
quorum) ܵ parmi ܰ points de l’ensemble. Un plan est défini par quatre paramètres, dont trois
ሺߠଵ, ߠଶ, ߠଷሻ étant indépendants, sont les composantes de la normale au plan et ߠସ est la
distance du plan à l’origine. Alors, l’échantillon minimal contiendra trois points ܵ ൌ
ሼଵ, ଶ, ଷሽ à partir desquels tous ces indices seront déterminés. Nous désignons par ܯሺߠሻ le
modèle mathématique du plan défini de la manière suivante :
ܯሺߠሻ ൌ ሼߠଵஸஸସ ∈ Թ: ߠଵݔߠଶݕߠଷݖߠସ ൌ 0ሽ (9.3)
La seconde étape « Test », exécutée après le calcul du modèle, vérifie un score, perçu
généralement comme le nombre de points ajustant au mieux le plan. Nous considérons qu’un
point quelconque appartient au plan, si et seulement si, il est situé à une distance inférieure à
une tolérance prédéfinie ߜ.
Nous introduisons les termes inhérents à l’utilisation de RANSAC. On appelle désormais EC
« Ensemble de Consensus » (Consensus Set), l’ensemble de points satisfaisant au modèle prédéfini
auparavant par un quorum de points. On note Card(EC) le nombre de points valables (inliers).
(9.4) ൟߜ ሻ൯ߠሺܯ ,ெ൫݁ :ܰ ∋ ൛ ሻ ൌܥܧሺ݀ݎܽܥ
Dans la formule (9.4) l’écart entre le point p et le modèle ܯሺߠሻ se calcule de la manière
suivante :
,ሺݐݏ݅݀ ≝ ሻ൯ߠሺܯ ,ெ൫݁
∗ሻ (9.5)
où
∗
symbolise la projection orthogonale du point p sur le modèle ܯሺߠሻ. 66
Les deux phases sont répétées ܰ௧ fois. À ce moment, le plan est retenu s’il contient
suffisamment de points, c’est-à-dire si le nombre de points Card(EC) appartenant au
« meilleur modèle » est le plus grand (Figure 9.6).
Figure 9.6 Vue de profil de la zone d’épaisseur ߜ contenant les points valables (vert)
satisfaisants au modèle défini par un quorum de points (rouge)
L’estimation du nombre d’itérations qui permettrait d’interrompre l’algorithme reste une
question délicate. L’algorithme de RANSAC, dans sa version de base, vise à garantir un
nombre optimal de tirages indispensables pour estimer le meilleur plan avec une probabilité
ܲ. En admettant que ܹ désigne la probabilité de choisir, à chaque itération, un point valable,
la probabilité que les trois points du quorum appartiennent tous au plan final est de ܹଷ. De
ce fait, il y a une probabilité égale à ሺ1െܹଷሻ qu’au moins un de ces points ne fasse pas partie
des points valables. Nous pouvons relier les probabilités ܲ et ܹ avec le nombre d’itérations
ܰ௧ par l’équation suivante :
ሺ1െܲሻ ൌ ሺ1െܹଷሻேೝ ⇔ ܰ௧ ൌ ݈݃ሺ1െܲሻ
݈݃ሺ1െܹଷሻ
(9.6)
La formule (9.6) démontre qu’afin de déterminer le nombre d’itérations, la connaissance de ܲ
et ܹ est primordiale. Le choix de ces valeurs se fait de manière empirique. La probabilité ܲ
est choisie de préférence élevée ሺܲ 0.95ሻ. Quant à la valeur ܹ, elle doit être estimée en
fonction des données. Cette probabilité, pour un seul point, est exprimée par : CHAPITRE 4. Extraction d’arêtes
67
ܹ ൌ
ሻܥܧሺ݀ݎܽܥ
ሺܰሻ݀ݎܽܥ
(9.7)
Il est difficile de choisir dûment la probabilité ܹ car souvent nous ne connaissons pas le
nombre de points valables restant dans le nuage de points. L’algorithme est ainsi initialisé en
utilisant une estimation grossière de ܹ, ce qui augmente le risque d’accepter un nombre
inapproprié d’itérations.
Pour surmonter cet inconvénient, une version adaptative de RANSAC a été développée par
[Hartley et Zisserman, 2003]. L’idée consiste à sélectionner dynamiquement le nombre de
tirages à réaliser, en adaptant la valeur ܹ grâce au cardinal de l’ensemble de consensus
trouvé. En d’autres termes, le nombre maximal d’itérations sera mis à jour avant le
démarrage de la prochaine sélection d’un quorum de points. L’avantage principal d’un tel
raisonnement est d’être plus efficace et de réduire considérablement le temps de calcul.
4.4 Contribution à la détection de plans
Pour notre application, nous souhaitons pouvoir détecter de grands plans (plans principaux)
tels que les façades des bâtiments, le sol, tout en étant suffisamment rapide. L’analyse de
l’état de l’art, nous a encouragé de choisir l’estimateur de RANSAC comme l’algorithme de
base puisqu’il paraît le plus robuste pour traiter de nombreux points. Nous implémentons sa
version adaptative décrite dans la section précédente et caractérisée par [Zuliani, 2012]. La
segmentation en segments plans s’effectue de manière séquentielle. Une fois un plan détecté,
les points qui lui appartiennent sont retirés du nuage. L’algorithme s’interrompt lorsqu’il n’y
a plus de données à classer, ou lorsque les points restants ne permettent pas d’obtenir de
segment plan contenant un nombre suffisant de points, ou bien encore quand le nombre de
plans désirés ܰ a été retrouvé.
Sachant que les segments plans obtenus à l’aide de l’algorithme de RANSAC ne peuvent pas
toujours coïncider avec la scène réelle du point de vue sémantique, il nous faut aussi prendre
en compte les relations topologiques entre les points formant un plan. Nous avons donc
enrichi l’algorithme de RANSAC d’une analyse des composantes connexes. La problématique
de connectivité a été largement étudiée en traitement d’images 2D. Elle vise à vérifier si
deux pixels sont voisins et s’ils respectent, en même temps, une condition arbitraire par
exemple l’égalité des niveaux de gris. En conséquence, nous pouvons nous en inspirer pour
incorporer une contrainte de connectivité entre les points formant un segment plan. Dans cet
esprit [Boulaassal, 2010] et [Gallo et al., 2010], transforment un plan 3D détecté par
l’algorithme de RANSAC en une image 2D. Le passage est réalisé par la projection des
points du nuage sur le plan moyen. Cette étape nécessite de choisir soigneusement la
résolution de l’image créée (le nombre de pixels par unité de longueur) afin d’éviter les
problèmes d’échantillonnage. Des valeurs trop larges ou trop petites ne permettront pas
d’étudier la connectivité de pixel. La séparation ultérieure des différentes régions consiste à
calculer la différence entre les valeurs de pixels voisins.
Étant donné que la conversion en image peut être une source importante d’erreurs, nous
avons proposé un algorithme fonctionnant directement sur des nuages de points. Il fait appel
aux éléments de la théorie des graphes et attend seulement quelques paramètres initiaux
pour s’exécuter. Ainsi, nous structurons les nuages, et effectuons une décomposition de
Dulmage–Mendelsohn [Dulmage et Mendelsohn, 1958] aboutissant à décomposer de façon
unique un graphe biparti non orienté en composantes connexes. Ce premier est défini grâce à
l’analyse du voisinage de chaque point du nuage. Nous systématisons les points du segment
plan, étant naturellement désordonnés, en les représentant par un ensemble de sommets
(points) ܸ et d’arêtes ܧ établissant les relations topologiques entre ces sommets. 68
L’extraction de segments plans est menée en deux étapes comme l’illustre la Figure 9.7.
Nous présenterons dans le paragraphe 4.4.2 l’algorithme de RANSAC tel qu’il est
implémenté. Ensuite, nous discuterons des principes de notre méthode de détection de
composantes connexes basée sur la théorie des graphes (paragraphe 4.4.3).
Figure 9.7 Schéma global de l’algorithme d’extraction de segments plans implémenté
4.4.1 Motivation
Un plan est une entité fondamentale à deux dimensions et nous l’imaginons comme une
feuille d’épaisseur nulle qui s’étend à l’infini. Cependant, les plans extraits à partir du nuage
de points n’ont pas forcément ces deux caractéristiques. D’une part, nous devons prendre en
compte la troisième dimension – l’épaisseur provenant principalement du comportement du
faisceau laser sur différentes surfaces. D’autre part, un plan quelconque approximant une
façade, un trottoir ou une route a des limites bien définies. Mais, l’estimateur de RANSAC
fournit un plan illimité, rassemblant tous les points qui appartiennent à un même plan
mathématique.
Figure 9.8 Détection de trois plans successifs par RANSAC. Une couleur correspond à un
plan CHAPITRE 4. Extraction d’arêtes
69
La Figure 9.8 montre trois plans successifs extraits à partir du nuage mobile
Stereopolis2009_Soufflot avec cet algorithme. Les deux façades (marquées en orange), étant en
réalité séparées, ont été classifiées comme une seule entité planaire. De plus, nous observons
de nombreuses régions éparpillées autour des régions principales qui ne devraient pas être
intégrées au modèle final.
Nous visons à supprimer ces petits plans pouvant fausser les résultats du traitement
ultérieur, notamment l’extraction d’arêtes basée, par défaut, sur les plans. Étant donné que
nous cherchons à conserver les plans les plus précis possibles et reconstruisant correctement
la scène réelle, il nous semble primordial d’effectuer une analyse du nombre d’entités
constituant le segment plan et d’en conserver une seule partie – celle ayant l’aire la plus
grande. La Figure 9.9 illustre le plan détecté via l’algorithme de RANSAC et celui que l’on
souhaiterait extraire. C’est pourquoi nous proposons une extraction innovante des
composantes connexes dédiée au nuage. Il s’agit d’étudier le voisinage de points pour s’en
servir lors de l’extraction des composantes connexes.
Figure 9.9 Exemple d’erreurs de connectivité : plan détecté (à gauche) ; plan recherché (à
droite)
4.4.2 Extraction séquentielle de plans
L’inconvénient majeur de l’algorithme de RANSAC classique est la détection d’une forme
unique. Pour y remédier, l’une des stratégies à envisager consiste à l’implémenter dans un
mode séquentiel. L’idée de cette approche nous amène à retirer du nuage les points valables
appartenant au segment plan détecté au préalable. Cette opération est de nouveau appliquée
sur les points restants jusqu’à ce que le nombre prédéfini de plans ܰ ait été extrait ou
jusqu’à ce qu’il n’y ait plus de points permettant une détection de surfaces désirées.
Du fait de la présence de bruit ߪ provenant de l’état d’objet balayé par scanner, sa couleur,
nature et rugosité (voir le Chapitre 3), les nuages de points ont habituellement une épaisseur
non négligeable. C’est pourquoi l’ajustement de plans s’effectue avec une certaine souplesse.
La sélection du seuil ߜ – la zone tampon autour du plan moyen, joue un rôle important au
niveau de la stabilité de l’algorithme de RANSAC puisqu’il peut provoquer des problèmes de
sous-segmentation et de sur-segmentation (Figure 9.10). La valeur de ce seuil ߜ doit être
fixée en tenant compte des caractéristiques du nuage comme sa densité et son degré de 70
bruitage. Ainsi, elle a tendance à être égale à l’épaisseur du nuage de points brut – sans
filtrage préalable.
Figure 9.10 Impact du choix du seuil ߜ sur les résultats de détection des plans :
a) Segmentation avec un seuil faible (0.03m) ; b) Segmentation avec un seuil élevé (0.15m)
D’après [Hartley et Zisserman, 2003] suivis par [Zuliani, 2012], le seuil ߜ peut se calculer
en supposant que tous les points suivent une distribution normale autour du plan moyen.
Nous faisons l’hypothèse que les nuages sont entachés par un bruit gaussien ߟ~ܰሺ0, ܫߪሻ pour
ߟൌെ∗. La valeur ߜ relie désormais, avec une probabilité ܲ, l’erreur générée par les points
valables affectés par le bruit ߪ. L’épaisseur de la zone de tampon δ se calcule de la manière
suivante :
ܨఎටߪൌߜ
ఞమ
మ
ିଵሺܲሻ (9.8)
où :
ܲ : probabilité considérée (ܲ 0.95)
ܨ
߯2
2
െ1 : valeur de la fonction de répartition de la loi chi-2 ሺ߯݉
2 ሻ à m ൌ 2 degrés de liberté
(Tableau 9.1)
ߪ : degré de bruitage
Tableau 9.1 Table de distribution ߯2
2 selon la valeur de probabilité P
Degré de
liberté P=0.900 P=0.950 P=0.975 P=0.990 P=0.999
2 4.605 5.991 7.378 9.210 13.861
Si nous souhaitons récupérer 99% des points d’un plan, nous avons P=0.99, et donc
ܨ
߯2
2
െ1ሺ0.99ሻ ൎ 9.21. L’analyse du Tableau 9.1 permet de constater que plus la valeur de la
probabilité ܲ est proche de l’unité, plus le seuil ߜ est important et, que l’épaisseur de la zone
tampon augmente. Le modèle risque, en réalité, de contenir beaucoup de points aberrants. En
outre, une probabilité ܲ trop petite génère un seuil insuffisant, et les points potentiellement
valables sont susceptibles d’être exclus du modèle.
Dans notre approche, nous avons employé la formule (9.8), au lieu de définir la tolérance de
distance maximale, pour tester l’appartenance des points au plan. Un point est considéré
comme valable si l’écart au carré entre ce point et le plan est inférieur à ߜ2
. Plus précisément,
le test statistique se fait de la manière suivante :
൝
ሻ൯ߠሺܯ ,൫ܯ݁ ݅ܵ
2
2ߜ
݊݉ܽݐ ݁݊ݖ ݈ܽ ݏ݊ܽ݀ éݑݐ݅ݏ ݈ܾ݈݁ܽܽݒ ݐ݊݅
ሻ൯ߠሺܯ ,൫ܯ݁ ݅ܵ
2
2ߜ
ሻ ݁ݏ݅݉݀ܽ ݁ܿ݊ܽݎé݈ݐ ݏݎ݄ሺ ݐ݊ܽݎݎܾ݁ܽ ݐ݊݅
(9.9) CHAPITRE 4. Extraction d’arêtes
71
Cette solution avec un degré de bruit ߪ associé au nuage est censée estimer une valeur
optimale du seuil ߜ. Nous avons implémenté l’algorithme de RANSAC dans la version cidécrite
(voir aussi le pseudo-code 4.1 dans l’Annexe E). Pour la détection de plans, nous
avons besoin en entrée d’un nuage de points ܰ relativement homogène. Néanmoins, il faut
noter que l’utilisation de cet estimateur implique un réglage de trois paramètres : ܲ, ߪ et
éventuellement un nombre de plans désiré ݈ܰ. Le symbole ܲ correspond à la probabilité
d’avoir les points correspondants au plan, tandis que la valeur ߪ est l’écart-type des distances
calculées par rapport au plan. Ces deux indices sont d’ores et déjà nécessaires pour
déterminer la valeur du seuil ߜ. Elle est alors assimilée à la distance maximale point –
modèle, et elle représente l’épaisseur du segment plan à extraire. En sortie, nous obtenons
des sous-ensembles de points formant des plans ∏ et leurs paramètres associés
ሺߠ1, ߠ2, ߠ3, ߠ4ሻ.
4.4.3 Connectivité de plans basée sur la théorie des graphes
Une fois le segment plan détecté, nous procédons à l’analyse des composantes connexes ܥܥ,
c’est-à-dire de toutes les parties surfaciques constituant cette entité. Le terme connectivité
dérive de la notion de voisinage. On dit que deux points de l’espace sont connectés s’ils
appartiennent à la même composante. Quant au critère de décision permettant de distinguer
les points voisins, il s’appuie sur le calcul de distance qui sera ensuite confronté avec un seuil
prédéfini ߩ (distance maximale). En effet, il s’agit de vérifier si un plan se constitue en un seul
« morceau ». Nous entendons par « connectivité » du plan sa continuité spatiale – le segment
plan doit constituer une entité contigüe et non pas un ensemble de surfaces séparées par des
vides comme le montre la Figure 9.9. Sinon, chacun de ses éléments est l’une des
composantes connexes.
La Figure 9.11 illustre notre raisonnement. D’abord, un segment plan est extrait via
l’algorithme de RANSAC tel qu’il est présenté dans la section 4.4.2. Ensuite, nous étudions
les relations de voisinage entre chaque point du sous-nuage. Dès que toutes les composantes
connexes sont déterminées, leurs surfaces sont calculées et comparées les unes par rapport
aux autres. Puis, la partie dont l’aire est la plus importante sera retenue, tandis que les points
des autres régions seront réintégrés dans le nuage pour participer à la recherche ultérieure
de meilleurs plans.
Figure 9.11 Correction d’extraction du plan : a) Premier plan détecté via l’algorithme de
RANSAC ; b) Étiquetage des composantes connexes ; c) Segment plan retenu après
intégration du critère de connectivité
Afin de résoudre le problème de connectivité, le nuage de points ܰ est traité comme un
graphe non orienté pour lequel tous ses sous-graphes ܩ′
seront recherchés. À ce stade, il
nous faut rappeler que nous travaillons directement sur les données laser 3D. Nous
constatons que les points appartiennent à la même composante connexe, si est seulement si,
il existe au moins un chemin reliant n’importe quel couple de points de cette composante. 72
Nous distinguons deux phases dans notre approche de détection de composantes connexes
d’un segment plan (Figure 9.12) : 1) la recherche du voisinage de chaque point du nuage en
respectant les seuils renseignés avec la construction d’une liste de paires de points (sommets)
de telle sorte que chaque paire correspondra à une arête au sens de la théorie des graphes ;
2) l’étiquetage des composantes connexes.
Figure 9.12 Organigramme de l’algorithme d’extraction de composantes connexes
Structuration du nuage de points
Concernant la théorie des graphes, un graphe simple non orienté ܩ ൌ ሺܸ, ܧሻ est défini par la
donnée d’un ensemble de sommets ܸ et d’un ensemble d’arêtes ܧ ⊆ ሼሺݑ, ݒሻ: ݑ, ݒ ∈ ܸ, ݑ ് ݒሽ.
En d’autres termes, un graphe est constitué de sommets ܸ, dont certains sont reliés par des
arêtes, si est seulement si, ces sommets sont adjacents les uns par rapport aux autres (Figure
9.13ab). Si un graphe est non orienté, dans ce cas-là, la relation binaire entre les sommets est
symétrique (si ݑ→ݒ alors ݒ→ݑ). On utilise la notion « ordre du graphe » pour décrire le
nombre de sommets de ce graphe. Un sous-graphe d’un graphe ܩ est défini comme un
′ܩ graphe
composé de certains sommets de ܩ, ainsi que de toutes les arêtes reliant ces
sommets dans ܩ :
′ܩ :ܩ ⊇ ′ܩ
′ܸ൫݄݁ܽݎ݃
′ܧ ,
(9.10) ܧ ∋ ′ܧ ݐ݁ ܸ ∋ ′ܸ ܿ݁ݒܽ ൯
D’un point de vue pratique, le processus de recherche des composantes connexes d’un graphe
non orienté quelconque aboutit à trouver ses sous-graphes connexes maximaux. Dans ce
contexte, « connexe » signifie qu’il existe une suite d’arêtes permettant d’atteindre ݒ à partir
.ݑ de
Pour systématiser les relations entre les points d’un nuage, il est possible de les représenter
sous forme d’une matrice d’adjacence servant ordinairement à caractériser des graphes non
orientés. Il s’agit de la matrice symétrique ܣሺܩሻ de dimension ܰൈܰ (ܰ – nombre de points
du nuage) de telle sorte que ܣሺܩሻ ൌ ൫ܽ൯: 1 ݅, ݆ ܰ. S’il existe une arête (en terme des
graphes) entre deux points i et j, alors ݆ܽ݅ est égal à l’unité, sinon on lui attribue une valeur
égale à zéro. L’inconvénient majeur d’une telle représentation des nuages de points est que
l’on a besoin d’une énorme quantité de mémoire pour son stockage. Cependant, tous les
graphes peuvent être classés en deux catégories : les graphes denses et creux (sparse). Ces
derniers contiennent beaucoup moins d’arêtes que le nombre de sommets au carré ሺ|ܧ|
|ܸ|
2ሻ. Or, la construction de matrice d’adjacence est superflue pour ce type de graphes. Elle
ne peut pas être aussi applicable à des nuages de points.
L’idée de notre approche consiste à créer plutôt une liste d’adjacence (liste de successeurs)
puisque c’est une représentation alternative de la matrice d’adjacence. En fait, elle comprend,
pour chaque point (sommet), une liste de sommets voisins à celui étant examiné (Figure
9.13c). Pour ce faire, il faut mettre en œuvre un algorithme de recherche de voisinage local
comme nous l’expliquerons plus loin. Son choix va imposer un mode de création des
connexions entre les points du nuage et donc, un nombre d’arêtes obtenues en dépendra.
Tous les points relativement proches de celui analysé seront reliés par une arête adéquate. CHAPITRE 4. Extraction d’arêtes
73
Figure 9.13 Représentation d’un nuage de points : a) Nuage de points de départ ; b) Graphe
non orienté ; c) Liste d’adjacence
Voisinage local
Au regard de récentes publications, deux définitions de voisinage local s’avèrent plus
répandues [Rabbani et al., 2006]. La première, utilisée par [Castillo et Zhao, 2009], amène à
prendre un échantillon, autour d’un point, composé des k voisins les plus proches k-NN
(k-Nearest Neighbors) selon une distance à définir. La métrique peut être donnée par la
distance Euclidienne, de Manhattan ou autre. En outre, la recherche des k-NN est souvent
optimisée à l’aide de différentes stratégies de partitionnement de l’espace comme l’arbre kd
(kd-tree) ou un octree. L’inconvénient majeur de cette technique est de dépendre de la densité
du nuage. En admettant un nuage peu dense, le k-ème point peut être très éloigné du point
envisagé et ne devrait pas être considéré comme voisin. En revanche, le fait d’être
indépendant de la distance rend cette méthode plus avantageuse pour certaines applications.
La seconde approche, employée entre autres dans les travaux de [Deschaud, 2010], mieux
adaptée aux données de densité élevée, consiste à percevoir comme voisins tous les points
inclus dans la sphère de rayon ߩ. Un tel raisonnement permet d’être partiellement
indépendant de la répartition des points. Par contre, cette méthode nécessite que la densité
du nuage reste assez homogène. Sinon, le voisinage va inclure trop de points dans les régions
denses et pas suffisamment de points dans celles ayant une densité faible. Dans le même
esprit [Lari et al., 2011] proposent un algorithme similaire dont l’idée consiste à établir le
voisinage de chaque point par l’intermédiaire d’un cylindre adaptif, tout en prenant en
compte la densité locale et la tendance de surface.
L’analyse de nos relevés laser mobile, en terme de répartition de point, confirme que les
points au sein du nuage ne sont pas uniformément répartis sur la surface balayée. En effet,
l’espacement entre les points n’est pas constant – il augmente avec la distance croissante
objet-scanner. De plus, nous observons qu’il varie suivant deux directions. La distance entre
deux points voisins en profil laser est plus petite que celle mesurée dans le sens de la
direction de la plate-forme. Cette première va dépendre de la résolution angulaire du scanner
laser, tandis que l’emplacement entre les profils laser change du fait de la vitesse du véhicule
et de la fréquence du scanner.
En fin de compte, nous avons décidé d’unir les deux premières définitions et de déterminer le
voisinage local comme un échantillon inclus dans la sphère de rayon ߩ, mais en même temps
de limiter le nombre de points autorisés à ݇. Dans ce cas, nous pouvons tirer profit des deux
techniques. Le voisinage établi au sein des régions sur-densifiées ne sera jamais trop chargé,
et celui créé pour les zones sous-densifiées ne contiendra pas de voisins inexacts. 74
Étiquetage des composantes connexes
Une fois le voisinage de chaque point du nuage établi, la matrice creuse A contenant une liste
de toutes les paires est créée. L’étape précédente étant primordiale, nous pouvons procéder à
l’extraction des composantes connexes à partir d’un graphe ܩ.
Figure 9.14 a) Graphe non orienté ; b) Trois composantes connexes détectées
L’une des façons de faire consiste à appliquer l’algorithme de parcours en profondeur DFS
(Depth First Search) [Sarni et Lemarchand, 2011], [Corman et al., 2001]. C’est un algorithme
de recherche explorant un chemin « à fond », sommet par sommet, jusqu’à ce que l’on ne
puisse plus avancer dans le graphe. Nous associons donc à un point de départ et à chacun des
sommets visités lors de l’exploration, un même numéro de composante connexe. Après cette
recherche deux cas peuvent se présenter :
1) Tous les sommets du graphe ont été atteints. Alors, le graphe est connexe et nous
obtenons une seule composante connexe ;
2) Certains sommets n’ont pas été visités et, par conséquent, nous relançons
l’algorithme à partir de l’un d’entre eux, en incrémentant l’indice de composante
connexe.
Nous continuons ainsi tant qu’il subsiste des sommets non explorés. La Figure 9.14 illustre
un exemple de résultats obtenus grâce à cet algorithme. Alternativement, il est possible
d’employer l’algorithme de parcours en largeur BFS (Breadth First Search) qui réalise le
parcours itératif d’un graphe en utilisant un fil. Il diffère du DFS par le fait qu’il liste d’abord
les sommets voisins du point examiné pour ensuite les explorer un par un.
Ces deux solutions paraissant être coûteuses en temps de calcul, nous proposons de nous
référer à une méthode plus efficace, rapide et facile à implémenter. Il s’agit d’appliquer l’un
des algorithmes classiques de la théorie des graphes notamment la décomposition de
Dulmage-Mendelsohn, notée la DM-Décomposition [Dulmage et Mendelsohn, 1958] de la
matrice non carrée A formée au préalable. Celle-ci consiste à permuter les colonnes Q et les
lignes P de la matrice creuse A (beaucoup plus grande que dense) représentant le graphe afin
d’obtenir la forme bloc triangulaire inférieur (9.11).
ܣሺܲ, ܳሻ ൌ ൦ܣଵଵ
0
0
0
ଵଶܣ
0
0
0
ଵଷܣ
ଶଷܣ
0
0
ଵସܣ
ଶସܣ
ଷସܣ
ସସܣ
൪ (9.11)
où : les sous-matrices ܣ12, ܣ23, ܣ34 sont carrées avec une diagonale entièrement non nulle. CHAPITRE 4. Extraction d’arêtes
75
En d’autres termes, nous allons partitionner les lignes ܮ (respectivement, les colonnes ܥ) en
trois sous-ensembles ce qui revient à partitionner la matrice ܣ en neuf blocs, dont trois vont
s’avérer être nuls (Figure 9.15). Pour rappel, chaque entrée non-nulle de la matrice creuse ܣ
représente une arête du graphe. Une telle matrice rectangulaire décrit naturellement un
graphe biparti non-orienté où il y a deux types de nœuds, les sommets « lignes » ܮ et les
sommets « colonnes » ܥ. Nous effectuons, pour mettre sous forme triangulaire par bloc la
matrice d’adjacence ܣ, la décomposition de Dulmage – Mendelsohn. Son idée consiste à
calculer un couplage maximum (matching) ܯ dans le graphe, c’est-à-dire, un sous-ensemble
des arêtes le plus grand possible tel qu’elles n’aient aucun sommet en commun [Cormen et
al., 2001].
௩ܥ ௦ܥ ܥ
A B ܯ ܮ
ܮ௦ 0 ܯ௦ C
ܮ௩ 0 0 ܯ௩
Figure 9.15 Décomposition canonique de la matrice d’adjacence ܣ
Nous introduisons, conformément à [Pothen et Fan, 1990], la terminologie suivante. Étant
donné un couplage ܯ, un sommet insaturé n’appartient à aucune arête du couplage. Une
chaîne alternée est un chemin dans le graphe qui ne repasse pas deux fois par le même
sommet, et dont une arête sur deux appartient au couplage. Une chaîne alternée est dite
augmentante si elle relie deux sommets insaturés. Sur cette base, nous constatons qu’un
couplage est maximal, si est seulement si, il n’existe pas de chaîne alternée augmentante
relativement à ܯ.
Une fois le couplage maximum calculé, le graphe ܩ est alors partitionné comme suit :
ܮ௩ : sommets de ܮ accessibles par une chaîne alternée depuis un sommet insaturé de ܮ ;
ܮ : sommets de ܮ accessibles par une chaîne alternée depuis un sommet insaturé de ܥ ;
ܥ௩ : sommets de ܥ accessibles par une chaîne alternée depuis un sommet insaturé de ܮ ;
ܥ : sommets de ܥ accessibles par une chaîne alternée depuis un sommet insaturé de ܥ ;
ܮ௦ ൌܮെ ሺܮ௩ ∪ ܮሻ
ܥ௦ ൌܥെ ሺܥ௩ ∪ ܥሻ
Comme l’affirme [Bouillaguet, 2011], il est aussi démontrable que :
1) Tous ces ensembles sont deux-à-deux disjoints ;
2) Le couplage relie les lignes de ܮ௩ à des colonnes de ܥ௩ et respectivement les lignes de
ܮ à des colonnes de ܥ. Par conséquent, |ܮ௩| |ܥ௩| et |ܮ| ൏ |ܥ| ;
3) Le couplage relie parfaitement les lignes de ܮ௦ aux colonnes de ܥ௦. Il en découle que
|ܮ௦| ൌ |ܥ௦|.
4) Dans le graphe de départ il n’y a pas d’arêtes entre ܥ et ܮ௦, ni entre ܥ et ܮ௩, ni entre
ܥ௦ et ܮ௩.
Pour mieux illustrer la DM-Décomposition d’une matrice ܣ, nous présentons le résultat
obtenu avec la fonction dmperm (accessible sous Matlab et implémentée aussi dans notre
algorithme) sur le nuage de la Figure 9.9a. Ainsi, la permutation des lignes ܲ et des colonnes
ܳ transforme la matrice d’adjacence ܣ en forme illustrée par la Figure 9.16. 76
Figure 9.16 DM-Décomposition sur données réelles
Ensuite, les indices de points ܦܫܺ du nuage ܰ appartenant à la même composante connexe
sont déterminés de la manière suivante :
ܦܫܺ ൌ ܲሺݎሺ݅ሻ: ݎሺ݅1ሻ െ 1ሻ (9.12)
où :
ܲ : liste permutée de colonnes
ݎ : vecteur indiquant les limites de blocs pour la décomposition
‖ݎ‖ െ 1 : nombre de composantes connexes retrouvées
Figure 9.17 Composantes connexes extraites à l’aide de l’algorithme proposé. Paramètres
fixés : R=0.10m, k=25, ܰ݉݅݊=0. Une couleur correspond à une composante.
L’étiquetage des composantes connexes se fait de façon itérative, en incrémentant la valeur ݅
jusqu’à ce que l’on atteigne le nombre de régions recherchées. À ce stade, nous pouvons
introduire une contrainte concernant le nombre minimal de points ܰ݉݅݊ formant la CHAPITRE 4. Extraction d’arêtes
77
composante connexe. Tous les sous-ensembles ne satisfaisant pas aux exigences sont
immédiatement rejetés. La Figure 9.17 présente les résultats d’étiquetage de composantes
connexes en tenant compte de la décomposition effectuée (Figure 9.16).
Surface d’un sous-ensemble de points
Dès que toutes les composantes connexes sont extraites, nous calculons leurs surfaces. Nous
entendons par ce terme l’aire de l’enveloppe convexe 2D (convex hull) englobant l’ensemble
fini de points d’une composante. Nous cherchons ainsi le contour du plus petit polygone
fermé et convexe délimité par tous les points (Figure 9.18).
Le calcul de l’enveloppe convexe se fait à l’aide du plan moyen Π sur lequel les points de la
région sont projetés. Plusieurs algorithmes de complexité diverse ont été développés pour
résoudre un tel problème notamment : la marche de Jarvis (Gift wrapping algorithm) [Jarvis,
1973], le parcours de Graham (Graham’s scan) [Graham, 1972], l’heuristique de AklToussaint,
ou le diagramme de Voronoï. Nous avons employé la bibliothèque CGAL
(Computational Geometry Algorithms Library) mettant à disposition l’algorithme Quickhull de
[Bykat, 1978]. Finalement, l’aire de l’enveloppe convexe représente la taille de la
composante connexe. Nous conservons uniquement, cette composante dont la surface est la
plus importante. Les autres points reviennent au nuage pour participer de nouveau à la
recherche d’un segment plan par l’algorithme de RANSAC.
Figure 9.18 Aire du segment plan
Le pseudo-code 4.2 (Annexe E) présente notre approche d’analyse de composantes connexes
telle qu’elle est décrite dans cette section. Trois paramètres sont attendus en entrée
notamment le rayon de sphère ߩ et la valeur ݇ afin d’établir le voisinage du chaque point du
nuage. Optionnellement, le nombre minimal de points ܰ݉݅݊, peut être pris en compte afin de
définir la taille de la plus petite composante connexe autorisée.
4.5 Méthode proposée d’extraction d’arêtes
Une fois tous les plans principaux détectés, nous procédons à extraire les segments de ligne.
Nous cherchons à retenir uniquement les arêtes réelles figurant dans la scène. Étant donné
que lors du processus de segmentation des surfaces planes décrit ci-dessus nous bénéficions
non seulement d’un ensemble de modèles de plans ∏, mais aussi des sous-ensembles de
points - segments plans (ܵܲ), le processus d’identification d’arêtes est assez aisé (Figure
9.19). Quant à l’ensemble ∏, il est défini de telle sorte que chacun de ces éléments soit
caractérisé par un vecteur directeur ݊݅ et un point ܣ݅ (par lequel le plan ∏i passe). Par
conséquent, la droite d’intersection ܫ entre deux plans ∏j et ∏k peut être facilement 78
retrouvée. Le vecteur directeur ݑሬԦ de cette ligne est le produit vectoriel de deux vecteurs
normaux :
ݑሬԦ ൌ ݆݊ ሬሬሬԦ ൈ ݊݇ ሬሬሬԦ (9.13)
Figure 9.19 Segments plans extraits par RANSAC
Néanmoins, à cette étape deux questions doivent se poser : 1) Quels segments plans de
l’ensemble ∏ sont sécants ?; 2) Comment définir les extrémités du segment de ligne
résultant de cette intersection ? Pour répondre à ces interrogations, nous proposons une
méthode qui s’attache à analyser toutes les combinaisons possibles des plans afin de dissocier
ceux étant voisins. La Figure 9.20 contient le schéma complet de l’approche discutée.
Figure 9.20 Procédure proposée d’extraction d’arêtes CHAPITRE 4. Extraction d’arêtes
79
Premier rejet des paires de plans – analyse de l’angle
Dans un premier temps, l’angle ߚ entre toute paire candidate de plans est calculé, ainsi que le
poids ܳ – critère de la qualité de cette intersection. Les deux valeurs peuvent être quantifiées
en considérant les vecteurs normaux ݆݊ et ݊݇ des deux plans étudiés.
Du point de vue géométrique, la norme de leur produit vectoriel se définit comme :
‖ݑሬԦ‖ ൌ ฮ݊ఫ ሬሬሬԦฮ ∙ ‖݊ሬሬሬሬ
(9.14) |ߚ݊݅ݏ| ∙ ‖Ԧ
Puisque les deux vecteurs sont unitaires (la norme est égale à l’unité), le poids ܳ peut se
calculer de la manière suivante :
ܳ ൌ ‖ݑሬԦ‖ଶ ൌ ݏ݅݊ଶߚ (9.15)
Il est évident que l’intersection est la meilleure si l’angle est droit. Or, le poids ܳ associé
doit être égal ou proche de l’unité. Si ܳ est petit, alors la longueur du vecteur ݑሬԦ est faible et,
par conséquent, la droite d’intersection est mal définie. De même, l’intersection n’existe pas,
si deux plans sont parallèles (ܳൌ0). L’analyse des poids ܳ nous permet de réduire la taille
de l’ensemble contenant des paires « potentielles » de plans. Dans ces conditions, lors du
premier rejet, nous ne conservons que les paires dont le facteur ܳ est supérieur à ܶொ. La
valeur ܶொ a été fixée à 0.5, ce qui revient à dire que nous ne prenons en considération que les
paires de plans se coupant sous l’angle de 45° à 135°. Toutefois, rien n’empêche d’accroître
les exigences envers les intersections recherchées et d’augmenter la limite basse ܶொ.
Deuxième rejet des paires de plans – analyse de la distance
L’étape suivante nous amène à vérifier la distance ݀ entre les paires restantes et à garder
uniquement celles composées par les plans voisins. Considérant deux segments plans chacun
doté d’un sous-ensemble de points valables ܵܲ et ܵܲ isolé lors de la segmentation, mais
aussi l’équation du plan approximant ∏j et ∏k passant par ce nuage (Figure 9.19), nous
pouvons vérifier leur distance réciproque. Nous calculons simplement les distances
Euclidiennes les plus courtes des points du nuage ܵܲ au plan ∏K et vice versa (9.16). Il en
résulte que les distances minimales ݀1 et ݀ଶ, sont requises afin de pouvoir juger si les plans
sont suffisamment proches l’un de l’autre. Les segments plans sont considérés comme
adjacents, si est seulement si, la distance ݀ définie comme ݀ ൌ ݉݅݊ሺ݀ଵ, ݀ଶሻ est proche de zéro,
avec une certaine tolérance.
݀1 ൌ min
݆∈Յ ൛݀൫݆ܵܲ, ∏݇൯:݆ ∈ ሺ1, ܰሻൟ ݀2 ൌ min
݇∈Յ ቄ݀ ቀܵܲ݇, ∏݆
ቁ :݇∈ ሺ1, ܯሻቅ (9.16)
pour ܰ,ܯ : nombre de points respectivement dans les sous-nuages ܵܲ et ܵܲ.
Cette condition de proximité étant primordiale, elle peut être toutefois insuffisante dans
certains cas. La Figure 9.21 illustre un exemple particulier où les deux segments plans ܵܲ et
ܵܲ (violet et vert) sont loin d’être sécants, alors que la distance ݀ est égale à zéro. De ce fait,
ils sont censés aboutir à une droite d’intersection. Nous souhaitons reconstruire fidèlement
les arêtes existantes dans le nuage et éviter de créer ce genre de faux segments. 80
Figure 9.21 Exemple d’appariement devant être rejeté
Troisième rejet – analyse des extrémités des segments
Pour remédier aux faux appariements, nous examinons la longueur et les extrémités des
segments obtenus par cette intersection. Sachant que les paires « candidates » parallèles ont
déjà été rejetées, nous déterminons la droite ܫ entre deux plans sécants, de sorte que
∏ ∩ ∏ ൌ ܫ, à l’aide de la formule (9.13).
Ensuite, les points ܵܲ et ܵܲ situés à une distance inférieure à une tolérance prédéfinie
ܶௗ sont projetés sur cette droite. Plus précisément, les points se trouvant autour de leur ligne
d’intersection servent à identifier les extrémités d’arête de pli. De cette façon, deux segments
de ligne ܵ et ܵ sont retrouvés puisque chaque nuage a des limites différentes (Figure 9.22).
La dernière étape – l’analyse de la position spatiale des extrémités appartenant aux segments
d’intersection créés ܵ et ܵ, permet de mettre de côté les paires de plans indûment classées et
d’établir la longueur de l’arête finale. Nous ne conservons que les paires de plans dont
l’intersection aboutit à deux segments se chevauchant au moins partiellement. L’étude de la
position relative de ces segments colinéaires est menée en analysant la distance entre leurs
milieux (ܯ, ܯሻ, ainsi que leurs longueurs (ܮ, ܮ). Trois cas peuvent se présenter :
1) L’un des segments est complètement inclus dans l’autre (Figure 9.23a) : ฮܯܯฮ
หܮ⁄2 െ ܮ⁄2ห. En conséquence, la longueur de l’arête créée correspond au plus court
segment ;
2) Les segments se chevauchent partiellement (Figure 9.23b) : หܮ⁄2 െ ܮ⁄2ห ൏
ฮܯܯฮ ൏ หܮ⁄2 ܮ⁄2ห et donc la longueur de l’arête retenue est exactement la
même que celle de la zone de chevauchement ;
3) Les segments sont disjoints (Figure 9.23c) : ฮܯܯฮ หܮ⁄2 ܮ⁄2ห alors l’arête
n’existe pas et la paire de plans est supprimée. CHAPITRE 4. Extraction d’arêtes
81
Figure 9.22 Droite d’intersection entre les plans ∏j et ∏k et les extrémités de segments ܵ et
ܵ
Sachant que nous cherchons à extraire les segments les plus longs possible, nous pouvons,
optionnellement, prendre en compte une contrainte ܶ௦, c’est-à-dire la longueur minimale
d’une arête recherchée. Dès lors les arêtes trop petites seront exclues des résultats.
Figure 9.23 Relations spatiales entre les extrémités de segments ܵ et ܵ : a)b) arête retenue ;
c) arête rejetée 82
Le pseudo-code 4.3 (Annexe E) détaille notre algorithme d’extraction d’arêtes de pli. Nous
avons besoin en entrée de segments plans (ܵܲ) isolés lors de la segmentation ainsi que les
paramètres de plan (∏i) approximant chaque sous-ensemble de points. Nous obtenons, à la
sortie, un ensemble d’arêtes ܵܦ de longueur supérieure à ܶ௦.
4.6 Exemples de résultats
L’algorithme d’extraction d’arêtes discuté dans ce chapitre a été testé avec plusieurs nuages
de points, qu’ils soient mobiles ou statiques. Nous présentons dans cette partie quelques
résultats finaux (4.6.2), ainsi que ceux intermédiaires concernant la détection de segments
plans (4.6.1). Sachant que notre algorithme a été développé entièrement sous Matlab,
inadapté pour traiter de gros nuages de points, nous ne renseignons pas le temps de calcul
(étant assez conséquent en Matlab). Mais, on parle d'environ 50 minutes (sous Intel Core x2
T7600 2.33GHz/4 Go Ram/Win7 64bits) en ce qui concerne les résultats illustrés par la
Figure 9.25 (au total 265 266 points ont été traités).
4.6.1 Détection de plans
La Figure 9.24 montre soixante plans successifs extraits pour un fragment du nuage de
points Stereopolis2009_Soufflot. Les valeurs de tous les paramètres nécessaires pour faire
fonctionner notre algorithme sont listées au-dessous de l’image. Nous remarquons que le
plan perpendiculaire au sens du déplacement du véhicule, couvrant une superficie assez
grande, n’a pas été retrouvé. Cet état de fait est dû à l’angle d’incidence du faisceau laser qui
était important, et influençait le taux de bruit entachant les données élevées. En outre, la
position de la façade vis-à-vis de la tête du scanner fait que peu de profils laser l’interceptent.
La distance moyenne entre les profils consécutifs est donc faible. Nous dénombrons environ
15 lignes sur 5m linéaires de mur, ce qui donne localement une ligne sur 30cm. Nous
pourrions ipso facto mettre en doute le fait que ces points forment un plan satisfaisant aux
exigences imposées. Quant aux autres plans, nous observons le phénomène de sursegmentation
se dévoilant quand les surfaces uniformes en réalité sont segmentées en au
moins deux plans distincts.
Figure 9.24 Détection de plans - Stereopolis2009_Soufflot. Paramètres fixés : σ=0.015m,
P=0.99, ܰ=60, R=0.30m, k=25, ܰ=100. Une couleur correspond à un plan (points non
segmentés en noir) CHAPITRE 4. Extraction d’arêtes
83
La Figure 9.25 illustre les plans extraits à partir du nuage Riegl2012_Slomniki se
caractérisant d’un faible taux de bruit. Les résultats sont corrects, mais le problème de sursegmentation
apparaît toujours, surtout lors de la segmentation du sol.
Figure 9.25 Détection de plans – Riegl2012_Slomniki. Paramètres fixés : σ=0.01m,
P=0.99, ܰ=16, R=0.200m, k=25, ܰ=200. Une couleur correspond à un plan (points non
segmentés en noir)
D’autres types de problèmes rencontrés lors de l’utilisation de l’algorithme de RANSAC sont
montrés par la Figure 9.26. Elle illustre la recherche du premier plan dans le nuage de points
mobile. Les études étaient menées sur les données brutes. Le plan mis en évidence était pour
l’estimateur la meilleure solution en raison de la forte accumulation des points acquis durant
l’arrêt forcé de la plate-forme. Pour pallier ces fausses détections, l’étape de prétraitement
des données laser paraît indispensable – le débruitage, la décimation ou bien encore la
contrainte de distance minimale entre les points voisins. 84
Figure 9.26 Exemple de problèmes survenus lors de la détection des plans via RANSAC (en
rouge les points appartenant au premier plan détecté). Nuage de points du système L3D2
Nous pouvons constater que l’algorithme de RANSAC est sensible à la densité des nuages de
points. Par contre, il fournit de très bons résultats, en peu de temps, si le nuage est
homogène et sa densité élevée. L’approche proposée d’analyse de composantes connexes
vérifie correctement la connectivité du segment plan. Néanmoins, elle exige un temps
considérable afin de trouver le voisinage local de chaque point, ce qui est son seul point
faible. L’accélération de recherche des voisins faite par un arbre kd ou un octree, au lieu d’un
parcours linéaire, serait appréciée. L’un des futurs travaux sera de tester sa robustesse par
rapport aux autres méthodes d’extraction des composantes connexes, notamment les
algorithmes récursifs d’exploration de graphe (DFS, BFS), ou bien encore la solution
d’analyse du voisinage à l’aide d’image 2D.
4.6.2 Extraction d’arêtes
La Figure 9.27 illustre des résultats d’extraction d’arêtes dans le nuage de points acquis par
les systèmes mobiles. Tandis que la Figure 9.28 montre les segments extraits à partir du
nuage Sulpice2013_statique. Notre algorithme arrive à détecter correctement toutes les arêtes,
mais leur précision et le nombre dépendra fortement des segments plans pris en compte. Dès
lors, l’algorithme choisi de segmentation prédéterminera la complétude et la qualité de la
solution. CHAPITRE 4. Extraction d’arêtes
85
Figure 9.27 Arêtes extraites à l’aide de l’algorithme proposé (Tseg=2.000m).
a) Riegl2012_Slomniki ; b) Stereopolis2009_Soufflot
Figure 9.28 Arêtes extraites à l’aide de l’algorithme proposée (Tseg=1.000m) :
Sulpice2013_statique
a)
b) 87
CHAPITRE 5
Qualification à partir d’entités linéaires
Sommaire :
5. Qualification à partir d’entités linéaires ........................................................................ 87
5.1 Problématique .......................................................................................................................... 87
5.1.1 Comment mesurer la distance entre deux segments dans l’espace ? .................................... 88
5.1.2 Contraintes ........................................................................................................................................ 90
5.2 Mesure de distance proposée ................................................................................................. 91
5.2.1 Distance de Hausdorff ..................................................................................................................... 92
5.2.2 Matrice de similarité ....................................................................................................................... 94
5.2.3 Mise en correspondance ................................................................................................................. 96
5.3 Résultats et évaluation ........................................................................................................... 99
5.3.1 Données expérimentales ................................................................................................................ 99
5.3.2 Évaluation de l’algorithme d’appariement ............................................................................... 100
5.3.3 Exactitude et précision ................................................................................................................. 105
5. Qualification à partir d’entités linéaires
Dans ce chapitre, une nouvelle approche de qualification de relevés laser mobiles, son implémentation et
les résultats sont présentés. Celle-ci, basée sur les arêtes, semble être efficace et tout particulièrement
pour les besoins d’évaluation des nuages dont la densité faible empêche une identification précise des
points de contrôle. Adressée principalement à des zones urbaines, riches en primitives linéaires, notre
méthode délivre une mesure de qualité en s’appuyant sur la distance modifiée de Hausdorff (LHD).
La mise en correspondance de segments homologues, menée simultanément, joue un rôle crucial et, par
conséquent, elle doit être fiable. Nous proposons alors un algorithme entièrement automatique,
consistant à analyser la similitude entre les arêtes extraites de données mobiles et celles de référence. Sa
valeur, recueillie par la matrice de similarité, est déterminée en tenant compte de la distance et de
l’angle. Enfin, nous testons la robustesse d’un tel algorithme d’appariement, et qualifions les relevés
laser mobiles en termes d’exactitude et de répétabilité.
5.1 Problématique
Dans le dessein de développer une méthode de qualification de relevés laser mobiles acquis
dans un environnement urbain, nous proposons une approche basée sur les entités linéaires.
Celles-ci, représentant des intersections entre des plans principaux modelés dans le nuage,
Résumé 88
peuvent être extraites à l’aide de l’algorithme présenté dans le Chapitre 4. Ensuite, la
technique mise en œuvre se résume à une comparaison de deux ensembles de segments. Le
premier ensemble Test, contenant des droites à qualifier, sera confronté avec le second
nommé Model. Ce dernier, considéré désormais comme référence, se compose des segments
plus précis provenant, entre autres de levés topographiques, de nuages de points collectés en
mode fixe, mais aussi d’autres bases de données, qu’elles soient 2D ou 3D. Notre solution,
contrairement à celles envisagées par les méthodes se référant aux points de contrôle, vise à
diminuer les problèmes liés à l’identification correcte de cibles correspondantes. Toutes les
démarches détaillées au fur à mesure dans ce chapitre ne nécessiteront plus l’intervention
d’opérateur. L’appariement des segments s’effectue automatiquement, en examinant la
similitude des droites. Grâce à la comparaison des segments entre eux, il est possible de
repérer les entités linéaires Model (M) identiques ou très proches de celles de l’ensemble Test
(T). Mais, cette tâche devient encore plus complexe, quand on présume que le nombre de
segments peut varier d’un ensemble à un autre, et que leur longueur ne sera pas forcément la
même. En outre, nous observons également des droites pour lesquelles aucun homologue
n’existe dans l’ensemble de référence (Figure 5.1). Ce constat est dû au fait que le processus
d’extraction des segments peut engendrer des phénomènes de sur-segmentation et de soussegmentation.
Figure 5.1 Exemple d’arêtes à comparer : a) segments ܶ݁ݐݏ ; b) segments ܯ݈݀݁ ; c) les deux
ensembles superposés
Dans ce chapitre, une méthode de qualification sera présentée (Section 5.2), ainsi que les
résultats obtenus. Aussi, l’algorithme de mise en correspondance des segments 3D sera
examiné par rapport à la vérité-terrain (Section 5.3). Pour compléter ces analyses, l’impact
du décalage réciproque entre les segments étudiés sur la robustesse de l’algorithme
d’appariement sera vérifié. Une fois le couplage créé, nous proposerons d’évaluer les nuages
de points en termes d’exactitude et de précision (répétabilité). C’est pourquoi la distance
moyenne calculée à partir de segments, étant la distance modifiée de Hausdorff LHD (Line
Hausdorff Distance), servira à noter les nuages. Finalement, les avantages et les inconvénients
d’une telle procédure de qualification de relevés laser seront mis en avant.
5.1.1 Comment mesurer la distance entre deux segments dans l’espace ?
L’utilisation des arêtes, au lieu des points de contrôle, pour les besoins de qualification, exige
d’élaborer une métrique qui permettrait de comparer deux ensembles d’entités linéaires.
Certes, nous ne pouvons plus nous référer uniquement aux extrémités, puisque les segments
correspondants ne sont pas censés ni partager les mêmes coordonnées ni avoir la même
longueur. L’une des façons de faire peut être de définir la moyenne des distances ݀ calculées
entre les segments homologues provenant de différentes sources. La plupart des méthodes
abordant cette question s’appuient sur le calcul de la distance Euclidienne. Nous pouvons
aboutir à différentes variantes, comme l’illustre la Figure 5.2, visant, par exemple, à
déterminer la distance minimale, la distance entre les milieux de segments correspondants
(ܯ, ܯொ), ou leurs extrémités (ܲ, ܲଵ, ܳ, ܳଵ). CHAPITRE 5. Qualification à partir d’entités linéaires
89
Figure 5.2 Définition de la distance entre deux segments 3D : a) Distances déterminées
entre les extrémités ; b) Distance calculée entre les milieux ; c) Distance perpendiculaire
d’une extrémité de segment à l’autre segment ; d) Distance minimale ;
En considérant la distance ݀ entre les extrémités des segments (Figure 5.2a), nous calculons
tout simplement les distances d’un point 3D à l’autre :
݀ሺܲ, ܳሻ ൌ ඨ ൫ܲ െ ܳ
൯
ଶ ଷ
ୀଵ
݀ሺܲଵ, ܳଵሻ ൌ ඨ ൫ܲଵ െ ܳଵ
൯
ଶ ଷ
ୀଵ
(5.1)
Sachant que les coordonnées du milieu d'un segment sont les demi-sommes de chacune des
coordonnées des extrémités, nous introduisons, de manière similaire (formule (5.1)), la
distance ݀ calculée, cette fois-ci, entre les milieux respectifs (Figure 5.2b).
De même, nous pouvons envisager la distance des extrémités du premier segment (ܲ, ܲଵ) par
rapport à la droite ܮ passant par le second segment, et vice versa (Figure 5.2c). Il s’agit alors
de la distance minimale d’un point à une droite ܮ, mesurée suivant la formule ci-dessous :
݀ሺܲଵ, ܮሻ ൌ ฮܳܲଵ ሬሬሬሬሬሬሬሬሬԦ˄ݒԦฮ
‖Ԧݒ‖
(5.2)
pour la droite ܮ définie par un point ܳ et un vecteur ݒԦ non nul. L’indice ˄ symbolise le
produit vectoriel de deux vecteurs.
Dans tous les cas mentionnés, l’étape dernière nous amène à prendre la moyenne ou le
minimum des distances ݀ obtenues.
Cependant, la formulation de la distance minimale entre deux segments n’est pas aisée
(Figure 5.2d). Aussi, elle ne peut pas être confondue avec la distance minimale entre les
droites traversant ces segments puisque ces valeurs sont souvent différentes (Figure 5.3). Or, 90
le point d’une ligne désigné comme le plus proche de l’autre ligne peut ne pas être situé sur
la partie de droite délimitée par deux points fixes (extrémités).
Figure 5.3 a) Distance entre deux droites; b) Distance entre deux segments de droite
[van Verth et Bishop, 2008] avancent une solution de [Sunday, 2001] permettant de
résoudre cette tâche. Étant donné que la distance entre deux objets géométriques ܲ et ܳ est
définie comme la distance entre deux points quelconques ∈ܲ et ݍ∈ܳ (5.3), le problème se
résume toujours à trouver ces points minimisant la distance ݀.
݀ሺܲ, ܳሻ ൌ min
ఢ,ఢொ ݀ሺ, ݍሻ (5.3)
Quant à la distance entre deux segments, nous l’assimilons au calcul de la distance d’une
ligne à l’autre. Nous représentons le segment ܵଵ ൌ ሾܲ, ܲଵሿ par l’équation paramétrique de
droite ܮଵ: ܲሺݏሻ ൌ ܲ ݏሺܲ െ ܲଵሻ ൌ ܲ ݑݏሬԦ et le segment ܵଶ ൌ ሾܳ, ܳଵሿ comme ܮଶ: ܳሺݐሻ ൌ ܳ
ݐሺܳ െ ܳଵሻ ൌ ܳ ݒݐԦ pour 0 ݏ, ݐ 1. Ainsi, nous cherchons, pour ܮଵ et ܮଶ, les paramètres ݏ
et ݐ de telle sorte qu’ils décrivent la position des points les plus proches ܲሺݏሻ et ܳሺݐሻ. Une
seule différence réside dans le fait que la recherche de ces points est restreinte à l’intervalle
défini par les extrémités de chacun des segments. Finalement, la distance minimale entre
deux segments ܵଵ et ܵଶ correspond à la norme du vecteur ݓሬሬሬሬሬ
Ԧ dont les coordonnées sont
données par les points ܲሺݏሻ et ܳሺݐሻ.
݀ሺܵଵ, ܵଶሻ ൌ ‖ݓሬሬሬሬሬ
Ԧ‖ ൌ ‖ܲሺݏሻ െ ܳሺݐሻ‖ (5.4)
En minimisant la norme de ݓሬሬሬሬሬ
Ԧ nous arrivons à déterminer les paramètres ݏ et ݐ. La
description plus exhaustive de cette approche fait partie de l’Annexe A.
5.1.2 Contraintes
Afin d’être en mesure de vérifier la qualité (l’exactitude et la précision) à partir des segments
de droite, la distance réciproque ݀ሺݐ, ݉ሻ entre eux doit être définie de manière à refléter leur
véritable éloignement. Cependant, les approches listées auparavant ne sont pas suffisamment
robustes pour nos applications puisqu’elles n’envisagent ni orientation de droites ni situation
où les segments se chevauchent seulement partiellement. Nous en avons pour preuve
quelques exemples présentés par la Figure 5.4. Nous y voyons clairement que, dans certains
cas, les distances déterminées ne restituent pas de vraies relations mutuelles entre les
segments. Ainsi, pour les droites quasiment parallèles (Figure 5.4a,b), cette valeur peut être
importante, et inversement, les deux segments orientés différemment (Figure 5.4c,d,e)
peuvent être classés comme relativement proches (distance faible, voire égale à zéro). CHAPITRE 5. Qualification à partir d’entités linéaires
91
Figure 5.4 Exemples générant des calculs de distances erronés : a) Distances déterminées
entre les extrémités ; b) Distance calculée entre les milieux ; c) Distance perpendiculaire
d’une extrémité de segment à l’autre segment ; d)e) Distance minimale ;
Afin de surmonter ce genre d’inconvénients [Gao et Leung, 2002] suivis par [Chen et al.,
2003] ont proposé une approche dédiée à la comparaison des segments 2D extraits à partir
des logos (images). Nous nous en sommes inspirés pour notre méthode en l’adaptant à un
espace tridimensionnel. Dès lors, la distance entre les segments 3D ralliera l’écartement,
mais aussi l’angle formé entre chaque paire de droites homologues. La section suivante
abordera en détail ce sujet.
5.2 Mesure de distance proposée
La Figure 5.5 présente un aperçu général des étapes de calcul constituant l’approche
proposée. Dans un premier temps, la similarité entre toutes les combinaisons possibles de
droites, provenant de deux ensembles ܶ (ܶ݁ݐݏ) et ܯ (ܯ݈݀݁), sera notée sous forme d’un score
݀ሺݐ, ݉ሻ. Celui-ci étant le coefficient de la matrice de similarité, il fera, par la suite, l’objet
d’une étude particulière. Sa valeur servira à vérifier si les deux segments sont suffisamment
similaires pour être appariés, et s’ils sont susceptibles d’être employés pour déterminer la
distance moyenne – notre mesure de qualité. Étant donné que seuls les segments quasiparallèles
peuvent être appariés, on se devra de prendre en compte l’orientation et la position
des segments pour calculer chaque score ݀ሺݐ, ݉ሻ. Le paragraphe 5.2.2 se penchera sur ce
sujet.
Passons à présent à la mise en correspondance des segments. Nous devons trouver le moyen
permettant de conclure que les deux entités comparées sont semblables. Nous mémoriserons
uniquement les paires dont les scores sont jugés négligeables, c’est-à-dire, inférieurs ou
égaux à un seuil que l’on s’est fixé automatiquement en fonction de valeurs ݀ሺݐ, ݉ሻ
sélectionnées. Toutes les paires retenues formeront ensuite la matrice binaire de
correspondance ݎܥ, systématisant les interactions entre les éléments linéaires de deux
ensembles étudiés ܶ݁ݐݏ et ܯ݈݀݁.
Une fois l’appariement retrouvé, nous déterminerons l’écartement des données traitées. Cette
mesure, étant la distance modifiée de Hausdorff LHD (Line Hausdorff Distance), évaluera,
d’une manière objective, l’exactitude du relevé laser en calculant sa distance par rapport à la
référence. Également, la qualification de la précision deviendra possible à réaliser, sous
réserve que des nuages redondants soient collectés au sein de zones d’intérêt. Comme nous 92
l’expliquerons plus loin, toutes les opérations seront menées dans deux sens : l’ensemble ܶ݁ݐݏ
sera comparé avec le ܯ݈݀݁ et vice versa. Par conséquent, deux matrices de correspondance
seront obtenues, ainsi que deux distances relatives de Hausdorff OLHD (Oriented Line
Hausdorff Distance).
Figure 5.5 Calcul de distance entre segments : algorithme proposé
5.2.1 Distance de Hausdorff
En géométrie, la métrique de Hausdorff est un outil de détermination de la proximité de deux
sous-ensembles de points dans un espace fini. Cette mesure de similarité naturelle est très
utilisée pour le traitement d’image. Elle permet de qualifier les dissemblances entre les
formes, de numériser une image ou bien encore de reconnaître une forme. Nombreux sont les
chercheurs faisant appel à cette métrique par exemple [Huttenlocher et al., 1993],
[Grussenmeyer et al., 1994], [Abbas et al., 1995], [Choi et al., 2001], [Gao et Leung, 2002],
[Chen et al., 2003], [Benhabiles et al., 2009], [Wang et Tan, 2012], [Gao et al., 2012].
Contrairement à la majorité des méthodes d’analyse de forme, la distance de Hausdorff ne
requiert pas de mise en correspondance explicite des points ܶ݁ݐݏ et ܯ݈݀݁.
Considérant deux ensembles de points ܶ ൌ ൛ݐଵ, ݐଶ,…,ݐൟ et ܯ ൌ ൛݉ଵ, ݉ଶ,…,݉ൟ, la distance de
Hausdorff (ܪ) est la distance maximale de deux quantités : ݄ሺܶ, ܯሻ et ݄ሺܯ, ܶሻ (5.5).
ܪሺܶ, ܯሻ ൌ ݉ܽݔ൫݄ሺܶ, ܯሻ, ݄ሺܯ, ܶሻ൯ (5.5)
Ces deux composants, nommés distances relatives de Hausdorff, n’ont quasiment jamais la
même valeur (Figure 5.6). La distance de Hausdorff n’est pas alors symétrique (݄ሺܶ, ܯሻ ്
݄ሺܯ, ܶሻ). La première distance ݄ሺܶ, ܯሻ est le maximum parmi toutes les distances ݀ሺݐ, ݉ሻ,
calculées entre chaque point d’un sous-ensemble ܶ et un autre point le plus proche de
l’ensemble ܯ (5.6). La seconde ݄ሺܯ, ܶሻ, est définie pareillement, mais en direction de calcul
opposée. Quant à ݀ሺݐ, ݉ሻ, c’est une distance quelconque – généralement exprimée en tant que
distance Euclidienne. Cependant, rien n’empêche l’utilisation des autres métriques telle que la
distance de Manhattan par exemple.
݄ሺܶ, ܯሻ ൌ max
௧∈்
min
∈ெ
݀ሺݐ, ݉ሻ (5.6) CHAPITRE 5. Qualification à partir d’entités linéaires
93
Figure 5.6 Définition de la distance de Hausdorff entre deux polygones
Nonobstant [Dubuisson et Jain, 1994] définissent 24 formes différentes de la distance de
Hausdorff, dont une version modifiée MHD (Modified Hausdorff Distance). La principale
différence réside dans la façon de définir la distance relative ݄ሺܶ, ܯሻ qui sera désormais
calculée comme suit :
݄ሺܶ, ܯሻ ൌ 1
ܰ௧
ሻܯ ,ݐሺ݀
௧∈்
(5.7)
où :
ܰݐ : nombre de points dans l’ensemble ܶ
Il s’agit de la moyenne de toutes les distances minimales obtenues. Ainsi, chaque point de
l’ensemble a un impact sur la valeur finale. Ce même constat ne peut s’observer lorsque la
distance classique de Hausdorff est employée, même si les points sont assez proches les uns
des autres. Cette définition non seulement ne néglige donc aucun des points, mais encore,
selon les études complémentaires effectuées par [Benhabiles et al., 2009], elle donne de
meilleurs résultats que la définition de Hausdorff classique. En d’autres termes, la distance de
Hausdorff définie par les équations (5.5) et (5.6) est censée être très sensible aux points
aberrants. Par conséquent, quelques points aberrants, même un seul, peuvent
considérablement perturber le calcul. Néanmoins, il faut souligner que sa valeur n’est pas
une distance à proprement parler, car elle ne vérifie pas le principe d’inégalité triangulaire.
Line Hausdorff Distance comme mesure d’écartement entre deux jeux de
segments
La définition de la distance modifiée de Hausdorff telle quelle n’est pas appropriée pour les
besoins de comparaison des entités linéaires, puisqu’elle ne prend pas en compte l’orientation
de celles-ci [Gao et Leung, 2002]. Un exemple de problèmes rencontrés est illustré par la
Figure 5.7. Il en ressort très clairement que la distance renvoyée par la Figure 5.7a peut être
identique à celle calculée entre les segments 3 et 4 (Figure 5.7b). Cependant, les droites sur
la Figure 5.7a, dans la perception humaine, sont plus proches que ces deux dernières. De
même, en analysant à l’aide de la distance de Hausdorff les segments présentés par la Figure
5.7c, nous comparerons l’extrémité de la partie la plus haute de 7 avec la ligne 5, tandis que
celle la plus basse avec la ligne 6. Cette démarche n’est pas correcte puisque la droite 7 doit
être intuitivement perçue comme une seule entité, et sa distance mesurée par rapport, soit au
segment 5, soit au segment 6. 94
Figure 5.7 Exemple de problèmes liés à la distance modifiée de Hausdorff appliquée à des
lignes (Image reproduite à partir de [Gao et Leung, 2002])
Afin de faire face à toutes ces contraintes [Gao et Leung, 2002] ont proposé, pour l’imagerie
2D, une extension de la distance introduite par [Dubuisson et Jain, 1994] applicable, cette
fois-ci, à des droites. La distance directe OLHD (Oriented Line Hausdorff Distance) se calcule
de la manière suivante :
ܱܦܪܮሺܶ, ܯሻ ൌ 1
∑ೕ∈ெ ܮೕ
ೕܮ
݀൫ݐ, ݉൯
ೕ∈ெ
(5.8)
où :
݆݉ܮ
: longueur du segment de l’ensemble Model (référence)
݀൫ݐ, ݉൯ : distance entre deux segments
Une telle solution, fondée sur la moyenne pondérée, semble plus robuste lorsque les
segments plus longs sont privilégiés.
Cette définition est devenue le point de départ pour notre approche de qualification basée sur
les entités linéaires. Afin qu’elle soit capable de décrire l’exactitude et la précision de données
étudiées, elle doit être modifiée. Ceci est dû au fait que nous voulons insister sur le fait que la
distance de Hausdorff représente un chiffre aisé à interpréter, nous permettant de connaître
l’écartement réel entre les segments examinés. Or, les distances directes ܱܦܪܮሺܶ, ܯሻ et
ܱܦܪܮሺܯ, ܶሻ seront déterminées, selon la formule (5.9), à partir de segments couplés et
ordonnés par la matrice de correspondance Cor que nous détaillons plus loin (paragraphe
5.2.3)
ܱܦܪܮሺܶ, ܯሻ ൌ 1
∑ೕ∈ெ ܮೕ
ೕܮ
݀൫ݐ, ݉൯
ሺ,ሻ∈
(5.9)
5.2.2 Matrice de similarité
L’étape cruciale de l’algorithme de qualification proposé consiste à créer une matrice de
similarité, dont chaque coefficient ሺ݅, ݆ሻ indiquera un score (une distance) ݀ሺݐ, ݉ሻ attribué à
une paire étudiée. L’objectif consiste à analyser toutes les combinaisons possibles de
segments entre deux jeux. La matrice de similarité de taille ሺ, ݍሻ, déterminée par le nombre
d’éléments dans les ensembles respectifs ܶ݁ݐݏ et ܯ݈݀݁, est obtenue selon la formule cidessous
: CHAPITRE 5. Qualification à partir d’entités linéaires
95
݀൫ݐ, ݉൯ ൌ ටܹ ∙ ቀ݀ఈ൫ݐ, ݉൯ቁଶ
ቀ݀ூூ൫ݐ, ݉൯ቁଶ
ቀ݀⟘൫ݐ, ݉൯ቁଶ (5.10)
Le score ݀൫ݐ, ݉൯ étant la mesure de similitude, représente, en pratique, « l’effort » nécessaire
pour superposer deux segments quelconques : l’un provenant de l’ensemble ܶ et l’autre de ܯ.
Sa valeur intègre : la distance angulaire ݀ఈሺݐ, ݉ሻ, la distance parallèle ݀ூூሺݐ, ݉ሻ et la distance
perpendiculaire ݀⟘ሺݐ, ݉ሻ. La constante ܹ, étant choisie empiriquement, permet de mieux
mettre en évidence l’éventuelle divergence d’orientation des droites. Plusieurs tests ont été
réalisés pour choisir la valeur optimale de ce poids. Nous en ressortons que le poids ܹ égale
à 10 donne le meilleur résultat, c’est-à-dire, il facilite nettement l’analyse ultérieure de la
matrice de similarité notamment lors de la recherche du seuil approprié. De plus, il n’affecte
pas de manière importante la distance angulaire, puisque sa valeur, pour les droites
quasiment parallèles, reste toujours pratiquement nulle.
La Figure 5.8 présente toutes les distances que nous définissons pour mesurer la
dissemblance entre les segments 3D. La distance angulaire ݀ఈሺݐ, ݉ሻ se calcule de la manière
suivante :
݀ఈ൫ݐ, ݉൯ ൌ ݉݅݊ ቀ||ܮ௧
ೕܮ|| ,||
||ቁ ∙ ݏ݅݊ߙ൫ݐ, ݉൯ (5.11)
où
: angle d’intersection de deux droites ݐ et ݉ ;
௧ܮ
,ܮೕ : longueur respective des segments ݐ et ݉.
Figure 5.8 Mesure de déplacement de la droite : a) Distance angulaire ; b) Distance
parallèle ; c) Distance perpendiculaire
Puisqu’en réalité, aucune paire de segments n’est jamais totalement parallèle, nous effectuons
une rotation de chaque droite ܶ݁ݐݏ autour de son milieu. Cette étape est indispensable pour
obtenir une orientation cohérente des entités linéaires et pour calculer, par la suite, les deux
distances manquantes : parallèle et perpendiculaire. Le calcul de la distance parallèle (Figure 96
5.8b) exige une étude des extrémités de deux segments. Nous assimilons ce problème à
l’analyse des positions relatives de deux cercles circonscrits à ces segments (comme dans le
chapitre précédent – voir la Figure 4.22). Leurs centres respectifs ܯ௧ et ܯ (milieux de
segments) ainsi que les rayons ܴ௧ ൌ ܮ௧/2 et ܴ ൌ ܮ/2 seront étudiés. Plus précisément, il
faut chercher si les deux cercles se croisent. Pour ce faire, le segment ܶ݁ݐݏ est projeté sur la
droite ܯ݈݀݁. Il n’y aura donc aucun point, ou alors un ou deux points d’intersection de
cercles qui permettent de distinguer deux cas :
1) L’un des segments est complètement inclus dans l’autre, ou bien ils sont tangents
intérieurement, alors ‖ܯ௧ܯ‖ |ܴ௧ െ ܴ|. En conséquence, la distance parallèle
݀ூூ൫ݐ, ݉൯ est nulle ;
2) Les segments se chevauchent partiellement (|ܴ௧ െ ܴ ൏ ‖ܯ௧ܯ‖ ൏ ܴ௧ ܴ|), ou ils
sont disjoints (|ܯ௧ܯ| ܴ௧ ܴ), ou bien encore ils sont tangents extérieurement
(|ܯ௧ܯ| ൌ ܴ௧ ܴ). Alors la distance parallèle ݀ூூ൫ݐ, ݉൯ ൌ ݉݅݊ሺ݀ܫܫଵ, ݀ܫܫଶሻ (Figure
5.8c). Autrement dit, sa valeur correspondra au déplacement minimal nécessaire pour
superposer soit les extrémités droites, soit les extrémités gauches de deux segments
appariés.
En résumé, la distance parallèle se calcule selon la formule ci-dessous :
ݐ݉ ݑ ݉ ݐ ݅ݏ ൯ൌ൜0݉ ,ݐூூ൫݀
ݐ݊݁݉݁ݎݐݑܽ ଶሻܫܫ݀ ,ଵܫܫ݀ሺ݊݅݉
(5.12)
Finalement, la distance perpendiculaire ݀⟘൫ݐ, ݉൯ est tout simplement la distance minimale
entre deux droites parallèles ܦ௧ et ܦ. Soit la droite ܦ௧ passant par ܯ௧ et de direction de
vecteur ܸ௧ ሬሬሬԦ, et la droite ܦ passant par ܯ et de direction ܸሬሬሬሬԦ. La distance est alors égale à :
݀⟘൫ݐ, ݉൯ ൌ ݇
ฮܸ௧ ሬሬሬԦ˄ܸሬሬሬሬԦฮ
(5.13)
où ݇ est le produit mixte de trois vecteurs ൣ ܯ௧ܯ ሬሬሬሬሬሬሬሬሬሬሬሬԦ, ܸ௧ ሬሬሬԦ, ܸሬሬሬሬԦ൧ (déterminant de la matrice formée
par les trois vecteurs).
5.2.3 Mise en correspondance
Dès que la matrice de similarité est créée (Figure 5.9a), nous procédons à l’analyse de celle-ci
pour fixer un seuil ߜ, nécessaire dans le processus de rejet des paires erronées et de mise en
correspondance des segments. Bien entendu, les correspondances recherchées ne seront
quasiment jamais de 1 à 1, mais plutôt de 1 à plusieurs, de plusieurs à 1, voire de 1 à nul. Afin
d’établir la valeur appropriée du seuil, nous commençons par un appariement préliminaire de
segments ܵ. Cette étape nous amène à apparier, à chaque droite de l’ensemble T, un
homologue le plus semblable de ܯ, c’est-à-dire, le segment le plus proche au sens de la
distance ݀ሺݐ, ݉ሻ. La tâche est aisée à remplir, puisque l’on peut toujours relier deux segments
entre eux, même si leur score est significatif et même si la paire formée de cette manière
n’existe pas en réalité (Figure 5.9b). CHAPITRE 5. Qualification à partir d’entités linéaires
97
Figure 5.9 Estimation des correspondances : a) Matrice de similarité ; b) Appariement
préliminaire ܵ (carrés blancs)
Se fondant sur cet appariement grossier ܵ, la recherche d’un seuil optimal se limite à
l’analyse des différences entre les distances associées aux paires sélectionnées.
Figure 5.10 Recherche du seuil ߜ
La soustraction membre à membre des valeurs ݀ሺݐ, ݉ሻ d’une telle suite ܵ est exécutée deux
fois. Nous partons d’abord des distances classées selon un ordre ascendant ce qui amène à
créer une nouvelle liste des valeurs Diff1 - première dérivée (courbe verte sur la Figure 5.10).
L’opération est effectuée encore une fois, mais cette fois-ci, pour les termes du suite Diff1.
Comme résultat, nous obtenons une courbe violette (Figure 5.10). Le premier pic (parmi les 98
valeurs Diff2 – deuxième dérivée) ayant la hauteur supérieure à la sensibilité admise
(U=0.5m) et détecté à l’aide d’une fonction localisant des maxima locaux, désigne l’indice du
couple de segments dont le score sera admis comme le seuil de couplage ߜ. Cette procédure
étant conçue pour les échantillons importants (nombre de paires ܰ supérieur à 10), nous
envisageons aussi une solution pour les cas ne remplissant pas cette condition. L’équation
(5.14) résume la façon de calculer le seuil ߜ, quel que soit le nombre de paires traitées.
ߜൌቐ ݉ܽݔሺܵሻ ܥܽݎ݀ሺܦ݂݂݅ଵ ൏ ܷሻ ൌܰെ1
ᇱ݊ ݈݈ܽܿ ݉ݑ݉݅ݔܽ݉ ݈݁ ݅ݏ ߪé݀݅ܽ݊݁ሺܵሻ 2݉
10 ܰ ˄ ݏܽ ݁ݐݏ݅ݔ݁
ݐ݊݁݉݁ݎݐݑܽ ܷ ଶሻ݂݂݅ܦሺ݈݈ܽܿ ݉ݑ݉݅ݔܽ݉ ݎ݁݅݉݁ݎ ݈݁
(5.14)
Dans le cas des échantillons petits, mais aussi ceux pour lesquels aucun maximum local
n’existe, deux résolutions du problème sont envisagées :
1) Toutes les paires de l’appariement préliminaire ܵ sont correctes et donc les
différences successives Diff1 sont négligeables (inférieures à ܷ). Le seuil ߜ sera la
valeur maximale parmi toutes les distances ݀ሺݐ, ݉ሻ ordonnées par la suite ܵ ;
2) L’existence de paires aberrantes au sein de l’ensemble ܵ est constatée et le seuil ߜ est
fixé comme la médiane de celui-ci, agrandie ensuite par une tolérance de 2ߪ. Ainsi,
toutes les valeurs inférieures ou égales à la médiane sont mises de côté, pour
participer au calcul du σ représentant l’écart –type de leur moyenne.
Une fois le seuil retrouvé, la matrice de correspondance ݎܥ est générée comme suit :
ݎܥ ൌ ൛ሺ݅,݆ሻ ∈ Յଶ: ∀൫ݐ ∈ ܶ, ݉ ∈ ܯ൯, ݀൫ݐ, ݉൯ ߜൟ (5.15)
Figure 5.11 Matrice de correspondance : a) ܶ݁ݐݏ → ܯ݈݀݁ ; b) ܯ݈݀݁ → ܶ݁ݐݏ
En d’autres termes, le seuillage de la matrice de similarité fournit un appariement définitif. Il
convient de rappeler que la procédure décrite ci-dessus est menée dans deux sens, surtout
pour des raisons de contrôle, mais aussi pour remplir les conditions imposées par la CHAPITRE 5. Qualification à partir d’entités linéaires
99
définition de la métrique de Hausdorff. En effet, deux matrices de correspondance sont
indépendamment déterminées, en supposant pour la seconde fois que l’ensemble ܶ݁ݐݏ est la
référence (Figure 5.11). Dès lors, les distances directes ܱܦܪܮሺܶ, ܯሻ et ܱܦܪܮሺܯ, ܶሻ peuvent
être calculées entre les segments grâce à la formule (5.9). Quant à la distance indirecte
(LHD), elle est obtenue à l’aide de l’équation (5.5).
5.3 Résultats et évaluation
Dans cette partie, nous validerons notre méthode de qualification des relevés laser mobile.
Nous commencerons par vérifier l’algorithme de mise en correspondance des segments,
puisqu’il influencera les résultats finaux (Paragraphe 5.3.2). Pour ce faire, les données réelles
seront employées. Trois critères : l’exactitude, la sensibilité et la spécificité nous permettront
de noter l’algorithme développé. L’appariement créé sera confronté avec la vérité-terrain.
Ensuite nous compléterons les analyses effectuées par une étude de l’impact d’éloignement
réciproque des nuages sur l’appariement des segments. En dernier lieu (Paragraphe 5.3.3),
nous qualifierons les relevés laser, en termes d’exactitude absolue et de précision
(répétabilité).
5.3.1 Données expérimentales
Figure 5.12 Zone de test : a) Prise de vue de la zone avec les trajets de la plate-forme
superposés ; b) Vue de dessus des relevés laser mobiles acquis
La zone de test est située à Paris, à proximité du croisement des rues du Vieux-Colombier et
Madame. Le choix de ce carrefour s’explique non seulement par la forte présence de façades
orientées différemment (la multitude d’arêtes), mais aussi par sa diversité. Il contient des
espaces « dégagés », ainsi que ceux considérés comme très problématiques du point de vue
des acquisitions mobiles. La géométrie des rues (canyons urbains souvent à sens unique) et
les bâtiments de hauteur importante rendent les conditions de réception du signal GNSS
particulièrement difficile. Ceci nous a permis d’acquérir des données mobiles de qualité
différente. Des relevés laser y ont été collectés par le système mobile Stéréopolis II d’IGN100
dans la configuration décrite dans la section 2.1.3. Quelques passages de la plate-forme ont
été réalisés dans ce périmètre comme on peut l’observer dans la Figure 5.12. En revanche,
pour les besoins de l’analyse, seulement trois nuages de points S1, S2 et S3 ont été employés.
Figure 5.13 Segments extraits à partir des nuages mobiles (les couleurs de segments
correspondent aux différents passages de la plate-forme - Figure 5.12
Les intersections entre les plans principaux (arêtes de pli) ont été retrouvées, constituant une
base exhaustive à tester. Dans le cas des nuages mobiles, la géométrie de balayage
(seulement le sol et le rez-de-chaussée de bâtiments constitué, en général, des devantures de
magasins, ont été balayés) nous a obligés à extraire manuellement les arêtes (Figure 5.13).
La détection précise de plans verticaux était impossible due au taux de bruit important.
Quant à la référence, nous employons le nuage Sulpice2013_statique (voir la Figure 2.21 dans
la Section 2.2) à partir duquel les arêtes (ܨ) ont été extraites avec l’algorithme proposé au
sein du Chapitre 4 (Figure 4.27).
5.3.2 Évaluation de l’algorithme d’appariement
Appariement des segments
Au premier abord, la mise en correspondance réalisée à travers l’approche développée a été
comparée avec la vérité-terrain. De ce fait, la capacité de l’algorithme à prédire si une paire
existe a été mesurée. À chaque fois, une matrice de confusion a été créée afin d’observer le
nombre de paires de segments : 1) correctement appariées VP (Vrais Positifs) ; 2)
correctement rejetées VN (Vrais Négatifs) ; 3) mal identifiées FP (Faux Positifs) ; 4) omises
FN (Faux Négatifs). La Figure 5.14 visualise un exemple de résultats de la mise en
correspondance des segments réalisée entre le nuage mobile (S3) et celui statique (F).
Sur cette base, trois critères servant à noter notre algorithme d’appariement, largement
employés en statistique, ont été définis de la manière suivante :
ݔܧܽܿݐ݅ݑݐ݀݁ ൌ ሺܸܲ ܸܰሻ/ሺ∙ݍሻ (5.16)
ܵ݁݊ݏܾ݈݅݅݅ݐé ൌ ܸܲ/ሺܸܲ ܨܰሻ (5.17)
ܵé݂ܿ݅݅ܿ݅ݐé ൌ ܸܰ/ሺܸܰ ܨܲሻ (5.18) CHAPITRE 5. Qualification à partir d’entités linéaires
101
Figure 5.14 Comparaison avec la vérité-terrain : a) ܶ݁ݐݏ → ܯ݈݀݁ ; b) ܯ݈݀݁ → ܶ݁ݐݏ
Le Tableau 5.1 résume les valeurs obtenues pour les données réelles, séparément pour
chaque direction de calcul, et accompagnées par la distance ܱܦܪܮ. Il en ressort que
l’appariement réalisé entre les segments est suffisamment exact (les valeurs de tous les trois
critères définis sont élevées).
Tableau 5.1 Validation de l’algorithme de mise en correspondance (T-ܶ݁ݐݏ, M-ܯ݈݀݁)
Nombre de
segments
N
Exactitude
[%]
Sensibilité
[%]
Spécificité
[%] OLHD[m]
Test
(p)
Model
(q) T→M M→T T→M M→T T→M M→T T→M M→T
S1-S2 36 28 11 99.8 99.8 100.0 91.7 99.9 99.8 0.518 0.472
S1-S3 36 41 29 99.5 99.5 93.1 93.1 99.7 99.7 0.302 0.297
S2-S3 28 41 12 99.7 99.7 91.7 91.7 99.8 99.8 0.481 0.560
S1-F 36 64 21 99.6 99.6 85.7 95.2 99.7 99.6 0.671 0.656
S2-F 28 64 22 99.3 98.9 90.9 90.9 99.4 99.0 1.104 1.257
S3-F 41 64 24 99.7 99.5 91.7 91.7 99.7 99.6 0.563 0.657
Moyenne 99.6 92.3 99.7
La probabilité que l’algorithme dissocie correctement les vraies paires parmi toutes les
combinaisons possibles (exactitude) est élevée et oscille autour de 99.6%. En moyenne, 92.3%
des paires (voir la sensibilité) ont été retrouvées, indépendamment de l’éloignement de deux
ensembles de droites, ܶ݁ݐݏ et ܯ݈݀݁. Quant à la probabilité de dénombrer les appariements
erronés, elle peut être décrite comme faible. Puisque la spécificité atteint moyennement un
niveau de 99.7%, le nombre de FP constitue 0.3% de tous les VN. Par contre, le taux de FP
(détection d’une paire inexistante) paraît dépendre de la distance réciproque entre les
segments de deux jeux traités. En réalité, cet impact sur l’écartement se traduit par une
augmentation du nombre de droites couplées qui, dans le cas étudié, sont enrichies par 73% 102
de paires de plus pour une distance ܦܪܮ égale à 1.257m. D’un point de vue pratique, les
segments très proches de l’ensemble ܶ݁ݐݏ seront appariés à un même élément de ܯ݈݀݁, car
leur distance est suffisamment petite. Notamment, comme le montre la Figure 5.15a (à
gauche), un grand décalage horizontal ݀ܲ exerce une influence sur le seuil ߜ devenant plus
grand. Les segments 17-18 et 15-16 seront ipso facto couplés avec les segments 47-48 et 5-6
respectivement, même si en réalité, leur homologue n’existe pas. Ceci est dû au fait que les
distances ݀ሺݐ, ݉ሻ calculées sont inférieures au seuil fixé. Pour y remédier, nous pouvons
imaginer deux solutions. La première consisterait à introduire une contrainte de couplage.
Nous autorisons une correspondance unique entre deux segments. Néanmoins, le processus
d’appariement nécessite que l’on affronte un phénomène de sur-segmentation. Les segments
n’auront que très rarement une seule entité correspondante. Un autre défaut, une telle
restriction dévoilera un accroissement du nombre de FN (non-détection d’une paire présente)
et par conséquent, la probabilité d’identification correcte des paires existantes de segments
(sensibilité) baissera. La seconde solution envisageable amènerait à rapprocher des segments
avant de démarrer l’algorithme de mise en correspondance (voir le Chapitre 6).
Figure 5.15 Exemple d’erreurs de mise en correspondance : a) FP ; b) FN
La Figure 5.15b illustre un autre problème noté lors du couplage d’entités linéaires. Le
segment 51-52 n’a pas pu être apparié avec le segment 29-30, du fait de la distance parallèle
݀ூூ supérieure au seuil ߜ. Nous avons aussi observé que, dans certains cas particulier, le poids
ܹ introduit (voir la formule (5.10)) pour mettre en évidence l’orientation incompatible des
droites peut être parfois insuffisant. Comme le présente la Figure 5.15a (à droite), le segment
33-34 a été apparié avec le segment 25-26 à cause de la distance ݀ୄ très petite et de celle ݀ூூ
étant nulle, par-devers les orientations différentes.
Impact de l’écartement entre les ensembles Test et Model
Après avoir effectué ces analyses, nous voyons que la mise en correspondance semble
dépendre du décalage réciproque des segments. Plus les ensembles à comparer sont proches
l’un de l’autre, plus le résultat sera précis. CHAPITRE 5. Qualification à partir d’entités linéaires
103
Figure 5.16 Exemple des résultats obtenus à partir de S1 et F (une seule direction de calcul)
en fonction de la distance LHD : a) Distance faible ; b) Distance importante 104
Dans un premier temps, nous avons vérifié cette propriété à l’aide de données réelles S1 et F
(originales, ensuite décalées). Deux cas sont illustrés : a) la distance réciproque ܦܪܮ entre les
ensembles est égale à 0.803m (Figure 5.16a) ; b) la distance est de 8.734m (Figure 5.16b).
Nous observons, à cause de l’écartement notable, que les scores ݀ሺݐ, ݉ሻ attribués aux paires
présentes sont à peu près de la même grandeur que ceux caractérisant les paires erronées.
Dès lors, il est impossible d’entreprendre correctement une classification. Le seuil fixé est
suffisamment important pour que les paires présentes soient détectées, par contre, il laisse
également incorporer des paires erronées (FP).
Figure 5.17 Problèmes d’appariement dus à l’écartement de segments Test (bleu) et Model
(rouge) : a) Segments proches ; b) Segments Test déplacés T=[0.0m, 5.5m] ; c) Segments
Test déplacés T=[5.5m 0.0m] ; d) Segments Test déplacés T=[5.5m, 5.5m]
Tableau 5.2 Matrices de similarité créées à partir des segments illustrés par la Figure 5.17
(sens de calcul ܶ݁ݐݏ → ܯ݈݀݁)
a) δ=0.33m b) δ=3,72m
0.28* 10.37 14.98 8.95 15.53 10 5.78 10.28 12.05 3.46* 10.05
13.50 0.32* 8.96 13.39 15.30 11 15.88 3.19* 4.32 12.16 11.42
9.53 8.82 10.09 0.32* 6.47 12 15.03 9.25 10.08 5.82 1.86*
17.89 4.10 0.32* 12.72 9.98 13 21.98 9.04 4.34 14.96 9.45
1 2 3 4 5 1 2 3 4 5
4.91* 12.60 17.55 9.97 16.82 10 7.58 12.53 15.13 5.60* 11.94
13.72 5.82 12.09 13.47 15.63 11 16.07 5.82* 9.20 12.25 11.87
10.91 11.68 13.88 4.83* 9.53 12 15.94 12.01 13.87 7.56 7.24
17.76 4.28* 5.82 12.46 9.98 13 21.88 9.13 7.26 14.74 9.45
c) δ=5.12m d) δ=7.09m CHAPITRE 5. Qualification à partir d’entités linéaires
105
L’origine de ce problème réside dans la matrice de similarité elle-même dont l’analyse, en
présence du décalage significatif, ne permet plus de restituer de vraies relations entre les
segments. Par l’intermédiaire du Tableau 5.2 (matrices de similarité) associé à la Figure 5.17,
nous fournissons un exemple justifiant nos conclusions. Pour simplifier notre expérience,
nous n’envisageons alors que le cas 2D.
Le déploiement des segments sur la Figure 5.17a permet, sans aucun doute, de constater
(visuellement) que les entités linéaires doivent être appariées de la manière suivante : 10-1,
11-2, 12-4, 13-3, nul-5. Aussi, les scores ݀ሺݐ, ݉ሻ attribués à ces paires par notre algorithme
sont moindres et le seuil δ=0.33m dissocie les paires de la même manière. Nonobstant, cette
certitude disparaît quand les segments sont de plus en plus éloignés (Figure 5.17b,c,d). Nous
les relions désormais d’une autre façon en tenant compte de la contrainte de choisir les paires
ayant la distance réciproque la plus petite, et les directions conformes. Les carrés gris du
Tableau 5.2 représentent l’appariement préliminaire ܵ, sur lequel notre algorithme
d’appariement va s’appuyer afin de calculer le seuil ߜ. Les paires retenues après le seuillage
sont marquées par un astérisque (*). Par conséquent, le résultat de mise en correspondance
effectuée par notre algorithme est suivant :
1) Figure 5.17a :VP=4, VN=16, FP=0, FN=0 ;
2) Figure 5.17b :VP=1, VN=14, FP=2, FN=3 ;
3) Figure 5.17c : VP=2, VN=15, FP=1, FN=2 ;
4) Figure 5.17d : VP=1, VN=14, FP=1, FN=3 ;
Au vu de ces résultats, nous constatons que l’algorithme fournit l’appariement adéquat à
l’emplacement actuel des segments. En souhaitant trouver des segments homologues parmi
deux ensembles éloignés, il faut se rendre compte que cette tâche peut être irréalisable.
Néanmoins, pour nos applications, c’est-à-dire l’appariement des segments lors de leur
qualification, cette remarque n’est pas trop pertinente. Premièrement, les nuages de points
ainsi que les données de référence sont géopositionnés dans un référentiel commun. En
second lieu, l’exactitude des systèmes mobiles récents est loin d’être métrique. C’est pourquoi
la contrainte de distance réciproque faible entre deux ensembles d’arêtes sera toujours
satisfaite. La mise en correspondance peut ainsi être précisément effectuée. Sinon, faute de
précision requise, il sera nécessaire de rapprocher des données avant d’exécuter l’algorithme
de couplage.
5.3.3 Exactitude et précision
Passons à présent à la qualification des relevés laser mobiles à l’aide des arêtes extraites.
Nous employons deux critères :
1) l’exactitude absolue calculée par rapport à la référence précise (données statiques) ;
2) la précision consistant à comparer plusieurs passages de la plate-forme mobile (S1-
S2, S1-S3, S2-S3).
Le Tableau 5.1 récapitule les distances relatives de Hausdorff (ܱܦܪܮ) déterminées pour les
deux sens de calcul : en comparant d’abord les entités linéaires ܶ݁ݐݏ (S1, S2, S3) entre elles –
mêmes, et ensuite avec celles de référence (F). À chaque fois, la valeur maximale ܦܪܮ décrit,
selon le cas, soit l’exactitude, soit la précision des données étudiées. Les tests effectués
montrent que, dans les zones urbaines, la précision du système mobile examiné est de 0.30m.
Cependant, une précision plus faible a été constatée lors de comparaison avec le passage S2.
Or, ce nuage a été très probablement affecté par une mauvaise qualité des mesures GNSS.
Cette hypothèse a pu être vérifiée par l’exactitude dont la valeur était égale à 1.257 m. En
revanche, dans les autres cas, l’exactitude absolue est d’environ 0.70m. Le Tableau 5.3
récapitule les valeurs de distance indirecte de Hausdorff ሺܦܪܮሻ retenues et décrivant la
qualité des données traitées. Aussi, le temps d’exécution CPU sous Matlab est renseigné. 106
Même si l’algorithme exige d’être encore optimisé, le temps de calcul est de l’ordre de
quelques secondes.
Tableau 5.3 Mesure de qualité :distance de Hausdorff retenue
Nombre de
segments
N LHD[m] CPU* [s]
Test
(p)
Model
(q)
S1-S2 36 28 11 0.518 1.39
S1-S3 36 41 29 0.302 1.99
S2-S3 28 41 12 0.560 1.54
S1-F 36 64 21 0.671 3.11
S2-F 28 64 22 1.257 2.36
S3-F 41 64 24 0.657 3.51
* Intel Core x2 T7600 2.33Ghz / 4Go Ram / Win7 64bits
Il convient aussi de souligner, que la distance moyenne évaluant la qualité des nuages à
partir des segments non seulement représente l’exactitude, mais aussi l’erreur survenue lors
de la procédure d’extraction d’arêtes. Cette dernière est propre à l’algorithme employé.
Quant à la distance de Hausdorff ܦܪܮ, ses autres propriétés seront encore abordées au
Chapitre suivant.
Notre algorithme de qualification est décrit par le pseudo-code 5.1(Annexe E). Son but est de
fournir une mesure de qualité ܦܪܮ, ainsi qu’une matrice binaire de correspondance ݎܥ entre
deux ensembles de segments. Nous obtenons également deux distances relatives de
Hausdorff : ܱܦܪܮ்ெ et ܱܦܪܮெ், une pour chaque direction de calcul. Nous nous en servons
pour contrôler la justesse de l’algorithme d’appariement. Si leurs valeurs diffèrent
significativement, il en résulte que la mise en correspondance n’est pas correcte. Il est donc
recommandé de changer, dans un premier temps, la sensibilité ܷ de la fonction de recherche
des maxima locaux (par défaut ܷ ൌ 0.5) puisqu’elle décide du seuil ߜ. L’algorithme attend en
entrée que l’on saisisse une liste de coordonnées des extrémités de segments ்ܺ௦௧ et ܺௌ
dans le format ሾܰݎ, ܺ, ܻ, ܼሿ. 107
CHAPITRE 6
Recalage à partir d’entités linéaires
Sommaire :
6. Recalage à partir d’entités linéaires ............................................................................. 107
6.1 Introduction ............................................................................................................................ 108
6.2 État de l’art du recalage rigide ........................................................................................... 109
6.2.1 Mise en correspondance automatique ....................................................................................... 109
6.2.2 Classification des méthodes existantes de recalage ................................................................ 111
6.2.3 Aperçu des méthodes basées sur les entités linéaires ............................................................ 113
6.3 Recalage basé-lignes : caractérisation des méthodes ..................................................... 115
6.4 Évaluation des méthodes présentées ................................................................................. 116
6.4.1 Données pour les expérimentations .......................................................................................... 117
6.4.2 Algorithmes implémentés ............................................................................................................ 118
6.4.3 Outils d’évaluation ........................................................................................................................ 118
6.4.4 Résultats – recalage des données bruitées ............................................................................... 119
6.4.5 Impact du bruit sur la distance de Hausdorff ........................................................................... 122
6.5 Approche proposée : RLMR-FMII2 ................................................................................... 124
6.5.1 Recalage grossier – principe ....................................................................................................... 126
6.5.2 Évaluation avec données simulées ............................................................................................. 127
6.5.3 Tests sur données réelles ............................................................................................................. 130
6. Recalage à partir d’entités linéaires
Dans ce chapitre un état de l’art de techniques de recalage rigide basé sur les entités linéaires est
effectué. Trois méthodes d’estimation sont choisies et examinées avec des données simulées, afin de
vérifier leur robustesse et leur précision vis-à-vis notre problématique. Au vu des analyses effectuées,
l’une des méthodes existantes est adaptée à nos besoins, puis renforcée d’un algorithme permettant
parallèlement la mise en correspondance. Sachant que notre technique d’appariement impose une
contrainte – la distance réciproque des segments doit être assez faible, nous procédons d’abord à
rapprocher des arêtes pour faciliter et améliorer leur couplage ultérieur. Nous proposons une chaîne
complète nommée ܴܯܮܴ െ ܫܫܯܨଶ comprenant le recalage grossier (utilisation complémentaire de
l’algorithme de RANSAC et celui de ܫܫܯܨଶ) et un recalage fin (raffinement des segments approchés
par le ܫܫܯܨଶ). Finalement, la performance d’une telle procédure est évaluée avec des données simulées
et réelles.
Résumé 108
6.1 Introduction
La consolidation des nuages de points a pour but d’assembler des données devant servir à la
reconstruction tridimensionnelle d’environnements et de base à des études géométriques.
L’existence de zones d’ombre dues à la complexité des formes numérisées ainsi qu’aux
artefacts (voitures, piétons ou autres obstacles) présents sur la zone durant l’acquisition se
manifeste par un accroissement du nombre de stations du scanner laser fixe – les poses
[Landes et al., 2011]. Lorsqu’il s’agit d’un robot mobile se mouvant, les nuages de points
consécutifs contiennent toujours une même partie de l’environnement, mais avec des points
de vue différents. Ces données doivent être mises en cohérence pour en déduire le
déplacement relatif. Aussi, pour les zones d’intérêts numérisées deux ou plusieurs fois, au fil
du temps, la question de la consolidation se pose. D’autre part, pour des plates-formes
aériennes ou terrestres se localisant grâce à des systèmes hybrides IMU/GNSS, nous
observons un biais entre les nuages de points distincts. Alors, dans le cas de la cartographie
terrestre des zones de taille allongée (cartographie des corridors) les pertes du signal GNSS
apparaissent sous la forme d’un décalage de la trajectoire estimée. Enfin, tous les relevés
acquis par scanner laser aérien ALS sont encombrés par des écarts planimétriques et
altimétriques causés, cette fois-ci, par la dérive de la centrale.
Quel que soit le moyen de collecter les données, tous les relevés laser doivent être affinés
dans un système de référence commun, autrement dit consolidés (recalés). La solution au
problème de calage se réduit à déterminer une bonne transformation géométrique (rigide ou
non rigide), applicable aux données. Le référentiel commun est arbitrairement choisi parmi
l’un des nuages de points. Par essence, le recalage rallie trois problématiques : 1) la
reconstruction des primitives facilement identifiables dans la scène balayée ; 2) la mise en
correspondance et la planification de la stratégie des manipulations sur des entités couplées ;
3) la résolution du système de contraintes amenant à estimer les paramètres optimaux de
passage d’un repère à un autre – généralement un vecteur de translation ܶ ൌ ൣܶ௫, ܶ௬, ܶ௭൧ et
une matrice de rotation ܴଷ௫ଷ.
Nous nous concentrons, dans le cadre de notre travail, sur le recalage rigide de relevés laser
issus du système mobile de cartographie. Deux tâches principales sont à réaliser. D’une part,
l’intégration « multidonnées » visera, à améliorer le géo-référencement absolu, ainsi qu’à
incorporer d’autres types de données, externes au système d’acquisition, mais fournissant
souvent des informations complémentaires. Cependant, le principe du co-recalage de relevés
sera de rechercher à assembler, de manière relative, ces différents nuages acquis lors de
plusieurs passages. Son inconvénient principal réside dans le fait qu’aucune information
extérieure ne corrige le cumul des erreurs, si bien que l’exactitude du calcul final ne peut pas
être calculée. Rappelons que les entités géométriques choisies sont des segments de droite
(arêtes de pli), car les nuages de points bruts (sans traitement), avec lesquels nous
travaillons, peuvent empêcher la reconnaissance précise des points de contrôle, même sous
forme de cibles placées volontairement dans la scène.
Dans ce chapitre, on s’attardera, dans un premier temps (Section 6.2), sur un état de l’art des
techniques de recalage et d’appariement des entités linéaires. Puis (Section 6.3), trois
approches d’estimation des paramètres de pose à partir des lignes 3D seront présentées en
détail notamment : EIGEN [Zhang et Faugeras, 1991], ICL (forme ICP) [Alshawa, 2006]
et FMII [Kamgar-Parsi et Kamgar-Parsi, 2004]. Ces algorithmes ont été implémentés et
examinés avec des données simulées afin de vérifier leur robustesse, la résistance au bruit et
l’exactitude des résultats obtenus vis-à-vis de notre problématique (Section 6.4). C’est sur
cette base qu’une chaîne complète, nommée ܴܯܮܴ െ ܫܫܯܨଶ (Robust Line Matching and
Registration – FMIIଶ) permettant un recalage qui s’appuie sur l’appariement des primitives
linéaires, a été proposé (Section 6.5). La mise en correspondance s’effectue à l’aide de
l’algorithme présenté dans le Chapitre 5. Néanmoins, cette méthode requiert que les deux CHAPITRE 6. Recalage à partir d’entités linéaires
109
ensembles de segments à apparier soient relativement proches l’un de l’autre. Sinon,
l’appariement n’est qu’approximatif. Nous proposons, par conséquent, de rapprocher d’abord
les entités linéaires dans l’intention d’améliorer et de faciliter leur couplage ultérieur. Cette
étape étant réalisée par une approche couplant RANSAC et ܫܫܯܨଶ amène à trouver un
échantillon optimal à partir duquel les paramètres de recalage grossier seront calculés
(Paragraphe 6.5.1). Ensuite, la mise en correspondance explicite des segments sert à un
recalage fin, possible grâce à l’algorithme ܫܫܯܨଶ étant la version modifiée de ܫܫܯܨ. Nous
présenterons, à la fin du chapitre, l’analyse qualitative et quantitative des résultats obtenus
avec une telle procédure.
6.2 État de l’art du recalage rigide
Dans cette partie, le premier paragraphe (6.2.1) fera un bref état de l’art de divers
algorithmes d’appariements des entités linéaires. Puis, nous passerons à présenter une
classification des méthodes de recalage (6.2.2), pour finalement décrire quelques techniques
de minimisation des contraintes à partir des lignes, visant à déterminer les paramètres de
transformation rigide (6.2.3).
6.2.1 Mise en correspondance automatique
La raison principale pour laquelle le recalage est difficile vient du fait que les appariements,
c’est-à-dire les vraies associations entre les primitives extraites, sont inconnus. La mise en
correspondance de plusieurs éléments, reconstruits depuis des nuages de points distincts, est
une tâche cruciale puisqu’elle établit un système de contraintes à minimiser lors de
l’estimation des paramètres de pose (Figure 6.1). La convergence de l’algorithme de recalage
dépendra alors directement de ces associations. En d’autres termes, l’exactitude des
appariements créés, se manifestant par un nombre de paires erronées ou manquées,
influencera la qualité des paramètres déterminés.
Figure 6.1 Exemple de mise en correspondance entre deux nuages de points à partir de
descripteurs [Latulippe, 2013]
Considérant une technique itérative avec une présence de mauvais appariements, dans le
meilleur des cas, on ralentit sa convergence, et dans le pire de cas, on cause sa divergence.
Par conséquent, avec un algorithme comme ICP (Iterative Closest Point) (expliqué en 6.2.2), on
n’est jamais certain d’arriver à une solution optimale, car ces associations sont seulement
approximatives. Ainsi, lorsque l’écartement entre deux nuages est grand au départ, cet
algorithme reste facilement bloqué dans un minimum local. Pour remédier à ce problème,
l’une des idées serait de développer des méthodes permettant d’estimer des correspondances
avant de réaliser le recalage global. Ce résultat peut être atteint, comme expliqué par
[Latulippe, 2013], à l’aide d’un descripteur, à savoir un ensemble de valeurs caractéristiques,
attribué à un point et décrivant la géométrie locale autour de lui. Il existe de nombreuses
approches qui incorporent une étape d’extraction de points d’intérêt, auxquels sont ensuite 110
attribuées les valeurs de description. Ces dernières sont calculées à partir des coordonnées
(X,Y,Z) de ce point et de ses voisins. Nous pouvons citer, par ordre chronologique, quelques
types de descripteurs, applicables aux nuages de points par exemple : la variation de la
courbure ; les moments invariants ; les spin images ; les points fingerprints ; les shape
contexts 3D ; le SIFT (Scale-Invariant Feature Transform) ; les PFH (Point Feature
Histograms) ; les FPFH (Fast Point Feature Histograms) ; les SHOT (Signature of Histograms
and Orientations), etc. [Tangelder et Veltkamp, 2008] et [Latulippe, 2013].
Mise en correspondance des segments de ligne
Nous nous intéressons à réaliser le recalage par l’intermédiaire des entités linéaires 3D
appariées au préalable. Néanmoins, les travaux traitant de ce problème n’exposent presque
jamais la question de la mise correspondance, en supposant que celle-ci soit déjà établie. Pour
satisfaire ces besoins, un nombre de techniques d’appariement a été développé. La plupart des
revues liées à ce sujet dévoilent que les algorithmes utilisés se heurtent aux difficultés
suivantes : la sur-segmentation des segments et le bruit. Nous détaillerons dans cette section
quelques méthodes récentes d’estimation de correspondances. Une étude montre que la
distance Euclidienne « classique » peut toutefois ne pas être suffisante pour créer un
appariement relativement correct [Douadi, 2006]. Par conséquent, [Wang et al., 2012]
suggèrent de prendre en compte d’autres attributs de segments tels que la longueur, la
direction, la position ou le taux de chevauchement.
[Yao et al., 2010] proposent un algorithme bénéficiant de rigidité des droites pendant la
transformation, ce qui veut dire que les écartements et les angles entre les entités restent
toujours les mêmes. Pour chaque paire de segments de l’ensemble ܣ, des paires homologues
sont recherchées dans l’ensemble ܤ qui satisfont à deux conditions : les valeurs absolues de
différence de distances et celles d’angles sont inférieures à des seuils fixés. Afin de réduire le
temps de recherche, seulement les ݇ meilleures paires de ܤ sont retenues.
De la même manière, [Li et al., 2012] appliquent la même hypothèse afin d’établir de vraies
associations entre les segments 3D. La solution proposée consiste à attribuer, à toutes les
entités linéaires de l’ensemble, deux vecteurs, chacun comprenant quatre composantes
décrivant leur relation angulaire et l’éloignement vis-à-vis des autres éléments de l’ensemble.
Il s’agit de former le vecteur contenant : le maximum, le minimum, la moyenne et l’écarttype
de mesures calculées. Ensuite, on détermine la distance entre i-ème vecteur de
l’ensemble ܣ et tous les vecteurs de ܤ. Les segments sont appariés à condition que les deux
normes (concernant l’angle et la distance) soient minimales.
[Jaw et Chuang, 2008] développent une approche s’exécutant en deux étapes. Dans un
premier temps, les angles spatiaux (ߠ, ߠ …) entre un segment et ses voisins successifs dans
chaque ensemble sont déterminés en utilisant, à cet effet, les extrémités (Figure 6.2a et
Figure 6.2b). Deux segments de droites sont appariés, si et seulement si, la différence
angulaire ne dépasse pas un certain seuil. Ces associations préalables permettent ensuite
d’estimer les paramètres de transformation censés rapprocher les nuages de points (Figure
6.2c). La dernière phase nous amène à calculer la distance spatiale ܦ équivalente à la
moyenne des distances (ܦଵ et Dଶ) servant à retrouver des lignes homologues (Figure 6.2d). CHAPITRE 6. Recalage à partir d’entités linéaires
111
Figure 6.2 Estimation de correspondances selon [Jaw et Chuang., 2008] : a) b) Calcul des
angles spatiaux pour l’ensemble ܣ et ܤ respectivement ; c) Deux ensembles d’entités après la
transformation ; d) Définition de distance spatiale
Un regard tout à fait différent est énoncé avec des approches cherchant à apparier des points
au lieu des lignes. L’une des possibilités est de discrétiser chaque droite en un certain nombre
de points et de s’en servir pendant le couplage réalisé souvent à l’aide d’ICP. Ainsi [Belton et
al., 2011] proposent d’extraire des vertex représentant des intersections entre les lignes 2D.
La technique mise en œuvre consiste à étudier, au sein de chaque ensemble, les distances
Euclidiennes entre toutes les combinaisons possibles de points. Pour ce faire, une méthode de
vote est employée dont l’objectif est de trouver, sous une certaine tolérance, des distances
semblables. Pendant ce processus une matrice de correspondance est créée, de telle manière
que ses coefficients décrivent la probabilité que le point de l’ensemble ܣ appartienne au
point de l’ensemble ܤ.
De surcroît [Huh et al., 2013] cherchent à apparier des polygones. Cette problématique est
similaire à la nôtre puisqu’un polygone est considéré comme la réunion de segments appelés
côtés. D’abord, les calculs des régions de confiance des segments sont effectués à partir des
erreurs de position de leurs extrémités. Puis, des sommets ainsi que des « vertex virtuels »
étant l’intersection des droites dérivées depuis les segments, sont extraits. Enfin, un
algorithme de recherche de sous-chaîne (string matching algorithm) est employé afin d’estimer
des paires de points correspondants.
6.2.2 Classification des méthodes existantes de recalage
Il existe plusieurs techniques de calage de données laser. Nous pouvons l’effectuer par
consolidation (best fit/ICP) en nous appuyant sur la géométrie des objets numérisés, par un
relèvement sur les cibles disposées (Figure 6.3) ou bien encore sur les « cibles naturelles » en
les assimilant à des primitives géométriques (sphères, plans, cylindres, cônes, etc.) fortement
présentes dans les environnements bâtis et industriels aménagés par l’homme. Quant aux
cibles/primitives, elles peuvent servir également pour dissocier des entités géométriques (le
centre, l’axe principal, le sommet, l’intersection, etc.), ainsi que des invariants géométriques
tels que le rayon [Hullo, 2013]. 112
Figure 6.3 Différents types de cibles propres pour les constructeurs du scanner
La classification des méthodes de recalage proposée par [Gressin et al., 2013] peut être une
bonne démarche introductive pour les algorithmes existants. En effet, trois familles
d’approches sont considérées : 1) les méthodes basées sur la mise en correspondance de
primitives géométriques remarquables dans deux nuages et invariants lors d’un mouvement
rigide ; 2) les approches employant le modèle de surface (ordinairement un maillage) au lieu
des nuages de points 3D ; 3) les techniques focalisées sur les points et donc ne nécessitant ni
l’extraction préalable de primitives ni la phase de modélisation (p.ex. ICP, RANSAC).
Néanmoins, cette classification n’est pas unique. [Alshawa, 2006] suggère de classer des
algorithmes de la manière suivante : 1) les méthodes basées sur les entités géométriques,
dont la connaissance préalable et précise, est primordiale ; et 2) celles indépendantes des
entités d’intérêt. Parmi ces dernières deux sous-groupes sont distingués : 1) les techniques de
vote ; 2) les méthodes de correspondance sous-jacente telles que la méthode ICP et la
méthode DARCES (Data-Aligned Rigidity-Constrained Exhaustive Search) [Chen et al., 1999]
basée sur RANSAC. Il faut souligner que les algorithmes dépendants des primitives
nécessitent un temps considérable pour les extraire et que leur handicap se dévoile lors du
manque de détails caractéristiques. En revanche, ils n’exigent quasiment pas de valeurs
initiales pour se réinitialiser en permettant de réduire le nombre de combinaisons possibles
d’appariement. Quant aux calculs des inconnus de pose, ils sont effectués en assimilant des
méthodes indépendantes des entités géométriques, mais à une différence près, après avoir
extrait des primitives. C’est pourquoi certaines personnes considèrent ces méthodes comme
un cas particulier de ces dernières.
L’Iterative Closest Point (ICP), proposé concurremment par [Besl et McKay, 1992] et [Chen
et Medioni, 1992] est un algorithme itératif le plus souvent utilisé. Il est utilisé soit pour
recaler deux vues partielles d’un même objet, soit pour corriger des relevés laser mobiles
[Ridene, 2010]. L’idée est d’itérer deux étapes : celle de la mise en correspondance et celle de
l’estimation des paramètres afin d’établir la meilleure transformation recalant des scans dont
le recouvrement s’avère assez important. Au bout de chaque itération, une liste d’éléments
appariés est de nouveau fournie, servant à son tour à déterminer une nouvelle estimation des
paramètres de pose. Ces derniers seront utilisés par la suite, pour la mise à jour de la position
des données. Toutes ces étapes seront répétées jusqu’à l’obtention de la convergence de
l’algorithme. Celle-ci est atteinte lorsque l’erreur résiduelle ne dépasse pas un certain seuil,
ou bien que le nombre maximum d’itérations allouées à l’algorithme est atteint. Cependant,
l’ICP « classique » présente des limitations qui font, jusqu’à présent, l’objet de nombreuses
études. C’est pourquoi plusieurs améliorations y ont déjà été apportées. Elles visent à
intervenir à chaque étape de cet algorithme [Rusinkiewicz et Levoy, 2001], [Douadi, 2007],
[Gressin, 2013]. Cela concerne la façon de choisir des entités à apparier [Masuda et Yokoya,
1995], [Gelfand et al., 2003], la stratégie d’appariement employée [Pulli,1999], [AlDurgham
et al., 2011], la pondération des paires appariées [Gressin et al., 2012], le rejet de
mauvais appariements [Zhang, 1994] et enfin le type de critère à minimiser et/ou
l’algorithme de minimisation. L’objectif est toujours de minimiser un score, une distance ou
une erreur entre les parties communes. Le critère le plus simple à utiliser est la somme des
erreurs de distance quadratiques entre les points appariés (ICP Point à Point). Mais, les CHAPITRE 6. Recalage à partir d’entités linéaires
113
méthodes fondées sur la somme des carrés des distances entre les points d’un scan et le plan
de l’autre sont aussi couramment employées (ICP Point à Plan). L’estimation de la
transformation rigide s’effectue à l’aide de plusieurs approches telles que la technique SVD
(décomposition en valeurs singulières) [Arun et al., 1987], l’utilisation des quaternions
unitaires [Besl et McKay, 1992] ou l’algorithme d’optimisation non linéaire de LevenbergMarquardt
[Fitzgibbon, 2001]. L’inconvénient majeur de l’ICP dans sa forme originale vient
du fait qu’il peut converger vers un faux minimum lorsque les données sont très bruitées et
qu’il a besoin d’un nombre important d’itérations. Pour atteindre le minimum global et
accélérer la convergence, une initialisation préalable fournissant de bonnes valeurs initiales
est requise. En dépit de toutes les études, une intervention de l’opérateur est souvent
obligatoire puisque cette opération n’est généralement pas résolue automatiquement.
6.2.3 Aperçu des méthodes basées sur les entités linéaires
L’utilisation des entités linéaires au lieu des points, pour les besoins de consolidation,
constitue d’un point de vue algorithmique un défi plus important. Par contre, il a été
démontré que seules deux paires de droites non colinéaires permettent de dériver la solution
[Alshawa, 2006], [Yao et al., 2010]. Toutefois, compte tenu des bruits qui entachent les
données, il est conseillé d’employer un nombre de paires ܰ supérieur à deux et de résoudre
un système surdéterminé de ܰ équations afin de trouver la meilleure estimation.
Les méthodes de recalage conçues pour les entités linéaires ne sont pas nombreuses, nous en
citerons quelques – unes. Dans ces travaux [Zhang et Faugeras, 1991] analysent plusieurs
algorithmes de minimisation, y compris le Filtre de Kalman Étendu (EKF), la minimisation
par la méthode de moindres carrés et la décomposition en valeurs singulières, pour étudier le
déplacement à partir des segments 3D. Cette problématique étant similaire à la nôtre, elle
permet d’estimer les paramètres optimaux d’une transformation rigide. Différents scénarios
ont été vérifiés, en supposant que l’appariement des entités est connu, afin de juger la façon
optimale de représenter la matrice de rotation et de calculer des estimées. Finalement, la
représentation par un axe et un angle (axis-angle representation) avec l’utilisation simultanée
du Filtre de Kalman est la solution la plus précise. En revanche, lorsque l’on considère
exclusivement le temps de calcul, c’est l’approche EIGEN basée sur la rotation exprimée par
des quaternions et estimée par la SVD qui paraît la plus prometteuse.
Dans le même contexte [Alshawa, 2006] propose deux variantes de méthode ICL (Iterative
Closest Line) servant à déterminer des paramètres de transformation rigide à partir de
droites : 1) ICL (forme ICP) ; 2) ICL forme alternative. La première est identique à
l’algorithme ICP de base si l’on envisage uniquement la rotation. Mais, elle présente un
aspect différent sur la façon de calculer le vecteur de translation, comme nous pourrons
l’observer ultérieurement. La seconde solution inspirée de [Habib et al., 2004] est une
approche itérative et non de solution analytique (closed-form). Son principe consiste à
procéder à une consolidation en employant la transformation de similitude 3D
(transformation conforme 3D) de sept paramètres dont: R - rotation, T - translation et s –
facteur d’échelle, tous utilisés afin d’écrire la relation entre deux points homologues d’une
paire de segments :
ܺ
ܻ
ܼ
൩ ൌ ݏܴ ቈݔ
ݕ
ݖ
ܶ (6.1)
Il faut noter que le système d’équations obtenu à partir de la formule (6.1) est non-linéaire,
tandis que l’ajustement par la méthode des moindres carrés requiert un processus de
linéarisation et une bonne approximation initiale des paramètres recherchés. Quant à la
valeur du facteur d’échelle s, elle est égale à l’unité puisque les scanners laser produisent les
données à l’échelle réelle. Néanmoins, cette procédure suppose que les extrémités des 114
segments se conjuguent avec un autre, ce qui peut ne pas avoir lieu en réalité. Les deux
versions d’algorithmes implémentées par [Alshawa, 2006] permettent de coupler
itérativement des entités linéaires quasi-parallèles. Au cours de chaque itération, les deux
lignes les plus proches sont appariées, sous condition que leur distance réciproque soit
inférieure à un certain seuil. La procédure est répétée plusieurs fois. Nous partons de la pose
corrigée jusqu’à ce que l’appariement obtenu soit le même que celui de l’étape précédente.
Étant donné que les segments correspondants, extraits lors d’un processus automatique, se
caractérisent souvent par des longueurs différentes (sur-segmentation due au problème des
masques) une amélioration de la méthode de [Habib et al., 2004] a été suggérée par
[Renaudin et al., 2011]. Or, un vecteur des écarts ݀ܺԦ entre les extrémités des segments
correspondants est déterminé le long d’une entité linéaire (Figure 6.4) et rajouté au modèle
mathématique (6.1). Ensuite, la technique traditionnelle des moindres carrés a été modifiée
afin d’éliminer cette inconnue du processus d’estimation. Cet objectif a été atteint par une
nouvelle définition des poids associés au vecteur d’erreurs de mesures (bruit blanc).
Cependant, aucune des modifications effectuées n’a d’impact sur le calcul. L’algorithme de
minimisation de Gauss-Newton peut toujours être employé pour trouver la solution : les
paramètres de similitude spatiale entre deux ensembles de segments. Ce genre d’algorithmes
nécessite une transformation initiale et peut offrir une mauvaise estimation lorsque cette
dernière est loin de la réalité, ce qui est son inconvénient majeur. L’évaluation qualitative
(visuelle) et quantitative du recalage réalisé grâce à un tel algorithme a été effectuée par
[Canaz et Habib, 2013]. À cet effet, les paramètres de pose obtenus ont été comparés avec
ceux fournis par d’autres méthodes, notamment par le recalage basé sur les plans [Ghanma,
2006] et l’algorithme ICPP (Iterative Closest Projected Point) de [Al-Durgham et al., 2011]
étant l’une des variantes d’ICP. Son idée consiste à minimiser la distance entre chaque point
d’un scan et sa projection sur trois points de l’autre. Quant à la technique examinée, certains
problèmes au niveau d’alignement vertical ont été observés. L’une des causes de cette
imprécision vient de la nature des lignes elles-mêmes. Par conséquent, la droite extraite à
partir des images et associée à l’arête reconstruite du nuage de points peut être sensiblement
différente.
Figure 6.4 Principe du recalage se référant à la transformation de similitude 3D (Illustration
reproduite à partir de [Renaudin et al., 2011])
Sous un autre point de vue [Guerra et Pascucci, 1999] discutent de différentes méthodes de
recalage d’entités linéaires pour lesquelles l’appariement n’est pas connu. Ils proposent
d’utiliser un triplet de paires de segments afin de trouver des paramètres de transformation
rigide. Le but à atteindre est celui de tester un très large nombre de transformations, toutes
calculées à partir des échantillons tirés aléatoirement. La distance déterminée, à chaque fois,
entre les lignes permet d’indiquer le meilleur couplage. L’inconvénient de cette méthode est
d’avoir une complexité de calcul relativement élevée. De plus, elle suppose implicitement que
les milieux des segments doivent être des points correspondants. CHAPITRE 6. Recalage à partir d’entités linéaires
115
[Kamgar-Parsi et Kamgar-Parsi, 2004] ont développé des algorithmes applicables, quelles
que soient les lignes : finies ou infinies. La solution adaptée à des segments de ligne de même
longueur est présentée par [Kamgar-Parsi et Kamgar-Parsi, 1997]. Pour des segments de
longueur différente, trois cas sont envisagés. En désignant des entités linéaires à déplacer
par Image (I), tandis que celles de référence comme Model (M), nous distinguons des
approches : 1) FMFI (Finite Model, Finite Image) conçu pour dériver la transformation à
partir de deux ensembles de segments ; 2) IMII (Infinite Model, Infinite Image) destiné aux
lignes infinies et 3) FMII (Finite Model, Infinite Image) approprié à des cas mixtes. En
revanche, tous les calculs associés s’appuient sur le schéma développé pour les segments
égaux. La fonction de coût minimise la distance entre les points correspondants de chaque
paire de droites. Ces derniers sont établis par le paramètre shift ሼs୧ሽ. Finalement, l’estimation
de la meilleure transformation se fait itérativement, par la résolution d’un système non
linéaire de ሺ6ܰሻ équations, en partant de valeurs initiales de ሼݏሽ, actualisées au bout de
chaque boucle. Les analyses effectuées par les auteurs montrent que l’algorithme converge
presque toujours vers un minimum, et indépendamment des paramètres initiaux choisis. Le
temps de calcul et le nombre d’itérations dépendent de la précision souhaitée.
Deux des algorithmes mentionnés auparavant sont devenus l’élément de base des autres
méthodes. [Yao et al., 2010] ont cherché à combler le manque d’informations sur
l’appariement des entités linéaires à travers une approche s’effectuant en deux étapes. Dans
un premier temps, une transformation initiale est calculée à l’aide d’algorithme de [Zhang et
Faugeras, 1991], afin d’être ensuite affinée avec l’une des solutions de [Kamgar-Parsi et
Kamgar-Parsi, 2004] modifiée de telle façon qu’elle soit moins susceptible de s’appuyer sur
des segments de qualité différente. Il se peut que l’incertitude associée à chaque ligne ne soit
pas la même, car elle résulte de la densité du nuage diminuant avec l’augmentation de la
distance objet-scanner. À chaque phase, le calcul est mené à partir d’un nombre minimal de
paires ሺܰ2ሻ, excepté que les résultats pour ܰൌ3 sont plus robustes et fiables que ceux
pour ܰൌ2.
6.3 Recalage basé-lignes : caractérisation des méthodes
Plusieurs approches traitant du problème de recalage rigide basé sur les entités linéaires 3D
ont été proposées dans la littérature, comme il a été montré dans la section précédente. Ce
paragraphe va aborder en détail trois méthodes méritant notre attention, puisqu’elles
donnent un autre regard sur la question mise en avant. Dans un premier temps, la solution
nommée EIGEN de [Zhang et Faugeras, 1991] ayant pour but d’estimer le mouvement à
partir des segments 3D sera détaillée. Ensuite, l’algorithme ICL de [Alshawa, 2006]
conceptuellement inspiré de l’algorithme ICP sera présenté – ICL(forme ICP). Enfin,
l’essentiel de l’approche FMII de [Kamgar-Parsi et Kamgar-Parsi, 2004] sera discuté.
Chacune des méthodes mentionnées auparavant profite d’une autre représentation du
segment dans un espace tridimensionnel et s’appuie sur une autre notation mathématique
décrivant la rotation d’objet telle que les quaternions, les angles d’Euler ou bien encore la
matrice traditionnelle de rotation.
Ces méthodes sont spécifiées respectivement à l’Annexe B, Annexe C et Annexe D. Les
signes apparaissant dans toutes les équations se présentent de la manière suivante : ‖ݒ‖
symbolise la longueur (norme) du vecteur ݒ, t indique la transposition, l’inverse d’une
matrice est marqué par l’indice (-1), le produit vectoriel est signalé par « ˄ » et bien entendu
chaque vecteur s’exprime verticalement.
Le Tableau 6.1 résume les trois méthodes d’estimation de la transformation présentées dans
la section précédente. Les approches ICL (forme ICP) et EIGEN sont assez similaires, si
nous envisageons seulement les démarches nécessaires pour calculer la matrice de rotation –
elles s’appuient toutes deux sur l’orientation de lignes. Aussi, la SVD est employée afin de
dériver la rotation optimale. Néanmoins, elles présentent un regard diffèrent quand il s’agit 116
de déterminer la translation, résultant principalement de la représentation différente de ligne
3D. Contrairement à EIGEN, l’approche ICL(forme ICP) permet simultanément d’apparier
les entités linéaires ce qui devient son point fort. Ce processus se fait de façon itérative et
implique le temps de calcul adéquat. Si jamais l’appariement explicite est connu, la solution
peut être immédiatement trouvée (non itérativement).
Quant à la méthode EIGEN, elle se réfère à des points correspondants et non plus des lignes.
Leurs coordonnées sont déterminées grâce au paramètre shift ሼݏሽ, étant calculé de manière
itérative. Nous devons alors introduire ses valeurs initiales, proches de celles réelles. Sinon,
l’algorithme peut donner de mauvais résultats.
Chacune des méthodes aboutit, quelles que soient les démarches proposées, à estimer les
paramètres de transformation en deux étapes : d’abord la rotation ܴ suivie ensuite par la
translation ܶ.
Tableau 6.1 Récapitulatif de méthodes présentées
Auteurs [Zhang et Faugeras,
1991]
[Alshawa, 2006] [Kamgar–Parsi et
Kamgar–Parsi 2004]
Nom EIGEN ICL (forme ICP) FMII
Appariement
connu
Oui Non Oui
Représentation
du segment
Deux vecteurs
perpendiculaires : vecteur
directeur normalisé et
vecteur parallèle à la
normale d’un plan passant
par cette ligne et l’origine
Deux points
(extrémités) et
vecteur directeur
Ligne finie : (milieu,
vecteur directeur unitaire,
longueur)
Ligne infinie : (point de la
ligne le plus proche de
l’origine, vecteur directeur
unitaire)
Représentation
de la matrice de
rotation
Quaternion Matrice
traditionnelle de
rotation
Quaternion
Fonction à
minimiser
Orientation de lignes Orientation de lignes Distances entre points
correspondants
Approche SVD SVD Méthode d’optimisation
non-linéaire
(valeurs initiales du
paramètre shift demandées)
Besoin
d’itérations ?
Non Oui
(si appariement à faire)
Oui
6.4 Évaluation des méthodes présentées
Dans cette partie, nous contrôlerons la robustesse des trois algorithmes détaillés ci-dessus et
récapitulés dans le Tableau 6.1. Pour ce faire, plusieurs tests ont été proposés, puis effectués
sur des données simulées pour lesquelles l’appariement était déjà connu. Les segments ont
été obtenus par modification des arêtes extraites à partir du nuage Sulpice2013_statique,
acquis au sein d’une zone test (description détaillée se trouve en section paragraphe 2.2).
Nous avons évalué la précision des paramètres estimés par chacune des méthodes en
admettons le taux de bruit. À chaque fois, les erreurs ݁ோ ݁ݐ ்݁ des paramètres de
transformation estimés ܴ ݁ݐ ܶ ont été calculées. Aussi, la distance de Hausdorff orientée CHAPITRE 6. Recalage à partir d’entités linéaires
117
(OLHD) entre deux ensembles de segments, avant et après la transformation, a été
déterminée comme cela est expliqué dans le Chapitre 5.
6.4.1 Données pour les expérimentations
Quant aux données simulées, elles étaient générées à partir de 64 segments (F) nommés
désormais Model, en appliquant les paramètres prédéfinis de transformation. Deux scénarios
ont été examinés : 1) les extrémités des segments originaux, en système Lambert93, ont été
dégénérées en leur ajoutant un bruit blanc gaussien centré et de variance connue ߪ ; 2) de
plus, la position des points a été modifiée en appliquant les paramètres prédéfinis de
transformation rigide ܴ et ܶ.
Figure 6.5 Données expérimentales à recaler : a) Test2a ; b) Test2b
Dans un premier temps, de petites rotations dans l’espace 3D, exprimées par les trois angles
d’Euler (1.0000º ; -1.0000º ; 1.0000º), ont été introduites. Le vecteur de translation
ܶ ൌ [-1.000m ; 0.500m ; 1.000m] y associé a été aussi pris en compte. De surcroît, les
coordonnées de ces entités linéaires ont été bruitées par tirage aléatoire suivant une loi 118
normale centrée d’écart-type ߪ. Les tests ont été menés pour différentes valeurs de bruit, en
partant de ߪ ൌ0.000m et en finissant sur ߪ ൌ0.050m, avec l’intervalle constant de 0.001m.
En résulte, des centaines de nouveaux ensembles de données Test, chacun contenant 64
segments, ont été obtenus. Ils constituent d’ores et déjà les données nommées Test2a (Figure
6.5a). Les données Test2b (Figure 6.5b) étaient obtenues de façon identique, mais cette fois-ci,
les angles d’Euler ainsi que la translation introduits étaient plus importants et égaux
respectivement (3.0000° ;-7.0000° ; 6.0000°) et (3.000m ; 1.000m ; -2.000m). La distance
LHD mesurée entre les données Test2a était égale environ à 2.7m, tandis que celle entre les
entités Test2b est de 27.5m, en ignorant le bruit ajouté.
Nous avons généré un autre jeu de données (Test3), pour lequel la transformation Ƭ fixée en
entrée était nulle. Nous avons uniquement simulé le bruit gaussien de variance ߪ pour
obtenir l’ensemble Test à partir de Model.
6.4.2 Algorithmes implémentés
Le travail réalisé avec l’implémentation sous Matlab® R2010a a permis d’évaluer chaque
approche en termes de sensibilité au bruit, de précision de résultats et de temps d’exécution.
Les méthodes mises en œuvre suivent le raisonnement présenté dans la section précédente.
Parmi les approches proposées par [Kamgar – Parsi et Kamgar-Parsi, 2004] nous avons
décidé d’examiner l’algorithme ܫܫܯܨ, en dépit du fait qu’il est dédié à recaler des lignes
infinies avec des lignes finies. Notre choix s’explique, conformément à la suggestion des
auteurs, par le fait que le ܫܨܯܨ, dédié aux segments de ligne, peut échouer si le segment plus
court d’une paire n’est pas complètement inclus dans son homologue. Nous avons
légèrement modifié l’algorithme FMII pour le rendre mieux adapté à nos besoins. Nous lui
accordons le nom ܫܫܯܨଶ pour le différencier de la version de base. D’abord, la représentation
d’entités à déplacer (Image) a été remplacée par celle utilisée pour les droites finies, à une
différence près, nous ne prenons pas toujours en compte les longueurs de segments. Chaque
élément Image ܺ ൌ ሺݔ, ݒ
ᇱ
ሻ est alors représenté par ݔ étant son milieu (et non plus le point le
plus proche de l’origine du système de coordonnées) et ݒ
ᇱ
son vecteur directeur. Cette
solution paraît plus adéquate et accélère la recherche ultérieure des points correspondants
qui seront désormais déterminés par rapport aux milieux des segments. En conséquence
nous avons dû changer la façon de calculer le paramètre shift ሼݏሽ en s’inspirant aussi de
l’algorithme ܫܨܯܨ. Celui-ci est obtenu par la résolution de l’équation ߲ܯ/߲ݏ ൌ 0, où la
distance M(A,ƬX), introduite pour le ܫܨܯܨ (6.2), se calcule en fonction de la longueur des
segments.
ܯሺܣ, Ƭܺሻ ൌ ൝݈‖ܽ ݏݒ െ ܶ െ ܴݔ‖ଶ ݈
ଷ൫1 െ ݒ
௧
ݒܴ
ܮ ݈ ݅ݏ ൯/6 ′
ݒݏ ݔฮܽ െ ܶ െ ܴ൫ܮ
′ ൯ฮଶ
ܮ
ଷ൫1 െ ݒ
௧
ݒܴ
ܮ ݈ ݅ݏ ൯/6 ′
(6.2)
où :
ܮ : longueur du segment Model
݈ : longueur du segment Image
Sachant que nous considérons les entités linéaires Image comme infinies, leur longueur ሺ݈ሻ
sera toujours plus grande que celles Model. De ce fait, la formule (D.10) est substituée en :
ݏ ൌ ሺܽ െ ܶ െ ܴݔሻ௧ܴݒ
ᇱ (6.3)
6.4.3 Outils d’évaluation
La justesse des paramètres de transformation estimés à l’aide de chacune des méthodes a été
validée selon les formules : CHAPITRE 6. Recalage à partir d’entités linéaires
119
݁ோ ൌ 100% ∙ ‖ݎെݎ̂‖/‖ݎ‖ (6.4)
்݁ ൌ 100% ∙ ฮܶ െ ܶฮ/‖ܶ‖ (6.5)
où :
ݎ : rotation réelle (paramètre fixé en entrée)
ݎ̂ : rotation estimée
ܶ : vecteur tridimensionnel de translation (paramètre fixé en entrée)
ܶ : vecteur de translation estimée
L’équation (6.4) est exacte pour la rotation exprimée à l’aide de quatre paramètres (forme
axe-angle de rotation) : un angle ߠ et un axe dirigé par un vecteur unitaire ݎ ൌ ൣ݁௫, ݁௬, ݁௭൧
௧
(alors avec ݁௫
ଶ ݁௬
ଶ ݁௭
ଶ ൌ 1). Il est donc nécessaire de remplacer la représentation classique
de rotation ܴ par ݎ de la manière suivante :
ߠ ൌ ܽݎܿܿݏ ቆݎݐܽܿ݁ሺܴሻ െ 1
2 ቇ (6.6)
ൌ ݎ
1
൭ ߠ݊݅ݏ2
ܴଷଶ െ ܴଶଷ
ܴଵଷ െ ܴଷଵ
ܴଶଵ െ ܴଵଶ
൱ (6.7)
6.4.4 Résultats – recalage des données bruitées
Ensemble Test2a
La Figure 6.6 illustre les erreurs de la rotation ݁ோ et de la translation ்݁, par rapport à ses
valeurs réelles. Les tests effectués avec les données Test2a, montrent que les algorithmes
ICL(forme ICP) et EIGEN produisent des résultats à un niveau de précision similaire, avec
des estimations légèrement plus précises pour EIGEN.
Même si les deux approches bénéficient d’une représentation différente de segments, et que
la translation est calculée dissemblablement, ceci n’a pas une réelle importance. Dans les
deux cas, la fonction de coût est uniquement définie à partir des orientations de segments.
Aussi, la matrice de rotation est retrouvée par une décomposition SVD d’une matrice de
covariance croisée. Rappelons que l’utilisation de SVD impose de considérer trois
possibilités :
1) Les segments ne sont pas colinéaires : donc ݀݁ݐሺܴሻ ൌ 1, la solution unique existe
ܴ ൌ ܸܷ௧ ;
2) Les segments sont coplanaires, mais pas colinéaires : alors ݀݁ݐሺܴሻ ൌ െ1, la solution
unique existe nommée la réflexion ܴ∗ ൌ ܸ∗ܷ௧
où ܸ∗est créé en changeant le signe de
la troisième colonne de V ;
3) Les segments sont colinéaires : il existe une infinité de solutions.
Quant à l’évaluation des approches implémentées, les deux méthodes mentionnées présentent
une faible résistance au bruit. L’estimation de la rotation atteint un niveau de précision de 5%
pour un écart-type du bruit ߪ ne dépassant pas 0.015m. L’erreur de la translation est plus
importante et peut arriver, dans cet intervalle, jusqu’à 27%. De loin, le meilleur algorithme le
ܫܫܯܨଶ donne, indépendamment du bruit introduit (ߪ ∈ [0.000 ;0.005]), des résultats précis.
L’erreur de la matrice de rotation ݁ோ est inférieure à 0.5% pour un ߪ ൏0.02m et oscille entre
0.5% et 3.6% pour les autres valeurs ߪ, afin d’atteindre son maximum pour ߪ ൌ0.047.
L’erreur de translation ்݁, quant à elle, est supérieure à ݁ோ et reste dans un intervalle de
2.9% à 8.5%. 120
Figure 6.6 Comparaison de différentes méthodes d'estimation de transformation rigide –
données Test2a
Figure 6.7 Méthode ܫܫܯܨଶ : évaluation de chaque composant de la rotation et de la
translation par rapport aux valeurs réelles CHAPITRE 6. Recalage à partir d’entités linéaires
121
Afin d’obtenir une évaluation plus complète du ܫܫܯܨଶ, une analyse exhaustive de chaque
composant du vecteur de translation et de tous les angles d’Euler () a été faite. Des
différences entre les paramètres estimés et réels ont été calculées et illustrées dans la Figure
6.7. Quant aux valeurs angulaires, aucune tendance n’a été constatée pouvant indiquer
l’angle le moins bien estimé. Mais, en tenant compte du vecteur de translation, l’alignement
selon l’axe Y est déterminé inexactement dans la plupart de cas. Pour un écart-type du bruit
raisonnable, c’est-à-dire un ߪ inférieur à 0.02m, il est clairement visible qu’il existe une
dépendance entre les erreurs relatives de déplacements. Ainsi, l’erreur d’alignement selon
l’axe Z est la plus petite, suivie ensuite d’erreur selon l’axe X et Y.
Ensemble Test2b
Des tests tout à fait identiques ont été aussi menés pour des valeurs beaucoup plus
importantes de rotation et de translation – données Test2b. Plusieurs combinaisons d’angles
de rotation ont été examinées. La Figure 6.8 illustre les erreurs ݁ோ et ்݁ obtenues pour
différents écarts-types du bruit ߪ. Les résultats confirment que les trois méthodes sont
adéquates pour recaler deux ensembles de segments à condition que les angles d’Euler
décrivant une rotation soient petits (inférieurs à 2-3 degrés) et la distance relative assez
faible. Cette constatation n’est pas très surprenante puisque les méthodes semblables à l’ICP
sont censées fournir un bon recalage local. Ceci est dû à l’étape de linéarisation indispensable
pour résoudre le problème non-linéaire de rotation. Ainsi, la fonction ne peut plus décrire les
vraies interactions entre les éléments. Il est alors nécessaire que les deux nuages soient à peu
près alignés. Une transformation grossière doit être appliquée avant de démarrer ces
algorithmes. Aussi, le ܫܫܯܨଶ, comme il a été démontré, exige des estimées initiales, si la
rotation mutuelle des éléments à affiner est trop importante.
Figure 6.8 Comparaison de différentes méthodes d'estimation de transformation rigide –
données Test2b 122
Pour conclure, nous constatons alors que les méthodes ICL(forme ICP) et EIGEN,
contrairement au ܫܫܯܨଶ, présentent une faible robustesse au bruit et ne peuvent être
employées qu’afin de recaler des segments dont la position des extrémités est précisément
connue (ߪ ൏ 0.005m). De plus, l’emplacement relatif de deux ensembles d’entités linéaires
joue un rôle important en rendant ces trois approches appropriées pour affiner des données
proches.
Temps de calcul
En outre, une analyse complémentaire (avec les données Test2a) ayant pour but de mesurer
le temps de calcul (CPU time) en fonction du bruit simulé a été effectuée. La Figure 6.9
présente la performance des trois approches, examinée sur 64 segments. La méthode EIGEN
s’avère légèrement plus rapide (avec en moyenne 2ms de différence) que l’algorithme itératif
ICL(forme ICP). Cependant, les deux techniques convergent trois fois plus rapidement que le
ܫܫܯܨଶ. Néanmoins, il faut noter que chaque algorithme a été appliqué sur l’appariement déjà
connu et donc l’approche ICL(forme ICP) s’exécute en une seule itération.
Figure 6.9 Comparaison des temps d’exécution (Matlab® R2010a)* * Intel Core x2 T7600 2.33Ghz / 4Go Ram / Win7 64bits
6.4.5 Impact du bruit sur la distance de Hausdorff
Pour compléter les analyses présentées précédemment et pour mieux visualiser l’impact de la
précision des paramètres estimés sur la qualité du recalage, la distance orientée de Hausdorff
(OLHD) a été utilisée comme il a été vu et défini dans le Chapitre 5. Un autre jeu de données
(Test3) a été employé. Nous rappelons que cette fois-ci, les paramètres fixés servant à créer
les segments Test étaient nuls, et seulement la position des segments Model a été dégénérée
par un bruit gaussien prédéfini.
Nous attendons que les paramètres estimés (ܴ ݁ݐ ܶ) par chacun des algorithmes testés soient
égaux, quasiment équivalents ou proches de zéro. Aussi, la position des segments
transformés (Test) devrait rester pratiquement inchangée. Nous vérifions alors l’éloignement
entre les entités linéaires, en tant que la distance OLHD. Les valeurs obtenues après le
recalage réalisé à l’aide de la méthode ICL(forme ICP) et ܫܫܯܨଶ sont confrontées avec les
écarts initiaux (Figure 6.10). L’approche EIGEN a été exclue de l’analyse puisqu’elle est
censée fournir les paramètres de transformation ayant les erreurs similaires à l’algorithme
ICL(forme ICP). CHAPITRE 6. Recalage à partir d’entités linéaires
123
Nous observons, dans le cas d’ICL, une forte influence du bruit sur le résultat d’évaluation.
Même si l’inexactitude des extrémités de segments est faible, cet algorithme empêche de
parvenir aux paramètres optimaux. Par conséquent, la distance réciproque entre les
segments consolidés augmente par rapport à celle de départ. Cela veut dire que le recalage,
lui-même, est loin d’être correct et satisfaisant. Le problème mentionné n’existe pas lorsque
l’algorithme ܫܫܯܨଶ est implémenté.
Figure 6.10 Distance orientée de Hausdorff (OLHD) : a) algorithme ICL(forme ICP) ;
b) algorithme ܫܫܯܨଶ
Propriété de la distance de Hausdorff
De surcroît, une propriété intéressante de la métrique de Hausdorff employée a été constatée.
Il s’agit de la relation entre la distance OLHD et l’écart-type de bruit gaussien ߪ rajouté à
des extrémités de segments. Nous avons démontré que plus le taux de bruit est important
plus la valeur de distance OLHD augmente. Plusieurs échantillons ont été créés à partir de 124
données réelles (S1,S2,S3,F), comme celui illustré dans la Figure 6.11, pour retrouver cette
constante (coefficient de proportionnalité). Finalement, l’équation d’une droite ayant une
meilleure approximation (régression linéaire) notée sous la forme ݕ ൌ ܽݔ ܾ a été
déterminée, de sorte que le coefficient directeur de la droite ሺܽሻ est égal à 5.8 ∓ 0.17 et que le
nombre ܾ est 0.000 ∓ 0.001. Pour être plus précis, il y a une proportionnalité entre la
distance obtenue (OLHD) et l’écart-type de bruit ߪ, ce que l’on peut exprimer par ܱܦܪܮ ∝
ߪ. C’est pourquoi, si la distance de Hausdorff entre deux ensembles de segments est connue,
nous pouvons estimer l’écart-type de bruit ߪ associé aux segments et vice versa.
Figure 6.11 Représentation graphique d’une droite d’approximation retrouvée à partir des
distances OLHD calculées pour les différents écarts-types de bruit ߪ
6.5 Approche proposée : RLMR-FMII2
Nous avons pu observer dans la section précédente que l’imprécision du recalage vient de
l’algorithme d’estimation et voire même plus, de la particularité géométrique d’une entité
linéaire. Comme le rapporte [Hullo, 2013], l’incertitude d’une ligne 3D, à la différence de
celle d’un point 3D, n’est pas bien définie. En outre, elle varie d’une représentation à une
autre pouvant provoquer des difficultés lors de l’optimisation des contraintes sur ces lignes.
Les analyses effectuées au sein de cette thèse le confirment aussi. Les algorithmes EIGEN et
ICL(forme ICP) basés entièrement sur des segments ont la précision en deçà du ܫܫܯܨଶ
minimisant la distance entre les points correspondants. Ils ne peuvent être employés que sur
des segments dont les extrémités ne sont pas bruitées.
Ce constat nous a encouragés à choisir le ܫܫܯܨଶ, comme notre algorithme de base.
Néanmoins, cette méthode offre des résultats précis à condition que l’appariement explicite
des entités linéaires soit connu. Nous avons voulu combler ce défaut en suggérant une chaîne
complète, nommée ܴܯܮܴ െ ܫܫܯܨଶ, comprenant la mise en correspondance des segments,
suivie par l’estimation des paramètres de pose. Pour apparier des entités linéaires, nous
proposons d’utiliser l’approche déjà discutée dans le cadre de ce manuscrit, et détaillée au
chapitre précédent. Sa performance a été vérifiée à travers plusieurs tests dont les résultats
ont dévoilé une dépendance forte entre l’exactitude du couplage effectuée et l’écartement de
deux ensembles de segments. Ceci est dû au fait que la mise en correspondance des segments
peut s’effectuer incorrectement, puisque la méthode employée se heurte à un seuil
inapproprié, ou bien encore les ressemblances entre les segments ne peuvent plus être
reconnues proprement. Il se peut alors qu’au bout d’une certaine distance, le taux de Faux
Positif (FP) soit élevée par-devers le nombre de Vrais Positifs faible. Nous avons aussi conclu
que l’un des remèdes à ce genre de problème pouvait consister à rapprocher des segments
avant de démarrer l’algorithme. Nous avons fait recours à cette solution en proposant des CHAPITRE 6. Recalage à partir d’entités linéaires
125
démarches complémentaires (recalage grossier) ayant pour but de diminuer l’éloignement
entre les données traitées et faciliter leur mise en correspondance ultérieure. Notre but est
donc de développer une méthode de recalage 3D résistante au bruit, aux paires aberrantes,
mais aussi permettant d’apparier simultanément des segments, puisque cette tâche n’est pas
triviale et surtout impossible avec le ܫܫܯܨଶ seul.
Figure 6.12 Schéma général du recalage proposé ܴܯܮܴ െ ܫܫܯܨଶ
De manière générale, nous pouvons distinguer quatre étapes principales de l’approche
développée : 1) l’appariement combinatoire (approximatif) d’entités linéaires 3D ; 2) le
recalage grossier à partir d’un triplet de paires ; 3) l’appariement fin; 4) le raffinement du
recalage (Figure 6.12).
La mise en correspondance, qu’elle soit approximative ܣ ou explicite ܣ, est réalisée
conformément à la solution proposée pour la méthode de qualification. C’est pourquoi nous
ne revenons plus sur cette procédure. Rappelons seulement qu’une fois cet algorithme
exécuté, les calculs sont menés dans deux sens : en comparant l’ensemble Test (segments à
déplacer) avec le Model (segments immobiles) et vice versa. Ainsi, à la sortie, deux matrices
de correspondance sont indépendamment déterminées. Cette information redondante peut
être utile pour contrôler la justesse de l’appariement. Afin de diminuer le nombre de paires
erronées (FP) et de garantir un bon appariement approximatif ܣ, les segments sont
initialement couplés en relation de 1 à 1 au plus. Mais, cette contrainte n’est plus valable avec
l’appariement explicite ܣ.
Les deux recalages – grossier et fin, sont calculés de la même façon, à savoir, à l’aide de
l’approche ܫܫܯܨଶ. La seule différence réside dans le fait que la consolidation initiale (ܴ, ܶ)
est atteinte à partir d’un sous-ensemble minimal (k), considéré comme « le meilleur »
possible. Une technique de tirage aléatoire (RANSAC) de ݇ paires de l’ensemble ܣ amène à
assurer un échantillon optimal, ne contenant plus de mauvaises associations. Or, la méthode
combinée RANSAC-FMII2 fournit une estimation initiale de la transformation en prenant en
compte l’appariement préalable ܣ. Pourtant, la position des segments, après le recalage
grossier, est suffisamment proche de l’optimum, nous pouvons créer un appariement explicite
ܣ servant, à son tour, au recalage fin réalisé avec le ܫܫܯܨଶ seul. En fin de compte, chacun de
ces algorithmes constitue une partie intégrale de notre procédure ܴܯܮܴ െ ܫܫܯܨଶ.126
6.5.1 Recalage grossier – principe
La finalité du recalage grossier cherche à rapprocher deux ensembles d’entités linéaires pour
faciliter leur appariement. En présumant l’existence de mauvaises paires au sein de
l’appariement ܣ résultante de la distance mutuelle importante entre deux ensembles de
segments, nous ne pouvons pas l’utiliser tel quel lors de l’estimation des paramètres par
ܫܫܯܨଶ. Se référant aux tests menés par [Yao et al., 2010], nous avons décidé de nous appuyer
sur seulement trois paires de segments (k=3) pour trouver les estimées initiales. Ces
dernières sont calculées à l’aide de la méthode ܫܫܯܨଶ. Plusieurs tirages aléatoires doivent être
effectués avec l’algorithme de RANSAC, afin de découvrir le meilleur triplet de paires parmi
celles recueillies par l’appariement initial ܣ. Pour obtenir les bons paramètres, le nombre
d’itérations (ܰ௧) est choisi dynamiquement en fonction des « inliers » présents dans la
boucle précédente (équations (6.8) et (6.9)).
ܰ௧ ൌ logሺߝሻ
logሺ1 െ ݍሻ
(6.8)
ൌ ݍ
ቀ
ܰூ
݇ ቁ
ቀ
ܰ
݇ቁ
ൌ ܰூ! ሺܰെ݇ሻ!
ܰ! ሺܰூ െ ݇ሻ!
ൌ ෑܰூ െ ݅
ܰെ݅ ൎ ൬୍ܰ
ܰ൰
ିଵ
ୀଵ
(6.9)
où :
ܰூ ൌ ܿܽݎ݀ሺܥܧሻ : nombre de paires de segments (inliers) satisfaisants la transformation
effectuée ;
ܰ ൌ ܿܽݎ݀ሺܣሻ : nombre de paires de l’appariement initial ܣ ;
݇ : nombre minimal de paires de segments pour estimer la transformation optimale, la valeur
adoptée k=3 ;
ߝ : taux de fausses alertes (false alarm rate), la valeur adoptée ߝ ൌ 1݁ െ 6 ;
En raison de la faible probabilité de parvenir à la même combinaison de triplet de segments
deux fois, nous n’avons pas modifié l’algorithme de RANSAC, en exigeant la mise en place
d’une liste de combinaisons d’entités linéaires déjà prises. Pour chaque échantillon, la
transformation du repère est calculée (avec FMIIଶ), et suivie par un recalage correspondant.
Dès lors, les distances ݀൫ݐ, ݉൯ entre toutes les paires de segments listées par l’appariement
approximatif ܣ sont recalculées (équation 5.10), afin de mesurer le nombre de valeurs
aberrantes (outliers) définies comme หሼሺ݅, ݆ሻ߳ܣሽ: ∀൫ݐ ∈ ܦܽݐܽ, ݉ ∈ ܯ݈݀݁൯, ݀൫ݐ, ݉൯ ߜห. Le
seuil ߜ est fixé du fait que la distance de Hausdorff orientée (OLHD) entre deux ensembles de
lignes n’est jamais inférieure à 5.8ߪ; comme il a été démontré préalablement (Paragraphe
6.4.5). Cette constatation nous a permis de garder « le meilleur » triplet de paires. Celui-ci
est désigné à partir du nombre de segments recalés ayant la distance réciproque inférieur au
seuil prédéfini ߜ. En conséquence, plus le nombre de segments est important, plus la
transformation calculée est meilleure.
Nous avons également examiné la précision des paramètres estimés ܴ et ܶ lors du recalage
grossier. Les données du Test2a ont été employées pour calculer les erreurs ݁ோ et ்݁, selon
les équations (6.4) et (6.5). La Figure 6.13 présente les résultats obtenus par rapport à l’état
de l’art. Il en résulte que le recalage grossier basé sur trois paires de segments est moins
précis que celui réalisé par l’algorithme ܫܫܯܨଶ seul sur toutes les paires connues a priori. Cela
n’est guère surprenant puisque la qualité de la solution reçue avec le ܫܫܯܨଶ augmente de plus
en plus, quand nous rajoutons d’autres couples. Par contre, ce recalage garantit une bonne
estimation initiale, si les deux ensembles de segments ne sont pas très éloignés, et si les
angles de rotation à estimer ne sont pas trop importants. CHAPITRE 6. Recalage à partir d’entités linéaires
127
Figure 6.13 Exactitude du recalage basé sur un triplet de paires de segments (données
Test2a)
6.5.2 Évaluation avec données simulées
La qualité des estimations obtenues par notre approche ܴܯܮܴ െ ܫܫܯܨଶ a été vérifiée, tout
d’abord, à l’aide des données simulées (Test 2a). La Figure 6.14 visualise le chemin détaillé de
notre parcours et les résultats intermédiaires d’appariement avec leur évaluation qualitative
(VP, VN, FP, FN marqués par différentes couleurs), tous les deux obtenus à partir du jeu
dégénéré par le bruit gaussien dont le ߪ ൌ0.03m. Conformément aux hypothèses posées,
l’appariement approximatif ܣ contient à peine quelques Faux Positifs au détriment du
nombre de Faux Négatif. Mais, il constitue une bonne base de départ pour calculer
rapidement des paramètres initiaux, même si l’algorithme de RANSAC est généralement
assez coûteux en temps de calcul.
Quant à l’appariement final ܣ déterminé de nouveau à partir des segments déjà recalés
grossièrement, il se caractérise par une précision beaucoup plus élevée (par exemple, dans le
cas étudié Sensibilité=100%, Spécificité=99.95% alors que seulement 0.05% des
combinaisons envisagées avaient été examinées de manière incorrecte). Aussi, les tests
procédés sur d’autres données simulées ont confirmé que la solution proposée permet
d’améliorer significativement la mise en correspondance de segments. En revanche, le
résultat dépend également du taux de bruit, moyennant quoi les faux appariements peuvent
être toujours présents.
Afin d’analyser l’impact de ces mauvaises paires (notamment les FP) sur la qualité des
estimations, nous avons analysé les erreurs ݁ோ et ்݁ calculées selon les formules (6.4) et (6.5).
Ensuite, une comparaison de ces valeurs par rapport à celles obtenues par l’algorithme ܫܫܯܨଶ
basé sur l’appariement précis connu a priori, a été entreprise. La Figure 6.15 présente le
résultat d’une telle expérimentation. Nous pouvons constater que plus l’écart-type de bruit σ
est petit, plus l’appariement est précis, et donc que les erreurs d’estimation sont du même 128
ordre de grandeur. Néanmoins, la méthode ܴܯܮܴ െ ܫܫܯܨଶ paraît donner des résultats
légèrement moins précis, surtout quand le ߪ est supérieur à 0.025m et une présence de Faux
Positifs est incontestable.
Figure 6.14 Mise en correspondance des segments Test2a (σ=0.03m) et le recalage rigide
selon l’approche proposée ܴܯܮܴ െ ܫܫܯܨଶ. Les couleurs employées pour évaluer
l’appariement : Vrai Positif(VP)-vert ; Vrai Négatif(VN) – gris ; Faux Positif(FP) – jaune ;
Faux Négatif(FN) – rouge ; CHAPITRE 6. Recalage à partir d’entités linéaires
129
Figure 6.15 Qualité de la solution (données Test2a) : Algorithme ܫܫܯܨଶ vs. Approche
ܴܯܮܴ െ ܫܫܯܨଶ avec la mise en correspondance de segments effectuée simultanément
L’histogramme de répartition de différences d’erreurs d’estimation créé à partir de la Figure
6.15 montre que pour 95% des valeurs de ߪ, les différences de ݁ோ sont comprises dans un
intervalle de [-1.28% ; 1.28%], tandis que celles de ்݁ sont dans un intervalle de [-2.82% ;
2.82%] (Figure 6.16).
Figure 6.16 Histogramme de différences d'erreurs
Pour mieux comprendre la grandeur de cette imprécision d’estimation de paramètres sur la
position relative des segments recalés, nous avons déterminé la distance LHD. La Figure
6.17 illustre les différences entre la distance calculée après le recalage basé sur l’algorithme
ܫܫܯܨଶ et celle obtenue après avoir mis en œuvre le ܴܯܮܴ െ ܫܫܯܨଶ. Ces valeurs sont
négligeables et ne dépassent pas 0.004m, même si la présence de quelques paires erronées
avait été constatée. Notre algorithme, effectuant à la fois l’appariement des entités linéaires
et l’estimation des paramètres de pose, donne des résultats fiables. En ce qui concerne la mise
en correspondance ܣ, elle se caractérise d’une précision élevée, atteinte grâce au recalage
grossier convenable. 130
Figure 6.17 Vérification des différences de distances LHD
6.5.3 Tests sur données réelles
La performance de l’approche ܴܯܮܴ െ ܫܫܯܨଶ a été aussi vérifiée à l’aide de données réelles
(voir Figure 5.13). Le Tableau 6.2 représente les valeurs numériques (les paramètres de
transformation estimée, l’éloignement des deux nuages de points, le temps de calcul, etc.)
obtenues avec ces segments. À cet effet, les relevés laser mobiles de différents passages ont
été recalés entre eux (S1_S2 ; S1_S2 ; S2_S3), ainsi qu’avec le nuage de points statique (F)
dans l’intention de corriger leur position absolue. À chaque fois, une amélioration importante
de l’appariement initial ܣ a été relevée (Figure 6.18). De plus, la vérification d’ajustement
des nuages de points après les deux recalages successifs grossier et fin a été réalisée à travers
la distance OLHD. Les valeurs obtenues confirment que la méthode proposée permet
d’estimer une transformation optimale, à condition que les angles de rotation et la distance
réciproque soient petits. Cette modalité est aisée à remplir puisque les nuages de points issus
d’une plate-forme mobile sont déjà géo-référencés dans un système de référence commun.
Dès lors, leur position relative est assez proche et l’orientation pratiquement parallèle. Par
conséquent, la suppression d’erreur systématique, plus précisément d’erreur de mesure
restant constante pendant l’acquisition, peut être corrigée par la méthode de recalage
proposée.
Pour justifier notre démarche nécessitant la mise en correspondance des segments à deux
reprises (d’abord l’appariement approximatif ܣ suivi par l’appariement affiné ܣ), nous
avons également envisagé une solution consistant à appliquer l’algorithme ܫܫܯܨଶ
directement sur l’ensemble de paires ܣ. La dernière ligne du Tableau 6.2 contient la
distance LHD déterminée lors d’un tel recalage. Celle-ci est plus importante que l’écart
atteint avec la méthode proposée ܴܯܮܴ െ ܫܫܯܨଶ. Nous pouvons noter que l’utilisation de
l’algorithme RANSAC habituellement très coûteux en temps de calcul a été compensée par la
mise en correspondance explicite des segments. La consolidation précise de nuages de points
devient possible.
Quant au temps de calcul, il est de l’ordre de dizaines de secondes (code non optimisé). Le
plus important a été observé lors du recalage avec les segments S2. Mais, c’est un cas
particulier car d’une côté la zone de chevauchement entre ces deux nuages est petite. De
l’autre côté, la qualité du nuage S2 est faible (comme il est démontré au Chapitre 5) et il
devient difficile à trouver un échantillon optimal satisfaisant aux exigences imposées (les
mêmes pour tous les jeux de données). D’où un grand nombre d’itérations de RANSAC. CHAPITRE 6. Recalage à partir d’entités linéaires
131
Tableau 6.2 Résultats de l’approche combinée
Jeu de données S1-S2 S1-S3 S2-S3 S1-F S2-F S3-F
Distance initiale [m] 0,516 0,230 0,560 0,671 1,257 0,657
Nombre d'itérations 248 58 563 88 1640 109
Distance après le
recalage grossier [m] 0,346 0,223 0,481 0,266 0,451 0,320
Distance FINALE [m] 0,304 0,213 0,377 0,189 0,220 0,140
Angle d'Euler estimés
[°]:
Ω 0,35196 -0,15530 0,68971 0,30821 -0,00763 0,03841
Φ -0,12854 -0,00760 -0,19781 -0,17301 -0,14627 -0,08465
Κ -0,43047 -0,21210 0,28428 -0,01031 0,09351 0,18708
Translation estimée [m]:
Tx 0,950 -0,205 1,172 -0,646 -0,331 -0,205
Ty -0,833 0,108 -1,048 0,014 -0,525 -0,461
Tz 0,189 0,177 -0,708 -0,494 -0,285 -0,507
CPU Time* [s] 18,1 10,4 50,4 7,8 183,6 16,4
Distance [m]: FMII2+Aini 0,328 0,214 0,391 0,254 0,861 0,334
* Intel Core x2 T7600 2.33Ghz / 4Go Ram / Win7 64bits
Le pseudo-code 6.1 (Annexe E) est notre approche du recalage telle qu’elle est implémentée.
Nous avons besoin en entrée de coordonnées de deux ensembles de segments : ்ܺ௦௧ et
ܺௌ. Aussi, quelques paramètres sont attendus notamment l’écart-type du bruit ߪ et le
nombre d’un échantillon minimal (k), tous les deux indispensables pour initialiser
l’estimateur de RANSAC. L’algorithme rend une solution optimale, c’est-à-dire les
paramètres de transformation rigide ܴ et ܶ. Optionnellement, nous pouvons obtenir
l’information sur l’appariement créé ݎܥ, ainsi que les résidus calculés (distances) entre les
segments recalés. 132
Figure 6.18 Mise en correspondance de segments réel S2 (en vert) et F(en rouge) avec
l’évaluation des résultats 133
CHAPITRE 7
Perspectives et conclusion
Sommaire :
7. Perspectives et conclusion ............................................................................................. 133
7.1 Conclusion ............................................................................................................................... 133
7.2 Perspectives et futurs travaux ............................................................................................. 136
7.2.1 Étalonnage extrinsèque du système : esquisse de solution .................................................. 136
7. Perspectives et conclusion
7.1 Conclusion
Dans cette thèse, nous nous sommes intéressés à la cartographie mobile terrestre. Notre étude
se place dans le cadre du projet TerraMobilita dont l’objectif est de développer des
technologies optimisées de relevé des voiries et de l’espace public avec une précision
topographique élevée. Les travaux présentés proposent alors des solutions pour la
qualification des nuages de points collectés, ainsi que des méthodes de recalage de données
multi-sources. Nous nous sommes également penchés sur l’étalonnage du système intégral. Ce
manuscrit se divise en quatre parties principales : 1) L’acquisition de nuages de points mobiles
et l’étude bibliographique sur les erreurs ayant un impact sur leur qualité ; 2) L’extraction
d’arêtes ; 3) La qualification à partir d’entités linéaires ; 4) Le recalage rigide basé sur des
arêtes.
Nous avons commencé par présenter de manière générale les différents systèmes de
numérisation 3D mobile terrestre afin de nous focaliser sur les systèmes et les données utilisées
dans cette thèse. La problématique d’évaluation de l’exactitude des données mobiles et des
protocoles de contrôle de la qualité géométrique sont ensuite abordés en détail. Après, de
différentes anomalies entachant le fonctionnement d’un système de cartographie mobile ont
été analysées. Le but a été d’aider à établir une connaissance profonde des facteurs primordiaux
affectant les nuages de points. Nous pouvons ici citer à titre d’exemple la précision du système
de positionnement hybride à base de GNSS et INS, l’angle d’incidence du rayon laser, la
distance scanner-objet, le manque d’étalonnage juste (extrinsèque ou intrinsèque). La prise en
conscience de leur nature ouvre également la porte à des améliorations et des développements
possibles. Cette partie fortement théorique nous a permis de converger vers des solutions
innovantes d’évaluation et de correction de données laser produites. Nous avons ainsi présenté
nos travaux se rapportant à la qualification et l’amélioration du système de balayage laser 134
mobile. Les méthodes que nous avons adoptées sont celles basées sur les entités linéaires.
D’ailleurs, toutes les parties de notre manuscrit ont été accompagnées par un état de l’art
exhaustif permettant de repérer la place de notre travail par rapport à l’état actuel de la
recherche. La Figure 7.1 nous montre un schéma général des tâches réalisées, avec extraction
des entités linéaires, servant à leur tour à la qualification et au recalage. La problématique de
l’étalonnage basé sur les segments reste toujours à poursuivre. Mais, une procédure possible à
mettre en place est décrite ci-dessous.
Figure 7.1 Schéma des travaux réalisés et travaux futurs
La deuxième partie de notre thèse se focalise sur l’extraction des arêtes à partir de nuage de
points de densité faible. Même si la détection de lignes est une tâche primordiale dans la
modélisation 3D, les travaux existants ne sont pas nombreux. Certains algorithmes
permettent de détecter des ouvertures en forme de fenêtre et de porte (arêtes de pas). Une
autre possibilité est d’examiner la normale au point. Le changement brusque de son orientation
permet de constater la présence d’intersection de deux surfaces adjacentes. Néanmoins, l’arête
reconstituée à l’aide de telles méthodes sera d’autant plus proche de l’arête réelle que la densité
du nuage est élevée. Puisque notre but est de parvenir à extraire des segments précis, quelle
que soit la densité du nuage, nous avons développé une méthode de détection des plis
(intersections entre segments plans principaux de la scène). Celle-ci comporte deux étapes : 1)
la segmentation en éléments plans via l’algorithme de RANSAC enrichi d’une analyse des
composantes connexes ; 2) la reconstruction des arêtes. En ce qui concerne l’étude de la
connectivité et de la sémantique, nous avons proposé une nouvelle méthode fondée sur la
théorie des graphes. Le nuage est structuré en tenant compte du voisinage local de chaque
point. Puis, la décomposition de Dulmage-Mendelsohn est effectuée. Les résultats obtenus avec
des relevés laser mobiles confirment que cette méthode d’extraction de composantes connexes
est efficace et robuste. Son étape la plus coûteuse en temps de calcul est celle de la
détermination du voisinage. Concernant la performance de l’algorithme de RANSAC
implémenté dans l’intention d’isoler les plans principaux, elle dépend de deux grandeurs : du
taux de bruit et de la densité du nuage. Il se peut alors que certains plans, les plus souvent
perpendiculaires à la direction de la plate-forme, ne soient pas détectés puisque ces sous-nuages
se caractérisent par une densité plus faible et par un bruit important. Ce constat signifie pour
nous qu’un nombre d’arêtes ne sera jamais extrait, du fait de l’incomplétude des plans fournis
par l’algorithme de RANSAC.
Par la suite, nous avons élaboré une démarche de qualification, en termes d’exactitude et de
précision, de relevés laser mobiles. Certes, l’évaluation des nuages de points pose des défis
particuliers en raison de la nature de données traitées. Plusieurs méthodes portant un intérêt
sur l’exactitude ont été déjà discutées, toutes nécessitant une référence externe au système
d’acquisition. Les travaux aboutissent soit à une analyse de coordonnées des points de contrôle,
soit à une mesure d’éloignement dérivée grâce à des approches traitant du problème de manière
plus globale (algorithme de type ICP). Dans le cas d’une comparaison de cibles, la résolution
limitée de nuage mobile peut empêcher l’identification précise de détails. Cette tâche étant
fastidieuse, son automatisation est difficile à atteindre. Quant à la qualification basée sur l’ICP,
elle ne vérifie que l’exactitude relative puisque la valeur de qualité obtenue représente la
distance résiduelle entre deux ensembles de données. De plus, la mise en œuvre de l’ICP exige CHAPITRE 7. Perspectives et conclusion
135
que les données à comparer soient à peu près alignées. Étant donné que nous avons souhaité
déterminer l’exactitude absolue, l’évaluation des relevés laser par recalage demeure
inappropriée. Nous avons proposé une procédure de qualification basée sur des entités
linéaires. Notre objectif a été de développer une solution entièrement automatique.
L’éloignement de deux sous-ensembles d’arêtes, exprimé en tant que la distance de Hausdorff
modifiée adaptée aux lignes est notre indicateur de qualité. Mais, d’abord nous apparions, entre
deux nuages, les segments les plus proches au sens de la métrique définie. Nous prenons en
compte la distance et l’angle entre toutes les combinaisons de segments afin de déterminer,
pour chaque couple de segment, un score. Ce dernier est alors composé d'un écart angulaire,
d’un indicateur de recouvrement et de la distance entre les segments parallélisés. La mise en
correspondance entre les segments de référence et les segments extraits des scans se fait via
le seuillage d’une matrice de similarité dont les coefficients sont un score mentionné. Les
données réelles ont permis d’observer que notre algorithme d’appariement devient de plus en
plus robuste lorsque l’éloignement est moindre. Nous admettons, avec une marge importante,
que la distance réciproque inférieure à 2.5 m garantit un taux élevé de bons appariements.
Puisque l’exactitude des données produites par des systèmes mobiles récents est loin d’être
métrique, cette contrainte de distance sera toujours satisfaite. La mise en correspondance peut
ainsi être précisément effectuée, permettant une qualification robuste et efficace. Quant à la
métrique de Hausdorff introduite, elle est tout à fait adaptée pour mesurer l’écart géométrique
entre segments potentiellement homologues. De plus, elle se caractérise par une propriété
intéressante. Nous constatons que sa grandeur est proportionnelle à l’écart-type de bruit
entachant des arêtes. Par conséquent, la connaissance de la distance entre deux ensembles de
segments permet d’estimer l’incertitude associée aux extrémités et vice versa. Résumant, la
méthode proposée paraît pertinente, et également transposable en photogrammétrie
notamment pour l’évaluation de la qualité d’une stéréorestitution ou de modèles 3D. Notre
solution peut être perçue comme un compromis entre les deux familles d’algorithmes de
qualification : ceux profitants de cibles ou de détails « naturels », et ceux se référant au
recalage.
Nous nous sommes ensuite intéressés aux problèmes de recalage rigide basé, lui aussi, sur les
entités linéaires. Une grande partie de ce chapitre traite la problématique d’estimation des
paramètres de transformation rigide à partir de lignes. Nous avons porté un regard critique
sur quelques méthodes conçues à cet effet. Les analyses effectuées ont eu pour but de vérifier
leur efficacité et leur précision vis-à-vis de notre problématique. Il s’agit de corriger le décalage
(shift) survenu entre les nuages redondants acquis par une plate-forme mobile terrestre. Il en
ressort que :
1) l’utilisation de primitives linéaires telles que les arêtes de plis (intersections de plans)
est appropriée pour les environnements urbains et permet la réduction du nombre de
cibles nécessaires ;
2) le gain de précision du recalage dépend de l’incertitude d’une ligne 3D qui, quant à
elle, est due à la présence du bruit, et peut varier d’une représentation de droite à une
autre ;
3) la mise en correspondance explicite des entités linéaires joue un rôle crucial dans le
processus de recalage ;
4) le bruit affectant les extrémités de segments 3D peut provoquer des difficultés de
convergence lors de l’optimisation de contraintes sur ces lignes ;
5) en l’absence de précision requise, le recalage basé sur les segments peut toujours servir
à trouver les estimées initiales, indispensables pour initialiser certains algorithmes.
Sur cette base, nous avons proposé d’étendre l’étude à la chaîne complète comprenant une mise
en correspondance suivie par une estimation des paramètres de recalage à travers de segments.
Une nouvelle approche nommée ܴܮܯܴ െ ܫܫܯܨଶ est développée, puis évaluée. Nous avons testé 136
sa robustesse face à différentes valeurs du bruit ajoutées aux extrémités et ayant l’effet sur
l’incertitude d’une ligne.
Par ailleurs, pour diminuer les anomalies affectant la génération de données laser 3D, nous
nous sommes penchés sur l’étalonnage extrinsèque. Nous avons étudié, si et dans quelle
mesure, les arêtes doivent être prises en compte pour déterminer la matrice de boresight. Les
résultats d’une analyse préliminaire étant prometteurs, cet axe de recherche mérite d’être
approfondi. Avant tout, des solutions dédiées aux systèmes terrestres équipés de scanners de
profil 2D doivent être développées.
En conclusion, les arêtes sont appropriées pour qualifier et recaler les relevés laser mobiles
acquis en environnement urbain. Étant donné qu’avec le fort développement des SIG, les bases
de données vectorielles sont devenues de plus en plus nombreuses (et souvent accessibles en
tant que l’Open Data - données librement réutilisables), il serait envisageable de s’en servir lors
du processus de qualification. Nous avons donc démontré notre hypothèse avancée tout au
début de ce manuscrit.
7.2 Perspectives et futurs travaux
Au terme de ce travail, nous pouvons envisager plusieurs pistes de recherche qui mériteraient
d'être approfondies. Tout d'abord, il pourrait être intéressant de comparer notre méthode
d’extraction des composantes connexes non seulement avec d’autres algorithmes récursifs de
parcours d’un graphe (DFS, BFS), mais aussi avec la méthode aboutissant à convertir un nuage
de points 3D en image 2D.
Puisque la justesse et le nombre de segments extraits par notre algorithme sont liés à la qualité
de plans détectés auparavant, il paraîtrait aussi nécessaire de rendre l’étape de segmentation
en plans encore plus efficace. Cette remarque est surtout pertinente quand les données peu
denses sont traitées. L’une des solutions possibles serait de diviser un nuage en petits blocs et
d’y exécuter l’algorithme proposé.
Étant donné que la distance moyenne LHD évaluant la qualité des nuages à partir de deux
ensembles de segments non seulement représente l’exactitude, mais aussi l’erreur survenue
lors de la procédure d’extraction des arêtes, il serait judicieux de caractériser son apport à la
grandeur de qualité obtenue.
Enfin, d'autres voies de recherche peuvent être favorisées, telles que l’étalonnage extrinsèque
basé sur des lignes. Des solutions adéquates aux scanners laser à double balayage (3D), mais
aussi celles dédiées aux scanners de profil 2D devraient être avancées.
7.2.1 Étalonnage extrinsèque du système : esquisse de solution
Concernant l’étalonnage extrinsèque du système mobile doté d’un scanner 3D, nous
présentons une étude théorique, exigeant d’être encore approfondie et testée sur des données
réelles. Aussi, la précision des paramètres obtenus de cette façon devrait être confrontée avec
d’autres méthodes. En revanche, si le système mobile commercial est étalonné, une
comparaison avec l’étalonnage renseigné par le fabricant sera appréciée. Nous cherchons une
solution pour laquelle aucun déploiement antérieur de cibles n’est demandé. Une seule
contrainte est de balayer un endroit riche en entités linéaires orientées différemment. La
référence fiable ܺோாி
ெ peut être établie après l’acquisition. Outre, des arêtes de pli doivent être
extraites à partir du nuage mobile et comparer par la suite avec celles de référence. Nous
supposons que les données de trajectographie sont bonnes et le nuage de points lié au repère
scanner ܺ௦ est fiable (étalonnage intrinsèque connu).
Nous nous référons, pour passer du repère laser (s) aux coordonnées terrain (M), à la formule
(2.1) du géo-référencement direct qui s’écrit en coordonnées homogènes : CHAPITRE 7. Perspectives et conclusion
137
ܺெ ൌ Ƭ
ெ ∙ Ƭ௦
∙ ܺ௦
(7.1)
où :
Ƭ
ெ ൌ ܴ
ெ ݎ/ீேௌௌ
ெ
0 1 ൨
ସ௫ସ
: position et altitude de l’unité inertielle IMU dans un repère terrain
(M), connues grâce à la fusion GNSS/INS ;
Ƭ௦
ൌ ܴ௦
௦/ݎ
0 1 ൨
ସ௫ସ
: position et altitude du scanner laser dans le repère IMU (b), les paramètres
d’étalonnage extrinsèque comprenant la matrice de boresight ܴ௦
et le bras de levier ݎ/௦
;
ܺ௦ : points laser dans le repère capteur (s) en coordonnées homogènes ሾܺ, ܻ, ܼ, 1ሿ௧
Sur cette base, la formule pour passer des données laser ܺ௦ au repère IMU (b) est suivante :
ܺூெ ൌ Ƭ௦ ∙ ܺ௦
(7.2)
Le nuage de points est généré, en tenant compte des valeurs initiales d’étalonnage extrinsèque
ݏƬ
ܾ assez proche de celui que l’on cherche à déterminer. Nous visons ensuite à raffiner ces
paramètres à travers une comparaison avec des données extérieures au système d’acquisition.
En admettant que nous disposions d’une référence ܺோாி
ெ plus précise que le nuage mobile, et
dont les coordonnées sont connues dans un repère global (M), sa position dans le repère IMU
(b) se calcule comme suit :
ܺோாி
ൌ ሺƬ
ெሻିଵ ∙ ܺோாி
ெ (7.3)
Par conséquent, plus les deux nuages ܺூெ et ܺோாி
sont proches, plus l’étalonnage extrinsèque
Ƭ௦ est bon. Puisqu’ils représentent la même scène, nous pouvons déterminer les paramètres de
transformation rigide du nuage ܺூெ au nuage ܺோாி
. À cet effet, nous suggérons d’effectuer un
ajustement de deux ensembles de lignes à l’aide de l’algorithme de recalage proposé dans la
section précédente : ܴܯܮܴ െ ܫܫܯܨଶ. Néanmoins, rien d’empêche d’utiliser un autre algorithme
semblable à l’ICP. En sortie, nous obtenons toujours une matrice de rotation ܴ et un vecteur
de translation ܶ permettant de rapprocher, de manière optimale, des données :
ܺோாி
ൌ ߜƬ ∙ ܺூெ
(7.4)
où ߜƬ ൌ ቂܴ ܶ
0 1ቃ
ସ௫ସ
.
De l’autre côté, si nous connaissions de vrais paramètres d’étalonnage Ƭ௦
, la position des
données laser dans le repère IMU (b) devrait coïncider à celle de référence :
ܺோாி
ൌ Ƭ௦
∙ ܺ௦
(7.5)
En tant que les formules (7.4) et (7.5) déterminent la même grandeur, nous arrivons à formuler
la relation :
ߜƬ ∙ ܺூெ ൌ Ƭ௦
∙ ܺ௦
(7.6)138
En remplaçant, dans la formule (7.6), les coordonnées du nuage de points liées au repère IMU
par (7.2), nous obtenons :
ߜƬ ∙ Ƭ௦ ∙ ܺ௦ ൌ Ƭ௦
∙ ܺ௦
(7.7)
Allons plus loin, la dépendance entre l’étalonnage extrinsèque initial et celui recherché est
exprimée par :
ߜƬ ∙ Ƭ௦ ൌ Ƭ௦
(7.8)
La formule (7.8) peut s’écrire également sous forme matricielle :
ቂ
ܴ ܶ
0 1ቃ
ସ௫ସ ∙ ቈܴ௦ ݎ௦/
0 1
ସ௫ସ
ൌ ܴ௦
/௦ݎ
0 1 ൨
ସ௫ସ
(7.9)
Nous en déduisons, par multiplication de matrices, que les valeurs initiales ቀܴ௦ , ݎ/௦
ቁ de
l’étalonnage extrinsèque pris en compte au départ doivent être corrigées de la manière
suivante :
ܴ௦
ൌܴ∙ܴ௦ (7.10)
/௦ݎ
ൌܴ∙ݎ௦/
ܶ
La Figure 7.2 récapitule toutes les démarches de la procédure proposée qui mènent à
déterminer l’étalonnage extrinsèque du système en partant de ses valeurs approchées. L’idée
consiste alors à effectuer des scans avec un scanner laser 3D travaillant en mode statique et
monté sur la plate-forme mobile. Les acquisitions depuis plusieurs points de vue ou bien encore
au sein de différentes zones, sont prévues à réaliser pour améliorer la précision des résultats.
Ensuite, la moyenne des paramètres calculés indépendamment lors de chaque stationnement
décrit l’étalonnage extrinsèque ൫ܴ௦
/௦ݎ ,
൯ (7.10). Conceptuellement, une telle approche peut
être alors assimilée au procédé « 2-step » étalonnant les systèmes mobiles basés sur des
caméras.
Figure 7.2 Organigramme de l’approche envisagée. Paramètres recherchés : ܴ௦
/௦ݎ ,
139
0
Publications
7. Publications
Publications dans des revues avec comité de lecture et dans des conférences
avec actes
o Articles liés à la thèse :
Poreba M., Goulette F., 2014. A linear feature-based solution for robust and accurate
registration of point clouds. Sensors (en cours de soumission).
Poreba M., Goulette F., 2014. Recalage rigide de relevés laser par mise en correspondance
robuste basée sur des segments. Revue Française de Photogrammétrie et de Télédétection
RFPT, vol.207, (accepté).
↦ Deuxième Prix Étudiant du meilleur article soumis en 2013 à la RFPT, décerné par la
Société Française de Photogrammétrie et de Télédétection (SFPT)
Poreba M., Goulette F., 2013. Line Segment-based Approach for Accuracy Assessment of
MLS point clouds in Urban Areas. Conference Proceedings of the 8th International
Symposium on Mobile Mapping Technology MMT 2013, 1-3 May, Tainan, Taïwan.
↦ Prix internationaux du Best Student Paper Award et du Best Presentation
Award
Poreba M., Goulette F., 2012. RANSAC algorithm and elements of graph theory for
automatic plane detection in 3D point clouds. Archives of Photogrammetry, Cartography
and Remote Sensing, vol. 24, pp.301-310.
Poreba M., Goulette F., 2012. Assessing the Accuracy of Land-Based Mobile Laser Scanning
Data. Geomatics and Environmental Engineering, vol. 6/3, pp.83-91.
Pyka K., Borowiec N., Poreba M., Slota M., Kundzierewicz T., 2012. Airborne laser scanning
data for railway lines survey. PAK Measurement Automation and Monitoring, vol.58,
pp.260-263. 140
o Articles antérieurs :
Poreba M., 2011. Use of integrated GPS and INS systems in aerial photogrammetry.
Geomatics and Environmental Engineering, vol.5, no.3, pp.79-87.
Poreba M., 2009. Modern methods of earth mass volume determination. Archives of
Photogrammetry, Cartography and Remote Sensing, vol.19, pp.351-361.
Séminaires sans actes
Marcotegui, B., Serna, A., Goulette, F., Poreba, M., Frauciel, L., Mittet, M.A., Rialland, S.,
Benjemaa, R., Hervieu, A., Soheilian, B., Paparoditis, N., 2013. TerraMobilita : urban scene
analysis. 13th International Scientific and Technical Conference « From imagery to map:
digital photogrammetric technologies », 23-26 September 2013, Fontainebleau, France.
Poreba, M., Goulette, F., 2013. Registration of 3D point clouds using extracted line
segments. VIII Colloque national en Géomatique intitulé «Géo - informatique comme un
outil intégré d’analyses spatiales », 11-13 Septembre 2013, Université de Varsovie, Varsovie,
Pologne.
Poreba, M., Goulette, F., 2012. Extraction d’arêtes et comparaison avec des données de
référence pour la qualification de relevés laser mobiles, Journée du GDR ISIS, Thème B –
Analyse de scènes en image et vision, 8 Novembre 2012, Télécom ParisTech, Paris, France. 141
0
Bibliographie
0. Bibliographie
Abbas, I., Grussenmeyer, P., Hottier, P., 1995. Contrôle de la planimétrie d’une base de
données vectorielles : une nouvelle méthode basée sur la distance de Hausdorff : la méthode
du contrôle linéaire. Revue de la Société Française de Photogrammétrie et de Télédétection
(1995-1), n°137, ISSN 0244-6014, pp. 6-11.
Abuhadrous, I., 2005. Système embarqué temps réel de localisation et de modélisation 3D
par fusion multi-capteur. Thèse de Doctorat, MINES ParisTech.
Al-Durgham, M., Detchev I., Habib, A., 2011. Analysis of Two Triangle-Based MultiSurface
Registration Algorithms of Irregular Point Clouds. International Archives of the
Photogrammetry, Remote Sensing and Spatial Information Sciences, vol. XXXVIII-5/W12,
pp.61-66.
Alshawa, M., 2006. Consolidation des nuages de Points en Lasergrammétrie Terrestre.
Thèse de Master, École Nationale Supérieure d’Architecture de Nancy.
Alshawa, M., 2010. Contribution à la cartographie mobile : développement et caractérisation
d’un système base sur un scanner laser terrestre. Thèse de Doctorat, INSA Strasbourg.
Arun, K.S., Huang, T.S., Blostein, S.D., 1987. Least-Squares Fitting of Two 3-D Point Sets.
IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 9, No.5. pp. 698-700.
Atanacio-Jiménez, G., Gonzalez-Barbarosa, J-J., Hurtado-Ramos, J.B., Ornelas-Rodriguez,
F.J., Jiménez-Hernandez, H., Garcia-Ramirez, T., Gonzalez –Barbarosa, R., 2011. LIDAR
Velodyne HDL-64E Calibration Using Pattern Planes. International Journal of Advanced
Robotic Systems, vol.8, no.5, pp.70-82.
Awwad, T. M., Zhu, Q., Du, Z., Zhang, Y., 2010. An improved segmentation approach for
planar surfaces from unstructured 3D point clouds. The Photogrammetric Record, 25(129),
pp. 5-23.
Babu, R., Wang, J., 2005. Ultra-Tight GPS/INS/PL integration: a system concept and
performance analysis. GPS Solution, vol.13, pp.75-82.
Barber, D., Mills, J., 2008. Geometric validation of a ground-based mobile laser scanning
system. ISPRS Journal of Photogrammetry & Remote Sensing, Vol. 63, pp.128-141. 142
Bauer, J., Karner, K., Schindler, K., Klaus, A., Zach, C., 2005. Segmentation of building from
dense 3D point-clouds. Proceedings of the ISPRS Workshop Laser scanning, September 12-
14, Enschede, Netherlands.
Belton, D., Mooney, B., Snow, T., Kwang-Ho, B., 2011. Automated Matching of Segmented
Point Clouds to As-built Plans. Proceedings of the Surveying & Spatial Sciences Biennial
Conference, 21-25 November, Wellington, New Zealand.
Benhabiles, H., Vanderborr, J-P., Lavoué, G., Daoudi, M., 2009. Une collection de modèles
3D avec vérité – terrain pour l’évaluation des algorithmes de segmentation. Proceedings of
CORESA (COmpression et REpresentation des Signaux Audiovisuels), 19-20 mars 2009,
Toulouse, France.
Besl, P.J., McKay, N.D., 1992. A method for registration of 3-D shapes. IEEE Transactions
of Pattern Analysis and Machine Intelligence, vol. 14, no. 2, pp.239-256.
Bienert, A., 2008. Vectorization, Edge Preserving Smoothing and Dimensioning of Profiles
in Laser Scanner Point Clouds. The International Archives of the Photogrammetry, Remote
Sensing and Spatial Information Sciences, vol. XXXVII, part. B5, pp. 507-512.
Bitenc, M., Lindenbergh, R., Khoshelham, K., van Waarden, A.P., 2011. Evaluation of a
LIDAR Land-Based Mobile Mapping System for Monitoring Sandy Coasts. Remote
Sensing, vol. 3, pp. 1472-1491.
Boehler, W., Bordas, V., Marbs, A., 2003. Investigating laser scanner accuracy. Proceedings
of the XIXth CIPA Symposium, 30 September – 4 October, Antalya, Turkey.
Borowiec, N., 2009. Generowanie trójwymiarowego modelu budynku na podstawie danych
lidarowych. Archiwum Fotogrametrii, Kartografii i Teledetecji, vol. 20, pp.47-56.
Borowiec, N., 2012. Transformata Hough’a jako narzedzie wspomagające wykrywanie
dachów budynków. Archiwum Fotogrametrii, Kartografii i Teledetekcji, vol. 25, pp.45-54.
Borrmann, D., Elseberg, J., Lingemann, K., Nüchter, A., 2011. The 3D Hough Transform for
Plane Detection in Point Clouds: A Review and a new Accumulator Design. 3D Research,
vol. 02, pp.1-13.
Boudet, L., 2007. Auto-qualification de données géographiques 3D par appariement multiimage
et classification supervisée. Application au bâti en milieu urbain dense. Thèse de
doctorat, Université Paris-EstMarne-la-Vallée.
Bouillaguet, Ch.,. 2011. Algorithmique et Programmation. Projet :permutations de matrices
creuses et décompositions de graphes Cours en-ligne, École Nationale Supérieure :
http://www.lifl.fr/~bouillag/teaching/ens_2011/sparse1.pdf
Boulaassal, H., 2010. Segmentation et modélisation géométrique de façades de bâtiments à
partir de relevés laser terrestres. Thèse de Doctorat, INSA Strasbourg.
Brabant, M., 2011. In : Topographie opérationnelle: Mesure – Calculs – Dessins -
Implémentations. Editeur Eyrolles.
Bretar, F., Roux, M., 2005. Hybrid image segmentation using lidar 3D planar primitives.
Proceedings of ISPRS Workshop Laser scanning, September 12-14, Enschede, the
Netherlands, 2005, pp 72-78.
Bykat, A., 1978. Convex hull of a finite set of points in two dimensions. Information
Processing Letters, vol. 7, pp.296–298. Bibliographie
143
Cahalane C., McCarthy, T., McElhinney, C., 2010. Mobile mapping system performance – an
initial investigation into the effect of vehicle speed on laser scan lines, RSPSoc no.2005.
Canaz, S., Habib, A., 2013. Planar and linear feature –based registration of terrestrial laser
scans with minimum overlap using photogrammetric data. Proceedings of the 8th
International Symposium on Mobile Mapping Technology, 1-3 May, Tainan, Taiwan.
Cannelle, B., Paparoditis, N., Pierrot-Deseilligny, M., Papelard, J-P., 2012. Off-line vs. Online
calibration of a panoramic-based mobile mapping system. ISPRS Annals of the
Photogrammetry, Remote Sensing and Spatial Information Sciences, vol. I-3, pp. 31-36.
Castillo, E., Zhao, H.,2009. Point Cloud Segmentation via Constrained Nonlinear Least
Squares Surface Normal Estimates. Computational Geometry.
Cazzaniga, N.E., Fornali, G., Roncella, R., 2007. Improving the reliability of a GPS/INS
Navigation Solution for MM Vehicles By Photogrammetry. Proceedings of the 5th
International Symposium on Mobile Mapping Technology, Padua, Italy.
Chan, T. O., Lichti, D. D., Feature-based self-calibration of Velodyne HDL-32E LiDAR for
terrestrial mobile mapping applications. 2013. Proceedings of the 8th International
Symposium on Mobile Mapping Technology, 1-3May, Tainan, Taiwan.
Chan, T-O., Lichti, D.D., Glennie, C.L., 2013. Multi-feature based boresight self-calibration
of a terrestrial mobile mapping system. ISPRS Journal of Photogrammetry and Remote
Sensing, vol. 82, pp.112-124.
Chen, C., Hung, Y., Cheng, J., 1999. RANSAC-based DARCES: A New Approach to Fast
Automatic Registration of Partially Overlapping Range Image. IEEE Transactions on
Pattern Analysis and Machine Intelligence, vol.21, no. 11, pp.1229-1234.
Chen, J., Leung, M.K., Gao, Y., 2003. Noisy logo recognition using line segment Hausdorff
distance. The Journal of the Pattern Recognition Society, vol.36, pp.943-955.
Chen, Y., Medioni, G., 1992. Object modelling by registration of multiple range images.
Image Vision Computing, vol. 10(3), pp.145-155.
Chen, Y-Ch., Tseng, Y-H., Wang, P-Ch., 2013. The calibration of a portable panoramic
image mapping system. Proceedings of the 8th International Symposium on Mobile Mapping
Technology, Mai 1-3, Tainan, Taiwan.
Choi, W-P., Lam, K-M., Siu, W-Ch., 2001. A robust Line-Feature-Based Hausdorff Distance
for Shape Matching. Proceedings of Advances in Multimedia Information Processing – PCM
2001, Second IEEE Pacific Rim Conference on Multimedia, 24-26 Octobre, Bejing, Chine,
pp.764-771.
Cormen, T., Leiserson, Ch., Rivest, R., Stein, C., 2001. Introduction à l’algorithmique. Cours
et exercices. The Massachusetts Institute of Technology, 2e édition. pp.1-1176.
Guan, H., Li, J., Yu, Y., Wang, Ch., 2013. Geometric validation of a mobile laser scanning
system for urban applications. Proceedings of the 8th International Symposium on Mobile
Mapping Technology, 1-3 May, Tainan, Taiwan.
Delmerico, J.A., David, P., Corso, J.J., 2011. Building Facade Detection, Segmentation, and
Parameter Estimation for Mobile Robot Localization and Guidance, Proceedings of the
International Conference of Intelligent Robots and System (IROS)., pp.1632-1639. 144
Demarsin, K., Vanderstraeten, D., Volodine, T., Roosea, D., 2007. Detection of closed sharp
edges in point clouds using normal estimation and graph theory. Computer-Aided Design,
vol. 39, pp.276-283.
Deschaud, J-E., 2010. Traitement de nuages de points denses et modélisation 3D
d’environnements par système mobile LiDAR/Caméra. Thèse de Doctorat, MINES
ParisTech.
Douadi, L., 2006. Contribution à l’étude du recalage de données 3D/couleur. Thèse de
doctorat, Université Montpellier II.
Dubuisson, M.P., Jain, A.K., 1994. A modified Hausdorff distance for object matching.
Proceedings 12th International Conference on Pattern Recognition, Jerusalem, Israel,
pp.566-568.
Duda, R.O., Hart, P.E., 1971. Use of the Hough Transformation to Detect Lines and Curves
in Pictures. Technical Note 36, Artificial Intelligence Center, SRI International.
Feng, J., Zhong, R., Yang, Y., Zhao, W., 2008. Quality Evaluation of Spatial Point-Cloud
Data Collected by Vehicle-Borne Laser Scanner. International Workshop on Education and
Training & International Workshop on Geosciences and Remote Sensing.
Dulmage, A.L., Mendelsohn, N.S., 1958. Coverings of bipartite graphs. Canadian Journal of
Mathematics, vol.10, pp. 517–534.
Ellum, C., El-Sheimy, N., 2002. The calibration of Image-Based Mobile Mapping Systems.
Proceedings of the 6th Conference on Optical 3D Measurements Techniques, September 22-
25, Zurich, Swiss.
Ellum, C., El-Sheimy, N., 2003. Investigations in boresight and lever-arm calibration.
Elsbourg, J., Borrmann, D., Nüchter, A., 2013. Automatic and Full Calibration of Mobile
Laser Scanning Systems. Experimental Robotics, Springer Tracts in Advanced Robotics,
Vol.88, part. XIII, pp.907-917.
El-Sheimy, N., 2011. Land-based MMT: State of the Art and Future Trends. Proceedings of
the 7th International Symposium on Mobile Mapping Technology, June 13-16, Cracow,
Poland.
Evans, S., 2013. 3D Laser Scanning Market Continues Trend of Robust Growth. Publication
en-ligne : http://www.arcweb.com/press-center/2013-07-11/3d-laser-scanning-market-continuestrend-of-robust-growth-1.aspx
(accessible le 16.04.2014).
Feng, J., Zhong, R., Yang, Y., Zhao, W., 2008. Quality Evaluation of Spatial Point-Cloud
Data Collected by Vehicle-Borne Laser Scanner. Proceedings of the International Workshop
on Education and Training & 2008 International Workshop on Geosciences and Remote
Sensing, pp. 320-323.
Filin, S., 2003. Recovery of systematic biases in laser altimetry data using natural surfaces.
Photogrammetric Engineering and Remote Sensing, vol.69(11), pp.1235-1242.
Fischler, M.A. et Bolles, R.C., 1981. Random sample consensus: A paradigm for model fitting
with applications to image analysis and automated cartography. Communications of the
ACM, vol.24(6), pp.381-395.
Fitzgibbon, A., 2001. Robust registration of 2D and 3D point sets. The British Machine
Vision Conference.
Frémont, V., 2009. Odométrie 3D vision/lidar pour les véhicules intelligents. Journées
Nationales de la Recherche en Robotique, Neuvy-sur-Barangeon, France. Bibliographie
145
Gallo, O., Manduchi, R., Rafii, A., 2010. CC-RANSAC: Fitting planes in the presence of
multiple surfaces in range data. Pattern Recognition Letters, vol. 32, pp. 403–410.
Gandofi, S., Barbarelle, M., Ronci, E., Bruchi, A., 2008. Close photogrammetry and laser
scanning using a mobile mapping system for high detailed survey of a high-density urban
area. The International Archives of the Photogrammetry, Remote Sensing and Spatial
Information Sciences, Vol. XXXVII, part B5, pp.909-914.
Gao, J., Sun, J., Wu, K., 2012. Image Matching Method Based on Hausdorff Distance of
Neighborhood Grayscale. Journal of Information & Computational Science, vol.10, pp. 2855-
2863.
Gao, Y., Leung, M.K., 2002. Line segment Hausdorff distance on face matching. The Journal
of the Pattern Recognition Society, vol.35, pp.361-371.
Gelfand, N., Ikemoto, L., Rusinkiewicz, Sz., Levoy, M., 2003. Geometrically Stable Sampling
for the ICP Algorithm. 2003. Proceedings of the 4th International Conference on 3D Digital
Imaging and Modeling (3DIM), pp.260-267.
Ghanma, M., 2006. Integration of Photogrammetry and LIDAR. Thèse de doctorat,
Université de Calagary, Canada.
Glennie, C., 2007. Rigorous 3D error analysis of kinematic scanning LIDAR systems.
Journal of Applied Geodesy, vol.1, pp.147-157.
Glennie, C., 2012. Calibration and kinematic analysis of the Velodyne HDL-64E S2 LiDAR
sensor. Photogrammetric Engineering and Remote Sensing, vol. 78(4), pp.339-347.
Graham, R.L., 1972. An Efficient Algorithm for Determining the Convex Hull of a Finite
Planar Set. Information Processing Letters, vol. 1, pp.132-133.
Grejner-Brzezinska, D., Toth, Ch., 2010. High-Accuracy Multi-Sensor Geolocation
Technology to Support Geophysical Data Collection at MEC Sites. Final Report SERDP
Project MR-1564
Gressin, A., Mallet, C., David, N., 2012. Improving 3D LIDAR point cloud registration
using optimal neighborhood knowledge. ISPRS Annals of the Photogrammetry, Remote
Sensing and Spatial Information Sciences, vol. I-3, pp. 111-116.
Gressin, A., Mallet, C., Damantké, J., David, N., 2013. Towards 3D lidar point cloud
registration improvement using optimal neighborhood knowledge. ISPRS Journal of
Photogrammetry and Remote Sensing, vol. 79, pp. 240-251.
Gruen, A., Akca, D., 2005. Least squares 3D surface and curve matching. ISPRS Journal de
Photogrammetry and Remote Sensing, vol.59(3), pp.151-174.
Grussenmeyer, P., Hottier, P., Abbas, I., 1994. Le contrôle topographique d’une carte ou
d’une base de données constituées par voie photogrammétrique. Revue de l’Association
Française de Topographie, XYZ 2e trim. 1994 N°59, ISSN 0290-9057, pp. 39-45.
Guerra, C., Pascucci, V., 1999. On matching Sets of 3D Segments. Proceedings SPIE, vol.
3811, pp.157-167.
Haala, N., Peter, M., Kremer, J., Hunter, G., 2008. Mobile LIDAR Mapping for 3d point
cloud collection in urban areas – a performance test. Proceedings of XXIth ISPRS Congress. 146
Habib, A.F., Ghanma, M.S., Tait, M., 2004. Integration of LIDAR and photogrammetry for
close range applications. ISPRS Proceedings of XXth Congress, July12-23, Istanbul, Turkey.
Habib, A., Bang; K., Kersting, A.P., Chow, J., 2010. Alternatives methodologies for LiDAR
system calibration. Remote Sensing, vol.2, pp.874-907.
Habib, A.F., Kersting, A.P. Shaker, A., Yan, W-Y., 2011. Geometric Calibration and
Radiometric Correction of LiDAR Data and Their Impact on the Quality of Derived
Products. Sensors, vol.11, pp.9069-9097.
Hanke, K., Grussenmeyer, P., Grimm-Pitzinger, A., Weinold, T., 2006. First Experiences
with Trimble GX Scanner. International Archives of the Photogrammetry, Remote Sensing
and Spatial Information Sciences, vol. XXXVI, part 5.
Harris, C., Stephens, M.A., 1988. A Combined Corner and Edge Detector. Proceedings of 4th
Alvey Vision Conference, pp. 147-151.
Hartley, R., Zisserman, A., 2003. Multiple view geometry in computer vision. Cambrige
University Press, Second edition, pp.117-121.
Hassan, T., El-Sheimy, N., 2008. System calibration of land-based mobile mapping systems.
Proceedings of the International Calibration and Orientation Workshop EuroCOW 2008, 30
January-1 February, Castelldefels, Spain.
Hernandez, J., Marcotegui, B., 2008. Segmentation de Nuages de Points pour la
Modélisation d’Environnement Urbains. Revue Française de Photogrammétrie et de
Télédétection, vol.191, pp.28-35.
Hiremagalur, J., Yen, K.S., Lasky, T.A., Ravani, B., 2009. Testing and Performance
Evaluation of Fixed Terrestrial 3D Laser Scanning Systems for Highway Applications.
Transportation Research Board TBR 88th Metting CD-ROM, pp. 1-19.
Hough, P.C.V., 1962. Method and Means for Recognizing Complex Patterns. US Patent
3.069.654.
Huh, Y., Yang, S., Ga, Ch., Yu, K., Shi, W., 2013. Line segment confidence region-based
string matching method for map conflation. ISPRS Journal of Photogrammetry and Remote
Sensing, vol.78, pp.69-84.
Hullo, J-F., 2013. Consolidation de relevés laser d’intérieurs construits : pour une approche
probabiliste initialisée par géolocalisation. Thèse de doctorat, Université de Strasbourg.
Huttenlocher, D.P., Klanderman, G.A., Kl, G.A, Rucklifge, W.J., 1993. Comparing Images
Using the Hausdorff Distance. IEEE Transactions on Pattern Analysis and Machine
Intelligence, vol.15, pp. 850-863.
Jarvis, R. A., 1973. On the identification of the convex hull of a finite set of points in the
plane. Information Processing Letters vol.2, pp.18–21.
Jarzabek-Rychard, M., Borkowski, A., 2010. Porównanie algorytmów RANSAC oraz
rosnacych płaszczyzn w procesie segmentacji danych z lotniczego skaningu laserowego.
Archiwum Fotogrametrii, Kartografii i Teledetecji, vol. 21, pp.119-129.
Jaw, J-J., Chuang, T-Y., 2008. Registration of ground-based LIDAR point clouds by means
of 3D line features. Journal of the Chinese Institute of Engineers, vol. 31, no. 6, pp.1031-
1045.
JCGM 200 :2012. Vocabulaire international de métrologie – Concepts fondamentaux et
généreux et termes associés (VIM), BIPM, pp.18-28. Bibliographie
147
Jibrini, H., 2002. Reconstruction automatique des bâtiments en modèles polyédriques 3-D à
partir de donnés cadastrales vectorisées 2D et d’un copule d’images aériennes à haute
résolution. Thèse de doctorat de Télécom Paris.
Kaartinen, H., Hyyppä, J., Kukko, A., Jaakkola, A., Hyyppä, H., 2012. Benchmarking the
Performance of Mobile Laser Scanning Systems Using a Permanent Test Field. Sensors, vol.
12, pp. 12814-12835.
Kamgar-Parsi, B., Kamgar-Parsi, B., 1997. Matching Sets of 3D Line Segments with
Application to Polygonal Arc Matching. IEEE Transactions on Pattern Analysis and
Machine Intelligence, vol.19, No. 10.
Kamgar-Parsi, B., Kamgar-Parsi, B., 2004. Algorithms for Matching 3D Line Sets. IEEE
Transactions on Pattern Analysis and Machine Intelligence, vol. 26, No.5.
Klimkowska, H., Wróbel, A., 2006. Uwagi o wykorzystaniu Tachymetrów Bezlustrowych w
Inwentaryzacji Architektonicznej (Some Remarks Concerning the Use of Reflector less
Total Stations for Architectural Recording). Archiwum Fotogrametrii, Kartografii i
Teledetekcji, vol.16, pp.297-303.
Kumari, P., Carter, W.E., Shrestha, R.L., 2011. Adjustment of systematic errors in ALS data
through surface matching. Advances in Space Research, vol.47, pp. 1851-1864.
Landes, T., Grussenmeyer, P., 2011. Les principes fondamentaux de la lasergrammétrie
terrestre : systèmes et caractéristiques. Revue XYZ, no. 128/3, pp.37-49.
Landes, T., Grussenmeyer, P., Boulaassal, H., 2011. Les principes fondamentaux de la
lasergrammétrie terrestre : acquisition, traitement des données et applications. Revue XYZ,
no. 129/4, pp.25-38.
Landes, T., Boulaassal, H., Grussenmeyer, P., 2012. Quality Assessment of geometric façade
models reconstructed from TLS data. The Photogrammetric Record, no. 27(138), pp.137-
154.
Lari, Z., Habib, A.F., Kwak, E., An adaptive approach for segmentation of 3D laser point
clouds. International Archives of Photogrammetry, Remote Sensing and Spatial Information
Sciences, vol. XXXVIII-5/W12, pp.103-108.
Latulippe, M., 2013. Calage robuste et accéléré de nuages de points en environnements
naturels via l’apprentissage automatique. Thèse de Master, Université Laval, Québec,
Canada.
Lee, D., Kim, Y., Bang, H., 2013. Vision-based Terrain Referenced Navigation for Unmanned
Aerial Vehicles using Homography Relationship. Journal of Intelligent and Robotic Systems,
vol.69(1-4), pp. 489-497.
Levinson, J.S., 2011. Automatic laser calibration, mapping, and localization for autonomous
vehicles. Thèse de Doctorat, Stanford Artificial Intelligence Laboratory.
Li, W., Li, X., Bian, Y., Zhao, H., 2012. Multiple View Point Cloud Registration Based on 3D
Lines. Proceedings of the 2012 International Conference on Image Processing, Computer
Vision & Pattern Recognition, Las Vegas, USA.
Li-Chee-Ming, J., Armenakis, C., Lee, R., 2011. Mobile Stereo-Mapper: a Portable Kit for
Unmanned Aerial Vehicles. International Archives of the Photogrammetry, Remote Sensing
and Spatial Information Sciences, vol. XXXVIII-1/C22, pp.1-6. 148
Liao, H-M., Liu, H-S., Chen, C., 2013. Develop Backpack Mobile Mapping System Based on
Open Source Software and Hardware Platform. Proceedings of the 8th International
Symposium on Mobile Mapping Technology, 1-3 May, Tainan, Taiwan.
Lowe, D.G., 2004. Distinctive image features from scale – invariant key points. International
Journal of Computer Vision, vol.60(2), pp.91-110.
Mano, K., Ishii, K., Hirao, M., Tachibana, K., Yoshimura, M., Akca, D., Gruen, A., 2012.
Empirical accuracy assessment of MMS Laser point clouds. International Archives of the
Photogrammetry, Remote Sensing and Spatial Information Sciences, vol. XXXIX-B5, pp.
495-498.
Masuda, T., Yokoya, N., 1995. A robust Method for Registration and Segmentation of
Multiple Range Images. Computer Vision and Image Understanding, vol. 16, no.3, pp.295-
307.
Monnier, F., Vallet, B., Paparoditis, N., Papelard, J-P., David, N., 2013. Mise en cohérence de
données laser mobile sur un modèle cartographique par recalage non-rigide. Revue Française
de Photogrammétrie et de Télédetection, no. 202, pp.27-41.
Narayana, K.S., 2011. Solutions for the localization of Mobile Mapping Systems in
structured environments. Thèse de Doctorat, MINES ParisTech.
Newby, P. R. T., 2011. Editorial: Accuracy, precision, extraction, citation and valediction.
The Photogrammetric Record, 26(134): 149-153.
Ning, F-S., Kao, S-P., Chang, Ch-Ch, Meng, X., 2007. A simulation of the effect of GPS
Pseudolite observations on the obstructed sky view. Survey Review, vol. 39, pp.34-42.
Oehler, B., Stueckler, J., Welle, J., Schulz, D., Behnke S., 2011. Efficient Multi-Resolution
Plane Segmentation of 3D Point Clouds. Proceedings of the 4th International Conference on
Intelligent Robotics and Applications (ICIRA), Aachen, Germany.
Paparoditis, N., Papelard, J-P., Cannelle, B., Devaux, A., Soheilian, B., Nicolas, D., Houzay,
E., 2012. Stéréopolis II: A multi-purpose and multi-sensor 3D mobile mapping system for
street visualization and 3D metrology. Revue Française de Photogrammetry et de
Télédetection, pp.69-79.
Pawleta, M., Igielska, A., 2009. Analiza dokładnosci wybranych modeli naziemnych
skanerów laserowych. Thèse de Master, AGH de Cracovie.
Pesci, A., Teza, G., 2008. Effects of surface irregularities on intensity data from laser
scanning: an experimental approach. Annals of Geophysics, vol. 51/1, pp.839-848.
Poncelet, N., Cornet, Y., 2010. Transformée de Hough et détection de linéaments sur images
satellitaires et modèles numériques de terrain. Bulletin de la Société Géographique de Liège,
vol.54, pp.145-156.
Poreba, M., Goulette, F., 2012. Assessing the Accuracy of Land-Based Mobile Laser
Scanning Data. Geomatics and Environmental Engineering, vol.6, no. 3, pp.73-81.
Pothen, Al., Fan, Ch-J., 1990. Computing the Block Triangular Form of a Sparse Matrix.
ACM Transactions on Mathematical Software, vol.16, no.4, pp.303-324.
Pulli, K., 1999. Multiview Registration for Large Data Sets. Proceedings of the International
Conference on 3D Digital Imaging for the ICP Algorithm (3DIM), Ottawa, pp. 160-168. Bibliographie
149
Rabbani, T., van den Heuvel, F. A., Vosselman, G., 2006. Segmentation of Point Clouds
using Smoothness Constraint. ISPRS Commission V Symposium on Image Engineering and
Vision Metrology, pp.248-253.
Rau, J-Y., Habib, A.F., Kersting, A.P., Chiang, K-W., Bang, K-I., Tseng, Y-H., Li, Y-H.,
2011a. Direct Sensor Orientation of a Land-Based Mobile Mapping System. Sensors, vol.11,
pp. 7243-7261.
Rau, J-Y., Chen, L-Ch., Hsieh, Ch-Ch., Huang, T-M., 2011b. Static error budget analysis for
a land-based dual-camera mobile mapping system. Journal of the Chinese Institute of
Engineers, vol. 34, no. 7, pp.849-862.
Ray, J.A., Graham, L., 2008. New horizontal accuracy assessment tools and techniques for
LIDAR data. Proceedings of the ASPRS Annual Conference, Portland, Oregon.
Reichle, R.H., 2008. Data assimilation Methods in the Earth sciences. Advances in Water
Resources, vol.31, no.11, pp.1411-1418.
Renaudin, E., Habib, A., Kersting, A.P., 2011. Feature-Based Registration of Terrestrial
Laser Scans with Minimum Overlap Using Photogrammetric Data. ETRI Journal, vol. 33,
no. 4, pp.517-527.
Ridene, T., 2010. Co-recalage de données hétérogènes 3D géo-référencées: contributions à la
correction de relevés laser mobiles. Thèse de doctorat, MINES ParisTech.
Rieger, P., Studnicka, N., Pfennigbauer, M., Zach, G., 2010. Boresight alignment method for
mobile laser scanning systems. Journal of Applied Geodesy, vol. 4, pp. 13-21.
Rusinkiewicz, Sz., Levoy, M., 2001. Efficient Variants of the ICP Algorithms. Proceedings of
the International Conference on 3D Digital Imaging and Modeling (3DIM), Québec,
Canada, pp.145-152.
Shear, P., In-flight Quality Assessment and Data Processing for Airborne Laser Scanning.
Thèse de Doctorat, École Polytechnique Fédérale de Lausanne.
Sappa, A., Restrepo-Specht, A., Devy, M., 2001. Range Image Registration by using an
Edge-based Representation. Proceedings of the 9th International Symposium on Intelligent
Robotic Systems (SIRS’01), Toulouse, France, pp.167-176.
Sarni D., Lemarchande L., 2011. Graphes, Université de Brest, cours en-ligne
http://www.lisyc.univ-brest.fr/pages_perso/lemarch/Cours/polyGraphes.pdf, pp.1-63.
Selmi, I., 2013. Optimisation de de l'infrastructure d'un système de positionnement indoor à
base de transmetteurs GNSS. Thèse de Doctorat, Télécom SudParis.
Serna, A., Marcotegui, B., 2013. Urban accessibility diagnosis from mobile laser scanning
data, ISPRS Journal of Photogrammetry and Remote Sensing, vol.84, pp.23-32.
Shaer, P., 2010. In-Flight Quality Assessment and Data Processing for Airborne Laser
Scanning. Thèse de doctorat, École Polytechnique Fédérale de Lausanne.
Shi, Y., 2008. Advanced Mobile Mapping System Development with Integration of Laser
Data, Stereo Image and other Sensor Data. Publication of Tokyo City University, no.10, pp.
24-31.
Skaloud, J., Lichti, D.D., 2006. Rigorous approach to boresight self-calibration in airborne
laser scanning. ISPRS Journal of Photogrammetry and Remote Sensing, vol. 61(1), pp.47-59. 150
Soria-Medina, A., Martinez, J., Buffara-Antunes, A.F., Arias, P., Gonzalez-Jorge, H., 2011.
An approach to extracting façade features using the intensity value of terrestrial laser
scanner with mathematical morphology. The 28th International Symposium on Automation
and Robotics in Construction, Republic of Korea, pp.552-557.
Soudarissanane, S., Lindenbergh, R., Menenti, M., Teunissen, P.J.G., 2009. Incidence angle
influence on the quality of terrestrial laser scanning points. Proceedings of ISPRS Workshop
Laser Scanning; Paris, France, vol. XXXVIII, part 3/W8, pp.183-188.
Steiger, R., 2005. The Geometrical Quality of Terrestrial Laser Scanner (TLS). Proceedings
of FIG Working Week, Egypt.
Sunday, D., 2001. Distance between lines and segments with their closest point of approach.
Technical report, en-ligne : http://geometryalgorithms.com.
Talaya, J., Alamus, R., Bosch, E., Serra, A., Kornus, W., Baron, A., 2004. Integration of a
Terrestrial Laser Scanner with GPS/IMU Orientation Sensors. Proceedings of the XX
ISPRS Congress (Commission V), July 12-23, Istanbul, Turkey.
Tangelder, J.W.H., Veltkamp, R.C., 2008. A survey of content based 3D shape retrieval
methods. Multimedia Tools Applications, vol.39(3), pp.441-471.
Tarsha-Kurdi, F., Landes, T., Grussenmeyer, P., 2007. Hough Transform and Extended
RANSAC algorithms for automatic detection of 3D building roof planes from LIDAR data.
The International Archives of the Photogrammetry, Remote Sensing and Spatial
Information Sciences, vol.XXXVI, part 3/W52, pp.407-412.
Tarsha-Kurdi, F., 2008. Extraction et reconstruction de bâtiments en 3D à partir de relevés
lidar aéroportés. Thèse de doctorat, Université de Strasbourg.
Titterton, D.H., Weston, J.L., 2004. Strapdown Inertial Navigation Technology – 2nd
Edition. The institution of Electrical Engineering. 557 pages.
Toth, C., Grejner-Brzezinska, D., Oh, J.H., Markiel, J.N., 2009. Terrain-based navigation: a
tool to improve navigation and feature extraction performance of mobile mapping systems.
Boletim de Ciências Geodésicas – Special Issue on Mobile Mapping Technology, vol. 15,
no.5, p. 807-823.
Tournaire, O., Soheilian, B., Paparoditis, N., 2006. Towards a sub-decimetric georeferencing
of a ground-based mobile mapping systems in urban areas :matching ground-based and
aerial-based imagery using road marks. Proceedings of the ISPRS Commission I
Symposium, volume Part A, Marne-la-Vallée, France.
Tuttas, S., Stilla, U., 2011. Window Detection In Sparse Point Clouds Using Indoor Points.
International Archives of Photogrammetry, Remote Sensing and Spatial Information
Sciences, vol. 38(3/W22), pp. 131-136.
Tuttas, S., Stilla, U., 2013. Reconstruction of façades in point clouds from multi-aspect
oblique ALS. ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial
Information Sciences, vol.II-3/W3, pp.91-96.
van Verth, J.M., Bishop, L.M., 2008. Essential Mathematics for Games & Interactive
Applications. A programmer’s guide. Second Edition, (674 pages).
Vervisch-Picois, A., 2010. Etude de Systèmes de Positionnement en Intérieur Utilisant des
Mesures de Phase du Code ou de Phase de la Porteuse de Signaux de Navigation par
Satellites. Thèse de Doctorat, Université Pierre et Marie Curie - Paris 6. Bibliographie
151
Vosselman, G., Gorte, B.G.H., Sithole, G., Rabbani, T., 2004. Recognizing structure in laser
scanner point clouds. The International Archives of the Photogrammetry, Remote Sensing
and Spatial Information Sciences, vol. XXXVI, pp.33-38.
Vosselman; G., Maas, H.G., 2010. Airborne and terrestrial laser scanning. Whittles
Publishing, 2010 - Technology & Engineering, 318 pages.
Wang, J., Dai, L., Tsujii, T., Rizos, Ch., 2001. GPS/INS/Pseudolite Integration: Concepts,
Simulation and Testing. Proceedings of the 14th International Technical Meeting of the
Satellite Division of the Institute of Navigation. Salt Lake City, UT, 11-14 September, 2708-
2715.
Wang, J., Tan, Y., 2012. Hausdorff Distance with k-Nearest Neighbors. Advances in Swarm
Intelligence, Third International Conference, ICSI, 17-20 Juin, Shenzhen, Chine, pp.272-281.
Wang, R., Bach, J., Ferrie, F., 2011. Window Detection form Mobile LiDAR Data. IEEE
Workshop on Applications of Computer Vision (WACV), 5-7 Janvier, Kona, Hawaii.
Wang, W., Lou, A., Wang, J., 2012. The research of line matching algorithm under the
improved homograph matrix constraint condition. International Archives of
Photogrammetry, Remote Sensing and Spatial Information Sciences, vol. XXXIX-B3, pp.
345-350.
Wang, Y., Ewert, D., Schilberg, D., Jeschke, S., 2013. Edge Extraction by Merging 3D Point
Cloud and 2D Image Data. 10th International Conference & Expo on Emerging
Technologies for a Smarter World (CEWIT), 21-22 Octobre, Melville, New York.
Wang, Y., Ewert, D., Schilberg, D., Jeschke, S., 2014. A New Approach for 3D Edge
Extraction by Fusing Point Clouds and Digital Images. Applied Mechanics and Materials,
vol. 457-458, pp.1012-1016.
Wiart, A., 2013. Calibration extrinsèque d’un scanner laser multi-fibre. Test sur le laser
Velodyne. Rapport de stage de fin d’étude. MINES ParisTech & ENSG.
Williams, K.E., 2012. Accuracy Assessment of LIDAR Point Cloud Geo-Referencing. These
de Master, Oregon State University.
Yang, M.Y., Forstner, W., 2010. Plane Detection in Point Cloud Data. Technical Report
Nr.1, Department of Photogrammetry, Institute of Geodesy and Geoinformation, University
of Bonn.
Yao, J., Ruggeri, M.R., Taddei, P., Sequeira, V., 2010. Robust range image registration using
3D lines. Proceedings of 2010 IEEE 17th International Conference on Image Processing,
September 26-29, Hong Kong, pp.4321-4324.
Yong, L., Huayi, W., 2008. Adaptive building edge detection by combining Lidar data and
aerial images. The International Archives of the Photogrammetry, Remote Sensing and
Spatial Information Sciences, vol. XXXVII, pp.197-202.
Yoo, H-J., 2010. Analyse et conception de scanners laser mobiles dédiés à la cartographie 3D
d’environnements urbains. Thèse de doctorat, MINES ParisTech.
Yousif, H., Li, J., Chapman, M., Shu, Y., 2010. Accuracy enhancement of terrestrial mobile
LIDAR data using theory of assimilation. IAPRS International Archives of the
Photogrammetry, Remote Sensing and Spatial Information Sciences, vol. XXXVIII, part.5,
pp. 639-645. 152
Zampa, F., Conforti, D., 2009. Mapping with Mobile Radar. GIM International, vol. 23, no.4,
pp.35-37.
Zhang, Z., Faugeras, O.D., 1991. Determining Motion from 3D Line Segment Matches: a
comparative Study. Journal Image and Vision Computing, vol. 9, no.1, pp.10-19.
Zhang, Z., 1994. Iterative Point Matching for Registration of Free – Form Curves and
Surfaces. International Journal of Computer Vision, vol. 13, pp.119-152.
Zhu, Z., Liu, J., 2013 Unsupervised Extrinsic Parameters Calibration for Multi-beam
LIDARs, Proceedings of the 2nd International Conference on Computer Science and
Electronics Engineering, ICCSEE.
Zuliani M., 2012. RANSAC for Dummies, Technical Report. en-ligne:
http://vision.ece.ucsb.edu/~zuliani/Research/RANSAC/docs/RANSAC4Dummies.pdf153
Annexe A
Distance minimale entre deux segments
0. Distance minimale entre deux segments
Nous présentons dans cette annexe la méthode de [Sanday, 2001] permettant de déterminer
la distance la plus courte entre deux segments. Puisqu’elle s’inspire de la définition de
distance minimale entre deux lignes, nous commençons par expliquer son calcul.
Soient ܮଵ, et ܮଶ deux droites représentées respectivement par les points ܲ, ܳ et les vecteurs
non nuls ݑሬԦ, ݒԦ (Figure A.1) :
ܮଵ: ܲሺݏሻ ൌ ܲ ݑݏሬԦ ܮଶ: ܳሺݐሻ ൌ ܳ ݒݐԦ (A.1)
Les paramètres ݏ et ݐ indiquent la localisation des deux points plus proches sur les
lignes ܮଵ, et ܮଶ. Nous désignons par ݓሬሬԦ le vecteur défini par les deux points ܲሺݏሻ et ܳሺݐሻ. Sa
norme correspond à la distance minimale entre deux lignes (A.2).
ݓሬሬԦ ൌ ܲሺݏሻ െ ܳሺݐሻ (A.2)
Figure A.1 Définition de la distance minimale entre deux segments de droite
En remplaçant dans la formule (A.2) les points ܲሺݏሻ et ܳሺݐሻ par (A.1), nous obtenons : 154
ݓሬሬԦ ൌ ݓ ሬሬሬሬሬԦ ݏݑሬԦ െ ݐݒԦ (A.3)
où ݓ ሬሬሬሬሬԦ ൌ ሺܲ െ ܳሻ.
Par définition, le vecteur ݓሬሬԦ doit être, à la fois, perpendiculaire à ܮଵ et ܮଶ tant qu’il représente
la distance minimale entre ces deux lignes. Sachant que les deux vecteurs sont orthogonaux
si est seulement si, leur produit scalaire est nul, nous notons :
൜
ሬݓሬሬሬሬ
Ԧ ∙ ݑሬԦ ൌ 0
ሬሬሬሬሬݓ
Ԧ ∙ ݒԦ ൌ 0
(A.4)
En prenant en compte de l’équation (A.3), la formule (A.4) prend forme :
൜
ൌ 0 Ԧݒ ∙ Ԧሬݑݐ ሬԦ െݑ ∙ Ԧሬݑݏ Ԧሬݑ ∙ Ԧሬሬሬሬሬ ݓ
ൌ 0 Ԧݒ ∙ Ԧݒݐ െ Ԧݒ ∙ ԦሬݑݏԦݒ ∙ Ԧሬሬݓ
(A.5)
La résolution de ce système d’équations linéaires à deux inconnues nous amène à déterminer
les valeurs ݏ et ݐ de la manière suivante :
ݏ ൌ ܾ݁ െ ܿ݀
ܽܿ െ ܾଶ
(A.6)
ݐ ൌ ܽ݁ െ ܾ݀
ܽܿ െ ܾଶ
(A.7)
pour les ܽ, ܾ, ܿ, ݀, ݁ s’interprètent comme le produit scalaire de deux vecteurs (A.8).
ܽൌݑሬԦ ∙ ݑሬԦ ܾൌݑሬԦ ∙ ݒԦ ܿൌݒԦ ∙ ݒԦ ݀ൌݑሬԦ ∙ ݓሬሬԦ ݁ൌݒԦ ∙ ݓሬሬԦ
(A.8)
Il faut noter que le dénominateur ܽܿ െ ܾଶ de deux équations (A.6) et (A.7) doit être positif.
S’il est égal à zéro, les deux lignes sont parallèles.
La recherche de distance minimale entre deux lignes se résume alors à employer les
paramètres ݏ et ݐ obtenus pour trouver la norme du vecteur ݓሬሬԦ défini selon la formule
(A.2).
Passant à présent au cas de deux segments ܵଵ et ܵଶ représentés par les équations
paramétriques :
ܵଵሺݏሻ ൌ ܲ ݑݏሬԦ,ݏ ∈ ሾ0,1ሿ (A.9)
ܵଶሺݏሻ ൌ ܳ ݒݐԦ,ݐ ∈ ሾ0,1ሿ
Nous commençons, de manière similaire, par calculer la distance entre deux segments en
minimisant la norme du vecteur ݓሬሬԦ (‖ݓሬሬԦ‖ሻଶ). Ainsi, la position des points les plus proches
sur les deux droites ܮଵ et ܮଶ est retrouvée grâce aux équations (A.6) et (A.7).
Ensuite, nous procédons à vérifier si les valeurs de ݏ et ݐ sont comprises dans l’intervalle de
0 à 1, puisque ݏ ∈ ሾ0,1ሿ et ݐ ∈ ሾ0,1ሿ. Si c’est le cas, les points ܲሺܵሻ et ܳሺݐሻ appartiennent Annexe A. Distance minimale entre deux segments
155
aux segments (c’est-à-dire sont situés à l’intérieur du segment délimité par ces extrémités) et
nous nous en servons pour déterminer la distance minimale.
Si par contre, ils se trouvent au-delà d’un segment, il faut recalculer les paramètres ݏ et ݐ
de façon qu’ils minimisent la norme de ݓሬሬԦ. Nous testons plusieurs scénarios (A.10) comme
nous l’expliquons au fur et à mesure.
Valeur calculée Valeur admise
(A.10)
ൌ0ݏ 0൏ݏ
ൌ1ݏ 1ݏ
ൌ0ݐ 0൏ݐ
ൌ1ݐ 1ݐ
Alors, si ݏ൏0, nous changeons sa valeur qui sera désormais égale à zéro (ݏൌ0). Par
conséquent, l’équation (A.3) s’écrit comme :
ݓሬሬԦ ൌ ݓሬሬԦ െ ݐݒԦ (A.11)
et la distance à minimiser :
ݓሬሬԦ ∙ ݓሬሬԦ ൌ ሺݓሬሬԦ െ ݐݒԦሻ ∙ ሺݓሬሬԦ െ ݐݒԦሻ (A.12)
La dérivée partielle selon ݐ de l’équation (A.12) amène à la formule suivante :
െ2ݒԦ ∙ ሺݓሬሬԦ െ ݐݒԦሻ ൌ 0 (A.13)
dont la résolution donne la valeur de ݐ :
Ԧሬሬݓ ∙ Ԧݒ ൌ ݐ
Ԧݒ ∙ Ԧݒ
(A.14)
En admettant que le ݏൌ0 pour le segment ܵଵ (qui correspond nota bene à l’une des
extrémités du segment ܵଵ), nous obtenons la valeur de ݐ pour le segment ܵଶ.
Lorsque ݏ1, on fixe ݏൌ1. Puis, nous entreprenons les mêmes démarches. La distance
minimisée est :
ݓሬሬԦ ∙ ݓሬሬԦ ൌ ሺݓሬሬԦ ݑሬԦ െ ݐݒԦሻ ∙ ሺݓሬሬԦ ݑሬԦ െ ݐݒԦሻ (A.15)
De même, nous calculons la dérivée partielle de (A.15) selon ݐ :
െ2ݒԦ ∙ ሺݓሬሬԦ ݑሬԦ െ ݐݒԦሻ ൌ 0 (A.16)
afin d’obtenir, par résolution du système linéaire, le ݐ :
Ԧݒ ∙ Ԧሬݑ Ԧሬሬݓ ∙ Ԧݒ ൌ ݐ
Ԧݒ ∙ Ԧݒ
(A.17)156
De cette façon, nous déterminons, sur le segment ܵଶ, le point le plus proche du segment ܵଵ.
Si aucun des cas envisagés ci-dessus n’aboutit pas à parvenir le paramètre ݐ dont la valeur se
trouve dans l’intervalle de 0 à 1, nous appliquons la même procédure pour ݐ conformément
aux variantes affichées par (A.10). 157
Annexe B
Méthode EIGEN
0. Méthode EIGEN
Dans leur travail [Zhang et Faugeras, 1991] discutent de différentes représentations d’une
ligne ܮ dans l’espace 3D. Celle-ci peut être intuitivement définie par deux points quelconques
(représentation étant plutôt utilisée lorsque l’on s’intéresse à un segment de ligne) (Figure
B.1a), ou bien encore par un point m et un vecteur directeur ݑ (Figure B.1b). Une autre
possibilité se réfère à la représentation de Plücker d’une ligne, c’est-à-dire celle par deux
vecteurs perpendiculaires ሺݑ, ݀ሻ de telle sorte que ݑ soit le vecteur directeur unitaire et le
vecteur ݀ soit perpendiculaire au plan passant par cette ligne et l’origine (Figure B.1c). Le
vecteur ݀ est alors le produit vectoriel de deux vecteurs ݑ et ݉ (point arbitraire sur la ligne
ܮ). Cette dernière définition a été employée par les auteurs afin de dériver la solution
analytique d’une transformation rigide - la combinaison d’une rotation ሺܴሻ suivie d’une
translation ሺܶሻ.
Figure B.1 Différentes représentations d'une ligne 3D 158
Admettons que ሺݑ, ݀ሻ sont les paramètres de segments à transformer et que ሺݑᇱ
, ݀ᇱ
ሻ ceux de
segments de référence, la relation entre les entités linéaires s’écrit alors :
ݑᇱ ൌ ܴݑ (B.1)
݀ᇱ ≜ ݑᇱ
˄ ݉ᇱ ൌ ܴ݀ ݑᇱ
˄ ܶ (B.2)
En conséquence, nous insistons sur le fait que les segments transformés doivent être
parallèles aux segments de référence. L’estimation des inconnues de pose aboutit à envisager
deux sous-problèmes distincts.
Rotation
Tout d’abord, la matrice de rotation ሺܴሻ est déterminée par minimisation de la fonction (B.3)
qui bénéfice seulement de l’orientation de toutes les paires de segments ሺݑ, ݑ
ᇱ
ሻ.
ݑ‖݊݅ܯ ሺܴሻ ൌݎݎܧ
ᇱ െ ܴݑ‖ଶ
ே
ୀଵ
(B.3)
Évidemment, l’appariement créé se traduit implicitement par le système d’indiçage ce qui
veut dire que: pour tout i, la ligne ሺݑ, ݀ሻ correspond à la ligne ሺݑ
ᇱ
, ݀
ᇱ
ሻ. Tous les calculs sont
adaptés à la rotation représentée par un quaternion unitaire q ൌ ሾλ, λଵ, λଶ, λଷሿ୲
.
Étant donné que le produit Ru peut être également exprimé comme la multiplication des
quaternions (∗) et que ‖ݍ‖ ൌ 1, la formule (B.3) est modifiée en (B.4) :
(ത (B.4ݍ ∗ ݑ ∗ ݍ ൌ ݑܴ
où ݍത symbolise le conjugué du quaternion, par définition, obtenu en conservant sa partie
scalaire et en prenant l’opposé de sa partie vectorielle. La fonction à minimiser prend alors la
forme suivante :
ݑ‖݊݅ܯ ሺܴሻ ൌݎݎܧ
ଶ‖ݑ∗ݍെݍ∗ ᇱ
ே
ୀଵ
(B.5)
Se référant à la définition du produit de deux quaternions l’expression ݑ
peut ݑ∗ݍെݍ∗ ᇱ
être remplacée par une fonction linéaire ܣݍ telle que :
ܣ ൌ ቈ 0 ሺݑ െ ݑ
ᇱ
ሻ௧
ݑ െ ݑെሺ
ᇱ
ሻ ൫ݑప ݑప ෩ᇱ
൯
ସ௫ସ
(B.6)
où la notation ݑ signifie la matrice antisymétrique créée pour le vecteur ݑ ൌ ሾݔ, ݕ, ݖሿ௧ selon la
formule (B.7).
ݕ ݖൌ 0 െ ݑ
ݔ0 െ ݖ
െݕ ݔ 0 ൩ (B.7)
Avec toutes ces informations, l’équation (B.5) s’exprime finalement de la manière suivante : Annexe B. Méthode EIGEN
159
ܣ௧ݍ ݊݅ܯ ሺܴሻ ൌݎݎܧ
௧
ܣ
ே
ୀଵ
ݍ ൌ ܯ݅݊ሺݍ௧ݍܣሻ (B.8)
où la matrice symétrique ܣ ൌ ∑ ܣ
௧
ܣ
ୀଵ est calculée progressivement pour chaque paire de
segments.
Le vecteur propre de la matrice ܣ convenant à la plus petite valeur propre est le quaternion
ݍ ൌ ሾߣ, ߣଵ, ߣଶ, ߣଷሿ௧ qui représentera la rotation optimale. En revanche, il existe toujours deux
quaternions correspondant à la rotation. Ce constat n’est pas surprenant puisque la rotation
autour de l’axe ݑ et d’angle ߠ et la même que celle de l’axe « െݑ » et d’angle 2ߨ െ ߠ.
Néanmoins, dans la plupart de cas, la rotation ne dépasse presque jamais ߨ. Nous pouvons
alors présumer que le premier élément du quaternion (composante réelle) doit être positif. La
matrice orthogonale correspondant à la rotation au moyen du quaternion unitaire est donnée
par :
ߣൌܴ
ଶ ߣଵ
ଶ െ ߣଶ
ଶ െ ߣଷ
ଶ 2ሺߣଵߣଶ െ ߣߣଷሻ 2ሺߣଵߣଷ ߣߣଶሻ
ߣ ଷሻߣߣ ଶߣଵߣ2ሺ
ଶ െ ߣଵ
ଶ ߣଶ
ଶ െ ߣଷ
ଶ 2ሺߣଶߣଷ െ ߣߣଵሻ
ߣ ଵሻߣߣ ଷߣଶߣଶሻ 2ሺߣߣ ଷ െߣଵߣ2ሺ
ଶ െ ߣଵ
ଶ െ ߣଶ
ଶ ߣଷ
ଶ
(B.9)
Translation
Une fois la rotation calculée, la détermination de la translation ܶ est assez aisée. Sachant que
tous les paramètres de segments sont des constantes, et que seulement les trois composants
de vecteur ܶ sont des variables, le calcul de ceux-ci s’effectue par la méthode des moindres
carrés, ce qui revient à minimiser :
ݎݎܧሺܶሻ ൌ ܯ݅݊‖݀
ᇱ െ ܴ݀ െ ݑ
ᇱ ˄ ܶ‖ଶ
ே
ୀଵ
(B.10)
La dérivée partielle selon ܶ de l’équation (B.10) amène à la formule suivante :
2൫݀
ᇱ െ ܴ݀ െ ݑప ෩ᇱ
ܶ൯௧
ݑ
ᇱ ൌ 0
ே
ୀଵ
(B.11)
dont la solution est :
ܶ ൌ ൭ ݑప ෩ᇱ
൫ݑప ෩ᇱ
൯
௧
ே
ୀଵ
൱
ିଵ ቌ൫ݑప ෩ᇱ
൯
௧
ே
ୀଵ
ሺ݀
ᇱ െ ܴ݀ሻቍ (B.12)161
Annexe C
Méthode ICL(forme ICP)
0. Méthode ICL(forme ICP)
La méthode ICL (forme ICP) suit les mêmes étapes que l’approche EIGEN. Elle cherche à
résoudre deux tâches : le problème non linéaire de rotation et celui linéaire de translation.
Mais, nous observons une différence au niveau de représentation des segments et de calcul
du vecteur de translation. Chaque droite de l’ensemble ܣ est décrite par sa forme
paramétrique ሺ, ݒሻ où symbolise un point aléatoire de la droite et ݒ son vecteur directeur
unitaire. Pareillement, les segments de référence ܯ sont caractérisés par ሺ
ᇱ
ݒ ,
ᇱ
ሻ.
Rotation
La matrice de rotation est calculée à partir de direction de toutes les paires de lignes ሺݒ, ݒ
ᇱ
ሻ.
La fonction d’erreur à minimiser est tout à fait similaire à la formule (B.3). La solution par
moindres carrés d’un tel système non linéaire d’équations avait été aussi proposée par [Arun
et al., 1987]. Il s’agit de mettre en œuvre la décomposition en valeurs singulières (SVD) de la
matrice de covariance croisée ∑௩௩ᇲ formée pour l’appariement composé de ܰ paires de
segments comme suit :
ൌ 1
௩௩ᇲ ܰሺݒ െ ݒ̅ሻሺݒ
ᇱ െ ݒഥᇱሻ௧
ே
ୀଵ
(C.1)
Sachant que les vecteurs ݒ̅ et ݒ
ഥᇱ
sont les centres de masse qui valent respectivement :
ଵ ≜̅ݒ
ே ∑ ݒప ሬሬሬԦ ே
ୀଵ et ݒ
ഥᇱ ≜ ଵ
ே ∑ ݒప ே ሬሬሬԦᇱ ୀଵ
(C.2)
nous arrivons à la formule suivante :
ൌ 1
ܰቀݒప ሬሬሬԦ ൫ݒప ሬሬሬԦᇱ
൯
௧
ݒሺ̅ݒ െ
ഥᇱሻ௧ቁ
ே
ୀଵ ௩௩ᇲ
(C.3)
La décomposition de matrice carrée (3x3) ∑௩௩ᇲ s’écrit :
ൌ ܷܸܵ௧
௩௩ᇲ
(C.4)162
où la matrice ܵ contient les valeurs singulières de la matrice ∑௩௩ᇲ , et les matrices ܷ et ܸ
comprennent chacune un ensemble de vecteurs orthonormés. Ceci nous permet de calculer la
matrice de rotation d’une manière simple :
ܴ ൌ ܸܷ௧ (C.5)
Translation
Dès que la rotation ܴ est déterminée, le vecteur de translation ܶ peut être calculé par les
moindres carrés. À cet effet, deux points quelconques ሺܽ, ܾሻ appartenant à i-ème droite de ܣ,
mais aussi leurs points homologues ሺܽ
ᇱ
, ܾ
ᇱ
ሻ de ܯ, sont utilisés. Leurs positions sur les droites
respectives sont déterminées grâce à l’équation paramétrique :
ܽ ൌ ݐଵݒ et ܾ ൌ ݐଶݒ (C.6)
ܽ
ᇱ ൌ
ݒଷݐ ᇱ
ᇱ
et ܾ
ᇱ ൌ
ݒସݐ ᇱ
ᇱ (C.7)
Puisque ሺ
ᇱ
ݒ ,
ᇱ
ሻ caractérisent une ligne de référence ܯ (immobile), la correspondance avec
son homologue fournit également la contrainte :
൜
ݒଷݐ ᇱ
ᇱ ൌ ܴሺ ݐଵݒሻ ܶ
ݒସݐ ᇱ
ᇱ ൌ ܴሺ ݐଶݒሻ ܶ
(C.8)
Allons plus loin, la formule (C.8) est substituée par :
ە
ۖ
ۖ
۔
ۖ
ۖ
൭ۓ
ᇱݔ
ᇱݕ
ᇱݖ
൱ݐଷ ቌ
௫ݒ
ᇱ
௬ݒ
ᇱ
௭ݒ
ᇱ
ቍൌܴቆݔ
ݕ
ݖ
ቇݐଵܴ ൭ݒ௫
௬ݒ
௭ݒ
൱ቌܶ௫
ܶ௬
ܶ௭
ቍ
൭
ᇱݔ
ᇱݕ
ᇱݖ
൱ݐସ ቌ
௫ݒ
ᇱ
௬ݒ
ᇱ
௭ݒ
ᇱ
ቍൌܴቆݔ
ݕ
ݖ
ቇݐଶܴ ൭ݒ௫
௬ݒ
௭ݒ
൱ቌܶ௫
ܶ௬
ܶ௭
ቍ
(C.9)
Cela permet aussi de l’écrire sous la forme matricielle d’un système linéaire ܣܺ ൌ ܮ possédant
sept inconnues, dont trois composants du vecteur de translation et quatre variables :
ۉ
ۈ
ۈ
ۈ
ۇ
ݔݒെ ܴݔݒ
′ 0 0 100
ݕݒെ ܴݕݒ
′ 0 0 010
ݖݒെ ܴݖݒ
′ 0 0 001
0 0ݔݒܴ െݔݒ
′ 100
0 0ݕݒܴ െݕݒ
′ 010
0 0ݖݒܴ െݖݒ
ی001 ′
ۋ
ۋ
ۋ
ۊ
ᇣᇧᇧᇧᇧᇧᇧᇧᇧᇧᇧᇧᇤᇧᇧᇧᇧᇧᇧᇧᇧᇧᇧᇧ6݊ݔ7ᇥ
ۉ
ۈ
ۈ
ۈ
ۇ
1ݐ
3ݐ
2ݐ
4ݐ
ݔܶ
ݕܶ
یݖܶ
ۋ
ۋ
ۋ
ۊ
ᇣᇧᇤᇧ7ݔ1ᇥ
=
ۉ
ۈ
ۈ
ۈ
ۇ
ܴݔ െ ′ݔ
ܴݕ െ ′ݕ
ܴݖ െ ′ݖ
ܴݔ െ ′ݔ
ܴݕ െ ′ݕ
یܴݖ െ ′ݖ
ۋ
ۋ
ۋ
ۊ
ᇣᇧᇧᇧᇤᇧᇧᇧ6ݔ1ᇥ
(C.10)
où :
൭
ோݔ
ோݕ
ோݖ
൱ൌܴቆݔ
ݕ
ݖ
ቇ et ൭
௫ோݒ
௬ோݒ
௭ோݒ
൱ൌܴ൭ݒ௫
௬ݒ
௭ݒ
൱ (C.11)
La résolution du système revient alors à chercher les inconnues ܺ satisfaisantes
simultanément toutes les équations de la formule (C.10). Ainsi, ܺ ൌ ሺܣ௧ܣሻିଵܣ௧ܮ.163
Annexe D
Méthode FMII
0. Méthode FMII
Dans nos travaux, nous nous intéressons tout particulièrement à la variante FMII
permettant de résoudre le problème du recalage de deux jeux de lignes, dont les entités
linéaires de référence (Model) sont finies et celles à recaler (Image) infinies. Ce choix peut
s’expliquer, conformément à [Kamgar-Parsi et Kamgar-Parsi, 2004], par le fait que le
FMFI, conçu pour les segments de ligne, risque d’échouer si le segment plus court d’une
paire n’est pas complètement inclus dans son homologue. Dans un cas général, cette
approche n’est pas exploitable puisque les segments provenant de différentes sources ne se
chevauchent souvent que partiellement. L’alternative serait plutôt de remplacer des
segments Image par des lignes et de suivre, par la suite, des démarches envisagées pour la
procédure FMII, comme nous l’expliquerons au fur et à mesure dans cette section.
Étant donné deux ensembles d’entités linéaires, de telle sorte que ܣ ൌ ሼܣଵ,…,ܣ,…,ܣேሽ
comprend des segments de référence (Model) par rapport auxquels des lignes Image
ܺ ൌ ሼܺଵ,…,ܺ,…,ܺேሽ seront déplacés, la représentation de chacun des éléments est la
suivante :
ܣ ൌ ሺܽ, ݒ, ܮሻ et ܺ ൌ ሺݔ, ݒ
ᇱ
ሻ (D.1)
où :
ܽ : milieu du segment Model
ݒ et ݒ
ᇱ : vecteur directeur unitaire de la ligne Model et Image
x୧ : point de la ligne Image le plus proche de l’origine ce qui implique ݔ
௧
ݒ
ᇱ ൌ 0
ܮ : longueur du segment Model
Les lignes Image seront désormais considérées comme illimitées.
Distance entre les segments de longueur identique
Comme il a déjà été démontré (Chapitre 5), le calcul de la distance entre deux jeux de
segments 3D n’est pas trivial. Pour leur part [Kamgar-Parsi et Kamgar-Parsi, 2004], la
définissent comme la somme des carrés des distances obtenues entre les points
correspondants appartenant à ܣ et ܺ. Ces derniers sont considérés comme les points ayant la
même distance ݑ par rapport à des points de départ admis. La Figure D.1 illustre deux
segments de longueur identique ܮ pour lesquels les points correspondants et ݍ ont été
définis à l’égard de leurs milieux ܽ et ݔ. 164
Figure D.1 Choix des points correspondants p et q par rapport aux milieux a et x
(Illustration reproduite à partir de [Kamgar-Parsi et Kamgar-Parsi, 1997])
Envisageant ce cas, nous pouvons utiliser la variable ݑ, de sorte que െܮ/2 ݑ ܮ/2, pour
paramétrer les segments ܣ et ܺ. Nous notons les coordonnées de points correspondants :
ᇱݒݑ ݔ ൌ ݍ et ݒݑ ܽ ൌ
. D’où, le carré de la distance Euclidienne entre ces deux points se
calcule :
ܦଶሺݑሻ ൌ ‖ሺܽെݔሻ ݑሺݒെݒᇱ
ሻ‖ଶ (D.2)
ce qui amène à la formule suivante :
ܯሺܣ, ܺሻ ൌ න ݀ܦݑଶሺݑሻ ൌ ܮ‖ܽ െ ݔ‖ଶ
ܮ
ଷ
6 ሺ1െݒ
௧
ݒ
ᇱ
ሻ
/ଶ
ି/ଶ
(D.3)
Nous en ressortons que la distance M(A,X) dépend de l’orientation des lignes, mais aussi de
l’écartement entre leurs milieux. Par conséquent, sa valeur est nulle, si est seulement si, les
deux segments sont parallèles et leurs milieux coïncident.
Étant donné que chaque ensemble est composé de ܰ segments correspondants, la distance
mesurée entre eux s’exprime par l’équation (D.4).
ܯሺܣ, ܺሻ ൌܯሺܣ, ܺሻ ൌ ቈܮ‖ܽ െ ݔ‖ଶ
ܮ
ଷ
6 ሺ1െݒ
௧
ݒ
ᇱ
ሻ
ே
ୀଵ
ே
ୀଵ
(D.4)
Admettons que les segments Model ሺܣሻ sont fixes, nous souhaitons, dans un premier temps,
tourner les segments ܺ et ensuite les déplacer. C’est pourquoi, la nouvelle position de
segment après la transformation Ƭ, consistant en rotation ܴ suivie par la translation ܶ, est
suivante :
൜
ݔܴ ܶ ൌ ݔ
ݒ
ᇱ ൌ ܴݒ
ᇱ (D.5)
La distance entre les segments transformés peut être remplacée par :
ܯሺܣ, ܺሻ ൌܯሺܣ, ܺሻ ൌ ቈܮ‖ܽ െ ܶ െ ܴݔ‖ଶ
ܮ
ଷ
6 ሺ1െݒ
௧
ݒ
ᇱ
ሻ
ே
ୀଵ
ே
ୀଵ
(D.6) Annexe D. Méthode FMII
165
Distance entre les segments de longueur différente
La définition introduite (D.6) a été modifiée par les auteurs afin qu’elle soit susceptible d’être
employée pour les lignes – finies et infinies. Nous passons donc à présenter l’approche FMII
dédiée au cas mixte, où les segments sont définis par la formule (D.1). Sachant que, quel que
soit le point ܽ ∈ ܣ, il existe sur la ligne ܺ son homologue ݔ ݏݒ
ᇱ pour ݏ ∈ Թ, la distance
ܦሺܣ, ܺሻ entre ces deux points correspondants se calcule, conformément à la formule (D.3),
comme :
ݒݏ ݔ , ݒݑ ܽሺݐݏ݅݀ ∙ ݑ݀ ሻ ൌ නܺ ,ܣሺܦ
ݒݑ ᇱ
ᇱ
ሻ
Ω
(D.7)
où :
ݑ : scalaire caractérisant la droite (équation paramétrique)
Ω : chevauchement entre les segments
݀݅ݐݏ : fonction de distance employée (distance Euclidienne)
Nous limitons le calcul de la distance ܦሺܣ, ܺሻ à la partie de chevauchement entre les
segments. Cet intervalle étant défini par Ω, nous l’attribuons la longueur ܮ, puisque
seulement les entités linéaires ܣ sont finies.
Compte tenu de la transformation Ƭ de l’ensemble Image, la distance mesurée s’exprime de la
manière suivante :
ܯሺܣ, Ƭܺሻ ൌ ܦሺܣ, Ƭܺሻ
ே
ୀଵ
(D.8)
afin d’être finalement déterminée, par la norme euclidienne L2 selon la formule ci-dessous :
ܯሺܣ, Ƭܺሻ ൌ ሾܮ ‖ܽ െܶെܴሺݔ ݏݒ
ᇱ
ሻ‖ଶ ܮ
ݒଷሺ1െ
௧
ݒܴ
ᇱ
ሻ/6ሿ
ே
ୀଵ
(D.9)
Rotation
L’estimation de la transformation rigide dans la procédure d’alignement de segments
consiste à minimiser leur distance réciproque ܯሺܣ, Ƭܺሻ sur tous les Ƭ et ሼݏሽ possibles. La
solution proposée s’avère autour du problème d’optimisation non-linéaire, résolue grâce à la
technique itérative, d’un système à ሺ6ܰሻ variables avec six paramètres de la
transformation rigide et N variables pour identifier les points correspondants. La complexité
de l’algorithme est ܱሺܰሻ, alors il est considéré comme rapidement exécutable.
Lorsqu’on minimise la distance en fonction de ܴ, ܶ et l’ensemble ሼݏሽ, il faut résoudre
l’équation ߲ܯ ߲ݏ ⁄ ൌ 0, ce qui nous amène à calculer le paramètre shift ݏ ∈ Թ selon la formule
(D.10).
ݏ ൌ ሺܽ െ ܶሻ௧ܴݒ
ᇱ
en supposant que ሺܴݔሻ௧ܴݒ
ᇱ ൌ ݔ
௧
ݒ
ᇱ ൌ 0 (D.10)
En remplaçant, dans la formule (D.9), la translation ܶ calculée selon l’équation (D.18), nous
pouvons obtenir la mesure de distance se référant uniquement à la rotation ܴ :
ܯሺܣ, Ƭܺሻ ൌܮ ቆ‖ܽప
́‖ଶ ‖ݔప
́‖ଶ
ܮ
ଶ
6 ቇെ2ܮ ቆܽ́
௧
పݔܴ
́
ܮ
ଶ
ݒ 12
௧
ݒܴ
ᇱ
ቇ
ே
ୀଵ
ே
ୀଵ
(D.11)166
où :
ܽప
́ ൌ ܽ െ ܽത et ݔప
ݒݏ ݔ ൌ ́
′ െ ݔ̅ (D.12)
Le premier composant de la formule (D.11) est constant puisqu’il ne dépend pas de la matrice
de rotation ܴ. Afin de minimiser la distance M(A,ƬX), il est nécessaire de maximaliser la
seconde somme. Pour ce faire, la matrice de covariance croisée ∑, est créée entre les
segments correspondants de la manière suivante :
ൌሾܮሺܽ െ ܽതሻሺݔ ݏݒ
ᇱ െ ݔ̅ሻ௧ ܮ
ݒሺݒଷ
ᇱ
ሻ௧
/12ሿ
ே
ୀଵ ,
(D.13)
où les centres de masse ܽത et ݔ̅ sont donnés par la formule (D.14).
ܽത ൌ ଵ
ܽܮ ∑ ௐ
ே
ୀଵ et ݔ̅ൌ ଵ
݅ݒ݅ݏ ݅ݔሺ݅ܮ ∑ ௐ
′
ሻ ܰ
݅ൌ1 pour ܹ ൌ ∑ ܮ
ே
ୀଵ
(D.14)
La matrice de rotation est représentée par un quaternion unitaire ce qui nécessite, dans un
premier temps, de former la matrice symétrique ܥସ௫ସ dont les éléments sont définis à partir
de ∑, .
ܥଵଵ ൌ ∑ଵଵ ∑ଶଶ ∑ଷଷ ; ܥଵଶ ൌ ܥଶଵ ൌ ∑ଶଷ െ ∑ଷଶ ;
ܥଵଷ ൌ ܥଷଵ ൌ ∑ଷଵ െ ∑ଵଷ ; ܥଵସ ൌ ܥସଵ ൌ ∑ଵଶ െ ∑ଶଵ ;
ܥଶଶ ൌ ∑ଵଵ െ ∑ଶଶ െ ∑ଷଷ ; ܥଶଷ ൌ ܥଷଶ ൌ ∑ଵଶ ∑ଶଵ ;
ܥଶସ ൌ ܥସଶ ൌ ∑ଷଵ ∑ଵଷ ; ܥଷଷ ൌ ∑ଶଶ െ ∑ଷଷ െ ∑ଵଵ ;
ܥଷସ ൌ ܥସଷ ൌ ∑ଶଷ ∑ଷଶ ; ܥସସ ൌ ∑ଷଷ െ ∑ଵଵ െ ∑ଶଶ ;
(D.15)
Ensuite, les quatre valeurs propres de la matrice ܥ sont calculées en tant que solution
analytique. Le vecteur propre correspondant à la plus grande valeur propre représente la
rotation optimale ܴ exprimée en quaternion unité ݍ ൌ ሾߣ, ߣଵ, ߣଶ, ߣଷሿ௧. Le passage entre le
quaternion et la matrice de rotation traditionnelle est réalisé selon l’équation (B.9).
Nous pouvons aussi envisager une autre solution consistant à employer la SVD. Étant donné
que la seconde somme de la formule (D.11) doit être maximisée pour minimiser tout terme,
nous arrivons à obtenir :
́ܽቆ ܮ
௧
పݔܴ
́
ܮ
ଶ
ݒ 12
௧
ݒܴ
ᇱ
ቇ ൌ ݎݐܽܿ݁൫ߑ,ܴ௧
൯
ே
ୀଵ
(D.16)
Par conséquent, la décomposition en valeurs singulières de ∑, amène à calculer la rotation
ܴ. Pour plus de détails le lecteur pourra se référer à [Kamgar-Parsi et Kamgar-Parsi, 1997].
Translation
Dès que la rotation est déterminée, le vecteur de translation ܶ peut être retrouvé en
minimisant la formule (D.9). Pour y arriver, la dérivée partielle de ܯሺܣ, Ƭܺሻ par rapport à la
variable ܶ est calculée : Annexe D. Méthode FMII
167
ܯ߲
߲ܶ
ൌ െ2 ܮ
݁Ԧ
௧ሺܽ െ ܶ െ ܴݔሻ ൌ 0 (D.17)
Les équations ci-dessus étant linéaires, nous procédons alors à la résolution :
ܶൌܽത െ ܴݔ̅ (D.18)
Vu que les paramètres shift ሼݏሽ sont inconnus, les calculs des paramètres optimaux de
transformation Ƭ seront effectués de manière itérative jusqu’à ce que le changement de
valeurs ሼݏሽ ne dépasse plus un certain seuil. Le schéma récapitulatif à suivre est illustré par
la Figure D.2.
Figure D.2 Schéma général de l’approche
*Valeurs initiales recommandées pour tous les ݏ sont des zéros.
Les tests effectués par [Kamgar-Parsi et Kamgar-Parsi, 2004] montrent que le nombre
d’itérations ݐܫ݁ݎ est fortement lié à la précision désirée et oscille, pour un seuil de
convergence égal à 10-3 (valeur adimensionnelle), entre trois et vingt.
.169
Annexe E
Pseudo-codes
0. Pseudo-codes
Pseudo-code 4.1: Détection de plans via RANSAC
Entrée: ܰ : nuage de points Paramètres : ܲ : probabilité
ߪ : écart-type de bruit
ܰ : nombre de plans
1 Début
2 Initialiser des variables : ܥܧ ← 0; ܰ௧ ← ∞; ݅ ← 1; ܲ; ߪ
3 PourChaque ݆ ← 1: ܰ Faire
4 Seuil :ߜଶ ← ߪଶܨఞమ
మ
ିଵሺܲሻ
5 TantQue ݅ܰ௧ Faire
6 S ← Choisir aléatoirement un échantillon ݇ൌ3 de ܰ
7 Estimer le modèle: ܯሺߠሻ
8 Distance au modèle: ݀←݁ெ൫, ܯሺߠሻ൯
9 Si ݀ଶ ߜଶ Alors
10 Retour ܥܧ
11 FinSi
12 Mettre à jour le nombre d'itérations: ܰ௧ ← ݈݃ሺ1െܲሻ/݈݃ሺ1െݍሻ
13 pour ݍ ൌ ൫ܥܽݎ݀ሺܥܧሻ/ܥܽݎ݀ሺܰሻ൯
ଷ
14 Meilleur plan: ܥܧ ൌ ݉ܽݔሺܥܧሻ
15 Incrémenter: ݅←݅1
16 FinTantQue
17 CC ← Analyser des composantes connexes d’EC (Pseudo-code 4.2)
ܥܥ ;ߠ 18 Retour
19 ܰ ← ܰ െ ܥܥ
20 FinPour
21 Fin170
Pseudo-code 4.2: Détection et étiquetage des composantes connexes
Entrée: N : nuage de points Paramètres : ρ: rayon de sphère
k: nombre de points voisins
ܰ: nombre minimal de points
d’une composante connexe ܥܥ
1 Début
2 PourChaque point De ܰ Faire
3 Établir le voisinage ܸ de en respectant les seuils imposés (ρ et K)
4 Générer la matrice creuse ܣ de ܯ paires de points voisins
5 FinPour
6 Décomposition de Dulmage-Mendelsohn de A : dmperm(A)=[P,Q,r,s]
7 PourChaque colonne ݆ ൌ 1: |ݎ| െ 1 De vecteur d'indices r Faire
8 Étiqueter des composantes connexes ܥܥ
9 Si หܥܥหܰ Alors
10 Calculer la surface ܵ de ܥܥ
11 SinonSi CCj est trop petite Alors
12 ܵ ← 0
13 FinSi
14 Conserver la plus grande composante connexe ܥܥ
15 FinPour
16 FinAnnexe E. Pseudo-codes
171
Pseudo-code 4.3: Extraction d’arêtes de pli
Entrée: ∏ : paramètres associés au plan Paramètres: ܶொ : Seuil poids Q
ܵܲ : segment plan ܶ௦:longueur minimale d'une arête
ܶ : tolérance distance
1 Début
2 ܲ ← Générer toutes les combinaisons possibles à partir de l’ensemble de plans ∏
3 {Phase 1 : Tester l’angle β entre deux plans quelconques}
4 PourChaque paire ∏j et ∏k De ܲ Faire
5 Calculer l'angle β
6 ܳ ൌ ݏ݅݊ଶߚ
7 Si ܳܶொ Alors
8 Rejeter la paire de la liste ܲ
9 FinSi
10 FinPour
11 {Phase2: Tester si deux plans de ܲ sont voisins}
12 PourChaque paire ܵܲ et ܵܲ De ܲ Faire
13 ݀ ← Calculer la distance entre deux plans
14 Si ݀ܶ Alors
15 ܫ ← Déterminer la droite d'intersection
16 ܵ ← projeter ܵܲ sur ܫ
17 ܵ ← projeter ܵܲ sur ܫ
18 {Phase3: Tester si les segments ܵ et ܵ se chevauchent}
19 Si ฮܯܯฮ หܮ/2 െ ܮ/2ห Alors
20 Conserver le segment de droite (ܵܦ) de longueur ܮ ൌ min ሺܮ, ܮሻ si ܮܶ௦
21 SinonSi ฮܯܯฮ หܮ/2 ܮ/2ห Alors
22 Conserver ܵܦ de longueur ܮൌܮ ∩ ܮ si ܮܶ௦
23 SinonSi
24 Rejeter ܵܦ
25 FinSi
26 FinSi
27 FinPour
28 Fin172
Pseudo-code 5.1: Qualification à partir d'entités linéaires
Entrée : ்ܺ௦௧ : coordonnées des segments ܶ݁ݐݏ Paramètres: ܷ : sensibilité
ܺௌ : coordonnées des segments ܯ݈݀݁
ݎܥ ;ܦܪܮ ;்ெܦܪܮܱ ;ெ்ܦܪܮܱ : Sortie
1 Début
2 ܷ ← 0.5
3 ܶ݁ݐݏ ← ்ܺ௦௧; ܯ݈݀݁ ← ܺௌ;
4 PourChaque Segment ݅ ∈ 〈1; ܰ〉 De Test Faire
5 PourChaque Segment ݆ ∈ 〈1; ܯ〉 De Model Faire
6 Calculer les distances ݀ூூ; ݀ୄ; ݀ఈ
7 FinPour
8 FinPour
9 Créer la matrice de similarité ܵܯܫ de dimension ܰܯݔ
10 Créer l'appariement préliminaire ܵ contenant ܰ paires
11 ܦ݂݂݅ଵ ← ܵேାଵ െ ܵே
12 ܦ݂݂݅ଶ ← ܦ݂݂݅ଵೖశభ െ ܦ݂݂݅ଵೖ
13 Si ܥܽݎ݀ሺܦ݂݂݅ଵ ൏ ܷሻ ൌܰ1 Alors
14 ߜ ← max ሺܵሻ
15 SinonSi
16 ݅ܿ ←trouver le premier maximum local : ܦ݂݂݅ଶ ܷ
17 Si ݅ܿ ൌ Ø Alors
18 ߜ ← ݉é݀݅ܽ݊݁ሺܵሻ 2ߪ
19 SinonSi
20 ߜ ← ܵሺ݅ܿ 1ሻ
21 FinSi
22 FinSi
23 ݎܥ்ெ ← ሺܵܯܫ ߜሻ
24 Calculer ܱܦܪܮ்ெ
25 ܶ݁ݐݏ ← ܺௌ; ܯ݈݀݁ ← ்ܺ௦௧;
26 Reprendre les démarches de 4 à 24
27 Retour ݎܥெ்; ܱܦܪܮெ்
்ெݎܥ ∩ ெ்ݎܥ ← ݎܥ 28
29 ܦܪܮ ← max ሺܱܦܪܮ்ெ, ܱܦܪܮெ்ሻ
30 Fin Annexe E. Pseudo-codes
173
Pseudo-code 6.1: Recalage à partir d'entités linéaires
Entrée : ܺܶ݁ݐݏ : coordonnées des segments ܶ݁ݐݏ Paramètres: ߪ : écart-type de bruit
ܺௌ : coordonnées des segments ܯ݈݀݁ ݇ : échantillon minimal
ݎܥ ;ܶ ;ܴ : Sortie
1 Début
2 Initialiser des variables ܰூ_ௗ௧ ← 0; ܰ௧ ← 100; ݅ ← 1; ߝ ← 1݁ െ 6; ݇; ߜ ← 5.8ߪ
3 ܣ,ܰ← Créer l'appariement préliminaire entre ்ܺ௦௧ et ܺௌ (Pseudo-code 5.1)
4 TantQue ݅ܰ௧ Faire
5 ܵ ← Tirer aléatoirement un échantillon ݇ de ܣ
6 ܴ, ܶ ← Calculer les paramètres de transformation rigide par ܫܫܯܨଶ à partir de ܵ
7 Recaler ்ܺ௦௧ et ܺௌ : ்ܺ௦௧_ௗ௧ ൌ ்ܺ௦௧ ∙ ܴ ܶ
8 ݀ ← Calculer les distances entres les segments appariés ܣ (équation 5.10)
9 ܰூ ← ሺ݀ ߜሻ
10 Si ܰூ ܰூ_ௗ௧ Alors
11 ܴ ← ܴ
12 ܶ ← ܶ
13 ܰூ_ௗ௧ ൌ ܰூ
14 FinSi
15 Mettre à jour le nombre d'itérations : ݍ ← ሺܰூ/ܰሻ ; ܰ௧ ← ݈݃ሺߝሻ/݈݃ሺ1 െ ݍሻ
16 Incrémenter : ݅←݅1
17 FinTantQue
18 ܣ ← Créer l'appariement fin entre ்ܺ௦௧_ௗ௧ et ܺௌ (Pseudo-code 5.1)
19 ܴ, ܶ ← Calculer les paramètres des transformation rigide par ܫܫܯܨଶ à partir de ܣ
20 ܴൌܴ ∙ ܴ
21 ܶൌܴ ∙ ܶ ܶ
ܣ ← ݎܥ 22
23 Fin Qualification et amélioration de la précision de systèmes de balayage
laser mobiles par extraction d’arêtes
RESUME : Au cours de ces dernières décennies, le développement de Systèmes Mobiles de
Cartographie, soutenu par un progrès technologique important, est devenu plus proéminent
apparent. Il a été stimulé par le besoin grandissant de collecte d’informations géographiques
précises sur l’environnement. Nous considérons, au sein de cette thèse, des solutions pour
l’acquisition des nuages de points mobiles de qualité topographique (précision centimétrique). Il
s’agit, dans cette tâche, de mettre au point des méthodes de qualification des données, et d’en
améliorer les erreurs systématiques par des techniques d’étalonnage et de recalage adéquates.
Nous décrivons une nouvelle démarche d’évaluation de l’exactitude et/ou de la précision des
relevés laser mobiles. Celle-ci repose sur l’extraction et la comparaison des entités linéaires de
la scène urbaine. La distance moyenne calculée entre les segments appariés, étant la distance
modifiée de Hausdorff, sert à noter les nuages par rapport à des références existantes. Pour
l’extraction des arêtes, nous proposons une méthode de détection d’intersections entre
segments plans retrouvés via un algorithme de RANSAC enrichi d’une analyse de composantes
connexes. Nous envisageons également une démarche de correction de relevés laser mobiles
à travers un recalage rigide fondé, lui aussi, sur les éléments linéaires. Enfin, nous étudions la
pertinence des arêtes pour en déduire les paramètres de l’étalonnage extrinsèque du système
mobile. Nous testons nos méthodes sur des données simulées et des données réelles acquises
dans le cadre du projet TerraMobilita.
Mots clés : Nuage de points, Système Mobile de Cartographie, Exactitude, Précision, Arête,
Segmentation, Évaluation, RANSAC, Étalonnage, Calibrage, Mise en correspondance
Edge-based accuracy assessment and improvement of mobile laser
scanning systems
ABSTRACT : Over the past few decades, the development of Mobile Mapping Systems (MMS),
supported by significant technological progress, has become more prominent. It has been
motivated by the growing need for precise geographic information about the environment. In this
thesis, we consider approaches for the acquisition of mobile point clouds with topographic
quality (centimeter-level accuracy). The aim is to develop techniques for data quality
assessment and improvement. In particular, we eliminate the systematic errors inherent to an
MMS data using appropriate calibration and registration methods.
We describe a novel approach to assess the accuracy and/or the precision of mobile laser point
clouds. It is based on the extraction and comparison of line features detected within the urban
scene. The computed average distance between corresponding pairs of line segments, taking
advantage of a modified Hausdorff distance, is used to evaluate the MMS data with respect to a
reference data set. For edge extraction, we propose a method which relies on the intersections
between planes modelled via the RANSAC algorithm refined by an analysis of connected
components. We also consider an approach to correct point clouds using a line-based rigid
registration method. Finally, we study the use of edges for estimating the boresight angles of a
land-based mobile mapping system. We apply our methods to synthetic data and to real data
acquired as part of the TerraMobilita project.
Keywords : Point Cloud, Land-based mobile mapping system (MMS), Accuracy, Precision,
Edge, Segmentation, Assessment, RANSAC, Registration, Calibration, Matching
Collaboration de techniques formelles pour la
v´erification de propri´et´es de sˆuret´e sur des syst`emes de
transition
A. Champion
To cite this version:
A. Champion. Collaboration de techniques formelles pour la v´erification de propri´et´es de sˆuret´e
sur des syst`emes de transition. Databases. ISAE - Institut Sup´erieur de l’A´eronautique et de
l’Espace, 2014. French.
HAL Id: tel-01092412
https://hal.archives-ouvertes.fr/tel-01092412
Submitted on 8 Dec 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific
research documents, whether they are published
or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.Acknoledgments
First, I would like to thank my supervisors Rémi Delmas and Michael Dierkes for their
support, knowledge, time and energy. They provided me with the best environment I could
wish for. Everything I did during these last three years, I owe to them.
I also thank the reviewers, Daniel Le Berre and Cesare Tinelli, for taking the time to read
the manuscript and giving me constructive feedback, which lead to interesting discussions.
Many thanks to all the members of the jury: Yamine Aït Ameur for making the defense
possible and for his interest and insightful questions on my work; Virginie Wiels for making
this PhD possible at all, along with Rémi Delmas and Michael Dierkes; Steve Miller for flying
all the way to Toulouse, for his interest in my work, for his tricky questions on Boolean
differential calculus and for all his reviews on the manuscript; Viktor Kuncak for following
my work, and for the great discussions we had about both our research topics; Last, I thank
again Daniel Le Berre and Cesare Tinelli for taking the time to come to Toulouse and attend
the defense.
A few lines to thank the people close to me. I will only mention their names, the support
they gave me cannot be put into words. Thanks, love and apologies to Yves et Marie-Claire,
Claire, Yohann, X , Emy et Salomé, Tonton Chips, Rémi, Tof, Foufou, St Pouf, Étienne et
Maud et Chouquette.Contents
Extended Abstract (French) 1
1 Introduction 5
1.1 Cas d’Étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Notations et Notions Mathématiques . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Vérification de Systèmes de Transition . . . . . . . . . . . . . . . . . . . . . . . 12
2 Découverte d’Invariants 17
2.1 Élimination de Quantificateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Une Architecture Collaborative . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3 Découverte d’Invariants Potentiels par QE . . . . . . . . . . . . . . . . . . . . 29
2.4 Le Framework Formel Stuff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3 Conclusion 37
3.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.2 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
I Introduction 1
4 Problem 3
4.1 Lustre: A Synchronous Programming Language . . . . . . . . . . . . . . . . . 3
4.2 Safety Critical Avionics Systems Verification . . . . . . . . . . . . . . . . . . . 9
5 Mathematical Background and Notation 13
5.1 Many-Sorted First-Order Logic . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.2 SAT and SMT Solving . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
5.3 SMT: Standard, Implementations and Additional Features . . . . . . . . . . . 32
6 Transition Systems, State Invariant Verification 35
6.1 Transition Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
6.2 Bounded Model Checking and k-induction . . . . . . . . . . . . . . . . . . . . 39
6.3 Invariant Discovery and Other Techniques . . . . . . . . . . . . . . . . . . . . 476.4 Motivation and Outline of the Thesis . . . . . . . . . . . . . . . . . . . . . . . . 53
II Invariant Discovery Powered By Quantifier Elimination 55
7 SMT-Based Quantifier Elimination 59
7.1 Monniaux’s QE Algorithm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.2 Extension to Booleans and Integer Octagons . . . . . . . . . . . . . . . . . . . 60
7.3 Improving Extrapolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
7.4 Benchmarking Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
8 Invariant Discovery in a K-induction-based Framework 73
8.1 A Proof Engine Architecture Allowing Continuous Invariant Integration . . . 73
8.2 Invariant Discovery as a Quantifier Elimination Problem . . . . . . . . . . . . 75
8.3 Property Directed Reachability Modulo Theory . . . . . . . . . . . . . . . . . . 76
9 HullQe: QE And Convex Hull Computation 83
9.1 Extracting Potential Invariants From Pre-Images . . . . . . . . . . . . . . . . . 84
9.2 Exhaustive Exact Convex Hull Enumeration . . . . . . . . . . . . . . . . . . . 89
9.3 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
9.4 End-to-end Verification Of A Functional Chain . . . . . . . . . . . . . . . . . . 100
III The Stuff Formal Framework 103
10 Architecture and Transition System Representation 105
10.1 The Actor Formalism . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
10.2 Stuff: Architecture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
10.3 Stream Systems and Unrolling . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
11 Assumptio: an SMT-lib 2 Compliant Solver Wrapper 121
11.1 Overview . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
11.2 Architecture and Backend Solvers . . . . . . . . . . . . . . . . . . . . . . . . . 124
11.3 Source Code, User Manual and Integration in Stuff . . . . . . . . . . . . . . . . 127
IV Conclusion 129
12 Summary and Perspectives 131
12.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
12.2 Future Directions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13213 References 137
V Appendices 147
A Use Cases 149
A.1 The Rockwell Collins Triplex Voter . . . . . . . . . . . . . . . . . . . . . . . . . 149
A.2 A Reconfiguration Logic System . . . . . . . . . . . . . . . . . . . . . . . . . . 151List of Figures
1.1 A Single Computation Channel. . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Triple Channel Functional Chain. . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1 Règles de calcul de l’analyse structurelle. . . . . . . . . . . . . . . . . . . . . . 24
2.2 Une architecture collaborative basée sur la k-induction. . . . . . . . . . . . . . 28
2.3 Polyhedra examples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.4 ECH de polyhèdres entiers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5 Découverte d’invariant relationnels sur le système de reconfiguration. . . . . 32
2.6 Logique de vote en dimension deux. . . . . . . . . . . . . . . . . . . . . . . . . 34
2.7 Une chaîne fonctionnelle simplifiée. . . . . . . . . . . . . . . . . . . . . . . . . 35
4.1 A simple Lustre program. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
4.2 Network representation of the bounded node. . . . . . . . . . . . . . . . . . . 7
4.3 The observer pattern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4.4 Bounded liveness property as a safety property. . . . . . . . . . . . . . . . . . 9
4.5 A Single Computation Channel. . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.6 Triple Channel Functional Chain. . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.7 The shuffle mechanism. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
5.1 Push and pop example, assertion stack on the right. . . . . . . . . . . . . . . . 33
6.1 Reachable state space of SDC(4, 2), nodes show the values of x and y. . . . . 42
7.1 Activation conditions and cause propagation rules. . . . . . . . . . . . . . . . 66
7.2 Benchmark results part 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
7.3 Benchmark results part 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.4 Experimental results. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
8.1 k-induction based collaborative framework. . . . . . . . . . . . . . . . . . . . . 74
8.2 Asynchronous exact convex hull computation. . . . . . . . . . . . . . . . . . . 80
9.1 Polyhedra examples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
9.2 HullQe abstract view. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
9.3 Discovering new relations using convex hulls. . . . . . . . . . . . . . . . . . . 869.4 ECH calculation on the double counter with nx = 10 and ny = 6. . . . . . . . 86
9.5 Duplex voter equations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
9.6 Simple voting logic. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
9.7 Hullification redundancy issues. . . . . . . . . . . . . . . . . . . . . . . . . . . 93
9.8 View of HullQe internal processes. . . . . . . . . . . . . . . . . . . . . . . . . . 95
9.9 Reconfiguration subsystem with observer. . . . . . . . . . . . . . . . . . . . . . 96
9.10 Triplex voter equations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
9.11 Running example. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
10.1 Message handling. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
10.2 A code extract of the handleMessage function of the k-induction Method. . 112
10.3 Actor hierarchy in Stuff. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
10.4 A trace of a Stream System. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
10.5 Traces of the double counter system. . . . . . . . . . . . . . . . . . . . . . . . . 117
11.1 Hi-level view of user interaction and internal architecture. . . . . . . . . . . . 125PART
Extended Abstract (French)
Les systèmes critiques sont des systèmes dont les défaillances ont des conséquences catastrophiques
telles que la perte de vies humaines ou de fortes retombées économiques. On les
trouve typiquement dans des domaines tels que l’aérospatiale, l’aéronautique, l’automobile,
le ferroviaire, le nucléaire, les équipements médicaux, la conception de matériel informatique.
. . Il est donc d’un grand intérêt (i) d’établir une spécification précise de ces systèmes,
et (ii) de s’assurer de la correction du produit final par rapport à sa spécification, i.e. de
vérifier le produit final. L’étude présentée dans ce mémoire se concentre sur la vérification
de composants logiciels de systèmes critiques embarqués avioniques.
Il y a encore peu de temps, les industriels de notre domaine suivaient une approche dite
d’assurance qualité basée sur les processus. Cette approche consiste à examiner minutieusement
les processus menant à la création d’un produit. Si les processus sont jugés comme
étant de confiance, le produit final est également jugé de confiance. En avionique par exemple,
la conception ainsi que la production des composants matériels sont suivi de près au
niveau processus. Des échantillons sont ensuite préleés afin de tester leur cohérence avec la
spécification du produit.
Les récentes normes avioniques DO-178C –et sont supplément DO-333 concernant les
méthodes formelles– publiées par la RTCA1 – montrent une volonté de consolider cette approche
basée sur les processus, par une assurance qualité davantage basée sur les produits.
C’est à dire de vérifier mathématiquement l’adéquation entre le produit final et sa spécifi-
cation. Dans le domaine du logiciel, il existe des méthodes automatisables permettant de
prouver de telles propriétés. Ces méthodes mises au point par la communauté informatique
sont appelées méthodes formelles. Contrairement aux composants matériels, les logiciels sont
constitués de “0” et de “1” pouvant être dupliqués sans erreur, renforçant l’intérêt de les
vérifier.
Les systèmes critiques embarqués avioniques sont généralement développés au moyen
de language haut-niveau (niveau modèle) différant du language d’implémentation final
(niveau code). Les méthodes formelles fournissent des outils pour toutes les étapes du
1http://www.rtca.org/développement :
• la spécification formelle [71, 35] propose des languages à la sémantique mathématique
permettant d’exprimer ce que le système doit faire ;
• la vérification des modèles par rapport à leur spécification formelle [16, 17, 23, 55, 12, 6]
permettent de prouver que la spécification est respectée ;
• la génération de code à partir des modèles [13] produit du code respectant la sémantique
du language de conception haut-niveau, préservant ainsi l’effort de vérification
au moyen de compilateurs certifiés ou prouvés.
L’étude présentée dans ce mémoire se concentre sur la vérification automatique de mod-
èles. En effet, même si les organismes de certification encouragent leur utilisation, les méthodes
formelles ne sont pas capables à l’heure actuelle de résoudre les problèmes rencontrés
dans l’industrie. En pratique la vérification de propriétés fonctionnelles arbitraires sur des
systèmes réalistes demande souvent un travail d’expert autant sur le plan des systèmes
analysés que sur la (les) technique(s) employée(s). L’essort des méthodes formelles dans le
monde industriel est limité par ces interventions coûteuses financiérement et temporellement.
L’ambition de cette thèse est d’améliorer l’état de l’art de la vérification formelle dans
notre domaine d’application en (i) améliorant son automatisation sur des systèmes correspondant
à des patrons de conception rencontrés dans les systèmes avioniques ; (ii) trouvant
des preuves pouvant être rapidement vérifiées par différents outils afin d’assurer leur
véracité. Pour atteindre ces objectifs nous proposons d’étudier la collaboration de méthodes
formelles existantes –telles que la résolution SMT, la k-induction, l’élimination de quantificateurs,
etc.– afin d’introduire une méthodologie visant à la découverte automatique de
lemmes facilitant la conduite d’une preuve. De plus, cette étude s’intéresse en particulier
aux algorithmes parallèles, suivant la tendance actuelle des multi-cœurs.
Cette étude s’intéresse à l’analyse de systèmes réactifs embarqués [38]. Ces systèmes échantillonnent
leur environnement au moyen de capteurs, et calculent une commande destinée
à un actuateur. L’échantillonage est effectué à intervalles réguliers spécifiés par la fréquence
du système. Plus particulièrement nous considérons des composants logiciels de systèmes
réactifs, contribuant à la sûreté de chaînes fonctionnelles, i.e. de systèmes rassemblant des
capteurs, des unités de calcul en réseau, des actuateurs, etc.
Nous introduisons plus précisemment ces systèmes dans le Chapitre 1, dans lequel
nous introduisons également les notions sous-jacentes à leur représentation mathématique,
2ainsi que l’état de l’art en vérification formelle. Nous introduisons ensuite notre contribution
principale dans le Chapitre 2. Tout d’abord nous proposons des améliorations à
l’algorithme d’élimination de quantificateurs de Monniaux [56] permettant de calculer des
pré-images sur nos systèmes industriels. Nous exposons ensuite nos heuristiques de génération
d’invariants potentiels dans le cadre d’un framework collaboratif basé sur la k-induction,
et présentons nos expérimentation sur nos systèmes. La Section 2.4 présente Stuff2
, notre implémentation
de l’architecture et des techniques présentées en Section 2.2. Enfin, le Chapitre 3
conclut sur les résultats de l’étude et offre quelques éléments de perspective.
2
Suff’s The Ultimate Formal Framework
3CHAPTER 1
Introduction
Ce chapitre est un résumé en francais de la Partie I du mémoire. Comme mentionné
précédemment, l’aspect logiciel de ces systèmes est tout d’abord dévelopé au niveau modèle
avant que le code bas niveau destiné à des architectures temps réel ne soit généré automatiquement
en préservant la sémantique du modèle. Nous nous intéressons en particulier
au langage flot de données synchrone Lustre [36] décrit en détail dans le Chapitre 4.1. Un
modèle Lustre a une sémantique de système de transition dans lequel des calculs instantannés
sont effectués à une certaine fréquence afin de produire un signal de sortie en fonction
des signaux d’entrée. Nous présentons les systèmes auquels nous nous intéressons, appelés
chaînes fonctionnelles, en Section 1.1. Avant d’analyser un modèle Lustre, il est nécessaire
d’en extraire sa sémantique sous forme d’un système de transition. Ce chapitre présente,
en Section 1.2, les notions mathématiques nécessaires pour la représentation et l’analyse des
systèmes de transitions. La Section 1.3 présente l’état de l’art des méthodes s’intéressant à
leur vérification.
1.1 Cas d’Étude
La Figure 1.1 présente une chaîne de calcul correspondant à la fonction de “controle de
l’angle de tangage de l’avion”. Les capteurs sont tripliqués afin de réduire le taux de dé-
faillance de l’échantillonnage. Lors de chaque cycle, la chaîne échantillonne les capteurs de
Channel
Sensors
Order (x3)
Speed (x3)
Pitch (x3)
SMon
SMon
SMon
Voter
Voter
Voter
Law AMon Actuator
Figure 1.1: A Single Computation Channel.1.1 Cas d’Étude Introduction
Sensors
Order (x3)
Speed (x3)
Pitch (x3)
Channel1
Channel2
Channel3
Reconf
Reconf1
Reconf2
Reconf3
Actuator
Figure 1.2: Triple Channel Functional Chain.
vitesse (Speed), de tangage (Pitch) ainsi que la commande produite par le pilote (Order).
Des moniteurs de capteurs (SMon) examinent ces signaux afin de détecter des défaillances
temporaires ou permanentes, telles que des valeurs en dehors de l’intervalle légal du capteur.
Les signaux entrent ensuite dans un système de vote (Voter) chargé de produire un
signal unique à partir de ses trois entrées. Le bloc suivant est la loi de commande (Law) de
la chaîne qui calcule le signal commandant l’actuateur grâce à une unique valeur de vitesse,
tangage et d’ordre du pilote. Le signal passe ensuite par un moniteur d’actuateur (AMon)
s’assurant que la commande est correctement réalisée.
En pratique, les concepteurs de chaînes fonctionnelles tripliquent les canaux de calcul
afin de réduire davantage le taux de défaillance. Comme présenté sur la Figure 1.2, les
calculs sont effectués par trois chaînes redondantes évoluant sur des unités de calcul sé-
parées et communiquant au moyen de câbles distincts. Un mécanisme de reconfiguration
(Reconf) distribué sur les trois unités de calcul décide de la chaîne contrôlant effectivement
l’actuateur, et est capable de reconfigurer le système dans le cas où une chaîne est jugée
corrompue. Quels que soit les signaux produits par les différentes chaînes, la reconfiguration
doit s’assurer qu’aucune commande dangereuse pour l’actuateur ou pour l’avion n’est
produite par l’architecture tripliquée, et doit prévenir le pilote en cas de défaillance.
Il est à noter qu’une valeur de sortie incorrecte ne doit pas immédiatement faire basculer
le statut de la chaîne la produisant à “corrompue”. La défaillance peut n’être que temporaire,
par exemple à cause d’une perturbation électromagnétique causée par le passage de
la foudre à proximité de l’avion. C’est pourquoi la défaillance n’est considérée permanente
que si la valeur de sortie reste incohérente pendant plus de n cycles.
Les chaînes fonctionnelles sont donc des systèmes extrêmement complexes, et il en est
de même pour leur spécification [67]. La vérification de la partie logicielle d’une chaîne
fonctionnelle complète est donc d’une grande difficulté pour les outils actuels. Même en
suivant une approche modulaire, il loin d’être trivial de vérifier la correction des soussystèmes
séparément. L’objectif des travaux présentés dans ce mémoire est de fournir des
6Introduction 1.2 Notations et Notions Mathématiques
techniques génériques pour la vérification automatique de systèmes tels que ceux implé-
mentant la logique de vote, ou la logique de reconfiguration. Ces systèmes utilisent largement
l’arithmétique entière linéaire au travers des nombreux compteurs qu’ils utilisent pour
confirmer les défaillances et transférer le contrôle de l’actuateur d’une chaîne à une autre.
La logique de vote par exemple se doit de maintenir une certaine continuité dans les valeurs
qu’elle produit : la loi de commande est pensée pour des valeurs en accord avec le monde
réel et pourrait avoir un comportement imprévisible en cas de discontinuités irréalistes dans
ses signaux d’entrée. Plus précisemment nous nous focaliserons sur le “triplex voter”, un
système fourni par Rockwell Collins implémentant une logique de vote. Le code de ce système
est disponible dans l’annexe A. Les systèmes de loi de commande diffèrent du vote et
de la reconfiguration car ils sont basés sur des équations différentielles. Ils peuvent être nonlinéaires
ou n’être analysable qu’au moyen de méthodes non-linéaires et sortent du cadre de
cette étude.
1.2 Notations et Notions Mathématiques
1.2.1 Logique du Premier Ordre Multi-Sortée
La formalisation de la notion de système de transition s’appuie traditionellement sur le
système formel appelé logique du premier ordre1 multi-sortée, ou Many-Sorted First-Order
Logic (MSFOL), défini en Section 5.1 de façon similaire au standard SMT-LIB 2 [4]. MSFOL
permet de définir des logiques permettant à leur tour de construire des termes en combinant
des symboles dans le cadre de règles assurant le typage des expressions obtenues.
Syntaxe. Les symboles représentent des fonctions n’ayant pas d’interprétation fixée, mais
auquelles sont associées des rangsfaisant intervenir les types ou sortes autorisés par la logique.
Le symbole “+” par exemple aurait typiquement pour rangs (Int, Int) : Int et(Real, Real) :
Real. Le symbole “3”, respectivement “3.0”, peut avoir un unique rang () : Int, respectivement
() : Real. Les sortes sont des noms et n’ont pas non plus, à ce niveau, d’interprétation.
La notion de signature (Définition 5.1.1) déclare les sortes, les symboles, leurs rangs, ainsi
que les variables –sur lesquelles nous reviendrons un peu plus tard– composant la logique.
Les règles de typage définissent les termes légaux : avec les symboles et les rangs introduits
ci-dessus par exemple, le terme +(3, 3), c’est à dire “l’application du symbole + aux
symboles 3 et 3” est bien typé, de sorte Int. Le terme +(3, 3.0) au contraire n’est pas bien
typé. Dans la suite de ce mémoire, un terme sera toujours supposé bien typé, sauf indication
1Les lecteurs initiés à la logique du premier ordre remarqueront que nous ne mentionnerons quasiment pas
les quantificateurs dans cette section. En effet nous ne considérerons que des termes n’en utilisant pas par la
suite. Les quantificateurs sont formellement traités dans la Section 5.1 de la partie anglaise du mémoire.
71.2 Notations et Notions Mathématiques Introduction
contraire. Il est à noter qu’en pratique, on impose que toutes les signatures contiennent au
moins les sortes et les symboles –ainsi que leurs rangs– de la signature Core.
Core signature. Core est la signature composée du sorte Bool ainsi que des symboles et des
signatures
∨ (Bool, Bool) : Bool ∧ (Bool, Bool) : Bool ¬ (Bool) : Bool
> () : Bool ⊥ () : Bool = (Bool, Bool) : Bool
Les termes de sorte Bool sont appelées formules, et les symboles “∨”, “∧”, “¬” sont appelés
respectivement disjonction (ou), conjonction (et), négation. De plus, nous exigeons également
que pour chaque sorte σ apparaissant dans une logique le symbole “=” ait, entre autres, le
rang (σ, σ) : Bool.
Sémantique. Les notions introduites ci-dessus définissent la syntaxe de la logique. Pour
donner une sémantique aux termes, il est nécessaire d’y associer une sémantique. Une structure
(Définition 5.1.8) interprète les sortes d’une signature en ensembles de valeurs concrètes,
et les symboles comme des fonctions sur ces ensembles de façon consistante avec
leur rang. Une structure permet également d’interpréter des termes de la logique au moyen
d’une fonction d’interprétation I. Une application de symbole s(terme1, . . . , termen) est
évaluée récursivement :
I(s)
I(terme1), . . . , I(termen)
.
Une structure se doit de respecter les contraintes suivantes :
• l’interprétation du sorte Bool est l’ensemble {T, F} (True et False) ;
• I(>) est T ;
• I(⊥) est F ;
• I(¬)(p) est T si et seulement si p est F ;
• I(∨)(p, q) est T si et seulement si p ou q est T ;
• I(∧)(p, q) est T si et seulement si p et q est T ;
• I(=)(p, q) est T si et seulement si p est la même valeur concrète que q.
Étant donnée une signature Σ, une formule φ est satisfiable s’il existe une structure de
Σ qui évalue φ à T. Une telle structure est appelée un modèle de φ. Si toute structure de
Σ est un modèle de φ, alors φ est une tautologie ou est valide. Validité et satisfiabilité sont
8Introduction 1.2 Notations et Notions Mathématiques
des notions duales. En effet, si φ est valide alors sa négation, ¬φ, n’est pas satisfiable, ou
insatisfiable. Inversement, si φ est insatisfiable alors ¬φ est valide.
Soit Σ un signature et φ et ψ deux formules. Alors
• φ et ψ sont equisatisfiables si φ est satisfiable si et seulement si ψ est satisfiable ;
• ψ est une conséquence sémantique de φ, noté φ |= ψ, si tout modèle de φ est un modèle
de ψ ;
• ψ est équivalente sémantiquement à φ, noté φ ≡ ψ, si φ |= ψ et ψ |= φ.
Satisfiabilité modulo théorie. La notion de sémantique introduite ci-dessus n’est pas suffisante
pour les problèmes auquels nous nous intéressons. Malgré la possibilité d’obtenir des
résultats tels que
• φ ∧ ¬φ est insatisfiable,
• φ ∨ ¬φ est valide,
• ¬(φ ∧ ¬φ) ≡ φ ∨ ¬φ, . . .
Il n’est pas réaliste de raisonner au niveau arithmétique sans contraindre l’interprétation de
symboles tels que “+”, “42”, “7.13” dans des signatures les autorisant. C’est pourquoi une
logique est également composée d’une ou plusieurs théorie(s) restreignant l’interprétation
des symboles et sortes non purement propositionnels, les symboles et sortes autres que ceux
apparaissant dans Core. Une formule φ est alors satisfiable modulo théorie si elle admet un
modèle autorisé par la ou les théories de la logique considérée. Dans la suite de ce mé-
moire, nous utiliserons majoritairement des fragments de MSFOL permettant de construire
des termes arithmétiques linéaires réels ou entiers au moyen des symboles habituels “+”,
“−”, “0”, “1”, . . . , “0.0”, “2.3”, . . . dont l’inteprétation correspond à la sémantique usuelle
de l’arithmétique. Nous dirons dans la suite de ce mémoire qu’une formule φ est satisfiable
pour “satisfiable modulo théorie” pour des raisons de lisibilité.
Précisions sur la notion de variable d’une signature. Comme c’est le cas dans le standard
SMT-LIB 2, les variables d’une signature ne peuvent apparaître dans des termes bien typés
que si elles sont liée par un quantificateur (∃ ou ∀) ou un let-binding (parallèle). Nous ne
considérerons pas de termes quantifiés dans ce mémoire et omettons leur définition pour le
moment ; davantage d’informations sont disponibles dans les sections 5.1.1 et 5.1.2 définissant
formellement MSFOL, en particulier dans la Définition 5.1.3 pour la syntaxe abstraite, la
Définition 5.1.4 pour le typage, et la Définition 5.1.10 pour leur sémantique. Nous utilisons
91.2 Notations et Notions Mathématiques Introduction
les let-binding-s pour définir formellement le déroulement de la relation de transition d’un
système de transition en Section 6.1, mais nous n’en ferons pas usage dans ce résumé étendu
en français par soucis de concision. Nous renvoyons donc le lecteur aux sections et définitions
cîtées pour les quantificateurs traitant également de la syntaxe et de la sémantique des
let-binding-s dans MSFOL.
Les solveurs SAT et SMT sont des outils extrêmement efficaces capables, étant donnée
une formule φ exprimée dans un fragment de MSFOL, de répondre à la question “φ est-elle
satisfiable?”. Si c’est le cas, le solveur produit un modèle de φ. Par la suite nous abrégerons
souvent “satisfiable” par “sat” et “insatisfiable” par “unsat”. Le niveau de performance
actuel de ces outils est le fruit de plusieurs décennies de recherche et d’optimisation dé-
clenchées par les travaux précurseurs de [27, 28] mettant au point l’algorithme aujourd’hui
standard, nommé DPLL en l’honneur de ses créateurs (Davis-Putnam-Logemann-Loveland).
Les premiers solveurs ne s’intéressaient qu’au problème de la satisfiabilité de formules purement
propositionnel, appelé “problème SAT”. Les avancées considérables [9] dûes, entre
autres, à l’équipe à l’origine du solveur SAT Chaff [59] ont à terme rendu possible d’adapter
l’approche au problème de la satisfiabilité modulo théorie (SMT). La Section 5.2 de ce mé-
moire présente l’algorithme DPLL dans le cas SAT ainsi que dans le cas SMT au travers du
formalisme abstract DPLL [60].
L’initiative SMT-LIB [4] vise a fédérer les différents solveurs en proposant des descriptions
rigoureuses des théories qu’ils utilisent, ainsi qu’un langage d’entrée commun permettant
la construction d’une librairie de benchmarks impressionnante. L’objectif est de faciliter
l’utilisation et la comparaisons des solveurs disponibles. Les solveurs majeurs actuels sont
compatible avec le récent standard SMT-LIB 2 [4], les principaux étant les suivants :
• Z3 [29], developpé à Microsoft Research,
• MathSAT 5 [20] de l’Université de Trento, et
• CVC4 [3], developpé conjointement par l’Université d’Iowa et l’Université de New
York.
1.2.2 Systèmes de Transition
Les systèmes de transition encodent une sémantique de trace d’états partant d’états dits
initiaux. Les états représentent l’état interne du système à un moment donné. Un système de
transition encode les transitions légales pour le système lui permettant de passer d’un état
à un autre. Les systèmes de transition ayant un nombre fini d’états peuvent, en théorie, être
représentés de façon exhaustive en listant tous les états initiaux et tous les couples détats se
succédant. En pratique malheureusement les systèmes finis que nous considérons ne sont
10Introduction 1.2 Notations et Notions Mathématiques
pas représentables de cette façon à cause du nombre gigantesque d’états qu’ils peuvent atteindre,
sans parler des systèmes infinis. Il est donc plus réaliste de spécifier les états initiaux
ainsi que la relation de transition au moyen de formules dans un fragment de MSFOL.
Étant donnée une logique L, l’état interne du système de transition S est représenté par
un vecteur de variables d’états Var ∆= hv
1
, . . . , vn
i. Une fonction D associe à chaque variable
un sorte de L. Une formule d’init I(Var) portant sur les variables d’états défini les états
initiaux : ses modèles sont exactement les états initiaux du système. Un deuxième formule
T(Var, Var0
) porte sur Var vu comme “l’état courant” ainsi que sur une version primée de
Var représentant “l’état suivant”. Les modèles de cette formule de transition sont exactement
les paires d’états du système se succédant.
Afin d’encoder des traces d’états semous forme de formules, nous augmentons la logique
avec les symboles v
1
0
, . . . , vn
0
, v1
1
, . . . , vn
1
, . . . que nous appelons des variables d’état déroulées.
Nous notons la logique ainsi obtenue L(S). Par soucis de lisibilité, nous notons si
le vecteur
hv
1
1
, . . . , vn
1
i. Il est à présent possible de construire une formule dont les modèles sont , par
exemple, exactement les états atteignables en deux transitions à partir des états initiaux du
système :
φ
∆= I(s0) ∧ T(s0, s1) ∧ T(s1, s2).
Si φ est satisfiable, un modèle de φ assigne des valeurs concrètes à s0, s1 et s2 telles que s0 est
initial et les transition entre s0 et s1 et entre s1 et s2 sont légales.
Soit Scpt le système de transition composé d’une seule variable d’état n de sorte Int, de la
formule initiale I(n)
∆= (n = 0) et de la formule de transition T(n, n0
)
∆= (n
0 = n + 1). Scpt
représente un simple compteur initializé à zéro et s’incrémentant à chaque transition. Dans
ce cas, la formule φ ci-dessus est donc
φ
∆=
n0=0
z }| {
I(n0) ∧
n1=n0+1
z }| {
T(n0, n1) ∧
n2=n1+1
z }| {
T(n1, n2).
Il est alors possible de demander à un solveur SMT si φ est satisfiable, ce qui est le cas, puis
d’en obtenir un modèle :
{n0 7→ 0, n1 7→ 1, n2 7→ 2}.
Il est de plus possible d’ajouter des contraintes aux variables d’état déroulées, comme suit.
n0=0
z }| {
I(n0) ∧
n1=n0+1
z }| {
T(n0, n1) ∧
n2=n1+1
z }| {
T(n1, n2) ∧
contrainte sur n2
z }| {
(n2 ≤ 0)
Le solveur SMT nous répond alors que la formule n’est pas satisfiable. Nous lui avons
donc fait prouver qu’il n’était pas possible qu’un état à deux transitions d’un état initial soit
négatif ou nul.
Il est important de noter à ce stade que les modèles de la formule de transition ne dénotent
pas forcemment des états successeurs atteignables du système. Dans l’exemple décrit
111.3 Vérification de Systèmes de Transition Introduction
ci-dessus, {n0 7→ −10, n1 7→ −9} est un modèle de la formule T(n0, n1), mais ni l’un ni
l’autre ne sont atteignable.
1.3 Vérification de Systèmes de Transition
Nous nous intéressons à la vérification de propriétés de sûreté sur des systèmes de transition.
Ce problème correspond à une analyse d’atteignabilité. Étant donnés un système de
transition S et un objectif de preuve PO, existe-t-il un entier n ≥ 0 tel que
I(s0) ∧ T(s0, s1) ∧ · · · ∧ T(sn-1, sn) ∧ ¬PO(sn) (1.1)
soit satisfiable ? Si c’est le cas un modèle peut être extrait et constitue un contre-exemple,
c’est à dire une trace partant d’un état initial menant à une falsification de l’objectif de
preuve PO. Si ce n’est pas le cas, PO est un invariant de S : aucun état atteignable du
système ne falsifie PO. Un argument mathématique, une preuve en attestant doit être produit.
Dans le reste de ce mémoire nous nous focaliserons sur la recherche de preuve dans le
cas ou PO est effectivement un invariant de S.
1.3.1 K-induction
Pour ce faire nous utilisons la technique classique de la k-induction2
, consistant à trouver
un entier k ≥ 1 tel que deux formules soient unsat :
Basek (I, T, PO) ≡
Initial state
z }| {
I(s0) ∧
trace of k-1 transitions
z ^ }| {
i∈[0,k−2]
T(si
, si+1) ∧
PO falsified on some state
z _ }| {
i∈[0,k−1]
¬PO(si)
Stepk
(T, PO) ≡
^
i∈[0,k−1]
T(si
, si+1)
| {z }
trace of k transitions
∧
^
i∈[0,k−1]
PO(si)
| {z }
PO satisfied on first k states
∧ ¬PO(sk)
| {z }
PO falsified by last state
.
La formule Basek aussi appelée instance de base est satisfiable si une falsification de
l’objectif de preuve peut être atteinte en k −1 transitions à partir des états initiaux. Un mod-
èle de l’instance de base est donc un contre-exemple exhibant une falsification de l’objectif
de preuve. Si Basek n’est pas satisfiable, alors tous les états atteignables en k − 1 transitions
à partir des états initiaux vérifient l’objectif de preuve.
La formule Stepk aussi appelée instance de step n’est pas satisfiable si à partir du dernier état
d’une trace de k états vérifiant PO, il n’est pas possible d’atteindre une falsification de PO
en une transition.
Si les deux formules sont insatisfiable, toute trace partant des états initiaux ne peut atteindre
une falsification de PO en k − 1 transitions car l’instance de base n’est pas satisfiable. Le
2
Introduite formellement dans la Section 6.2.
12Introduction 1.3 Vérification de Systèmes de Transition
fait que Stepk ne soit pas satisfiable permet de conclure qu’il n’est pas possible d’atteindre
une falsification de PO en une transition à partir d’une trace initialisée de k états (k − 1
transitions). Par récurrence, il n’existe donc pas d’entier n ≥ 0 tel que l’Équation 1.1 soit
satisfiable, et PO est bien un invariant de S.
En revanche, le fait que l’instance de step soit satisfiable ne permet pas de conclure. La
formule de step ne prend pas en compte les états initiaux et il n’y a aucune garantie que ses
modèles dénotent des états atteignables. On parle dans ce cas de contre-exemple fallacieux.
Il est cependant possible, en théorie, de chercher itérativement à établir une preuve de
k-induction à partir de k = 1 en augmentant la valeur de k jusqu’à ce que les deux formules
soient insatisfiable –ou que l’instance de base soit satisfiable, indiquant l’existence d’une
falsification de PO.
Malheureusement, la complexité des formules augmente rapidement à chaque incré-
ment de k et il n’est pas réaliste sur des systèmes réalistes de dérouler la formule de transition
un grand nombre de fois. Les instances de base et de step deviennent rapidement trop
complexe et le solveur SMT n’est plus capable de les traiter efficacement.
Pour remédier à ce problème il est nécessaire de renforcer l’objectif de preuve : en découvrant
des invariants du système. L’intérêt est de contraindre l’instance de step dans le but de
bloquer les contre-exemples fallacieux. Les invariants non-relationels sont en général faciles à
découvrir car ils ne mentionnent qu’une seule variable d’état et correspondent à des bornes
souvent présentes dans la description du système, comme par exemple la valeur maximale
d’un compteur. Les invariants relationels en revanche expriment un lien entre plusieurs variables
d’état et ne sont que rarement apparents ce qui rend difficile leur découverte. Ils sont
en général plus informatifs que les invariants non-relationels et donc plus efficaces pour
l’exclusion de contre-exemples de step fallacieux.
1.3.2 État de l’art
Les techniques formelles récentes se concentrent sur la recherche d’invariants du système
permettant de renforcer un objectif de preuve afin de pouvoir le prouver par k-induction
pour un k relativement petit.
L’interprétation abstraite (AI [23]) est une technique travaillant sur une abstraction de la
sémantique du système qu’elle analyse. Cette approche est correcte dans la mesure ou tout
invariant pour la sémantique absraite est également un invariant pour la sémantique concrète
du programme. L’inverse n’est pas vrai cependant, AI n’est donc pas une technique
complète car l’abstraction peut être trop grossière et donc rater des invariants pour la séman-
131.3 Vérification de Systèmes de Transition Introduction
tique concrète. Les deux outils d’AI les plus intéressants dans notre cadre sont (i) Astrée [10]
qui analyse du code C, et (ii) NBac [43] analysant des modèles Lustre en combinant des calculs
de point fixes avants et arrières.
L’interprétation abstraite est une technique puissante, mais elle est loin d’être automatique.
En effet de nombreux paramètres contrôle les techniques d’abstraction et doivent être spé-
cifiés par un expert en AI ayant une bonne compréhension du système analysé.
Interpolation-based Model Checking (IMC) est une technique proposée par McMillan [55]
basée sur les solveurs SMT et le calcul d’interpolants paramétré par un entier n. Cette
approche consiste à calculer itérativement une suite de sur-approximations des états atteignables
en n transitions excluant de plus en plus de contre-exemples de l’instance destep
de n-induction à chaque itération. L’algorithme s’arrête quand il détecte que tous les contreexemples
de step sont bloqués, indiquant qu’un invariant du système permettant de prouver
l’objectif de preuve par n-induction a été découvert.
Malheureusement IMC nécessite de dérouler la relation de transition un nombre relativement
important de fois. Le méchanisme d’abstraction rend l’approche moins explosive que
la k-induction, mais limite considérablement son passage à l’échelle sur des systèmes tels
que les notres.
Property Directed Reachability (PDR, aussi appelé IC3 [12, 34]) ne construit pas de formule
déroulant la formule de transition plus d’une fois. L’approche consiste a diviser la
complexité de l’analyse en un grand nombre de problèmes plus simples. Une séquence de
frames bloquant des états dangereux est construite incrémentalement en mélangeant analyse
arrière de la négation de l’objectif de preuve et propagation en avant prenant en compte les
états initiaux. Cette technique a originellement été mise au point pour des systèmes purement
propositionels ; des généralizations au cas SMT ont été proposées [40, 19] et montrent
des résultats intéressants. Nous présentons notre propre généralisation dans la Section 8.3.
1.3.3 Motivation et Plan du Mémoire
La découverte d’invariants pour des systèmes industriels est un exercice difficile. Découvrir
des invariants relationnels dirigés par l’objectif de preuve est cependant souvent indispensable
au succès d’une analyse. Les méthodes décrites ci-dessus ne fonctionnent pas sur
nos systèmes car ils ne sont pas capables d’inférer des invariants relationels, à l’exception
de l’interprétation abstraite qui nécessite généralement une intervention experte pour les
découvrir. Notre intuition est qu’il peut s’avérer plus efficace de les deviner, i.e. de produire
des invariants potentiels grâce à une heuristique et de laisser à un moteur de k-induction le
soin de séparer les invariants potentiels falsifiables de ceux étant prouvables.
14Introduction 1.3 Vérification de Systèmes de Transition
Le moteur de preuve Kind [47] suit cette approche : des templates tirés d’une base de
données sont instanciés sur les variables d’états et les constantes apparaissant dans le systèm
[46]. Un moteur de k-induction est en suite chargé d’identifier les invariants. Cependant
les invariants ainsi trouvés ne sont pas dirigés par l’objectif de preuve, il n’y a donc
pas de garantie qu’ils aident à prouver l’objectif de preuve en bloquant des contre-exemples
fallacieux. De plus, cette approche est problématique sur des systèmes complexe car le moteur
de k-induction peut se retrouver noyé par le nombre d’invariants potentiels générés.
Le fait que la base de données de templates grossit généralement avec le temps ne fait
qu’augmenter ce risque.
Notre contribution se sépare en deux parties. Premiérement, nous définissons une architecture
parallèle basée sur un moteur de k-induction permettant à des méthodes de dé-
couverte d’invariants de collaborer entre elles et avec la k-induction. Deuxiémement, nous
proposons une heuristique de génération d’invariants potentiels dirigée par l’objectif de
preuve. Nous démontrons sa capacité à découvrir des invariants relationnels renforçant les
objectifs de preuve sur des systèmes standards dans le domaine des systèmes embarqués
critiques avioniques.
Le Chapitre 2 décrit notre méthodologie. Nous commençons par améliorer l’algorithme
d’élimination de quantificateurs (QE) introduit par Monniaux dans la Section 2.1, en termes
de performance mais aussi de pouvoir d’expression des formules qu’il est capable de traiter.
Nous introduisons ensuite notre architecture parallèle collaborative dans la Section 2.2 et
présentons une technique de découverte d’invariants par QE dans ce cadre. Nous présentons
HullQe dans la Section 2.3, notre heuristique générant des invariants potentiels dirigée
par l’objectif de preuve combinant élimination de quantificateurs et calcul d’enveloppes
convexes.
Enfin, nous concluons et donnons des perspectives pour des travaux poursuivant cette
étude dans le Chapitre 3.
15CHAPTER 2
Découverte d’Invariants par Élimination de
Quantificateurs
L’élimination de quantificateurs est un problème fondamental en mathématiques, et constitue
l’objet de recherches continues depuis des décennies. Cette section rapelle la chronologie
des progrès majeurs en QE et présente les applications les plus fréquentes de la QE pour
l’analyse de systèmes réactifs.
En 1951, Tarski prouve la décidabilité des corps algébriquement clos en exhibant une
procédure d’élimination de quantificateurs [73]. Pour décider une formule, on élimine
succsessivement toutes les variables quantifiées, chaque nouvelle formule obtenue étant
equi-satisfiable à la précédente, pour obtenir une formule ground, dont la valeur de vérité
peut facilement être réduite à vrai ou faux. L’algorithme de Tarski étant d’une complexité
non élémentaire, il est d’une utilité pratiquement nulle pour toute application. En 1975,
G. E. Collins publie la technique de Décomposition Cylindrique Algébrique (CAD) [21], avec
une complexité de 2
2
n
où n est le nombre de variables à éliminer, certes toujours élevée
mais grandement améliorée par rapport à la technique de Tarski, et permettant d’envisager
quelques applications. Les premières implémentations de CAD apparaissent au début des
années 1980 et ont depuis été continuellement améliorées [41]. Un autre saut en performance
est effectué par Weispfenning et Loos à la fin des années 1980 avec la méthode des Substitutions
Virtuelles (VS) sur les réels, d’abord pour les systèmes linéaires [52], puis pour les
systèmes au plus quadratiques [79] [80]. La méthode VS est très rapide mais tend à produire
des formules dont la taille explose, si bien que récemment, certains travaux comme [72] proposent
d’utiliser une combinaison de CAD, VS et de simplification de formule à la volée
pour traiter des problèmes non linéaires de QE issus de problèmes de vérification difficiles.
Aujourd’hui, des implémentations de ces techniques de QE générales sont disponibles dans
des suites logicielles telles que QEPCAD, Redlog, Matlab, Maple, etc..
Globalement, les méthodes de QE générales non linéaires restent très coûteuses, ce qui
justifie l’intéret de la recherche sur les algorithmes de QE très efficaces pour l’arithmétique
linéaire réelle, entière, ou combinée réelle-entière. En effet, le cadre linéaire suffit pour mod-
éliser de nombreuses classes de systèmes très courants dans les applications critiques : les2.1 Élimination de Quantificateurs Découverte d’Invariants
automates hybrides linéaires, les automates temporisés, les programmes manipulant des
compteurs entiers, les programmes synchrones mêlant Booléens, entiers et réels etc. La QE
linéaire s’utilise principalement de la même manière que la QE générale : calcul de préimage
[26], synthèse d’invariants par patrons [50], abstraction automatique de portions de
programmes [57]. Donc, se doter de techniques efficaces pour ces fragments peut être extrêmement
gratifiant dans les applications de vérification. La plus significative et récente
des avancées dans ce domaine est celle de la QE par énumération paresseuse et projection polyé-
drique publiée dans [56], et reprise dans [58]. Cette méthode capitalise les derniers progrès
de la satisfiabilité modulo théories (SMT), et apporte un gain de performance notable sur les
approches préexistantes.
Cette méthode de QE basée SMT se trouve au cœur de notre cadre logiciel pour l’analyse
de systèmes réactifs synchrones : dans [16], un calcul de préimage itéré est utilisé pour
alimenter un générateur de lemmes potentiels afin de prouver une propriété sur un système
de transitions. Dans cette application, c’est l’étape de QE qui constituait le principal goulot
d’étranglement, ce qui nous conduisit à améliorer l’algorithme original de [56], en modifiant
la phase d’extrapolation de l’algorithme.
2.1 Élimination de Quantificateurs
Definition 2.1.1 (Élimination de quantificateurs) Étant donnée une formule φ de QF_LRIA
et une collection V de variables de φ, l’élimination de quantificateurs consiste à produire une
autre formule O de QF_LRIA telle que O soit équivalente à ∃V, φ en éliminant les variables
V de φ. Cette opération est notée QE(V, φ).
Par exemple, si φ ≡ (x = 39 ∧ y ≥ 3 + x) ∨ (x ≥ 7 ∧ y = 11 − x) alors un résultat
possible pour QE(x, φ) serait O ≡ y ≥ 42 ∨ y ≤ 4.
L’algorithme d’élimination de quantificateurs par énumération paresseuse de modèles de [56]
est donné dans l’algorithme 1. Dans l’article original, φ est supposée appartenir au fragment
QF_LRA et V ne contient donc que des variables réelles. Dans cet algorithme, chaque itération
comporte trois phases. Premièrement, l’extraction de modèle, qui utilise un solveur SMT
pour trouver un modèle de φ ∧ ¬O tant qu’il en existe, sinon l’algorithme termine. Ensuite,
la phase d’extrapolation qui produit, à partir d’un modèle M de φ, une nouvelle formule E
qui se veut plus générale que le modèle dont elle est issue et qui implique φ. Une définition
formelle de la notion d’extrapolant, tirée de [62], est donnée ci-après :
Definition 2.1.2 (Extrapolant) Soient deux formules A et B. Une formule C est un extrapolant
de A et B si elle est telle que :
– si A ∧ B est unsat alors C ≡ ⊥
– si A ∧ B est sat alors A ∧ C est sat et C ∧ ¬B est unsat.
18Découverte d’Invariants 2.1 Élimination de Quantificateurs
Algorithm 1 QE par énumération paresseuse de modèles.
Require: φ : une formule QF_LRIA
Require: V : collection de variables à éliminer de φ.
Ensure: O : une formule en forme DNF telle que O ≡ ∃V, φ
function QE(V, φ)
O ← ⊥
while isSatisfiable(φ ∧ ¬O) do
M ← getModel(φ ∧ ¬O) . génération d’un modèle
E ← extrapolate(φ, M) . extrapolation du modèle
P ← project(E, V ) . projection de l’extrapolant
O ← O ∨ P . construction incrémentale du résultat
end while
return O . retrouner la formule DNF
end function
Cette définition est instanciée de la manière suivante dans le cadre de la QE : si M est un
modèle de φ, en prenant A ≡ (
V
v∈Vars(φ)
v = M (v)) pour caractériser le modèle et B ≡ φ,
un extrapolant E est tel que :
• A ∧ E est satisfiable, i.e. M(E) ≡ M(φ) ≡ >, i.e. M |= E ;
• E ∧ ¬φ est insatisfiable, i.e. E =⇒ φ.
Par extension, le calcul d’un tel E est appelé “extrapoler M par rapport à φ”.
Dans la QE de [56], l’extrapolation de M est réalisée par la technique appelée SMTtest,
par laquelle on considère l’ensemble des atomes de φ noté Atoms(φ), et l’on construit
l’ensemble des littéraux impliqués par le modèle :
L ≡ {si M (a) alors a sinon ¬a | a ∈ Atoms(φ)} (2.1)
On a alors (
V
l∈L l) =⇒ φ, i.e. (
V
l∈L l) ∧ ¬φ est insatisfiable. Ensuite, on minimise L en
en retirant successivement chaque littéral l
0
tel que ((V
l∈L, l6=l
0 l) ∧ ¬φ) devienne satisfiable.
Enfin, on retourne l’extrapolant (
V
l∈Lmin
l).
Enfin, la phase de projection élimine de E les variables de V par une projection polyé-
drique, fournie par exemple par la Parma Polyhedra Library [2]. Le résultat de chaque projection
nourrit la construction de la formule DNF résultat O, qui est équivalente à (∃V, φ)
et ne contient plus aucune variable de V lorsque l’algorithme termine, i.e. lorsque φ ∧ O n’a
plus de modèle.
Il est important de retenir le rôle clef joué par l’extrapolation dans l’algorithme de QE.
C’est en effet sa capacité à généraliser le modèle qui va permettre de limiter le nombre
d’itérations de la boucle principale. Plus un extrapolant est général, plus sa projection est
192.1 Élimination de Quantificateurs Découverte d’Invariants
générale, et sa négation bloque davantage de modèles de la formule φ. Dans l’algorithme
original, la plus grande partie de l’exécution est passée à généraliser les modèles. C’est ce
qui justifie notre travail sur l’extrapolation afin d’améliorer l’algorithme de QE.
2.1.1 Projection combinée d’atomes booléens, entiers et réels
L’algorithme de QE original imposait que les formules appartiennent au fragment linéaire
réel QF_LRA (variables réelles, relations et combinateurs booléens uniquement). Nous
généralisons ici l’approche à QF_LRIA, ce qui implique d’éliminer des variables pouvant
être booléennes, entières ou réelles. C’est la méthode de projection qu’il faut adapter ici.
En effet, en supposant qu’un solveur SMT compatible QF_LRIA soit utilisé, les phases
d’énumération de modèles et de génération d’extrapolants restent inchangées, l’essentiel du
raisonnement spécifique aux théories arithmétiques et booléennes étant délégué au solveur
SMT.
Un extrapolant n’est maintenant plus un polyèdre de variables réelles, mais un cube c
contenant des littéraux booléens, entiers et réels. Compte tenu de l’absence d’intersection
de types entre entiers et réels dans le langage QF_LRIA, ce cube peut être divisé en trois
cubes cbool, cint et creal tels que cbool (resp. cint, creal) ne contient que des littéraux booléens
(resp. entiers, réels), et c ≡ cbool ∧ cint ∧ creal.
L’ensemble V des variables à éliminer peut lui aussi être divisé en trois sous-ensembles
disjoints Vbool, Vint et Vreal tels que Vbool (resp. Vint, Vreal) ne contient que des variables
booléennes (resp. entières, réelles). Enfin, la propriété suivante nous permet d’obtenir trois
problèmes de projection distincts : projection des variables booléennes, entières et réelles,
qui peuvent être traitées en parallèle avec des méthodes dédiées.
Property 2.1.1 (Séparation de quantificateurs) Soient deux formules φ1 et φ2, et deux ensembles
de variables V1 et V2 tels que V1 ∩ F V (φ2) = ∅, V2 ∩ F V (φ1) = ∅, et F V (φ1) ∩
F V (φ2) = ∅, alors (∃V1 ∪ V2, φ1 ∧ φ2) ≡ (∃V1, φ1) ∧ (∃V2, φ2).
Cette adaptation de l’algorithme de QE à QF_LRIA permet d’aborder des systèmes typiques
du domaine avionique, dans lesquels les booléens supportent la logique de contrôle,
les entiers supportent l’implémentation de diverses primitives temporelles telles que les
timers, les watchdogs, etc. et les réels supportent les flots de données.
Ces systèmes s’expriment dans la théorie des octogones entiers et nous permettent d’éviter
d’avoir à recourir à l’opérateur modulo lors de l’élimination de quantificateurs. En effet,
QE(y, x = 7 ∗ y) où x et y sont des entiers devrait normalement renvoyer x%7 = 0 où %
est l’opérateur "modulo". En nous limitant aux octogones, nous pouvons donc projeter les
atomes entiers comme des atomes réels. Dans un contexte plus général le résultat de la projection
pourrait être faux. Avec notre méthode, QE(x, {0 < x, x < 1}) où x est un entier
20Découverte d’Invariants 2.1 Élimination de Quantificateurs
aurait pour résultat > ; cependant, l’algorithme de QE de Monniaux ne projetant que des
atomes satisfiables modulo théorie, ce genre de cas ne peut donc pas se présenter au sein de
la procédure.
2.1.2 Extrapolation : utilisation des cœurs insatisfiables
Le but de l’extrapolation est de dériver une formule E à partir d’un modèle M |= φ qui
soit plus générale que M , tout en impliquant φ. Si nous considérons tous les extrapolants
pouvant être construits à partir des atomes de φ, un meilleur extrapolant pour un modèle
M aurait un nombre minimal de littéraux. Un tel extrapolant peut être obtenu en prenant
la conjonction du sous-ensemble de littéraux U ⊆ L impliqué dans tout cœur insatisfiable
minimal de la formule ((V
l∈L l) ∧ ¬φ), où L est l’ensemble défini dans l’équation (7.1).
Calculer des extrapolants très généraux permet de limiter le nombre total d’itérations de
la boucle principale de QE. Cependant, l’extraction de cœurs insatisfiables minimaux pour
déterminer U se révèle trop coûteuse en pratique. Il est bénéfique pour la performance globale
de la QE de se contenter d’approximer les meilleurs extrapolants. Le coût des quelques
itérations supplémentaires de la boucle principale, du à la moindre qualité des extrapolants,
est amorti par le gain sur l’extrapolation plus rapide.
L’extrapolation SMT-test décrite en section 2.1 a de bonnes capacités de généralisation,
mais reste coûteuse en raison des tests SMT utilisés pour décider, pour chaque littéral de
la formule, de l’éliminer ou de le garder dans l’extrapolant. Le nombre de tests SMT peut
être réduit en utilisant les informations découvertes par le solveur SMT sur les formules
insatisfiables. Lorsqu’un littéral l
0 ∈ L tel que G ≡ ((V
l∈L, l6=l
0 l) ∧ ¬φ) est insatisfiable
est considéré, le solveur peut être interrogé pour savoir quels littéraux ont été utilisés dans
le graphe du dernier conflit. Ces littéraux font partie d’un cœur unsat de la formule G,
pas nécessairement minimal, et on peut éliminer de L tous les littéraux n’étant pas dans
ce graphe. On élimine ainsi plus d’un littéral de l’extrapolant par itération. Cette idée est
détaillée dans l’algorithme 2.
2.1.3 Extrapolation par analyse structurelle
Limiter l’utilisation du solveur SMT dans l’extrapolation est un progrès, mais la supprimer
totalement pourrait être encore mieux. Nous présentons ici une analyse structurelle
permettant d’identifier rapidement un sous-ensemble de littéraux expliquant la satisfiabilité
d’une formule par rapport à un modèle, et d’en générer un extrapolant. Cette méthode
est inspirée de [11], où les modèles découverts par un model-checker pour Simulink sont
simplifiés avant d’être présentés à l’utilisateur. Les portions du réseau à flots de données
impliquées dans la falsification de l’objectif de preuve sont identifiées par des règles structurelles.
De [11], nous retenons principalement les notions d’activité et de cause. L’idée de
212.1 Élimination de Quantificateurs Découverte d’Invariants
Algorithm 2 SMT-test avec cœurs insatisfiables.
Require: φ une formule QF_LRIA, M un modèle de φ.
Ensure: Un extrapolant de M par rapport à φ sous la forme d’un ensemble de littéraux.
function smtTestCores(φ, M )
toCheck ← L . Ensemble L de littéraux à tester (cf. Eq 7.1)
toKeep ← ∅
while toCheck 6= ∅ do . ensemble des littéraux de l’extrapolant
solver .assert(¬φ)
literal ← toCheck.first . prendre le prochain littéral à tester
toCheck ← (toCheck \ {literal}) . supprimer le littéral de l’ensemble
for lit ∈ toKeep ∪ toCheck do
solver .assert(lit) . supposer les littéraux à garder/tester
end for
if solver .checksat() = sat then
toKeep ← (toKeep ∪ {literal}) . ajouter le littéral dans l’ensemble résultat
else . supprimer les littéraux n’étant pas dans le cœur unsat
toCheck ← solver .getUnsatCore() ∩ toCheck
end if
solver .restart() . réinitialiser le solveur pour la prochaine itération
end while
return toKeep . retourner l’ensemble de littéraux formant l’extrapolant
end function
base ici est de ne pas juste considérer l’ensemble des littéraux de la formule “à plat”, mais
plutôt de garder une vision arborescente de la formule et de définir des règles permettant
d’identifier les sous-arbres expliquant la valeur de la racine.
Definition 2.1.3 (Activité d’une sous-formule) Soit f une formule et g une de ses sousformules
directes. On dit que g est active par rapport à f dans M si et seulement si la valeur
de g dans M est telle que la changer en préservant les valeurs des autres sous-formules directes
de f change la valeur de f, ou bien si cette valeur permet de déterminer complètement
la valeur de f dans M .
L’activation d’une sous-formule peut être résumée à une condition logique sur les valeurs
impliquées par un modèle pour la sous-formule et ses soeurs. Par exemple, si on considère
que a ∧ b, une sous-formule de φ, est active, alors une des situations suivantes se produit :
(a) si M (¬a) et M (b), la valeur de a dans M suffit à déterminer que a ∧ b est fausse dans M ,
mais pas la valeur de b. Donc a est active et b ne l’est pas ; (b) si M (a) et M (¬b), la valeur
de b dans M suffit à déterminer que a ∧ b est fausse dans M , mais pas la valeur de a. Donc
b est active et a ne l’est pas ; (c) si M (¬a) et M (¬b), alors la valeur de a ou celle de b dans
M permet indépendamment de déterminer que a ∧ b est fausse dans M . Donc a et b sont
22Découverte d’Invariants 2.1 Élimination de Quantificateurs
actives, c’est un cas combinaison de causes indépendantes ; (d) si M (a) et M (b), la connaissance
des valeurs de a et b est nécessaire pour déterminer que a ∧ b est vraie dans M . Donc a et b
sont actives, c’est un cas de combinaison de causes dépendantes. La condition d’activation de a
peut être réduite à M (¬a ∨ b), et celle de b à M (¬b ∨ a).
Definition 2.1.4 (Causes) Soient une formule φ et un de ses modèles M , une cause pour une
sous-formule g active par rapport à φ est un cube k sur les variables libres de φ tel que M |= k
et pour tout M 0
tel que M 0
|= k, M 0
(g) = M (g). Puisqu’il peut exister plusieurs causes pour
g dans un même modèle, l’ensemble des causes de g est noté KM (g), ou bien K(g) quand M
est évident d’après le contexte.
L’ensemble des causes d’une formule peut être construit inductivement à partir des ensembles
de causes de ses sous-formules. Pour l’opérateur unaire ¬a, les causes sont celles
de a. Pour un opérateur binaire hopi ∈ (∧, ∨), KM (a hopi b) est égal à :
• KM (a) si seulement a est active ;
• KM (b) si seulement b est active ;
• KM (a) ∪ KM (b) si a et b sont actives et leurs causes sont indépendantes ;
• {Ca ∧ Cb | (Ca, Cb) ∈ KM (a) × KM (b)} si a et b sont actives et leurs causes sont dépendantes.
Ces règles de construction et la définition d’une cause font que si a (resp. b) était active
par rapport à a hopi b dans M , alors elle l’est toujours dans tout M 0
|= k où k ∈ KM (a hopi b).
Donc, si M |= φ, tout k ∈ KM (φ) est en fait un extrapolant de M par rapport à φ, car M |= k
et tout M 0
|= k est tel que M 0
(φ) = M (φ) = >, ce qui est équivalent à k =⇒ φ, on retrouve
bien la définition 7.1.1 instanciée dans le cadre de la QE.
Il est donc possible de calculer des extrapolants pour M par rapport à φ en calculant
des causes pour φ dans M . Nous avons constaté expérimentalement que les combinaisons
de causes indépendantes augmentent la taille des ensembles de causes (par union), menant
indirectement à une explosion du nombre de causes lors du traitement des causes dépendantes
(produit cartésien). Nous avons donc décidé de n’extraire qu’un seul extrapolant
par modèle, en ne traitant que les combinaisons de causes dépendantes et en ne calculant que
la cause de la sous-formule active la plus à gauche lors de combinaisons de causes indépendantes.
L’algorithme 7 donne le parcours récursif de l’arbre de la formule et la combinaison
des causes utilisés pour générer des extrapolants.
Le Tableau 2.1 résume toutes les règles définissant les fonctions active et combine. La
colonne Terme spécifie l’opérateur en question. La colonne Condition spécifie la condition
logique à évaluer. La colonne Sous-formule active donne le comportement de la fonction
232.1 Élimination de Quantificateurs Découverte d’Invariants
Algorithm 3 Extrapolation par méthode structurelle.
Require: f une formule, M une fonction d’évaluation.
Ensure: Si M |= f alors le résultat est un extrapolant de M par rapport à f.
function struct(f, M)
activeSubFormulas ← active(f, M) . sous-formules actives (cf. Tableau 2.1)
subCauses ← activeSubFormulas map {x → struct(x, M)} . appel récursif
return combine(f, subCauses, M) . combinaison des sous-causes (cf. Tableau 2.1)
end function
active, qui retourne la liste des sous-formules actives d’une formule. La colonne Causes
générées/Combinaison donne le comportement de la fonction combine, qui retourne soit une
cause fraîchement générée dans les cas d’arrêt de la récursion (quand active renvoie une
liste vide), ou bien une cause obtenue par combinaison. Par exemple, la cinquième ligne du
tableau se lit : si la formule courante est de la forme x = y, la récursion s’arrête et alors si
M (x) est égal à M (y), la cause x = y est retournée, sinon si M (x) < M (y), alors la cause
x < y est retournée, sinon si M (y) < M (x), la cause y < x est retournée.
Terme Condition Sous-formules Causes générées/
actives Combinaison
hidi booléen T [] hidi si M (hidi), ¬hidi sinon
¬a T [a] K(a)
a ∧ b M (¬a) [a] K(a)
M (a ∧ ¬b) [b] K(b)
M (a ∧ b) [a, b] K(a) ∧ K(b)
a ∨ b M (a) [a] K(a)
M (¬a ∧ b) [b] K(b)
M (¬a ∧ ¬b) [a, b] K(a) ∧ K(b)
x = y M (x = y) [] (x = y)
M (x < y) [] (x < y)
M (y < x) [] (y < x)
x < y M (x < y) [] (x < y)
M (¬(x < y)) [] ¬(x < y)
Figure 2.1: Règles de calcul de l’analyse structurelle.
2.1.4 Combinaison de techniques d’extrapolation
L’analyse structurelle peut être intégrée dans l’algorithme 2, en remplaçant simplement
la première ligne toCheck ← L par toCheck ← struct(φ, M) où struct est la fonction de
24Découverte d’Invariants 2.1 Élimination de Quantificateurs
Algorithm 4 hybrid(φ, M ) . Extrapolation hybride.
Require: φ une formule, M un modèle de φ.
Ensure: Un extrapolant de M par rapport à φ, sous la forme d’un ensemble de littéraux.
toCheck ← struct(φ, M ) . ensemble de littéraux par analyse structurelle (cf. Alg. 7)
toKeep ← ∅
solver .assert(¬φ) . insérer ¬φ au niveau 0
solver .push(1) . à niveau 1 (littéraux à garder)
while toCheck 6= ∅ do
literal ← toCheck.first . prendre un littéral dans l’ensemble toCheck
toCheck ← (toCheck \ {literal}) . le supprimer de l’ensemble
solver .push(1) . à niveau 2 (littéral à tester)
for lit ∈ toCheck do
solver .assert(lit) . insérer le littéral à tester à niveau 2
end for
if solver .checksat() = sat then
toKeep ← (toKeep ∪ {literal})
solver .pop(1)
solver .assert(literal) . insérer le littéral à garder à niveau 1
else . éliminer les littéraux hors du cœur insatisfiable
solver .pop(1)
toCheck ← (solver .getUnsatCore() ∩ toCheck)
end if
end while
return toKeep
l’algorithme 7. Pour encore améliorer la performance, on peut utiliser la pile d’assertions
du solveur SMT sous-jacent. L’algorithme 8 illustre cette combinaison. La formule ¬φ est
insérée au bas de la pile d’assertions, les littéraux à garder pour former l’extrapolant sont
placés au niveau 1 de la pile, le littéral à tester est inséré en haut de la pile. Un simple
pop nous ramène au niveau 1, où l’on peut insérer le littéral à garder et passer au prochain
littéral à tester après un push, préservant ainsi au sein du solveur la majorité du contexte de
l’algorithme.
2.1.5 Évaluation de l’Approche
Nous avons implémenté chacune des techniques d’extrapolation discutées ci-dessus ainsi
qu’un algorithme de QE générique paramétré par la fonction d’extrapolation. Le solveur
SMT Microsoft Z3 [29] est utilisé pour couvrir les besoins SMT. Pour la projection sur contraintes
arithmétiques, décrite en section 2.1.1, nous avons utilisé la Parma Polyhedra Li-
252.1 Élimination de Quantificateurs Découverte d’Invariants
brary [2]
1
, la projection de Booléens étant réalisée par nos soins. Dans le tableau 7.4, nous
présentons les résultats obtenus avec les techniques d’extrapolation suivantes :
• SMT-test la technique de [56], fournie comme référence ;
• struct la technique purement structurelle de l’algorithme 7 ;
• hybrid la technique mêlant analyse structurelle, SMT-test et cœurs insatisfiables de
l’algorithme 8.
Les formules de test sont des problèmes de vérification générés par notre outil Stuff [16],
et correspondent à des itérations de calcul de préimage symbolique à partir de la négation
d’un objectif de preuve sur un système de transition. Plus précisément, si T(s, s0
) est la
relation de transition du système, appliquée à l’état courant s et à un successeur s
0
, le calcul
de préimage itéré est défini ainsi :
G1(s) ≡ QE(s
0
, P O(s) ∧ T(s, s0
) ∧ ¬PO(s
0
))
Gi+1(s) ≡ QE(s
0
,PO(s) ∧ T(s, s0
) ∧ Gi(s
0
))
La formule de chaque nouvelle itération contient donc le résultat de l’itération précédente
et grossit rapidement.
Comparaison de performances expérimentales.
Reconf Triplex
1 2 3 4 5 1 2 3
Durée totale
ms
SMT-test 53 172 114 371 99 953 131 855 318 257 13 855 30 163 119 771
struct 800 883 2 063 5 587 10 078 1 627 4 785 23 413
hybrid 25 078 27 837 31 024 50 160 51 913 7 005 16 978 42 063
Nb. cubes
dans O
SMT-test 55 106 125 119 264 33 38 84
struct 37 38 84 153 243 26 31 51
hybrid 37 39 45 70 74 23 28 48
Durée
ms / itération
SMT-test 966 1 078 799 1 108 1 205 419 793 1 425
struct 21 23 24 36 41 62 154 459
hybrid 677 713 689 716 701 304 606 876
Extrapol.
ms / itération
SMT-test 938 1 049 768 1 075 1 163 369 618 919
struct 1.810 0.684 0.595 0.483 0.427 0.115 0.290 0.117
hybrid 652 687 661 686 667 261 361 392
Projection
ms / itération
SMT-test 11 9 6 8 9 8 11 14
struct 5 6 5 5 5 19 30 42
hybrid 10 10 9 9 8 8 11 14
Check-sat
ms / itération
SMT-test 16 19 24 23 32 42 163 491
struct 14 16 18 31 35 43 123 416
hybrid 14 16 17 21 25 34 234 469
Nous donnons ici les résultats sur deux systèmes2
: le premier est une logique triplex
fournie par Rockwell-Collins, qui mêle Booléens et réels, pour laquelle nous calculons les
1Outil disponible à https://cavale.enseeiht.fr/redmine/projects/smt-qe/files
2Disponibles à https://cavale.enseeiht.fr/redmine/projects/smt-qe/files
26Découverte d’Invariants 2.2 Une Architecture Collaborative
trois premières préimages ; le second est une logique de reconfiguration distribuée mêlant
Booléens et entiers, pour laquelle nous calculons les cinq premières préimages. Nous ne les
détaillons pas plus ici et dirigeons le lecteur intéressé vers [16].
Le tableau 7.4 montre la performance des techniques d’extrapolation au travers de différentes
métriques. D’abord, la durée totale d’exécution en millisecondes. Ensuite, le nombre
d’itérations de la boucle principale de QE, qui correspond aussi au nombre de cubes
dans la formule DNF résultat. Nous donnons ensuite la durée moyenne d’une itération de
la boucle principale de QE, en détaillant les contributions de : (i) l’extrapolation, (ii) la
projection, (iii) l’obtention du modèle.
Les tests nous ont permis de remarquer que la durée d’exécution et le nombre total
d’itérations de la QE avec SMT-test pouvait varier grandement, jusqu’à ±50% d’une exé-
cution à l’autre, sur une même formule. Ceci est dû à la sensibilité à l’ordre dans lequel
SMT-test considère chaque littéral et – comme pour les méthodes struct et hybrid, à l’ordre
dans lequel les modèles sont découverts. La méthode struct est la plus stable de toutes avec
des variations de durée d’exécution de seulement ±5%.
Les bénéfices de l’analyse structurelle sans tests SMT sont clairement mis en avant : la
méthode de QE avec extrapolation struct est de loin la plus rapide de toutes les techniques,
parfois de plusieurs ordres de grandeur (cf. Reconf 5, struct termine en 10 secondes contre
300 secondes pour SMT-test, en produisant un nombre de cubes comparable). La contrepartie
est aussi apparente : en ne considérant pas finement la sémantique des littéraux
manipulés, mais seulement leur rôle structurel dans la formule, des littéraux inutiles peuvent
s’accumuler dans l’extrapolant et le rendre moins général. Mais, dans les rares cas où
les DNF produites contiennent plus de cubes (cf. Reconf 4), elles sont malgré tout produites
beaucoup plus rapidement qu’avec les autres techniques.
Si la taille de la formule produite est importante pour l’application en question, le meilleur
compromis entre rapidité d’exécution et pouvoir de généralisation semble être atteint avec
la méthode d’extrapolation hybrid : elle produit des formules DNF jusqu’à trois fois plus petites
en nombre de cubes que struct ou SMT-test (cf. Reconf 5, 74 cubes en 50 secondes contre
243 cubes en 10 secondes avec struct, et 264 cubes en 300 secondes pour SMT-test), montrant
donc une capacité de généralisation supérieure. En outre, hybrid s’est avérée beaucoup plus
rapide que la technique SMT-test de référence dans tous les tests conduits, et la variance des
temps d’exécution est aussi beaucoup plus faible qu’avec SMT-test, de l’ordre de ±10%.
2.2 Une Architecture Collaborative
Notre architecture est paramétrée par un entier n indiquant la profondeur maximale à
laquelle le moteur de k-induction est autorisé à dérouler la formule de transition. La Figure
2.2 illustre le fonctionnement de l’architecture à haut niveau. Des méthodes générent
272.2 Une Architecture Collaborative Découverte d’Invariants
Potential
Invariant
Generator
Potential
Invariant
Generator
Potential
Invariant
Generator
k-induction
if contains PO Done
if contains PO
Minimization
potential
invariants
Un (contains PO)
Fn Vn
counter example
V
proof
found
new invariants Vmin
Figure 2.2: Une architecture collaborative basée sur la k-induction.
des invariants potentiels et les envoient au moteur de k-induction en charge d’identifier
ceux étant effectivement des invariants. Pour ce faire la k-induction construit de manière
incrémentale trois ensembles Fn, Un et Vn à partir d’un ensemble d’invariants potentiels
s contenant l’objectif de preuve comme suit. L’ensemble Fn contient les invariants potentiels
falsifiables par n-induction, i.e. ceux pour lesquels l’instance de base est satisfiable.
L’ensemble Un contient ceux pour lesquels l’instance de base est insatisfiable mais l’instance
de step est satisfiable : leur statut est non-défini (Undefined). Enfin, l’ensemble Vn contient
les invariants potentiels prouvables par n-induction.
Si l’objectif de preuve PO est dans l’ensemble Vn, alors l’analyse est terminée, PO a été
renforcé et est prouvable par n-induction. Si PO est dans l’ensemble Fn, alors un contreexemple
existe et PO n’est pas un invariant. Si PO est dans Un alors la k-induction recommence
l’analyse décrite ci-dessus avec les nouveaux invariants potentiels générés par les
autres méthodes de l’architecture. Les invariants découverts durant une analyse –les élé-
ments de Vn– sont quant à eux communiqués aux méthodes de génération d’invariants potentiels
dans le but de raffiner les analyses qu’elles effectuent.
Nous illustrons à présent la découverte d’invariants par instanciation de templates via
élimination de quantificateurs bénéficiant des améliorations apportées à l’algorithme de
Monniaux présentées en Section 2.1. Cette méthode, appelée BrutalIQe, est fortement inspirée
des travaux de Kapur [49, 50]. Nous supposons l’existence d’une base de données de
fonctions de la forme template(vars)(params) retournant une formule, comme par exemple
template(var1, var2)(min, max )
∆= (min ≤ var1 + var2) ∧ (var1 + var2 ≤ max ).
L’argument vars de la fonction représente des variables d’état du système et params les
paramètres de la template. L’idée est de trouver des valeurs p pour ces paramètres. Notons
tout d’abord que le fait que la formule produite est (1-)inductive est équivalent à
l’insatisfiabilité de la formule
instance de base
z }| {
(I(s) ∧ ¬template(sv)(p)) ∨
instance de step
z }| {
(template(sv)(p) ∧ T(s, s0
) ∧ ¬template(sv0
)(p)).
28Découverte d’Invariants 2.3 Découverte d’Invariants Potentiels par QE
Nous construisons ensuite la formule suivante, dont les modèles sont exactement les valeurs
des paramètres pour lesquelles la template est inductive :
∀s, s0
, ¬
(I(s) ∧ ¬template(sv)(fresh))
∨ (template(sv)(fresh) ∧ T(s, s0
) ∧ ¬template(sv0
)(fresh))
où fresh est un vecteur de nouvelles variables. Cette formule peut être réécrite en
¬
∃s, s0
, (I(s) ∧ ¬template(sv)(fresh))
∨ (template(sv)(fresh) ∧ T(s, s0
) ∧ ¬template(sv)(fresh))
.
Il est à présent possible d’utiliser l’élimination de quantificateurs pour éliminer les variables
d’état du système pour obtenir un caractérisation sans quantificateurs des paramètres :
C
∆= ¬QE
s ∪ s
0
, (I(s) ∧ ¬template(sv)(fresh))
∨ (template(sv)(fresh) ∧ T(s, s0
) ∧ ¬template(sv0
)(fresh))
.
C ne porte que sur les variables fresh ; si elle est insatisfiable, alors aucune valeur de fresh
ne peut rendre la template inductive sans davantage de renforcement. Si au contraire C est
satisfiable, un modèle fournit des valeurs pour les paramètres de la template permettant
d’obtenir des invariants inductifs par construction. La formule obtenue est alors envoyée
au moteur de k-induction dans l’espoir de renforcer l’objectif de preuve mais également
afin de communiquer l’invariant découvert aux autres méthodes du framework.
En pratique, nous utilisons BrutalIQe pour découvrir des bornes sur les variables détat
du système. Cela permet de réduire fortement l’espace d’états considéré par la k-induction
et les autres méthodes, leur permettant de raffiner leurs analyses.
2.3 Découverte d’Invariants Potentiels par QE
Nous abordons à présent la contribution principale de ce mémoire, une heuristique
de génération d’invariants potentiels combinant le calcul de préimages par élimination de
quantificateurs avec le calcul d’enveloppes convexes. L’approche, nommée HullQe, bénéfi-
cie grandement des améliorations apportées à l’algorithme de QE de Monniaux présentées
dans la Section 2.1 et se décompose en deux parties. Premièrement, un calcul de pré-images
de la négation de l’objectif de preuve PO construit itérativement une caractérisation des
états gris. Les états gris sont des états vérifiant l’objectif de preuve desquels une falsification
292.3 Découverte d’Invariants Potentiels par QE Découverte d’Invariants
de PO peut être atteinte en un certain nombre de transitions. Dans un second temps, une
analyse des partitionnements de la représentation partielle des états gris essaie d’infèrer
des relations entre les variables envoyées au moteur de k-induction en tant qu’invariants
potentiels.
2.3.1 Calcul de Pré-images
Cette première étape de notre heuristique de génération d’invariants potentiels consiste
à calculer une caractérisation de tous les états gris pouvant atteindre une falsification de
l’objectif de preuve PO en une transition. Ce calcul est itéré afin d’identifier des états gris de
plus en plus éloignés des états falsifiant PO. En pratique, nous nous intéressons à la suite de
formules suivante :
G1(s)
∆= QE(s
0
, PO(s) ∧ T(s, s0
) ∧ ¬PO(s
0
))
Gi(s)
∆= QE(s
0
, PO(s) ∧ T(s, s0
) ∧ Gi−1(s
0
)) (for i > 1).
Ainsi, Gi(s) caractérise tous les états pouvant atteindre une falsification de l’objectif de
preuve en i transitions ou moins. Si pour un certain i, Gi+1(s) ne caractérise pas davantage
d’états que Gi(s), un point fixe est atteint et tous les états gris ont été découverts. Si
aucun d’eux n’intersecte les états initiaux, i.e. (
V
0≤j≤i Gj (s))∧I(s) n’est pas satisfiable, alors
PO est un invariant du système.
Malheureusement, il n’est pas réaliste de s’attendre à atteindre un point fixe sur des
système complexe tels que ceux qui nous intéressent. Les caractérisations partielles des états
gris sont donc envoyées au fur et à mesure au second composant de notre heuristique en
charge de faire apparaitre des relations entre les variables par calcul d’enveloppes convexes.
2.3.2 Extraction d’Invariants Potentiels par Calcul d’Enveloppes Convexes
Notons tout d’abord que l’algorithme que nous utilisons pour le calcul de pré-images a
la propriété de produire des formules en forme normale disjonctive ou DNF, i.e. des disjonctions
de conjonctions de littéraux. Dans cette section nous utiliserons couramment le terme
polyhèdre pour nous référer à une conjonction de littéraux. D’un point de vue géometrique,
une formule en DNF correspond à une union de polyhèdres tels que ceux représenté sur la
Figure 2.3a et la Figure 2.3b.
En raison du grand nombre de polyhèdres apparaissant dans les pré-images calculées
sur nos systèmes, il n’est pas réaliste de calculer toutes les enveloppes convexes possible.
De plus, il est important de préserver la localité des polyhèdres. Il est donc nécessaire
d’établir des critères conditionnant le calcul des enveloppes covexes dans le but d’identifier
les groupes de polyhèdres proches les uns des autres.
30Découverte d’Invariants 2.3 Découverte d’Invariants Potentiels par QE
x ≥ y
x
y
(a) x ≥ y
x ≥ y
x ≥ 3
y ≤ 8
x
y
(b) x ≥ y ∧ x ≥ 3 ∧ y ≥ 8
Figure 2.3: Polyhedra examples.
Enveloppes Convexes Exactes
Le premier critère que nous proposons consiste à ne valider l’enveloppe convexe h de
deux polyhèdres p1 et p2 que si celle-ci est exacte ; c’est à dire si elle décrit exactement les
mêmes points que l’union des deux polyhèdres dont elle est issue. Plus précisemment, cela
signifie que h a exactement les mèmes modèles que p1 ∨ p2. Ce critère est particulièrement
intéressant pour des polyhèdres dont les littéraux sont dans l’arithmétique entière linéaire.
La Figure 2.4 illustre les nouvelles relations pouvant apparaître lors du calcul d’ECH sur des
polyhèdres entiers. Dans le cas réel, aucune de ces enveloppes convexes ne serait exacte, et
de façon plus générale il n’est pas possible de faire apparaître de nouvelles relations entre
des variables réelles au moyen d’ECH. Nous verrons que nous utilisons un critère différent
pour les traiter.
x
y
0 1 2 3 4
0
1
2
3
s1
s2
s3
s4
s5
Figure 2.4: ECH de polyhèdres entiers.
Nous proposons un algorithme hautement optimisé décrit dans la Section 9.2.1 permettant
de calculer efficacement toutes les ECHs calculables à partir d’un ensemble non redondant
de polyhèdres. Cela nous permet de faire apparaître de nouvelles relations entre les
variables d’états dirigées par le calcul de pré-images présenté dans la section précédente.
Cependant, les enveloppes convexes ainsi générées caractérisent des états gris, c’est à
dire des états que nous souhaitons bloquer lors d’une tentative de preuve par k-induction.
312.3 Découverte d’Invariants Potentiels par QE Découverte d’Invariants
tobs
ti
0
boundobs
boundi
tobs − ti < (max obs − max i − 1)
0 ≤ tobs ≤ max obs ∧ 0 ≤ ti ≤ max i
First pre-image
Second pre-image
Figure 2.5: Découverte d’invariant relationnels sur le système de reconfiguration.
C’est pourquoi l’extraction d’invariants potentiels considère l’ensemble des littéraux découverts
indépendamment de l’enveloppe convexe à laquelle ils appartiennent. Les invariants
potentiels envoyés à la k-induction sont finalement l’ensemble des négations de chacun de
ces littéraux. Les éléments de cet ensemble confirmés comme étant des invariants par le
moteur de k-induction sont garantis de bloquer au moins une partie des contre-exemples de
step fallacieux apparaissant dans un tentative de preuve par k-induction.
Nous illustrons à présent l’intérêt de cette approche sur notre système de reconfiguration.
L’objectif de preuve PO de ce système est que “aucune chaîne n’est en contrôle de
l’actuateur” ne peut pas être vrai pendant plus de n cycles. Pour détecter une falsification de
PO un observateur du système utilise un compteur s’incrémentant tant qu’aucune chaîne de
calcul n’est en contrôle, et est remis à zéro sinon. Aucun outil de vérification formelle n’est
capable, à notre connaissance, de conclure sur ce système. La difficulté de l’analyse réside
dans le besoin d’identifier des relations entre les compteurs du système pour la confirmation
des défaillances, ainsi que le transfert de contrôle d’une chaîne à une autre.
Grâce au calcul exhaustif d’enveloppes convexes exactes, notre outil est capable de renforcer
l’objectif de preuve en quelques secondes. Après le calcul de la deuxième pré-image,
150 invariants potentiels sont envoyés à la k-induction. 70 sont prouvés et renforcent PO. Il
s’avère que seulement trois sont nécessaire au renforcement de l’objectif de preuve, exprimant
des relations entre le compteur de l’observateur et ceux apparaissant dans le système
de reconfiguration. La Figure 2.5 illustre le processus de découverte de ces relations.
Il est à noter que les résultats obtenus ne dépendent pas de la valeur des bornes des
compteurs, auxquelles sont sensibles la plupart des autres techniques formelles. Ces compteurs
peuvent être amenés à compter des centaines, voire des milliers de cycles suivant la
spécification du système. La k-induction, IMC, ainsi que PDR doivent dérouler la relation
de transition un nombre de fois proportionnel ce qui provoque la divergence de l’analyse.
32Découverte d’Invariants 2.3 Découverte d’Invariants Potentiels par QE
Enveloppes Convexes Modulo Intersection
Le second critère que nous proposons consiste à n’accepter l’enveloppe convexe h de
deux polyhèdres p1 et p2 que si p1 et p2 ont au moins un point en commun, c’est à dire si
p1 ∧ p2 est exacte. Si h est légale par ce critère, nous dirons que h est l’ICH de p1 et p2.
Ce critère n’est pas plus permissif que ECH. En effet, les ECH présentées ci-dessus dans
le cadre de la vérification du système de reconfiguration ne sont pas légales par rapport à ce
second critère. Les ICHs diffèrent également des ECH de par le fait qu’elle font apparaître
de nouveaux points dans les enveloppes convexes qu’elles calculent. Leur but est de surapproximer
des régions de l’espace d’états gris tout en évitant de fusionner des polyhèdres
distants.
Sur nos systèmes, le nombre d’ICH calculable est en général beaucoup trop grand pour
adopter une approche exhaustive. C’est pourquoi nous proposons, dans la Section 9.2.4, un
algorithme consistant à éliminer les polyhèdres fusionnables et à les remplacer par leur ICH
avant de rechercher d’autres combinaisons de polyhèdre légales. Ce faisant, une abstraction
des zones disjointes de l’espace d’états gris est calculée. Nous appliquons ensuite la même
stratégie d’extraction d’invariants potentiels que pour les ECHs : L’ensemble des négations
de chaque littéral apparaissant dans le résultat de l’algorithme est envoyé à la k-induction.
Nous illustrons l’intérêt de cette approche sur le système de logique de vote fournit
par Rockwell Collins. L’objectif de preuve que nous considérons est que si les entrées du
système sont bornées, alors c’est également le cas de sa sortie. Des invariants relationels
renforçant la propriété ont été trouvés à la main [32] au prix de longues simulations, une
approche inadaptée à la vérification de systèmes critiques dans le cadre d’un processus de
développement. À notre connaissance, aucun outil de vérification formelle n’est capable de
vérifier ce système. La difficulté de l’analyse réside dans la nécessité de trouver des invariants
reliant les trois variables d’égalisation du système desquelles dépend directement la
valeur du signal de sortie. Grâce au calcul d’ICHs, notre outil est capable de vérifier ce système
industriel en quelques secondes. Environ 60 invariants potentiels sont générés, dont
30 sont prouvés par k-induction et renforcent l’objectif de preuve. Il s’avère que seulement
deux sont nécessaires. La Figure 2.6 illustre le processus de découverte de ces invariants,
les invariants trouvés par simulation sont représentés en gris clair. La Figure 2.6a montre
la première préimage de la négation de l’objectif de preuve en noir, alors que la Figure 2.6b
montre le résultat du calcul d’ICH.
Comme c’est le cas pour le calcul d’ECHs sur le système de reconfiguration présenté
dans la section précédente, l’analyse menée ici n’est pas sensible à la taille des intervalles de
validité supposés sur les entrées du système de vote ni de celui à prouver sur sa sortie. Ce
n’est pas le cas de la k-induction, ni d’IMC ou de PDR qui doivent dérouler la relation de
332.4 Le Framework Formel Stuff Découverte d’Invariants
(a) Logique de vote, première pré-image
(en noir). (b) Résultat du calcul d’ICHs (en noir).
Figure 2.6: Logique de vote en dimension deux.
transition un nombre de fois proportionnel à la taille de ces intervalles, et donc ne parviennent
pas à conclure.
2.4 Le Framework Formel Stuff
Nous avons implémenté l’architecture collaborative parallèle décrite dans la Section 2.2
dans notre framework formel Stuff (Stuff’s The Ultimate Framework). Ce dernier est écrit
en Scala et utilise le framework Akka qui propose une API, basée sur le formalisme des acteurs
[39], pour le développement de logiciels parallèles. Nous détaillons notre utilisation
des acteurs dans la Section 10.1 du mémoire. Le framework Akka confère à Stuff la possibilité
de spécifier, après compilation, comment déployer ses composants sur plusieurs coeurs,
voire même sur plusieurs machines au travers d’un réseau.
De plus, Stuff est également extensible dans l’implémentation de nouvelles techniques
qui se fait sans impact sur le code existant. Comme décrit dans la Section 10.2, les techniques
sont gérées à l’exécution au moyen du patron de conception des chaînes de responsabilité,
permettant au framework de gérer des techniques avec un minimum de connaissance sur la
façon dont elles fonctionnent.
Enfin, les solveurs SMT utilisés par Stuff peuvent être spécifiés après compilation, grâce
à une librairie générique implémentée par nos soins. Cette librairie, appelée Assumptio, est
détaillée dans le Chapitre 11. Assumptio est compatible avec les principaux solveurs SMT
respectant le standard SMT-LIB 2 : Z3, CVC4 et MathSat 5.
Stuff s’est montré très utile dans nos récents travaux visant à la vérification d’une chaîne
fonctionnelle complète. En le combinant avec un interprétateur abstrait [65] développé à
l’Onera, nous avons pu vérifier la stabilité en boucle ouverte de la chaîne représentée en Fig-
34Découverte d’Invariants 2.4 Le Framework Formel Stuff
ure 2.7. Bien que considérablement plus simple que les chaînes fonctionnelles industrielles,
la vérification de cet exemple exécutable est un premier pas vers l’analyse de systèmes plus
complexe. Les moniteurs de capteurs (Sat) sont vérifiés par interprétation abstraite en utilisant
des intervalles en tant que domaines abstraits. Stuff se charge de vérifier la correction
des systèmes de vote au moyen de l’analyse basée sur les enveloppes convexes modulo intersection
présentée en Section 2.3.2. Enfin, l’interpréteur abstrait conduit une analyse utilisant
des ellipsoides permettant de prouver la stabilité de la loi de commande. La stabilité
de la chaîne est ainsi vérifiée de bout en bout.
u
Controller
in0_d in1_d
Triplex
in0
Triplex
in1
System
in0_v
in1_v
in0a Sat
in0b Sat
in0c Sat
in1a Sat
in1b Sat
in1c Sat
Figure 2.7: Une chaîne fonctionnelle simplifiée.
35CHAPTER 3
Conclusion
3.1 Conclusion
La vérification de logiciels est un domaine de recherche très actif, mais malgré les impressionnantes
avancées de ces dernières décennies certains systèmes restent hors de portée
des techniques actuelles. Le but de cette étude était d’améliorer l’état de l’art sur le problème
de la vérification automatique des composants logiciels issus de systèmes critiques embarqués
avioniques, présentés dans le Chapitre 1. Nous nous sommes en particulier concentrés
sur la découverte d’invariants relationels dans le cadre d’un framework collaboratif centré
autour d’un moteur de k-induction. Nous espérons que nos travaux aideront à la diffusion
de la vérification formelle dans la communauté industrielle.
Tout d’abord, nous avons formalisé la notion de systèmes de transition en termes de
prédicats dans MSFOL (logique du premier ordre multi-sortée) en Section 1.2.1 et Section 1.2.2.
La formalisation complète est donnée en Chapitre 5 et Chapitre 6. Nous avons défini une
catégorie de signatures MSFOL dans laquelle les notions de trace, d’objectif de preuve, de
validité, etc. sont précisemment formalisés. Ce type de représentation est très répandu
dans la littérature, mais les détails mathématiques et en particulier la sémantique précise du
déroulement de la relation de transition sont souvent omis.
Nous avons présenté notre contribution principale dans le Chapitre 2, exposée en détail
dans la Partie II. Nous avons commencé par améliorer l’algorithme d’élimination de quantificateurs
(QE) de Monniaux sur l’arithmetique réelle linéaire en Section 2.1 (correspondant
au Chapitre 7). Cela nous a permis de gagner plusieurs ordres de grandeur dans le calcul
de pré-images sur des systèmes de transition, gain mis en évidence par nos expérimentations
sur un grand nombre de benchmarks. Nous avons également adapté l’algorithme
aux formules mélangeant arithmétique réelle, octogones entiers et booléens. Nous avons
ensuite proposé des méthodes de découverte d’invariants profitant des améliorations apportées
à l’algorithme de QE. Premièrement, une méthode basée sur des templates, appelée
BrutalIQe, s’inspirant des travaux de Kapur [49] en Section 2.2 (cf. Section 8.2). En pratique
cette technique est utilisée pour decouvrir des invariants sous forme d’intervalles en-3.2 Perspectives Conclusion
cadrant les variables d’état du système. Dans un deuxième temps, nous avons proposé,
HullQe, une nouvelle heuristique de découverte d’invariants en Section 2.3 –correspondant
au Chapitre 9. HullQe calcule des pré-images d’états dangereux et étudie leurs partitionnements
pour en extraire des invariants potentiels relationels. Enfin, nous avons proposé
une architecture de moteur de preuve parallèle collaboratif centré autour de la k-induction
en Section 2.2 (voir Section 8.1). Cette architecture permet aux techniques de découverte
d’invariants de coopérer grâce à l’intégration continue des invariants découverts.
Stuff est l’implémentation de cette architecture, présentée en Section 2.4 –et détaillée dans
la Partie III. Nous avons présenté le formalisme des acteurs sur lequel Stuff est bâti, ainsi
que son caractère extensible, notamment par rapport à l’ajout de technique sans impact sur
les techniques déjà implémentées, et par rapport aux solveurs SMT utilisés pouvant être
spécifiés après compilation.
Nous avons évalué l’intêret de notre approche collaborative proposée dans ce mémoire
sur un système de reconfiguration et un système de vote fourni par Rockwell Collins. Stuff
conclut en quelques secondes grâce à la collaboration entre les différentes méthodes du
framework.
Enfin, nous avons étudié la combinaison de notre outil avec un interpréteur abstrait [65]
dans l’optique de la vérification d’une chaîne fonctionnelle complète. Grâce à cette combinaison
nous avons pu vérifier automatiquement une partie d’une chaîne fonctionnelle comportant
des entrées correspondant à des capteurs tripliqués, des moniteurs de capteurs, des
systèmes de vote et une loi de commande contrôllant un actuateur. Les résultats obtenus
sur un système exécutable représentatif sont une avancée vers la vérification de chaînes
fonctionnelles industrielles.
3.2 Perspectives
3.2.1 Élimination de Quantificateurs
L’élimination de quantificateurs (QE) est une brique de base utilisée par toutes les techniques
de découverte d’invariants présentées dans ce mémoire. Une direction naturelle de
recherche est donc d’étendre notre technique de QE à des fragments plus généraux, tels
que l’arithmétique entière linéaire et l’arithmétique réelle non-linéaire. De telles extensions
impacteraient l’ensemble du framework et permettraient d’évaluer la pertinence de notre
approche sur des systèmes s’exprimant dans des fragments plus complexes. De ce point de
vue, les limitations se situent au niveau de la phase de projection. En effet, les solveurs SMT
actuels sont déjà capables de traiter ces fragments, et notre analyse structurelle est tout à fait
compatible avec eux.
38Conclusion 3.2 Perspectives
Pour ce qui est de la projection de (conjonction de) littéraux, les techniques Cylindrical
Algebraic Decomposition (CAD [21]) et Virtual Substitution (VS [79, 80]) sont capables de
manipuler l’arithmétique entière non-linéaire. Malheureusement, elles sont loin de passer
à l’échelle sur des problèmes d’élimination de quantificateurs extraits de la vérification de
systèmes industriels tels que les notres. Augmenter le pouvoir d’expression des formules
d’entrée de la procédure de QE ne doit pas se faire au détriment de ses performances : toutes
nos techniques, excepté la k-induction, s’appuient fortement sur la rapidité de la procédure
de QE. Changer la phase de projection pour CAD ou VS causerait une baisse en performance
conséquente, et pourrait rendre le framework dans son ensemble inutilisable. Nous pensons
que davantage de recherche sur ce sujet est nécessaire, par exemple en identifiant des
sous-fragments de l’arithmétique non-linéaire pour lesquels des algorithmes de QE efficaces
existent. Une autre direction d’intêret est la combinaison des approches susnommées [72].
3.2.2 HullQe
La méthode HullQe est composée de deux parties : un calcul incrémental de pré-image
et les heuristiques étudiant celles-ci afin d’en extraire des invariants potentiels. Des invariants
relationel pertinents sont découverts en fusionnant les différents polyhèdres apparaissant
dans les pré-images. L’explosion du nombre d’invariants potentiels générés est limitée
par des critères conditionnant la fusion de deux polyhèdres. Une première heuristique
n’autorise une fusion que si celle-ci est exacte, la deuxième impose que les deux polyhè-
dres aient au moins un point en commun. Il serait intéressant d’évaluer des critères plus
permissifs sur des systèmes réalistes.
De plus, introduire un mécanisme d’abstraction dans le calcul de pré-image pourrait
accélérer le calcul des états gris et permettre de découvrir de nouveaux invariants. Des
travaux récents [22] introduise une technique d’abstraction adaptable a priori dans le calcul
de pré-images : si une trace contre-exemple partant des états initiaux est découverte, un
algorithme détermine quelles approximations la rendent possible –dans le cas où cette trace
ne constitue pas un vrai contre-exemple– et les annule.
3.2.3 Property-Directed Reachability
PDR est une technique très prometteuse, conçue à l’origine pour des systèmes purement
propositionnels. Généraliser cette approche au cas SMT n’est pas simple : les auteurs de [19]
proposent une adaptation de PDR à l’analyse de programmes sous la forme de Control Flow
Graphs (CFG) contenant de l’arithmétique. Ils proposent une version “ramifiée” de PDR qui
réduit l’explosion combinatoire de l’espace de recherche en bloquant des cubes pour des
branches abstraites du propramme au lieu d’essayer de les bloquer pour le système entier.
Il serait très intéressant d’adapter cette approche à l’analyse de programmes Lustre.
393.2 Perspectives Conclusion
3.2.4 Stuff
Les travaux présentés dans ce mémoire omettent le cas où l’objectif de preuve n’est pas
un invariant du système considéré. Il est alors important de produire un ou plusieurs contreexemple(s)
de manière efficace, ce qui peut s’avérer problématique pour des systèmes réalistes.
PDR prend en compte les états initiaux tout au long de l’analyse, et effectue une
exploration en arrière des antécédents de la négation de l’objectif de preuve. Cette stratégie
rend PDR capable de trouver des contre-exemples bien plus rapidement que le BMC et la
plupart des autres méthodes formelles, a fortiori dans sa version ramifiée.
La recherche de contre-exemples est d’un grand intêret pour les industriels de notre domaine
et dans le cadre de la coûteuse phase de détection et correction de bugs. Malheureusement
les traces contre-exemple produites par les méthodes formelles sont généralement constituées
d’états concrets trouvés par des solveurs SMT. Il est donc souvent difficile pour les
dévelopeurs d’identifier l’origine du bug dans le modèle, en particulier pour des traces de
centaines ou de milliers d’états. PDR diffère de la plupart des autres méthodes et produit,
non pas une unique trace, mais une classe de contre-exemples sous la forme d’une séquence
de cubes. Il serait intéressant d’évaluer l’intêret de ces contre-exemples abstraits pour les
concepteurs de systèmes critiques lors de la phase de correction de bugs dans un contexte
industriel.
Enfin, nous projetons de continuer nos travaux visant à la vérification de chaînes fonctionnelles
complètes grâce à la combinaison de notre framework et de l’interpréteur abstrait
introduit dans [65]. Nous insistons sur le besoin de cas d’étude, idéalement industriels.
Nous avons étudié avec succès une famille importante de propriété en boucle ouverte, mais
davantage de recherche est nécessaire pour étendre et améliorer ces résultats. En particulier
pour automatiser la décision de la méthode à employer pour analyser chaque sous-système.
Il est également primordial d’assurer le passage à l’échelle de l’approche aux système réels,
pouvant utiliser plus de dix fois plus de variables d’état.
40PART I
Introduction
Critical systems are systems the failure of which has catastrophic consequences such
as human casualties, economic loss, etc. They are typically encountered in fields such as
aerospace, avionics, automotive, rail transport, nuclear plants, medical equipment, hardware
design. . . There is thus a strong interest in (i) establishing precise specifications of
those systems, and (ii) making sure that the final product is correct with respect to the specifications.
The work presented in this thesis focuses on the latter in the context of software
components of avionics critical embedded systems.
Until recently, the industry in our domain is mostly relying on a process-based quality
assurance approach. The introduction of the DO-178C avionics norm and of its formal methods
supplement DO-333 published by RTCA1
shows a will to consolidate this process-based
approach with a product-based quality assurance one.
Process-based quality assurance consists in a thorough inspection of the process leading
to the creation of the product. If the process is deemed trustworthy, then so is the resulting
product. For avionics hardware parts for example the design and production of components
are closely monitored at the process level. They are then tested against their specification by
sampling the global production rather than testing all of them.
Product-based quality assurance on the other hand aims at verifying, in a sound way,
that the final product itself meets its specification. This especially applies to software, for
which there exists methods amenable to automation to prove mathematically that the software
itself respects its specification. These methods, established by the research community
in computer science, are called formal methods. The interest of the approach is strengthened
by the fact that software is made of zeros and ones which can be easily duplicated without
any margin of error, which is not the case of hardware.
Avionics critical embedded systems are traditionally developed in a high-level language
(model level) different from the final implementation language (code level). Formal methods
are available for each phase of this development process:
• formal specification [71, 35] provides languages with mathematical semantics and al-
1http://www.rtca.org/lows one to express what the system should do;
• verification of models against high-level specifications [16, 17, 23, 55, 12, 6] proves
mathematically that the design of the system respects its specification;
• code generation from high-level models [13] produces code respecting the semantics
of the high-level language, thus preserving the verification effort thanks to certified /
proved compilers.
The work presented in this thesis focuses on the automatic verification of models against
their specification. Indeed, while certification organisms acknowledge the existence of formal
methods and advise to use them, there is a gap to bridge between their capabilities and
the systems and specifications encountered in the industry. In practice verification of arbitrary
functional properties on realistic systems often requires expert knowledge about the
systems analyzed and the verification technique(s) used. The spread of formal verification
in the industrial community is hindered by this need for costly and time-consuming expert
intervention.
The goal of this thesis is to improve on the state of the art of formal verification in our
application domain by (i) improving its automation on common design patterns found in
avionics systems; (ii) finding proofs that can be quickly re-checked and are thus trustworthy.
To achieve these goals we propose to study the collaboration of existing formal methods –
such as SMT solving, k-induction, Quantifier Elimination, etc. – to propose a methodology
for the automatic discovery of lemmas easing the process of concluding the proof. Also, this
work focuses on parallel algorithms, consistently with the current trend of multi-core and
many-core computers.
In this part of the thesis, we expose further the problem of formal verification of avionics
critical systems at the model level in Chapter 4. We discuss languages used in model
level conception in Section 4.1 and present common avionics design patterns in Section 4.2.
Chapter 5 introduces basic formal notions to model the verification problems in Section 5.1
and presents building blocks to work on said verification problems, SAT and SMT solvers,
in Section 5.2. Then, Chapter 6 formalizes the representation of critical systems thanks to
transition systems in Section 6.1 and reviews the state of the art of transition system verification
in Section 6.2 and Section 6.3. Part II presents our main contribution, a parallel
collaborative proof engine architecture as well as invariant discovery methods to incorporate
in this framework. Part III presents the most interesting aspects of our implementation
of this proof engine, called Stuff.
2CHAPTER 4
Problem
In this thesis, we focus on the analysis of embedded reactive systems [38]. These systems
sample their environment using sensors, and compute an output used as a command
for an actuator. Sampling is performed at regular intervals specified by the frequency of
the system. We consider embedded reactive software functions which contribute to the
safe operation of collections of hardware sensors, networked computers, actuators, moving
surfaces, etc. called functional chains. A functional chain can for instance be in charge of
"controlling the aircraft pitch angle", and must meet both qualitative and quantitative safety
requirements depending on the effects of its failure. Effects are ranked from MIN (minor effect
with no casualties) to CAT (catastrophic effect with casualties). For instance, the failure
of a pitch control function is ranked CAT, and it shall be robust to at least a double failure
and have an average failure rate of at most 10 −9 per flight hour. In order to meet these requirements,
engineers must introduce hardware and software redundancy and implement
several fault detection and reconfiguration mechanisms in their software.
Software development is hard, even more so when developing real-time systems. To
address this issue, programmers first design their programs in a language abstracting away
real-time constraints. A code generator then produces low-level code targeted in real-time
operating systems. We present design languages, and in particular the Lustre language, in
Section 4.1. We then present our use case in Section 4.2, a typical avionics functional chain.
We will focus in particular on the reconfiguration and voting subsystems.
4.1 Lustre: A Synchronous Programming Language
Embedded systems in general and functional chains in particular have to comply with
real-time constraints such as release dates and deadlines on the computations, assuming a
non-faulty hardware. Low-level Application Programming Interfaces (API) such as POSIX [37]
are now widely used for development of small real-time systems. To develop complex functional
chains however, using such a low-level approach is tedious and error-prone, and
overall unrealistic. This is why during the eighties synchronous languages such as Lustre [36],
Esterel [7] and Signal [5] were proposed. The idea behind the synchronous paradigm is to4.1 Lustre: A Synchronous Programming Language Problem
provide designers with a language which (i) allows one to design real-time systems at a
higher level of abstraction; (ii) is formal, i.e. the semantics of a program is not ambiguous.
In the following we will refer to this level of abstraction as the model level, as opposed to code
level which is the code generated from a synchronous language. At the model level, realtime
constraints are abstracted to the notion of steps or cycles, and the following hypothesis
is assumed.
Definition 4.1.1 (Synchronous Hypothesis) The Synchronous Hypothesis consists in viewing
time as a succession of discrete instants at which computations take place instantly. Each of
these instants defines a global state, yielding a state machine or transition system semantics.
System design the at model level has many benefits. The most immediate from an industrial
point of view is that it shortens development processes by letting the code generator
handle the difficult part of implementing the high-level design by generating the low-level
code. It is thus not surprising that synchronous languages have been rapidly adopted by
embedded system designers. Most notably, the Esterel Technologies company1 provides
them with a complete suite of tools, the SCADE SuiteR , including the KCG code generator
certified/qualified according to international rail transport, nuclear energy, automotive
and avionics standards. The SCADE suite is centered around the SCADE language, which
is similar to Lustre. Verification, debug, coverage analysis. . . techniques are applied at the
model level, on SCADE programs. Verification at the model level is a rewarding approach:
as the code generator is trustworthy, a proof at the model level ensures the code generated
respects the specification.
Let us now give a brief overview of the Lustre language. It is the input language of the
verification tool in which the techniques discussed in this thesis have been implemented. In
addition to being a synchronous language, Lustre is a dataflow language: every variable or
expression is an infinite flow, or stream, of values following the rhythm of a clock. Every
Lustre program has a base clock, which represents the smallest, indivisible discrete steps for
the program. All the other clocks are streams of Boolean values for each instant defined by
the base clock and sample streams at a different, slower rate than the base clock. Consider
for instance the following Lustre program defining a node, i.e. a set of equations. Counter
c1 counts the number of cycles of the base clock and c2 counts the number of times clock,
the Boolean input of the system, is true.
1http://www.esterel-technologies.com/
4Problem 4.1 Lustre: A Synchronous Programming Language
node counters(clock: bool) returns (c1,c2: int);
let
c1 = 0 -> pre(c1) + 1;
c2 = 0 -> if clock then (pre(c2) + 1) else pre(c2);
tel
The equations linking the counters to the input are between the let and tel keywords.
Output c1 is initially zero, and at each step after that – operator -> – is equal to its value in
the preceding step plus one. Keyword pre is a unit delay operator defining a memory or latch.
The memory contains the value of the expression given as argument at the previous step. So
pre(c1) represents the value of stream c1 at the previous step. Stream c2 is also initially
zero but must stay the same when clock is false, and be equal to its previous value plus
one otherwise. Now, this node is observationally equivalent to the following one.
node counters(clock: bool) returns (c1,c2: int);
var
c2C: int;
let
c1 = 0 -> pre(c1) + 1;
c2C = (0 -> (pre(c2C) + 1)) when (true -> clock);
c2 = current(c2C);
tel
A local variable, c2C, has been introduced and follows a different clock than the base
one. The when keyword indicates that c2C is present – its clock ticks and its value is defined
– when (true -> clock) is true, i.e. in the initial state and whenever clock is true.
When it is not present, c2C is absent: it has no value. An example of trace – sequence of legal
values for the flows of the system – follows. With the exception of the line corresponding to
c2C, it is also a trace for the first version of the counters node since they are equivalent.
base clock true true true true true true true . . .
pre(c1) – 0 1 2 3 4 5 . . .
c1 = 0 -> pre(c1) + 1 0 1 2 3 4 5 6 . . .
clock false false true true false false true . . .
true -> clock true false true true false false true . . .
c2C 0 – 1 2 – – 3 . . .
c2 0 0 1 2 2 2 2 . . .
Notice that Lustre is a declarative language: "=" denotes a constraint via an equation,
and is not an assignment. Hence the body of the node is defined in a declarative manner by
a set of equations. Now, consider the Lustre program on Figure 4.1. Node middleValue
returns the middle value of its three inputs. It also outputs a Boolean flag faulty which
54.1 Lustre: A Synchronous Programming Language Problem
-- Returns the absolute value of its input.
node abs(n: int) returns (result: int);
let
result = if (n < 0) then -n else n;
tel
-- "ok" becomes and stays false as soon as "in" escapes
-- the -"bound", +"bound" interval.
node bounded(in, bound: real) returns (ok: bool);
let
assert(bound > 0);
ok = true -> pre(ok) and (abs(in) < bound);
tel
-- Returns the middle value of "in1", "in2" and "in3", and
-- "faulty" which is true as soon as an input escapes its interval.
node middleValue(in1, in2, in3, bound: real) returns (middle:
real; faulty: bool);
var
c12, c13, c23, toProve: bool;
let
assert(bound > 0);
c12 = in1 > in2;
c23 = in2 > in3;
c31 = in3 > in1;
middle = if (c12 = c23) then in2 else
if (c23 = c31) then in3 else in1;
faulty = not (bounded(in1,bound) and
bounded(in2,bound) and
bounded(in3,bound));
tel
Figure 4.1: A simple Lustre program.
indicates whether the inputs have always been in a specified interval or not, i.e. it becomes
true as soon as an input escapes its bounds, and stays that way forever. This nodes use the
assert keyword specifying a constraint on the flows.
6Problem 4.1 Lustre: A Synchronous Programming Language
bounded
in
bound
ok
true
abs
<
and →
pre
Figure 4.2: Network representation of the bounded node.
A Lustre program is a hierarchical network of nodes and operators connected by dataflow
variables. Figure 4.2 for instance represents the bounded node in SCADE-like representation.
Note the instantiation of the abs node, which means that an instance of the network
corresponding to abs should be placed here. As another example, the middleValue node
instantiates the bounded node three times, each with their different pre memories. The
result is clear and unambiguous semantics for the Lustre programs.
Verification. The node observer on Figure 4.3 illustrates the usual approach to the verifi-
cation of Lustre programs. Its inputs correspond to the inputs and outputs of the middleValue
node. It produces the value true at steps for which the value of result is within a certain
range, and at steps where faulty is true. Node top instantiates nodes of the system and
returns the status of the observers – only one in this example. The verification challenge is to
prove that the observers always produce the value true. If this is the case on our example,
then in all possible executions, whenever an input escapes its legal boundaries the faulty
flag is raised and stays that way. Such properties are called safety properties: they specify
the correct behavior of the system and should hold in any state of the system.
They differ from liveness properties which express that "if is true,
then eventually it must be true that ". For instance, it could be the case
that the faulty flag is not raised immediately when an input escapes its bound. Instead,
the system could wait for the input to stay out of its bounds for n steps to confirm that
the input is indeed faulty. The specification could then be the bounded liveness property
"if an input stays out of bounds for n consecutive steps, then the faulty flag is raised".
Bounded liveness properties can be seen as safety properties as illustrated on Figure 4.4
using a counter node to count the number of cycles the inputs have been out of bounds
for. This is not the case for unbounded liveness properties, such as "if an input stays out
of bounds (for an arbitrary long time), then eventually the faulty flag will be raised",
unless the system has a finite number of states [8], or for some special classes of infinite state
systems [68].
74.2 Safety Critical Avionics Systems Verification Problem
node observer(in1, in2, in3, bound, result: real; faulty: bool)
returns(
toProve: bool
);
let
assume(bound > 0);
-- As long as "faulty" is false, "result" is bounded by "bound".
toProve = bounded(result,bound) or faulty;
tel
node top(in1, in2, in3, bound: real) returns (ok: bool)
var
result: real;
faulty: bool;
let
assume(bound > 0);
(result,faulty) = middleValue(in1,in2,in3,bound);
ok = observer(in1,in2,in3,bound,result,faulty);
tel
Figure 4.3: The observer pattern.
The last category of properties are those of fairness, which express the fact that if something
is always possible then it must be done infinitely often. These properties are typically
used to specify that when some concurrent processes run in parallel and try to access a resource
concurrently, then if a process can always gain access to it then at some point it will.
In the following however we will only consider safety properties.
As we shall see in the presentation of our use case, industrial critical embedded systems
are very complex: this results in what is known as the combinatorial explosion of the state
space. The reachable state space, the set of all states the system can reach from its initial states,
is so huge that it cannot be represented, or is simply infinite. Chapter 6 discusses a compact
representation to conduct formal analyses on.
8Problem 4.2 Safety Critical Avionics Systems Verification
node counter(condition: bool; max: int) returns (maxed: bool);
var cpt: int;
let
assume(max > 0);
cpt = 0 -> if (condition) pre(cpt)+1 else 0;
maxed = cpt > max;
tel
node observer(
in1, in2, in3, bound, result: real; faulty: bool
) returns(ok: bool)
let
assume(bound > 0);
problemConfirmed = counter(not bounded(result,bound),42);
ok = (not problemConfirmed) or faulty;
tel
Figure 4.4: Bounded liveness property as a safety property.
Channel
Sensors
Order (x3)
Speed (x3)
Pitch (x3)
SMon
SMon
SMon
Voter
Voter
Voter
Law AMon Actuator
Figure 4.5: A Single Computation Channel.
4.2 Safety Critical Avionics Systems Verification
Figure 4.5 presents a computation channel corresponding to the function "controlling the
aircraft pitch angle" as usually found in avionics functional chains. Note that the sensors
are triplicated to tolerate sensor faults and hence reduce the failure rate of the sampling.
At each cycle, the channel samples the Speed, Pitch, and Order2
sensors. All the values
sampled go through sensor monitors (SMon) in charge of detecting temporary or permanent
failures such as out-of-bounds values. The signals then enter a triplex voter (Voter); the voter
2Order is the command from the pilot.
94.2 Safety Critical Avionics Systems Verification Problem
Sensors
Order (x3)
Speed (x3)
Pitch (x3)
Channel1
Channel2
Channel3
Reconf
Reconf1
Reconf2
Reconf3
Actuator
Figure 4.6: Triple Channel Functional Chain.
performs additional failure detection and outputs one single signal for, say, speed based on
the three speed values sampled – the simple Lustre program from Figure 4.1 can be seen
as a toy example of voting logic. The next block is the control law (Law) which computes
the signal to send to the actuator using a single input value for order, speed and pitch. The
signal also goes through an actuator monitor (AMon) which makes sure that the command
is indeed enforced by the actuator. If it is not the case, a failure flag is raised.
In order to further reduce the failure rate of this critical function of the aircraft, computation
channels are triplicated (Figure 4.6): the computations are performed by three redundant
channels running on separate hardware, each using distinct communication wires. To
decide which channel actually controls the actuator, a reconfiguration mechanism (Reconf) is
distributed over the three channels. It is responsible of the safety aspect of the triplication,
reconfiguring the system in case a channel is considered corrupted because it either consumes
or produces invalid data. In fact, whatever the output of each channel is, the reconfiguration
mechanism should ensure that no command dangerous for the actuator or the aircraft
is output by the triplicated architecture, and that proper flags are raised to inform the pilot
whenever a failure is detected.
Note that an incorrect output should not immediately mark a channel as corrupted. It
could be that the disturbance is temporary, e.g. because of a thunderbolt nearby causing
an electromagnetic perturbation. So, only if the output is incoherent for more than n cycles
will the failure be considered permanent. To detect incoherent outputs and be able to produce
a correct command while a timer counts the n cycles, functional chain designers can
use a technique called shuffle. It typically takes place after the control law computation, as
illustrated on Figure 4.7: each channel has access to the control law output computed by the
other channels. The actual output of a channel is the result of a vote between those three
values. This allows a channel to detect that it is incoherent on its own and count the n cycles
while still producing a correct output. There is also a timer used before switching between
a corrupted channel and a safe one; it can be the case that because of a temporary perturbation
the channel in control stops sending a command for a short time. Also, channels
10Problem 4.2 Safety Critical Avionics Systems Verification
Law Voter
Law Voter
Law Voter
Figure 4.7: The shuffle mechanism.
usually need to perform several checks before taking control to assess precisely the state of
the actuator.
As mentioned above, each channel runs on separate hardware, but it can be the case that
the different parts of one channel also run on different hardware components. In that case
functional chain designers can go further and allow the system to deactivate only part of a
channel. For instance, assume channel 1 has control but realizes that the voter after the control
law does not produce any output anymore because of a hardware failure. If the control
law of channel 1 – running on different hardware than the voter – is still operative then it
could be decided that control is transferred to channel 2, but that the control law of channel
1 keeps computing and participates in the voting now taking place on channel 2.
Functional chains are extremely complex, and so is their specification [67]. Verification
of the software of a full functional chain is thus a challenge for current techniques and tools.
Even with a modular approach, individual verification problems are far from trivial. The
objective of this thesis is to provide generic techniques for the verification of systems such
as voting and reconfiguration logic implementations. These systems make extensive use of
linear integer arithmetic because of the many timers they rely on for fault confirmation and
transition between faulty channels, as well as linear real arithmetic when handling a signal.
The voting logic for instance has to maintain a certain continuity in its output: the control
law expects values consistent with the real world and unexpected behavior could arise, were
its inputs to show discontinuities because of sensor failures. In particular, we will focus on
the Rockwell Collins triplex voter system and an implementation of reconfiguration logic,
the code of which is available in Appendix A. Control law systems differ from voting and
reconfiguration in that they are based on differential equations. They can be non-linear or
require a non-linear analysis and are outside the scope of this study.
11CHAPTER 5
Mathematical Background and Notation
This chapter gives notation and notions in order to define the problem of Boolean satisfi-
ability (SAT) and Satisfiability Modulo Theory (SMT). We will use SMT solvers extensively
in this thesis. We begin by defining many-sorted first-order logic in Section 5.1. We then
present the modern approach to solving SAT and SMT problems in Section 5.2. Last, we
discuss the SMT-LIB 2 standard and additional features encountered in most state of the art
solvers in Section 5.3.
5.1 Many-Sorted First-Order Logic
This section formalizes the concepts required to define many-sorted first-order logic. The
syntax of the logic allows the construction of sequences of symbols and is defined in Subsection
5.1.1 with the notions of many-sorted first-order signature and formula. In Subsection
5.1.2, semantics is given by structures over a many-sorted signature. Semantics gives
meaning to the sequences of symbols allowed by the syntax. We then formally introducing
logics in Subsection 5.1.3 before briefly discuss proof systems in Subsection 5.1.4.
5.1.1 Syntax
Definition 5.1.1 (Many-sorted signature) A many-sorted first-order signature Σ is a tuple h
Sorts, Var, Fun, Rank i consisting of:
• a set of sorts Sorts containing at least the sort Bool;
• a countably infinite set of variable symbols Var ∆= {v1, v2, . . . }, usually implicit when
defining an actual signature;
• a set of function symbols Fun such that Fun ∩ Var is empty and Fun contains ∧, ∨, ¬, ⊥,
>, and =;
• a left-total relation Rank on Fun × Sorts+.
Each sort sequence associated to f by Σ is a rank of f.5.1 Many-Sorted First-Order Logic Mathematical Background and Notation
Intuitively, the sorts of a signature are types used by the function symbols to specify their
ranks. Note that overloading is supported: a function can have multiple ranks. We will rely
heavily on the following notation to discuss function symbols ranks. Given a signature Σ,
we write f(σ1, . . . , σn) : σ for (f, σ1 . . . σn σ) ∈ Rank and f : σ if n = 0, in place of f() : σ.
Core signature. Core is the many-sorted signature h{Bool}, ∅, Funcore , Rank core i composed
of the following function symbols:
∨ (Bool, Bool) : Bool ∧ (Bool, Bool) : Bool ¬ (Bool) : Bool
> () : Bool ⊥ () : Bool = (Bool, Bool) : Bool
Definition 5.1.2 (Legal many-sorted signatures) A legal many-sorted signaturehSorts, Var, Fun, Ranki
is a many-sorted signature such that Bool ∈ Sorts, Fun ∈ Funcore , Rank ∈ Rank core , and for
all σ ∈ Sorts: = (σ, σ) : Bool ∈ Rank. In the following we consider only legal signatures.
For the sake of readability we will omit the word "legal".
Definition 5.1.3 (Abstract syntax) Given a many-sorted signature Σ, the abstract syntax of
Σ-terms is given by the following Extended Backus-Naur Form (EBNF [53]):
T ::= v | f T∗
| f
σ T
∗
| ∃(x : σ)
+ T | ∀(x : σ)
+ T | let (x = T)
+ in T | (T)
where f ∈ Fun, σ ∈ Sorts and v ∈ Var. f T∗
is called a function application, and so is f
σ T
∗
.
let . . . in . . . is called a (parallel) let-binding. Symbols ∀ and ∃ are called quantifiers.
Function application f
σ distinguishes between applications of function symbols with
more than one rank. This is made explicit in the rule (sfun) in the following rules of wellsortedness.
Definition 5.1.4 (Rules of well-sortedness) Given a many-sorted signature Σ, an environment
E is a set of statements v : σ, read as “v has sort σ”, where v ∈ Var and σ ∈ Sorts. We
say that “term t is well-sorted of sort σ in E”, written E ` t : σ, if t is derivable by the following
sorting rules:
E ` v : σ
(var) if v : σ ∈ E
E ` t1 : σ1 . . . E ` tn : σn
E ` (f t1 . . . tn) : σ
(fun) if
f(σ1, . . . , σn) : σ ∈ Σ and
f(σ1, . . . , σn) : σ
0 6∈ Σ for all σ
0 6= σ;
E ` t1 : σ1 . . . E ` tn : σn
E ` (f
σ
t1 . . . tn) : σ
(sfun) if
f(σ1, . . . , σn) : σ ∈ Σ and
f(σ1, . . . , σn) : σ
0 ∈ Σ for some σ
0 6= σ;
14Mathematical Background and Notation 5.1 Many-Sorted First-Order Logic
E ∪ {v1 : σ1, . . . , vn : σn} ` t : Bool
E ` (Q v1 : σ1 . . . vn : σn t) : Bool
(Q) if Q ∈ {∃, ∀} and n > 0;
E ` t1 : σ1 . . . E ` tn : σn E ∪ {v1 : σ1, . . . , vn : σn} ` t : σ
E ` (let v1 = t1 . . . vn = tn in t) : σ
(let) if n > 0.
We say that a term t is well-sorted of sort σ if it is well-sorted of sort σ in {}, the empty
environment. A well-sorted term is quantifier free if no quantifier appears in it – the (Q) rule
is never used in its well-sortedness derivation. A well-sorted formula in E is a well-sorted
term of sort Bool in E.
Definition 5.1.5 An atom is a formula in which the logical connectives ∧ (conjunction), ∨
(disjunction) and ¬ (negation) do not appear. A literal is a or ¬(a) where a is an atom. A cube
(resp. a clause) is a conjunction (resp. a disjunction) of literals. A formula is in Disjunctive
Normal Form (DNF) if it is a disjunction of cubes. A formula is in Conjunctive Normal Form
(CNF) if it is a conjunction of clauses.
Additional notation. It is possible to define a concrete syntax using Polish prefix notation:
an application of f(σ1, . . . , σn) : σ is of the form (f t1 . . . tn). While this notation is ideal
for machines as it is easy to parse and print, it is usually painful to process for humans
who are more accustomed to infix notation for applications of common function symbols,
e.g. (n + 1 > 3) ∧ b instead of (∧ (> (+ n 1) 3) b). In this thesis we will manipulate
terms extensively. We thus lighten their representation: application of f(σ1, . . . , σn) : σ will
usually be written f(t1, . . . , tn) instead of f t1 . . . tn with the following alternatives:
(t1 f t2) if n = 2, (f t1) if n = 1, or simply f if n = 0. Also, we allow ourselves to write
Q(v1 : σ1, . . . , vn : σn) t for Q v1 : σ1 . . . vn : σn t
where Q ∈ {∀, ∃}, and
let (v1 = t1, . . . , vn = tn) in t for let v1 = t1 . . . vn = tn in t.
The following operator precedence rules apply, where Q is a quantifier: = ¬ ∧ ∨
Q(. . .). where means “has precedence over”. Also, in a signature with function symbols
∗, −, +, ≥, ≤, >, < the following precedence convention will be followed:
∗ − + {≥, ≤, >, < } =
For example, n + 1 > 3 ∧ b is the same as ((n + 1) > 3) ∧ b and as ∧(> (+(n, 1), 3), b). Last,
we will often use the shorthand ⇒ defined as φ ⇒ ψ
∆= ¬φ ∨ ψ where φ and ψ are formulas.
Note that "∆=" represents meta-equality and should be read as "is defined as". It differs from
"=" which is just a function symbol in the signature.
15
Méthodes s´equentielles de Monte Carlo pour le suivi
d’objets multiples h´et´erog`enes en donn´ees brutes de
t´el´em´etrie laser
Elodie Vanpoperinghe ´
To cite this version:
Elodie Vanpoperinghe. M´ethodes s´equentielles de Monte Carlo pour le suivi d’objets multiples ´
h´et´erog`enes en donn´ees brutes de t´el´em´etrie laser. Other. Universit´e du Littoral Cˆote d’Opale,
2014. French. .
HAL Id: tel-00983352
https://tel.archives-ouvertes.fr/tel-00983352
Submitted on 25 Apr 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific
research documents, whether they are published
or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.Thèse de doctorat
De l’Université du Littoral Côte d’Opale
Présentée par
Élodie Vanpoperinghe
Pour obtenir le grade de
Docteur de l’Université du Littoral Côte d’Opale
Domaine
Automatique, génie informatique, traitement du signal et de l’image
Méthodes séquentielles de Monte Carlo pour
le suivi d’objets multiples hétérogènes en
données brutes de télémétrie laser
Thèse soutenue le 27 janvier 2014 devant le jury composé de
Michèle ROMBAUT Professeur des Universités Université Joseph Fourier Président
Régis LHERBIER Maître de Conférences Université du Littoral Côte
d’Opale
Examinateur
Véronique CHERFAOUI Maître de Conférences - HDR Université de Technologie de
Compiègne Rapporteur
Yassine RUICHEK Professeur des Universités Université de Technologie de
Belfort Montbéliard
Rapporteur
Jean-Charles NOYER Professeur des Universités Université du Littoral Côte
d’Opale
Co-directeur
Martine WAHL Chargé de Recherche Institut Français des Sciences et
Technologies des Transports, de
l’Aménagement et des Réseaux
Co-directeur
Année 2013 École Doctorale SPI
Numéro d’ordre : Sciences pour l’ingénieuri
À tous ceux que j’aimeiiRemerciement
Ce travail de thèse a été réalisé au laboratoire électronique, ondes et signaux pour les transports (LEOST
du département COSYS de l’Ifsttar) dirigé successivement par Mme Marion Berbineau et M. Charles Tatkeu
que je tiens à remercier. C’est avec bonne humeur et sympathie qu’ils m’ont accueillie au sein de leur équipe
durant ma thèse.
Je tiens à remercier l’Ifsttar et la région Nord-Pas-De-Calais pour avoir financé ce travail.
Je tiens tout particulièrement à remercier M. Jean-Charles Noyer, mon directeur de thèse sans qui celle-ci
n’aurait pu aboutir. Je suis reconnaissante du temps qu’il m’a accordé, ses qualités pédagogiques et scienti-
fiques, son écoute, ses conseils, sa franchise et sympathie. J’ai beaucoup appris grâce à lui et je lui adresse
ma gratitude pour cela.
J’adresse de chaleureux remerciements à mon encadrant de thèse Mme Martine Wahl, pour son attention
de tout instant sur mes travaux, pour ses conseils et son écoute qui ont mené à la réussite de cette thèse.
Je souhaite remercier Dominique Gruyer pour m’avoir permis d’utiliser les données SiVIC qui ont été
utilisées dans cette thèse. Je souhaite également remercier Sébastien Lefebvre pour m’avoir aidée dans l’utilisation
de ce logiciel.
Je souhaite remercier l’ensemble des membres du jury Véronique CHERFAOUI, Yassine RUICHEK,
Régis LHERBIER, Michèle ROMBAUT qui m’ont fait l’honneur de lire ma thèse et participer à ma soutenance.
Je voudrais leur témoigner ma gratitude et les remercier de l’intérêt qu’ils ont porté à mon travail.
Comment ne pas remercier les membres du site de Villeneuve d’Ascq qui m’ont accueillie, conseillée
et ont rendu agréable ces années : Isabelle, Corinne, Lidwine pour leurs attentions, leurs accompagnements
administratifs et leurs échanges amicaux, Émilie, Mohamed qui m’ont supportée comme voisine de bureau.
Manu qui a tout essayé pour avoir une JSS sans succès. Et enfin tous ceux que je ne cite pas mais avec qui
j’ai eu l’honneur de discuter et d’échanger des idées.
Un merci tout particulier a ceux qui ont parsemé ces trois années de souvenirs inoubliables : Sonia,
Aurélie, Stephen, Élody, Paola, Camille, Wilfried, Cyril, Philippe, Greg, Manu et tant d’autres qui se reconnaitront.
Sur un plan plus personnel, je tiens à remercier mes parents et grand-parents pour leur soutien sans faille
depuis tant d’année. Merci à eux de toujours être là pour moi dans les bons comme les mauvais moments.
Enfin je terminerais par mes amis sans qui rien ne serait possible, sans qui ma vie ne serait pas la même.
Pour tous les moments de détente, les week-ends, les rires et les larmes que nous avons partagées. Pour leur
présence et leur soutien dans ce voyage qui se termine. Fanny, Anne-Laure, Daisy, Béatrice, Jimmy, Élody,
Aurélie et Florent, les mots ne suffisent pas pour exprimer ma gratitude et mon amour pour vous.
iiiivTable des matières
Liste des figures xiii
Liste des tableaux xv
Glossaire xvii
Introduction 1
I Problématique, capteurs et architectures de traitement 3
I.1 Problématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
I.2 Capteurs et architectures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
I.2.1 Capteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
I.2.1.1 Système de vision par caméra . . . . . . . . . . . . . . . . . . . . . . . . 7
I.2.1.2 Radar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
I.2.1.3 Lidar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
I.2.2 Architectures de traitement de données . . . . . . . . . . . . . . . . . . . . . . . . 11
I.2.2.1 Architectures multicapteur classiques . . . . . . . . . . . . . . . . . . . . 11
I.2.2.2 Exemple d’une architecture autonome dans le domaine automobile . . . . 13
I.2.2.3 Architecture monocapteur pour lidar . . . . . . . . . . . . . . . . . . . . 13
I.3 Le télémètre laser à balayage : capteur lidar . . . . . . . . . . . . . . . . . . . . . . . . . . 15
I.3.1 Principe du télémètre laser à balayage . . . . . . . . . . . . . . . . . . . . . . . . . 15
I.3.2 Exemple de mesures lidar issue de capteur monoplan et multiplan . . . . . . . . . . 17
I.3.3 Évolution des capteurs lidar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
I.3.3.1 Capteur IBEO LD Automotive . . . . . . . . . . . . . . . . . . . . . . . . 20
I.3.3.2 Capteur IBEO LD-ML (Ladar Digital MultiLayer) . . . . . . . . . . . . . 20
I.3.3.3 Capteur ALASCA (Automotive Laser SCAnner) . . . . . . . . . . . . . . 21
I.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
II Problème de détection et suivi d’objets multiples 23
II.1 Architecture fonctionnelle classique du problème de détection et de suivi d’obstacles . . . . 23
II.2 Détection dans les données télémétriques . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
II.2.1 Partitionnement de données (clustering) . . . . . . . . . . . . . . . . . . . . . . . . 25
II.2.1.1 Algorithme de partitionnement . . . . . . . . . . . . . . . . . . . . . . . 25
II.2.1.2 Seuil adaptatif de Dietmayer et al. (2001) . . . . . . . . . . . . . . . . . 26
II.2.1.3 Seuil adaptatif de Santos et al. (2003) . . . . . . . . . . . . . . . . . . . 26
II.2.1.4 Seuil adaptatif de Borges et Aldon (2004) . . . . . . . . . . . . . . . . . 27
II.2.2 Segmentation de partitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
II.2.2.1 Approche incrémentale . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
II.2.2.2 Approche Split and Merge . . . . . . . . . . . . . . . . . . . . . . . . . . 28
II.2.2.3 Approche RANSAC (Random Sample Consensus) . . . . . . . . . . . . . 30
vvi TABLE DES MATIÈRES
II.2.2.4 Transformée de Hough . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
II.2.2.5 Approche de maximisation de l’espérance (EM, Expectation-Maximization) 33
II.2.3 Identification et classification d’objets . . . . . . . . . . . . . . . . . . . . . . . . . 34
II.3 Modélisation des objets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
II.4 Association de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
II.5 Méthode de suivi : filtrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
II.6 Filtre de Kalman et ses filtres dérivés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
II.6.1 Filtre de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
II.6.2 Filtre de Kalman étendu (EKF) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
II.6.3 Filtre de Kalman sans parfum (UKF) . . . . . . . . . . . . . . . . . . . . . . . . . 39
II.7 Filtrage particulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
II.7.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
II.7.2 Échantillonnage d’importance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
II.7.3 Problème de la dégénérescence des particules . . . . . . . . . . . . . . . . . . . . . 43
II.7.3.1 Résolution de la dégénérescence par choix d’une densité d’importance optimale
pour une application donnée . . . . . . . . . . . . . . . . . . . . . 43
II.7.3.2 Résolution de la dégénérescence par rééchantillonnage des poids . . . . . 44
II.8 Présentation de différents filtres particulaires . . . . . . . . . . . . . . . . . . . . . . . . . . 46
II.8.1 Filtre à échantillonnage séquentiel par importance (SIS) . . . . . . . . . . . . . . . 46
II.8.2 Filtre Bootstrap ou SIR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
II.8.3 Filtre à rééchantillonnage adaptatif (SIR adaptatif) . . . . . . . . . . . . . . . . . . 48
II.8.4 Filtre particulaire auxiliaire (APF) . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
II.8.5 Filtre de Rao-Blackwell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
II.9 Exemples d’application au suivi de cibles . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
II.10 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
III Approche conjointe de détection et suivi 55
III.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
III.2 Présentation du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
III.3 Architecture fonctionnelle proposée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
III.4 Module de surveillance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
III.4.1 Détecteur d’objets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
III.4.1.1 Restriction des mesures d’un balayage à une zone d’étude . . . . . . . . . 60
III.4.1.2 Algorithme de partitionnement des mesures d’un balayage utilisant le seuil
de Santos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
III.4.1.3 Algorithme de segmentation basé sur la théorie de Split and Merge . . . . 62
III.4.1.4 Calcul du centre de gravité de la partition . . . . . . . . . . . . . . . . . . 64
III.4.1.5 Résultats de détection . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
III.4.2 Gestionnaire de pistes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
III.4.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
III.5 Module de détection, association et suivi DAT . . . . . . . . . . . . . . . . . . . . . . . . . 70
III.6 Approche conjointe de détection et suivi (ITPF) . . . . . . . . . . . . . . . . . . . . . . . . 70
III.6.1 Modélisation d’état du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
III.6.1.1 Équation dynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
III.6.1.2 Équation de mesure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
III.6.2 Approche proposée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
III.6.2.1 Initialisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
III.6.2.2 Évolution des particules . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
III.6.2.3 Pondération des particules : exploitation du modèle d’état . . . . . . . . . 74
III.6.2.3.1 Calcul du poids sur la zone complète . . . . . . . . . . . . . . . 75TABLE DES MATIÈRES vii
III.6.2.3.2 Calcul du poids sur une restriction de l’espace d’observation . . 75
III.6.2.4 Redistribution des particules . . . . . . . . . . . . . . . . . . . . . . . . 79
III.6.2.5 Prédiction de la partie linéaire (Kalman) du filtre de Rao-Blackwell . . . . 79
III.6.2.6 Estimation d’état . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
III.7 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
III.7.1 Cas synthétique de suivi multivéhicule . . . . . . . . . . . . . . . . . . . . . . . . . 80
III.7.1.1 Scénario et caractéristiques du capteur . . . . . . . . . . . . . . . . . . . 80
III.7.1.2 Comparaison de l’approche proposée ITPF à une approche classique (CDG)
sur les données du simulateur de la thèse . . . . . . . . . . . . . . . . . . 82
III.7.2 Résultats obtenus avec les données du logiciel SiVIC . . . . . . . . . . . . . . . . . 92
III.7.2.1 Scénario et caractéristiques du capteur . . . . . . . . . . . . . . . . . . . 92
III.7.2.2 Comparaison de l’approche proposée ITPF à une approche classique (CDG)
sur des données du simulateur SiVIC . . . . . . . . . . . . . . . . . . . . 94
III.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
IV Approche conjointe de détection et de suivi d’objets multiples hétérogènes par laser multiplans109
IV.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
IV.2 Détection et suivi d’objets multiples hétérogènes (approche VS-ITPF) . . . . . . . . . . . . 110
IV.2.1 Problématique du cas multi-objets . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
IV.2.2 Adaptation du module de surveillance au cas multi-objets hétérogènes . . . . . . . . 111
IV.2.3 Résumé des algorithmes du module de surveillance dans le cas multi-objets hétérogènes
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
IV.2.4 Adaptation du module DAT au cas multi-objets hétérogènes . . . . . . . . . . . . . 115
IV.2.5 Résultats expérimentaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
IV.2.5.1 Scénario et caractéristiques du capteur pour le simulateur de la thèse . . . 116
IV.2.5.2 Résultat de l’approche multi-objets pour les données du simulateur de la
thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
IV.2.5.3 Scénario et caractéristiques du capteur pour le simulateur SiVIC . . . . . 125
IV.2.5.4 Résultat de l’approche VS-ITPF pour les données du simulateur SiVIC . . 126
IV.2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
IV.3 Détection et suivi d’obstacles multiples homogènes avec un lidar multiplan (approche MLITPF)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
IV.3.1 Problématique et mesures d’un capteur multiplan . . . . . . . . . . . . . . . . . . . 130
IV.3.2 Notation : extension au cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . 132
IV.3.3 Adaptation du détecteur d’objet du module de surveillance au cas multiplan . . . . . 132
IV.3.4 L’approche ML-ITPF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
IV.3.4.1 Modélisation du problème . . . . . . . . . . . . . . . . . . . . . . . . . . 134
IV.3.4.2 Filtrage de Rao-Blackwell . . . . . . . . . . . . . . . . . . . . . . . . . . 135
IV.3.4.3 Évolution des particules . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
IV.3.5 Résultats expérimentaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
IV.3.5.1 Scénario et caractéristiques du capteur . . . . . . . . . . . . . . . . . . . 137
IV.3.5.2 Résultats de l’approche ML-ITPF . . . . . . . . . . . . . . . . . . . . . . 138
IV.3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
Conclusion 149
A Simulateur de données 153
A.1 Le capteur lidar à balayage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
A.1.1 Principe du générateur de données télémétriques . . . . . . . . . . . . . . . . . . . 154
A.1.2 Modélisation d’un scénario routier . . . . . . . . . . . . . . . . . . . . . . . . . . . 154viii TABLE DES MATIÈRES
A.1.3 Modélisation de la trajectoire des véhicules cibles . . . . . . . . . . . . . . . . . . . 156
A.1.4 Construction d’une image pour un balayage donné . . . . . . . . . . . . . . . . . . 156
A.1.4.1 Représentation d’un véhicule dans le repère cartésien du capteur . . . . . 156
A.1.4.2 Représentation d’un véhicule dans le repère polaire du capteur . . . . . . 158
A.1.4.3 Calcul d’une image d’un véhicule dans le repère polaire du capteur . . . . 158
A.1.4.4 Calcul de l’image capteur d’une scène multivéhicule pour un balayage donné158
A.1.5 Exemple de données obtenues à partir du simulateur . . . . . . . . . . . . . . . . . 158
A.2 Le simulateur SiVIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
A.2.1 Présentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
A.2.2 Fonctionnalités du simulateur SiVIC . . . . . . . . . . . . . . . . . . . . . . . . . . 161
A.2.3 Exemple de données obtenues avec le simulateur SiVIC pour un lidar multiplan . . . 161
Références bibliographiques 174Table des figures
I.1 Nombre de tués sur les routes de 1950 à 2011 (Sécurité-routière, 2012) . . . . . . . . . . . . 3
I.2 Évolution du nombre de tués sur les routes en fonction des nouvelles législations (Sécurité-
routière, 2012) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
I.3 Architecture minimale de détection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
I.4 Une camera avec objectif de type Fisheye à gauche et photo du ciel prise avec la caméra à
droite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
I.5 Système stéréoscopique expérimental (LEOST) à gauche et image d’une scène prise par un
système stéréoscopique et sa carte de disparité à droite . . . . . . . . . . . . . . . . . . . . 8
I.6 Image d’un radar SRR extraite de (Bank, 2007) . . . . . . . . . . . . . . . . . . . . . . . . 9
I.7 Principe du lidar multicouche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
I.8 Architecture de fusion centralisée extraite de (Waltz et Llinas, 1990) . . . . . . . . . . . . . 11
I.9 Architecture de fusion autonome extraite de (Waltz et Llinas, 1990) . . . . . . . . . . . . . 12
I.10 Architecture de fusion hybride extraite de (Waltz et Llinas, 1990) . . . . . . . . . . . . . . . 12
I.11 Architecture du système de fusion de données du projet CARSENSE extraite de Wahl (2002) 13
I.12 Architecture de traitement monocapteur lidar extraite de (Kiehn et al., 2002) . . . . . . . . . 14
I.13 Architecture de traitement monocapteur lidar extraite de Jida (2008) . . . . . . . . . . . . . 15
I.14 Principe du balayage horizontal (en haut) et vertical (en bas) extrait de (Besesty, 1999) . . . 15
I.15 Schéma de fonctionnement du télémètre laser à balayage extrait de (Besesty, 1999) . . . . . 16
I.16 Principe de mesure du temps de vol d’une onde émise par le télémètre laser à balayage extrait
de (Besesty, 1999) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
I.17 Image CCD de la scène et le balayage capteur associé vu par le lidar monoplan (en bas à
gauche) et par le lidar multiplan (en bas à droite) . . . . . . . . . . . . . . . . . . . . . . . 18
I.18 Agrandissement de la représentation de la scène vue par le lidar multiplan (figure I.18 à
gauche) sur le véhicule en bas de la voie droite (à gauche) et sur le véhicule voie centrale (à
droite) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
I.19 Présentation des capteurs DENSO, SICK LD-MRS et Velodyne HDL-64E (de gauche à
droite) extrait de (com, 2014) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
I.20 Le capteur IBEO LD-ML (à gauche) et ses caractéristiques (à droite) . . . . . . . . . . . . . 20
I.21 Le capteur IBEO ALASCA XT (à gauche) et ses caractéristiques (à droite) . . . . . . . . . 21
II.1 Étapes classiques d’un algorithme de détection et de suivi . . . . . . . . . . . . . . . . . . . 23
II.2 Seuil SNA fixe d’un algorithme non adaptatif . . . . . . . . . . . . . . . . . . . . . . . . . . 25
II.3 Paramètres du seuil adaptatif SSantos selon Santos et al. (2003) . . . . . . . . . . . . . . . . 26
II.4 Paramètres du seuil adaptatif SBorges selon Borges et Aldon (2004) . . . . . . . . . . . . . . 27
II.5 Exemple de dispersion des inliers et outliers . . . . . . . . . . . . . . . . . . . . . . . . . . 30
II.6 Paramètres (Θ,ρ) tels que Θ est l’angle polaire de la normale à la droite (d) (Duda et Hart,
1971) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
II.7 Biais de l’estimateur de Kalman étendu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
II.8 Évolution des particules (figure extraite de Diginext (1996)) . . . . . . . . . . . . . . . . . 42
ixx TABLE DES FIGURES
II.9 Rééchantillonnage des particules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
II.10 Sélection des particules selon le vecteur U . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
III.1 Illustration d’un scénario de détection et de suivi . . . . . . . . . . . . . . . . . . . . . . . 56
III.2 Représentation d’un véhicule dans le repère du capteur . . . . . . . . . . . . . . . . . . . . 57
III.3 Représentation des impacts lidar pour différentes orientations de véhicules dans le référentiel
du capteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
III.4 Architecture fonctionnelle de l’approche ITPF proposée . . . . . . . . . . . . . . . . . . . . 58
III.5 Architecture fonctionnelle simplifiée du module de surveillance . . . . . . . . . . . . . . . 59
III.6 Entités étudiées du détecteur d’objet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
III.7 Zone d’étude d’une autoroute à trois voies : la zone est construite de façon à rejeter les points
de bordures de routes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
III.8 Point de rupture d’un ensemble de mesures dont on cherche les droites d’interpolation . . . . 63
III.9 Illustration des cinq configurations possibles d’une partition selon la position relative de
l’objet au capteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
III.10Estimation du centre de gravité des partitions détectées (données SiVIC) . . . . . . . . . . . 67
III.11Gestion des pistes d’une famille d’objet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
III.12Véhicule particulaire reconstruit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
III.13Une région d’intérêt (ROI) de la zone d’étude considérée . . . . . . . . . . . . . . . . . . . 76
III.14Paramètres (θ
ROI
min , θ
ROI
max , ρ
ROI
min , ρ
ROI
max ) d’une zone de suivi ou région d’intérêt (ROI) . . . . . 77
III.15Région ROI+ d’une région d’intérêt ROI . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
III.16Cas limite de la région ROI+ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
III.17Illustration des trajectoires relatives au véhicule porteur du capteur pour le scénario établi
aux tableaux III.1 et III.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
III.18Comparaison du nombre de pistes créées avec le nombre de véhicules pour les méthode ITPF
à gauche et CDG à droite appliquées aux données du simulateur de la thèse . . . . . . . . . 83
III.19Perception du lidar au temps t = 5s (mesures en rouge) superposée aux modèles estimés des
véhicules (rectangle en bleu) : approches ITPF à gauche et CDG à droite appliquées aux
données du simulateur de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
III.20Agrandissement des véhicules de la scène figure III.19, au temps t = 5s, véhicule de la voie
centrale en haut et de la voie de gauche en bas : approches ITPF à gauche et CDG à droite
appliquées aux données du simulateur de la thèse . . . . . . . . . . . . . . . . . . . . . . . 84
III.21Perception du lidar au temps t = 10s (mesures en rouge) superposée aux modèles estimés
des véhicules (rectangle en bleu) : approches ITPF à gauche et CDG à droite appliquées aux
données du simulateur de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
III.22Agrandissement du véhicule de la voie de droite, au temps t = 10s, de la figure III.21 :
approches ITPF à gauche et CDG à droite appliquées aux données du simulateur de la thèse . 85
III.23Agrandissement du véhicule de la voie de gauche, au temps t = 10s, de la figure III.21 :
approches ITPF à gauche et CDG à droite appliquées aux données du simulateur de la thèse . 86
III.24Agrandissement du véhicule de la voie centrale, au temps t = 10s, de la figure III.21 : approches
ITPF à gauche et CDG à droite appliquées aux données du simulateur de la thèse . . 86
III.25Courbes des Vitesses et accélérations de référence et estimées, du véhicule de la voie de
droite en fonction du temps : approches ITPF à gauche et CDG à droite appliquées aux
données du simulateur de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
III.26Courbes des Vitesses et accélérations de référence et estimées, du véhicule de la voie de
gauche en fonction du temps : approches ITPF à gauche et CDG à droite appliquées aux
données du simulateur de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
III.27Courbes des Vitesses et accélérations de référence et estimées, du véhicule de la voie centrale
en fonction du temps : approches ITPF à gauche et CDG à droite appliquées aux données du
simulateur de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90TABLE DES FIGURES xi
III.28Erreur sur la position du véhicule de la voie de droite en fonction du temps : approches ITPF
à gauche et CDG à droite appliquées aux données du simulateur de la thèse . . . . . . . . . 91
III.29Erreur sur la position du véhicule de la voie de gauche en fonction du temps : approches
ITPF à gauche et CDG à droite appliquées aux données du simulateur de la thèse . . . . . . 91
III.30Erreur sur la position du véhicule cible de la voie centrale en fonction du temps : approches
ITPF à gauche et CDG à droite appliquées aux données du simulateur de la thèse . . . . . . 92
III.31Illustration des trajectoires des véhicules relativement au véhicule porteur du capteur pour le
scénario établi au tableau III.4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
III.32Quatre images de la scène au temps t = 0s, t = 2,5s, t = 5s et t = 10s . . . . . . . . . . . . 94
III.33Comparaison du nombre de pistes créées avec le nombre de véhicules détectés pour les
méthodes ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC . . . 95
III.34Nombre de pistes créées avec le nombre de véhicules détectés pour la méthode ITPF appliquées
aux données du simulateur SiVIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
III.35Illustration de la perte d’un véhicule par masquage, image de la scène à t = 6,3s, t = 6,5s et
t = 6,7s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
III.36Image CCD de la scène, au temps t = 5s et la même scène perçue par le laser à balayage (en
rouge) superposée aux modèles estimés des véhicules (rectangle en bleu) : approches ITPF
à gauche et CDG à droite appliquées aux données du simulateur SiVIC . . . . . . . . . . . . 99
III.37Agrandissement du véhicule de la voie de droite haut, au temps t = 5s, de la figure III.36 :
approches ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC . . . 99
III.38Agrandissement du véhicule de la voie centrale, au temps t = 5s, de la figure III.36 : approches
ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC . . . . 100
III.39Agrandissement du véhicule de la voie de droite bas, au temps t = 5s, de la figure III.36 :
approches ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC . . . 100
III.40Agrandissement du véhicule de la voie de gauche, au temps t = 5s, de la figure III.36 :
approches ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC . . . 101
III.41Image CCD de la scène, au tempst = 10s et la même scène perçue par le laser à balayage (en
rouge) superposée aux modèles estimés des véhicules (rectangle en bleu) : approches ITPF
à gauche et CDG à droite appliquées aux données du simulateur SiVIC . . . . . . . . . . . . 101
III.42Agrandissement des véhicules de la scène figure III.41, au temps t = 10s, véhicule de la voie
de gauche en haut, de la voie de droite au centre et de la voie centrale en bas : approches
ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC . . . . . . . . 102
III.43Courbes de vitesse selon x en haut et y estimées du véhicule de la voie de droite en fonction
du temps : approches ITPF à gauche et CDG à droite appliquées aux données SiVIC . . . . 104
III.44Courbes d’accélération selon x en haut et y estimées du véhicule de la voie de droite en
fonction du temps : approches ITPF à gauche et CDG à droite appliquées aux données SiVIC 105
III.45Courbes de vitesse selon x en haut et y estimées du véhicule de la voie centrale en fonction
du temps : approches ITPF à gauche et CDG à droite appliquées aux données SiVIC . . . . 106
III.46Courbes d’accélération selon x en haut et y estimées du véhicule de la voie centrale en
fonction du temps : approches ITPF à gauche et CDG à droite appliquées aux données SiVIC 107
IV.1 Calcul du nouveau centre de gravité après modification du modèle véhicule . . . . . . . . . 115
IV.2 Illustration des trajectoires relatives au véhicule porteur pour le scénario (défini par les tableaux
IV.1 et IV.2), constitué d’un camion et de deux voitures . . . . . . . . . . . . . . . . 118
IV.3 Comparaison du nombre de pistes actives avec le nombre de véhicules estimé par le détecteur
au cours de la simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
IV.4 Perception du lidar aux temps t = 5s (figure haut gauche), t = 7,5s (figure haut droite),
t = 11s (figure bas gauche) et t = 14s (figure bas droite) superposée aux modèles de véhicules
estimés par le filtre ITPF, pour un cas multi-objets . . . . . . . . . . . . . . . . . . . . . . . 119xii TABLE DES FIGURES
IV.5 Courbes des vitesses à gauche et accélération à droite en fonction du temps, du camion situé
à droite (figure du haut), du véhicule central (figure du centre) et du véhicule de gauche
(figure du bas), pour un cas multi-objets . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
IV.6 Longueur et largeur estimées des boîtes englobantes des véhicules de la simulation en fonction
du temps, en haut le camion et en bas les deux voitures . . . . . . . . . . . . . . . . . . 122
IV.7 Courbes d’erreur sur la position en fonction du temps, du camion situé voie de droite (figure
haut gauche), pour la voiture voie centrale (figure haut droite) et pour la voiture voie de
gauche (figure du bas) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
IV.8 Illustration des trajectoires relatives au véhicule porteur pour le scénario du simulateur SiVIC 125
IV.9 Quatre images de la scène au temps t = 1s, t = 4s, t = 7,5s et t = 10s . . . . . . . . . . . . 126
IV.10Scènes aux instants t = 1s (figure haut gauche), t = 4s (figure haut droite), t = 7,5s (figure
bas gauche) et t = 10s (figure bas droite) et véhicules estimés par le filtre VS-ITPF . . . . . 127
IV.11Longueur et largeur estimées des véhicules en fonction du temps à gauche l’Espace et à
droite la Mini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
IV.12Représentation de l’Espace avant à t = 1s (à gauche) et après à t = 4s (à droite) mise à jour
des dimensions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
IV.13Architecture fonctionnelle de l’approche VS-ITPF modifiée . . . . . . . . . . . . . . . . . . 129
IV.14Exemple de deux véhicules vus par un capteur lidar multiplan au temps t = 5s (en bleu tir à
0˚ d’élévation, en rouge tir à 0,4˚ d’élévation, en vert tir à 0,8˚ d’élévation et en cyan tir à
1,2˚ d’élévation) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
IV.15Nombre de véhicules détectés en fonction du temps pour les plans 1 (à gauche) et 3 (à droite) 132
IV.16Illustration d’un véhicule vu par quatre plans capteur et la détection qui en découle . . . . . 134
IV.17Double restriction, ROI+ d’une région d’intérêt ROI de la zone d’étude considérée . . . . . 136
IV.18Trajectoires relatives au véhicule porteur de l’ensemble des véhicules de la scène . . . . . . 138
IV.19Quatre images de la scène au temps t = 0s, t = 2,5s, t = 5s et t = 10s . . . . . . . . . . . . 138
IV.20Comparaison du nombre de pistes créées avec le nombre de véhicule estimé par le détecteur
présent au cours de la simulation, pour les méthodes ML-ITPF à gauche et CDG à droite
appliquées aux données du simulateur SiVIC . . . . . . . . . . . . . . . . . . . . . . . . . 140
IV.21Image CCD de la scène, au temps t = 5s et la même scène perçue par le laser à balayage
(en rouge) superposée aux modèles estimés des véhicules (rectangle en bleu) : approches
ML-ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC, pour un
cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
IV.22Agrandissement du véhicule de la voie de droite haut, au temps t = 5s, de la figure IV.21 :
approches ML-ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC,
pour un cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
IV.23Agrandissement du véhicule de la voie centrale, au temps t = 5s, de la figure IV.21 : approches
ML-ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC,
pour un cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
IV.24Agrandissement du véhicule de la voie de gauche, au temps t = 5s, de la figure IV.21 :
approches ML-ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC,
pour un cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
IV.25Image CCD de la scène, au temps t = 10s et la même scène perçue par le laser à balayage
(en rouge) superposée aux modèles estimés des véhicules (rectangle en bleu) : approches
ML-ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC, pour un
cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
IV.26Agrandissement du véhicule de la voie de droite, au temps t = 10s, de la figure IV.25 :
approches ML-ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC,
pour un cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143TABLE DES FIGURES xiii
IV.27Agrandissement du véhicule de la voie centrale, au temps t = 10s, de la figure IV.25 : approches
ML-ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC,
pour un cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
IV.28Agrandissement du véhicule de la voie de gauche, au temps t = 10s, de la figure IV.25 :
approches ML-ITPF à gauche et CDG à droite appliquées aux données du simulateur SiVIC,
pour un cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
IV.29Courbes de vitesse selon x en haut et y en bas estimées du véhicule de la voie de droite en
fonction du temps : approches ML-ITPF à gauche et CDG à droite appliquées aux données
SiVIC, pour un cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
IV.30Courbes d’accélération selon x en haut et y en bas estimées du véhicule de la voie de droite
en fonction du temps : approches ML-ITPF à gauche et CDG à droite appliquées aux données
SiVIC, pour un cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
IV.31Courbes de vitesse selon x en haut et y en bas estimées du véhicule de la voie de gauche en
fonction du temps : approches ML-ITPF à gauche et CDG à droite appliquées aux données
SiVIC, pour un cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
IV.32Courbes d’accélération selon x en haut et y en bas estimées du véhicule de la voie de gauche
en fonction du temps : approches ML-ITPF à gauche et CDG à droite appliquées aux données
SiVIC, pour un cas multiplan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
A.1 Modélisation de la route, du capteur et des véhicules cibles . . . . . . . . . . . . . . . . . . 155
A.2 Modèle de la voiture dans les repères cartésien et polaire du capteur . . . . . . . . . . . . . 157
A.3 Données générées pour le scénario considéré (deux véhicules V1, V2 dont l’un change de voie)160
A.4 Modélisation de la rotation du capteur lidar pour générer des données multiplans . . . . . . 162
A.5 Exemple de données générées par le simulateur SiVIC . . . . . . . . . . . . . . . . . . . . 163xiv TABLE DES FIGURESListe des tableaux
I.1 Comparaison des capteurs DENSO, SICK LD-MRS et Velodyne HDL-64E extrait de (com,
2014) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
III.1 Paramètres de simulation du capteur positionné relativement à la route (données du simulateur
de la thèse) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
III.2 Paramètres de simulation initiaux des véhicules cibles relativement à la route (données du
simulateur de la thèse) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
III.3 Écart-type de l’erreur d’estimation des positions, vitesses et accélérations pour les véhicules
cibles sur une période de convergence de les méthodes ITPF et CDG appliquées aux données
du simulateur de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
III.4 Paramètres de simulation du capteur positionné relativement à la route (données SiVIC) . . . 93
IV.1 Paramètres de simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
IV.2 Paramètres de simulation initiaux des véhicules cibles relativement à la route et au véhicule
porteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
IV.3 Écart-type de l’erreur d’estimation des positions, vitesses et accélérations pour les véhicules
cibles sur une période de convergence de la méthode VS-ITPF appliquées aux données du
simulateur de la thèse, dans un cas multi-objets . . . . . . . . . . . . . . . . . . . . . . . . 124
IV.4 Paramètres de simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
IV.5 Paramètres du capteur positionné relativement à la route . . . . . . . . . . . . . . . . . . . 137
A.1 Données paramétrables pour un scénario donné . . . . . . . . . . . . . . . . . . . . . . . . 155
A.2 Données paramétrables pour chaque sous-ensemble du scénario . . . . . . . . . . . . . . . 156
A.3 Paramètres de simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
A.4 Paramètres du véhicule V1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
A.5 Paramètres du véhicule V2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
A.6 Paramètres de simulation du véhicule capteur, du capteur et de la route pour un scénario
donné associé au simulateur SiVIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
xvxvi LISTE DES TABLEAUXGlossaire
(i) une particule.
N le nombre de particules.
Xt
le vecteur d’état de position, vitesse et accélération à l’instant t, Xt = [x, y, vx, vy, ax, ay].
X
(i)
t
le vecteur d’état estimé à l’instant t pour la particule (i).
Zt
le vecteur des mesures du balayage capteur de l’instant t, Zt = {zθ ;θ ∈ {θmin,θmin +∆θ,...,θmax}} .
t l’indice de l’échantillon de mesure.
w
(i)
t
le poids de la particule (i) à l’instant t.
(ρ,θ) les mesures en sortie du capteur.
(θmin,θmax) l’ouverture angulaire du capteur.
Z
(i)
t
le vecteur à l’instant t des échos reconstitués d’un véhicule à partir de la particule (i).
∆θ la résolution angulaire du capteur.
∆t la période d’échantillonnage du capteur.
Pt
l’ensemble des partitions de Zt
, Pt =
n
P(n);n ∈ [0,Nmax],Nmax ≤
θmax−θmin
∆θ +1,P(0) = ∅
o
.
ρ la distance de l’impact au capteur.
θ la résolution angulaire du capteur (pas de tir du capteur).
z
+
θ
la mesure de l’écho par le capteur à l’angle de tir suivant, θ
+ = θ +∆θ .
z
−
θ
la mesure de l’écho à l’angle de tir précédent, θ
− = θ −∆θ .
zθ la mesure d’un écho exprimée en coordonnées polaires, zθ=(ρθ ,θ), ou en coordonnées cartésiennes,
zθ=(xθ ,yθ ).
xviixviii GlossaireIntroduction
Avec l’augmentation globale du trafic routier, la sécurité est devenue une problématique de plus en plus
importante. Limiter les risques d’accidents et les dégâts corporels sont des soucis permanents tant chez les
constructeurs automobiles que pour l’État. Ces dernières années, on a pu voir de nombreuses campagnes publicitaires
et de nombreuses lois visant à limiter ces risques. Depuis les années 80, de nombreuses recherches
sont effectuées dans le domaine de la sécurité routière et notamment sur les systèmes d’aide à la conduite
dits « intelligents » tels que les ADAS (Advance Driver Assistance System). Ceux-ci exploitent les informations
de l’environnement proche du véhicule afin de mettre en place des systèmes d’aide à la conduite. La
difficulté réside dans le choix des systèmes de perception et des traitements associés. Les travaux effectués
durant cette thèse se placent dans ce cadre général. On s’intéresse à un système coopératif de perception
active distribué et interconnecté par réseaux de communication (véhicule à véhicule ou V2V). Ce type de
système a pour but d’accroître le champ de vision de chacun des véhicules d’une scène par la prise en compte
de données provenant des véhicules situés dans son voisinage. Pour cela, chaque véhicule est composé d’un
système de perception local (pour la détection et le suivi des objets) et d’un système de communication (pour
la réception et le transfert des données). Dans cette thèse, nous nous sommes intéressés, plus particulièrement,
au système de perception local avec l’étude des problèmes de détection et de suivi multi-objet à partir
de données télémétriques de type lidar à balayage. Ainsi, notre objectif est de surveiller en permanence l’environnement
proche du véhicule, par une détection et un suivi des obstacles afin de détecter les situations
potentiellement dangereuses.
L’étude générale du problème de détection et de suivi a attiré notre attention sur les problèmes de pertes
d’informations et les cas de fausses alarmes. Les mesures issues des capteurs de type lidar sont de nature
spatialement distribuées ce qui conduit généralement à l’utilisation d’une étape de prétraitement (composée,
dans ce cas, de la détection et de l’association des objets de la scène). Cette phase permet d’extraire les vé-
hicules présents dans la scène et de délivrer une information sur leur position et vitesse relative. Il est connu
que cette étape de prétraitement peut engendrer des pertes d’informations menant à des cas de non détection
ou à des données aberrantes. Par ailleurs, les non-linéarités liées à la transformation polaire-cartésien des
mesures lidar ne permettent plus de préserver la statistique des bruits de mesure après traitement. La conclusion
qui en découle est que seule une approche exploitant directement les données brutes permet de garantir
l’optimalité des traitements (association, suivi, etc.). Pour cela, on s’est intéressé plus particulièrement aux
méthodes de Monte Carlo séquentielles (également appelées filtrage particulaire) pour leur aptitude à traiter
toute non-linéarité de modèle de manière naturelle.
Pour résoudre ce problème, nous avons développé une approche conjointe de détection et de suivi, que
nous appellerons Integrated Tracking Particle Filter (ITPF). Parmi l’ensemble des méthodes particulaires
disponibles, nous nous sommes focalisés sur les approches de filtrage hybride de type Rao-Blackwell. Ces
méthodes permettent d’exploiter les linéarités du modèle d’état de manière indépendante par un filtre conditionnellement
linéaire de type Kalman, optimal dans ce contexte. Le traitement de la partie non-linéaire est
dévolu au filtre particulaire. Le problème ainsi posé repose sur une exécution conjointe des phases de dé-
tection et de suivi des objets dans l’espace d’étude. Nous excluons de notre approche, tout recours à une
phase de détection isolée, utilisée comme entrée de l’étape de suivi. L’information utilisée correspond donc
à la mesure en sortie de capteur et non pas à une information potentiellement tronquée par un détecteur.
12 INTRODUCTION
Comme tout filtre récursif, il est connu que la vitesse de convergence de la méthode peut dépendre de l’information
dont on dispose a priori sur l’environnement. C’est pourquoi, nous mettons en place un module
de surveillance dont le but est de fournir au filtre ITPF une information a priori sur les objets présents. Ce
module agit alors comme un module de « veille » qui observe en permanence l’environnement du véhicule
porteur et alimente en continu le filtre de détection/suivi.
Comme dans toute méthode de suivi, une place importante doit être laissée à la validation des approches
proposées sur des données expérimentales. Nous avons donc choisi de les évaluer sur deux simulations dont
les détails sont donnés en annexe :
– un premier simulateur dont l’objectif est d’évaluer les performances en estimation qui permet, par une
connaissance exacte des paramètres dynamiques de tester les performances limites de la méthode ;
– le simulateur SiVIC développé par le LIVIC qui permet, par un rendu très proche de la réalité, d’évaluer
la robustesse de nos approches vis-à-vis des géométries variables d’objets, de non détection et de
fausse alarme.
Dans ce contexte, il est toujours difficile de pouvoir qualifier une nouvelle approche vis-à-vis de l’état
de l’art sur le domaine. Nous avons donc choisi de comparer notre approche ITPF à une méthode classique
basée sur un suivi du centre de gravité après une étape de détection, pour la même méthode de filtrage
particulaire. Cette méthode CDG (centre de gravité) est fondée sur la mise en œuvre séquentielle de la
détection, de l’association et du suivi des centres de gravité des objets de la scène. Ceci permet également
d’évaluer l’apport d’une approche conjointe de détection et suivi.
Cette thèse s’articule autour de quatre chapitres :
Le premier chapitre expose le contexte général applicatif de la thèse. Il met en avant les différentes dif-
ficultés liées aux choix du capteur et de l’architecture fonctionnelle à mettre en place. Ce chapitre permettra
d’amorcer nos choix pour la résolution du problème.
Le second chapitre propose un état de l’art des techniques de détection et de suivi d’objets multiples à
partir de mesures lidar. Nous nous sommes inspirés des différentes étapes de détection, association et suivi
d’une architecture fonctionnelle de traitement classique pour présenter les différentes étapes. Ce chapitre
permet d’exposer, d’une part, les techniques de détection et de suivi les plus couramment utilisées dans la
littérature et, d’autre part, il permet de proposer une comparaison de quelques méthodes de filtrage (particulaire)
par rapport au filtre de Kalman (plus classiquement utilisé pour le suivi de véhicule). Ce dernier point
permettra de détailler les raisons de notre choix de méthode de filtrage.
Maintenant que nous avons parcouru l’ensemble du problème, le chapitre trois propose de décrire notre
méthode conjointe de détection et de suivi multi-objet (ITPF). Cette méthode a la particularité de ne pas
utiliser de phase de détection ni d’association, puisque la détection et le suivi sont réalisées par le filtre
particulaire mis en place. La méthode présentée propose d’utiliser, tout au long des traitements, la mesure
brute en sortie du capteur. On s’intéressera, dans ce chapitre, au cas simplifié d’une détection et d’un suivi
multi-objet de forme et taille semblable sur des données lidar monoplan (c’est-à-dire que le capteur lidar
balaye la scène sur un seul plan vertical durant toute la simulation).
Les capteurs lidar monoplans ayant montré, sur route, leur vulnérabilité au tangage et roulis, le chapitre
quatre se propose de traiter le cas de capteur lidar multiplan. Afin de traiter le problème dans sa globalité,
nous choisissons également d’accroître notre champ de recherche à l’étude d’objet de différentes natures
(tels que camion, piéton...) dans ce chapitre. De même, la possibilité d’obtenir plusieurs plans verticaux de
balayage va modifier les structures de détection et de filtrage afin de prendre en compte les informations
des différents plans de balayage. L’intégration des différents plans de mesures va ainsi être discutée dans un
second temps.
Enfin, nous conclurons sur les apports et perspectives de nos travaux.Chapitre I
Problématique, capteurs et architectures de
traitement
I.1 Problématique
Les accidents de la route sont la première cause de mortalité chez les 15−29 ans et restent importants
dans les autres classes d’âges. Le parc automobile français, constitué de l’ensemble des véhicules immatriculés
en France, est passé de 4,5 millions en 1955 contre plus de 38 millions de véhicules au premier janvier
2012. Selon les chiffres de la sécurité routière (figure I.1), issus de l’observatoire national interministériel
de sécurité routière (ONISR), nous sommes passés d’environ 18000 tués sur les routes dans les années 70 à
3963 personnes tuées en 2011.
FIGURE I.1. Nombre de tués sur les routes de 1950 à 2011 (Sécurité-routière, 2012)
Il existe plusieurs causes et facteurs de risque d’accident dont nous faisons une liste non-exhaustive :
– comportement des usagers (non respect du code, ingestion de substances influençant le comportement,
téléphone...),
– fatigue, baisse de vigilance et somnolence,
– vitesse,
– infrastructures routières,
– véhicules automobiles.
Bien qu’il soit impossible d’agir sur l’ensemble de ses facteurs, de nombreuses mesures sont mises en
34 Problématique, capteurs et architectures de traitement
place pour en limiter les risques. Par exemple, dans les années 70 où le taux de mortalité sur les routes atteint
un pic, le port obligatoire de la ceinture de sécurité et l’apparition des limitations de vitesse sur routes et
autoroutes ont initié une baisse du nombre de tués sur les routes (figure I.2 issue de l’observatoire national
interministériel de sécurité routière (ONISR)). Par la suite, de nouvelles législations relatives au code de
la route apparaissent. Leur mise en place permet la poursuite de la baisse de mortalité sur les routes. Les
plus récentes (2012) concernent l’interdiction des avertisseurs radar et le durcissement des sanctions contre
l’utilisation du téléphone portable au volant.
FIGURE I.2. Évolution du nombre de tués sur les routes en fonction des nouvelles législations (Sécurité-
routière, 2012)
Dans le même temps, les constructeurs automobiles conçoivent des véhicules de plus en plus sûrs. Ils
mettent en place des systèmes de sécurité dits actifs ou passifs :
– les systèmes passifs n’interviennent pas directement sur la conduite. Ils permettent de sécuriser les
passagers ou les usagers de la route. Citons par exemple, la ceinture de sécurité, les airbags (coussins
gonflables de sécurité) ou également les études sur l’optimisation des déformations de la structure du
véhicule.
– les systèmes actifs eux interviennent directement sur la conduite. Ils permettent d’aider le conducteur.
L’aide au freinage ABS (Anti Blockier System), par exemple, est apparu pour la première fois en
1966 (Wikipedia, 2013). Cependant, ces systèmes ne permettent pas d’anticiper des situations à risque
mais seulement de répondre à un problème survenu. Idéalement, un système de freinage va s’activer
lorsque la pédale de frein est activée. Par contre, les systèmes d’aide à la conduite dits « intelligents »
sont capables d’interagir avec le conducteur sans s’y substituer. C’est ce genre de système qui est
étudié dans cette thèse.
Comme nous venons de le voir, la sécurité routière est, de nos jours, très importante. Limiter les risques
d’accidents est un souci permanent tant chez les constructeurs automobiles que pour l’État. Actuellement,
les recherches sont centrées sur les systèmes d’aide à la conduite dits « intelligents » tels que les ADAS
(Advanced Driver Assistance Systems). Les ADAS exploitent les informations de l’environnement proche
du véhicule afin de mettre en place des systèmes d’aide à la conduite. Les recherches portent sur des aspects
perceptifs comme la détection de signalisation, la détection d’obstacle, les systèmes de conduite autonome.Problématique 5
La détection et le suivi d’obstacle s’avèrent prometteurs pour anticiper les collisions, principales causes
d’accidents corporels.
Depuis les années 90, de nombreux travaux ont été menés sur ce sujet. La difficulté réside ici dans le choix
du système de perception, d’une méthode de détection et de suivi. Dans la suite, nous faisons une rapide étude
des techniques d’exploitation des informations de l’environnement qui se basent sur trois principales étapes
dont l’architecture est présentée en figure I.3.
FIGURE I.3. Architecture minimale de détection
Les travaux portés par les chercheurs diffèrent en particulier par le système de perception utilisé : radar
(Tan et al., 2007; Bank, 2007), lidar (Takagi et al., 2006) et image (Tango et al., 2008; Richter et al., 2008).
Dans la suite, nous présentons des exemples utilisant l’un ou l’autre de ces capteurs. Dans ce cadre, une
thématique importante est la détection d’obstacle au voisinage du véhicule.
Dans notre contexte d’étude autoroutier, nous considérerons comme l’a fait (Perrollaz, 2008) qu’un obstacle
est un objet de taille significative susceptible de couper la route de notre véhicule dans un laps de temps
court, compte tenu du temps de réaction du conducteur et des vitesses mises en jeu.
Le problème peut être étudié selon deux points de vue, que cherche-t-on à détecter, et quels outils de
détection peut-on mettre en œuvre ? Dans le premier cas, nous cherchons à déterminer des obstacles potentiels
au voisinage du véhicule. Le type d’obstacle diffère selon l’environnement dans lequel nous nous
trouvons. Par exemple, sur autoroute, les principaux objets à suivre sont des véhicules motorisés (tels que
véhicule, camion...), par contre, à un carrefour, il faut également prendre en compte les piétons, les cyclistes,
etc. Citons les travaux de (Koller et al., 1992) qui proposent une détection des véhicules dans des séquences
d’images et les travaux de (Sato et al., 2010; Ogawa et al., 2011) qui travaillent à partir de données lidar,
pour la détection de piétons.
Après avoir décrit quel type d’objet nous cherchons à détecter, le deuxième aspect de la détection
concerne les outils. Comment détecter ces objets dans des séquences d’images ou de données ? Pour cela,
plusieurs méthodes existent pouvant être utilisées à la fois dans le cas de séquences d’images et dans le cas
de séquences de données (radar, lidar). Deux types d’algorithmes de détection existent :
– les algorithmes de partitionnement qui consistent à regrouper les mesures qui partagent un caractère
commun. Citons, par exemple, l’algorithme de K-means, méthode dont le but est de diviser des observations
en K partitions dans lesquelles chaque observation appartient à la partition avec la moyenne la
plus proche, ou encore les algorithmes reposant sur la comparaison de critère de distance entre deux
données successives telles que les seuils adaptatifs de Santos (Santos et al., 2003), de Borges (Borges
et Aldon, 2000, 2004) et de Dietmayer (Dietmayer et al., 2001).
– les algorithmes de segmentation qui consistent à retrouver des formes (droites, rectangles, etc) dans
des ensembles de données. Leur but est d’extraire les contours des objets. Citons quelques exemples
d’algorithmes. L’algorithme Split and merge (Ray et Ray, 1995) permet de réaliser des approximations
polygonales de lignes par une succession de division de ces lignes en deux, puis par une phase
de fusion. La transformée de Hough (Duda et Hart, 1971) cherche à déterminer les paramètres géomé-
triques d’une forme donnée au moyen de vote. L’approche de maximisation de l’espérance (Dempster
et al., 1977) repose sur la recherche du maximum de vraisemblance ou du maximum a posteriori pour
estimer les paramètres de modèle statistique. L’algorithme de Ransac, méthode destinée à estimer les6 Problématique, capteurs et architectures de traitement
paramètres d’un modèle mathématique à partir d’un ensemble de données observées contenant un
grand nombre de valeurs aberrantes.
Il reste une étape à étudier, le suivi des objets détectés. Cette étape est indispensable afin de déterminer si
un objet est un futur obstacle ou non. Là encore, différentes méthodes existent. En effet, au début des années
90, dans le contexte automobile, c’est le filtre de Kalman (KF) qui est utilisé pour le suivi des objets car
il a prouvé son efficacité dans de nombreux domaines applicatifs. Différentes méthodes seront alors mises
en œuvre comme l’utilisation de plusieurs capteurs (Baig et al., 2011; Darms et al., 2008), l’utilisation des
lignes de la route qui permettent d’améliorer les précisions de modèle (Tan et al., 2007). Cependant, ce filtre
ne permet pas l’étude de système non-linéaire. Des extensions du filtre de Kalman prenant en compte ce type
de systèmes existent : le filtre de Kalman étendu (EKF) permettant de linéariser les systèmes non-linéaires
et le filtre de Kalman sans parfum (UKF) qui est une extension de la transformation sans parfum (méthode
pour calculer les statistiques d’une variable aléatoire issue d’une transformation non-linéaire). De même que
pour le filtre de Kalman, ces filtres sont exploités. Depuis les années 2000, une nouvelle catégorie de filtres,
reposant directement sur l’estimation de la densité de probabilité conditionnelle, solution du problème de
filtrage, fait son apparition. Ces filtres, appelés filtres particulaires ou méthodes de Monte-Carlo séquentielles
ont été introduis en 1992. Contrairement au filtre de Kalman et ses extensions, ces derniers sont applicables
quelles que soient les non-linéarités de modèle.
Une autre difficulté réside dans l’environnement dans lequel nous nous trouvons. En effet, la technique
mise en œuvre pour suivre un véhicule de jour sera différente de celle de nuit, compte tenu des différences de
visibilité. Le jour, les véhicules sont entièrement visibles (s’ils ne sont pas occultés par les autres), par contre
de nuit, les véhicules sont partiellement visibles (sans pour autant être occultés). Cela implique des méthodes
de suivi variées. Considérons l’exemple de O’Malley et al. (2011), où les auteurs partent du constat que, la
nuit, les premiers éléments visibles des véhicules sont ses phares. C’est pourquoi, ils proposent un système de
traitement des images vidéo pour détecter et suivre les véhicules de nuit à partir de leurs phares. Pour le suivi
de jour, il existe plusieurs méthodes, par exemple, celle de Tan et al. (2007), qui met en place un système
de vision monoculaire guidé par radar combiné à la détection et au suivi de la signalisation horizontale de
la route afin de détecter les véhicules et prédire leur intention de changer de voie. Leur but est de mettre en
place des systèmes d’aide à la conduite et de prévention de collision.
On peut constater le même phénomène avec le suivi des piétons. Olmeda et al. (2009) proposent de dé-
tecter et suivre, de nuit, des piétons à partir d’une caméra infrarouge avec laquelle ils peuvent extraire les
caractéristiques de distribution de la chaleur du corps humain. Dans les travaux de Masoud et Papanikolopoulos
(2001), les auteurs s’intéressent à la modélisation et au suivi des piétons, de jour, aux intersections de
type carrefour. Pour cela, ils présentent un système temps réel pour le suivi de piétons dans des séquences
d’images acquises par caméra fixe.
Compte tenu du nombre important de recherches sur le sujet, il est évident que nous n’avons pas balayé
l’intégralité des techniques et méthodes utilisées pour la détection et le suivi d’obstacles sur route. Cependant,
nous avons mis en évidence que le choix d’un capteur, d’un outil et plus généralement d’une méthode de
détection et de suivi est déterminé par le système que nous souhaitons étudier. Toute la difficulté réside donc
dans les choix réalisés pour la mise en place de notre approche de détection et de suivi multicible. Quel
capteur est le plus approprié ? De quels outils de détection et de suivi avons-nous besoin ? Et enfin quelle
méthode allons-nous mettre en place ? Le paragraphe suivant sera consacré à l’étude des capteurs utilisés
dans le domaine automobile et aux architectures fonctionnelles existantes.Capteurs et architectures 7
I.2 Capteurs et architectures
La section précédente a mis en évidence la complexité des systèmes de suivi multi-objets, liés aux
contraintes du domaine autoroutier et à l’environnement. Dans cette section, nous cherchons des solutions à
ces contraintes en étudiant les différents capteurs utilisés et également les différentes architectures de traitement
qui existent, pour la détection d’objets sur route. Nous étudierons dans un premier temps les différents
capteurs, puis dans un second temps les architectures existantes.
I.2.1 Capteurs
I.2.1.1 Système de vision par caméra
Les systèmes de vision par caméra sont utilisés dans les systèmes d’aide à la conduite. Suivant le système
mis en place, ils sont composés d’une ou plusieurs caméras. Elles permettent d’accéder à une grande
quantité d’informations sur un champ de vue large (les données maximales peuvent atteindre 180˚ d’angle
de vue sur environ 90m). L’image résultante peut être en couleur, en niveau de gris ou encore une image
infrarouge, cela dépend de la caméra utilisée. L’un des inconvénients de la caméra pour ce type d’application
est qu’elle ne fournit pas directement l’information de mesure des distances. Pour cela, elle doit faire
appel à des algorithmes de traitement d’image plus ou moins complexes pour réaliser la détection. Dans la
littérature, différents systèmes sont mis en place à partir de caméra.
– Les systèmes de vision par caméra monoculaire se distinguent généralement par le type d’objectif qui
les composent. Nous pouvons distinguer deux types d’objectif, ceux de petit angle de vue, celui-ci
correspond généralement à un objectif de longue focale et ceux de grand angle de vue, qui peuvent
atteindre jusqu’à 180˚ dans la diagonale. Dans cette dernière catégorie, il existe des objectifs de type
Fisheye (figure I.4 gauche).
FIGURE I.4. Une camera avec objectif de type Fisheye à gauche et photo du ciel prise avec la caméra à droite
L’intérêt premier de ces caméras est leur grand angle de champ, cependant, celui-ci cause une distorsion
de l’image. La figure I.4 de droite montre une photo prise par la caméra Fisheye appartenant
au LEOST, c’est une vue du ciel qui présente des distorsions (le centre est grossi par rapport aux cô-
tés de l’image). L’utilisation de ce type de caméra implique donc de mettre en place des traitements
particulier afin de réduire ces effets de champ.
Dans le contexte routier, la plupart des algorithmes de détection visent à trouver dans l’image un
modèle d’objet connu, le plus souvent voiture ou piéton. Selon (Perrollaz, 2008), deux étapes sont
nécessaires pour la détection. La première consiste à extraire des primitives pouvant appartenir à des
obstacles (par exemple, utiliser les contours images des objets, utiliser les symétries des objets à suivre,
les textures et les ombres, l’utilisation de capteur particulier comme les caméras infrarouges permettent
de distinguer efficacement les sources de chaleur), et la deuxième cherche à vérifier que celles-ci
correspondent effectivement aux modèles d’obstacles recherchés.8 Problématique, capteurs et architectures de traitement
– Les systèmes stéréoscopiques sont généralement constitués de deux caméras identiques fixées sur
un support rigide. Elles sont alignées, et ont leur objectif parallèle, pointant vers la même direction,
sans pour autant converger. La figure I.5 de gauche montre un système stéréoscopique appartenant au
LEOST. Il est composé de deux caméras positionnées sur un support rigide à une distance connue l’un
de l’autre. Le système est tel que les deux caméras sont déclenchées au même instant. Ceci implique
une synchronisation importante d’autant plus si le ou les objets à suivre sont mobiles. L’utilisation de
ce genre de système permet d’obtenir des informations de profondeur de la scène. Il est également possible
de faire de la vision stéréoscopique avec une unique caméra en utilisant deux instants successifs
et la donnée temps, les traitements des images sont ensuite similaires.
FIGURE I.5. Système stéréoscopique expérimental (LEOST) à gauche et image d’une scène prise par un
système stéréoscopique et sa carte de disparité à droite
La stéréovision permet d’obtenir une image 3D de la scène à partir des deux images prisent au même
instant. Pour cela, il existe plusieurs techniques décrites dans (Perrollaz, 2008) que nous présentons
rapidement :
Les approches par appariement qui correspondent à la mise en correspondance des informations issues
des différentes images du système stéréoscopique. Cette méthode correspond à l’algorithme de stereo
matching qui cherche à définir les pixels en correspondance, c’est-à-dire, ceux formés par un seul point
de l’objet observé sur chacune des images. Cela permet de construire une image ou carte de disparité,
la segmentation de celle-ci permet de réaliser la détection des objets. La figure I.5 de droite, prise avec
le matériel du LEOST, montre une scène prise sur autoroute à gauche, et à droite sa carte de disparité
associée. La carte de disparité correspond à une image de profondeur, on l’interprète ainsi, lorsque les
couleurs tendent vers le rouge foncé, cela signifie que l’on est proche du véhicule porteur, à l’inverse
lorsque les couleurs tendent vers le bleu foncé, cela signifie que l’on est loin du véhicule porteur.
Les approches par rectification homographique qui consistent à appliquer une transformation homographique
à l’une des images, ou une transformation perspective inverse aux deux, pour que l’apparence
de la route soit semblable dans les deux images. Les pixels n’appartenant pas au plan de la route
sont alors extraits par la différence entre les deux images, associés à un seuillage. Ces pixels sont alors
segmentés et correspondent aux objets.
Les systèmes de vision par caméra sont intéressants car ils permettent d’obtenir des informations sur une
distance pouvant atteindre les 90 mètres. En dépit de leurs hautes performances en vision de la scène, on
distingue quatre types de contraintes relatives à l’information transmises par une caméra :
– les problèmes de synchronisation des différentes caméras entre elles,
– les temps de transfert,
– les temps de traitement,
– les problèmes de stockage.
Les trois dernières sont consécutives à la quantité d’information à traiter. En effet, la quantité d’information
contenue dans une image est importante (2048x1944 pixels) suivant la résolution de l’objectif, le temps de
transfert, le temps de traitement et les problèmes de stockage d’une image dépendent de la quantité d’information
qu’elle contient. Il est possible de réduire cette quantité d’information en réduisant la taille de l’imageCapteurs et architectures 9
cependant, cette manipulation implique une perte de précision qui, si elle est trop prononcée, implique une
perte de précision au niveau des traitements. Une autre possibilité pour "réduire" la quantité d’information à
traiter est de choisir de ne pas traiter toutes les images en provenance de la caméra. Cela permet de stocker
une quantité d’information moins importante mais également de réduire le coût de traitement.
I.2.1.2 Radar
Le radar est un système utilisant les ondes radio afin de détecter la présence, la position et la vitesse
d’objets. Pour cela, il émet une onde produite par un oscillateur radio. C’est la réflexion de cette onde sur un
objet qui sera analysée à son retour. Le temps de vol aller et retour mesuré permet de localiser l’objet détecté.
Il existe différentes façons d’émettre ces ondes. Les plus utilisées sont :
– les radars à impulsions, où le radar émet périodiquement une impulsion et attend son retour. Le temps
de vol aller et retour de l’onde entre l’antenne et la cible est alors mesuré.
– les radars à émission continue qui émettent continuellement à partir d’une antenne et reçoivent à l’aide
d’une seconde.
L’analyse du signal réfléchi offre la possibilité de localiser et d’identifier l’objet responsable de la ré-
flexion, ainsi que le calcul de sa vitesse de déplacement grâce à l’effet Doppler (dans le cas des radars
cohérents). Ainsi, le radar peut détecter des objets ayant une large gamme de propriétés réflectives alors que
les autres types de signaux, tels que le son ou la lumière visible revenant de ces objets, seraient trop faibles
pour être détectés. De plus, les ondes radio peuvent se propager avec une faible atténuation à travers l’air
et divers obstacles tels les nuages, le brouillard ou la fumée, qui absorbent rapidement un signal lumineux.
Cela rend possible la détection et le pistage dans des conditions qui paralysent les autres technologies.
Dans le domaine automobile, citons à titre d’exemple les travaux de Bank (2007) qui introduisent un
algorithme de traitement du signal Radar pour le développement d’une fonction d’alerte de collision latéral.
Pour cela, ils utilisent un capteur radar SRR (figure I.6) de fréquence 24,125GHz pour la détection d’objets
de 0,2m à 30m avec une résolution en distance de 0,15m. Ils utilisent un filtre de Kalman pour réaliser le suivi
multicapteur, multicible. Pour appliquer ce filtre, un modèle de vitesse constante est choisi. Enfin, l’approche
globale du plus proche voisin est utilisée pour associer les nouveaux objets avec des pistes existantes.
FIGURE I.6. Image d’un radar SRR extraite de (Bank, 2007)
Skutek et al. (2003) mettent en place un système anticollision pour voiture, fonctionnant sous toutes les
conditions météorologiques. Il est basé sur quatre radars courte portée de 24GHz et un système de traitement
du signal associé. Ce dernier fournit l’information sur une situation de collision potentielle. Le système est
décrit en quatre étapes, d’abord, les mesures passent dans un filtre d’entrée qui crée un masque et filtre la
distance entre objet et radar. Ensuite, la vitesse relative des objets est estimée. Puis, les auteurs estiment les
distances critiques entre deux véhicules et enfin, ils classifient les objets par rapport à cette distance.
Perrollaz (2008) montre que le radar présente quelques limites pour les applications automobiles. En
premier lieu, l’angle de vue du capteur est faible, environ 10 degrés pour un radar longue portée (∼ 120m) et10 Problématique, capteurs et architectures de traitement
70 degrés pour les radars courtes portées (∼ 30m). Cette faible résolution angulaire ne permet pas toujours
de distinguer deux objets situés côte à côte par exemple. En second lieu, la présence de nombreux échos
parasites dans la chaussée ou sur les bords de la route provoque un grand nombre de fausses détections. Pour
limiter ces fausses détections, les objets situés en milieu de voie et immobiles par rapport au véhicule porteur
sont filtrés, par comparaison de leur vitesse avec celle du porteur. Enfin, ce type de capteur ne permet pas la
détection fiable des piétons car ceux-ci créent peu d’échos.
I.2.1.3 Lidar
Un télémètre laser permet de réaliser une mesure précise entre le capteur et un obstacle. Ce système
de mesure, également appelé LIDAR (LIght Detection And Ranging) est conçu à l’aide de lasers. C’est un
système utilisant la lumière afin d’estimer la distance d’un objet. Pour cela, il émet une onde lumineuse, la
distance à un objet ou à une surface est donnée par le délai entre le temps d’émission de l’impulsion et le
temps de détection du signal réfléchi. Contrairement au radar, le lidar permet de détecter tout type d’objets
(aussi bien véhicule que piéton) à partir du moment où celui-ci renvoie tout ou une partie de la lumière
incidente. Les mesures transmises par le lidar correspondent à une distance et un angle.
À la différence du radar, le capteur lidar émet une onde très focalisée et non sur un cône d’ouverture
angulaire donnée. Dans le domaine autoroutier, ce sont les capteurs télémétriques à balayage qui sont géné-
ralement utilisés car ils permettent de balayer la scène par envoi de multiple rayons. L’orientation du rayon
est permise par un miroir rotatif, commandé par un moteur électrique. Cette technique permet d’orienter le
rayon dans un grand nombre de direction, ainsi un angle de vue large peut être étudié et ce avec une grande
précision angulaire.
En raison de sa directivité plus grande, le capteur lidar est plus sensible aux mouvements du véhicule
que les autres capteurs. Le tangage de celui-ci peut provoquer une désorientation du rayon capteur et ainsi
toucher la route émettant un écho factice. L’utilisation d’un capteur télémétrique multicouche permet de
remédier partiellement à cette difficulté en donnant une vision 3D de la scène. Ce type de capteur émet
plusieurs niveaux de tir comme le montre la figure I.7. Des traitements et un paramétrage supplémentaire
sont donc indispensables.
FIGURE I.7. Principe du lidar multicouche
Takagi et al. (2006) présentent un algorithme de reconnaissance de l’environnement routier à partir d’un
capteur lidar. Pour cela, ils utilisent un capteur DENSO multiplan à trois nappes pour détecter les véhicules
et les signalisations horizontales jusqu’à 120m. Dans cet article, la fréquence est de 10Hz, l’élévation du
rayon est de (−4˚, 4˚) et son azimut est de (−18˚, 18˚) avec une résolution angulaire de 0,08˚. Les auteurs
utilisent un algorithme de détection en trois étapes, reconnaissance des objets, reconnaissance des signalisations
horizontales et reconnaissance de l’environnement routier par l’intégration des deux premières étapes.
Nous choisissons de nous focaliser sur le capteur lidar pour résoudre notre problème de détection et
de suivi d’obstacle. En effet, ce capteur permet d’obtenir une grande quantité d’informations concernant laCapteurs et architectures 11
scène, et ceci avec une faible demande en mémoire. Ceci a notamment un impact sur les temps de transfert
et les problèmes de stockage. La capacité du capteur à détecter tous types d’objets et cela sur une distance
pouvant atteindre 120m sur une ouverture angulaire de (−18˚, 18˚) (exemple de (Takagi et al., 2006)) correspond
à nos besoins. Un dernier aspect est la capacité des fournisseurs à gérer les difficultés liées au domaine
automobile, avec notamment la mise en place d’un balayage horizontal et d’un balayage vertical pour pallier
les difficultés liées au contexte routier (déplacement sur la route, tangage). La section I.3 concernant le lidar
réalise une étude plus poussée des capteurs lidar avec notamment un tour d’horizon des différents capteurs
du marché.
I.2.2 Architectures de traitement de données
Dans cette section, nous cherchons à caractériser les différentes architectures de traitement des systèmes
de détection et de suivi d’obstacles. Ces systèmes sont représentés par une suite de tâches liées, qui effectuées
les unes après les autres, permettent d’obtenir l’objet suivi ou à suivre à partir des données reçues en entrée
du système.
L’architecture de traitement d’un problème de détection et de suivi d’objets varie suivant plusieurs
points : le nombre de capteurs utilisés, l’utilisation d’une tâche de fusion de données, le nombre d’objets
à suivre. Nous présentons ici les architectures permettant la détection et le suivi d’un ou plusieurs objets à
partir d’un ou plusieurs capteurs. Les cas multicapteur et monocapteur sont étudiés séparément.
I.2.2.1 Architectures multicapteur classiques
La présence de plusieurs capteurs implique la présence d’une étape de fusion de données. Dans les
livres (Waltz et Llinas, 1990; Hall, 1992; Hall et Llinas, 1997), les auteurs présentent trois types distincts
d’architecture basés sur la fusion des données que nous présentons ci-après :
– architecture de fusion centralisée (figure I.8). Dans cette approche, les données brutes de chaque capteur
sont transmises à une unité de traitement composée successivement d’une étape de fusion centralisé
qui réalise l’association des données, suivie par une étape de corrélation, une étape de filtrage qui
réalise l’estimation dynamique et enfin une étape de classification des objets ciblés. Ce type d’architecture
permet d’obtenir à la fois une estimation du vecteur d’état de chaque objet mais également une
classification des objets suivis.
FIGURE I.8. Architecture de fusion centralisée extraite de (Waltz et Llinas, 1990)
– architecture de fusion autonome (figure I.9). Les données brutes de chaque capteur sont localement
prétraitées pour générer un vecteur d’état et classifier les objets. Les informations résultantes sont
transmises à l’unité de traitement, identique à celle de l’architecture de fusion centralisée, pour le
calcul de l’estimation d’état.12 Problématique, capteurs et architectures de traitement
FIGURE I.9. Architecture de fusion autonome extraite de (Waltz et Llinas, 1990)
– architecture de fusion hybride (figure I.10). Cette architecture est une combinaison des architectures
centralisées et autonomes. On a donc deux étapes distinctes. La première partie de l’architecture est
identique à celle de fusion autonome. Ensuite, une deuxième partie récupère les informations brutes
en sortie des capteurs et les transmet à une unité centrale qui effectue la détection suivant le même
schéma que l’architecture de fusion centralisée. Les informations résultantes sont transmises à l’unité
de filtrage qui calcule l’estimation des vecteurs d’états et classe les objets.
FIGURE I.10. Architecture de fusion hybride extraite de (Waltz et Llinas, 1990)
Dans ces trois cas, on utilise les données brutes de chacun des capteurs. Il existe également une autre
alternative qui ajoute une étape de prétraitement local associé à chaque capteur (en pointillés sur les figures).
Cette étape permet d’extraire des données brutes les vecteurs caractéristiques pour chaque objet détecté.
C’est cette étape de prétraitement qui diffère suivant le capteur utilisé.
Dans ce type d’architecture, l’abondance de capteurs peut vite devenir problématique et ce pour diffé-
rentes raisons. L’utilisation de capteurs de types différents implique des prétraitements de données locaux
afin de fusionner des informations de même type, ce qui peut augmenter le coût de calcul. Par contre, cette
multiplicité des informations est un avantage majeur qui permet la redondance des informations. Ainsi, un
objet peut être vu par plusieurs capteurs. Cela a pour avantage de limiter les fausses alarmes, non détection
et autres. Ceci implique également que la défaillance d’un capteur peut être compensé par les autres ce qui
n’est pas le cas dans les architectures monocapteurs.
Quand plusieurs capteurs coexistent, un autre souci est la synchronisation des données. En effet, il est
possible que les informations émises par les différents capteurs ne proviennent pas des mêmes instants rendant
nécessaire l’utilisation d’une étape de synchronisation.Capteurs et architectures 13
I.2.2.2 Exemple d’une architecture autonome dans le domaine automobile
Le projet européen CARSENSE (Wahl, 2002) a conçu un démonstrateur de fusion de données multicapteurs
pour détecter les objets devant le véhicule porteur. Son architecture comporte (figure I.11) deux
capteurs extéroceptifs autonomes dotés de capacité locale de suivi (laser scanner) et de traitement d’images
(unité vidéo) et des capteurs proprioceptifs fournissant au système de fusion de données et aux capteurs
extéroceptifs les informations d’angle de braquage, de vitesse, de vitesse de lacet et d’accélération latérale
du véhicule. Dans cette architecture, l’unité de fusion est en charge de la gestion centralisée du bus capteur
auquel sont connectés les unités vidéo et laser scanner. Elle transfère périodiquement du bus véhicule au
bus capteur, les informations proprioceptives nécessaires aux capteurs extéroceptifs. Elle réalise également
la fusion des informations du laser scanner et de l’unité vidéo sur un matériel spécifiquement conçu pour
accueillir les algorithmes de fusion de données.
FIGURE I.11. Architecture du système de fusion de données du projet CARSENSE extraite de Wahl (2002)
I.2.2.3 Architecture monocapteur pour lidar
Dans le cas d’une détection et d’un suivi monocapteur, l’architecture de traitement est simplifiée quant au
nombre de capteurs mais reste similaire au niveau des étapes de traitement. Prenons l’exemple monocapteur
(figure I.12) du projet CARSENCE (Kiehn et al., 2002). L’objectif est le suivi des objets, via des informations
de haut niveau, obtenues à partir d’un laser à balayage. Les données brutes sont segmentées puis transmises à
un module d’affectation, correspondant à la fusion. Celui-ci associe les données provenant de la segmentation
à celles de la prédiction des objets (de l’instant précédent). Les informations résultantes sont transmises à un
module de classification des objets puis à un module de mise à jour, il en ressort l’objet suivi.14 Problématique, capteurs et architectures de traitement
FIGURE I.12. Architecture de traitement monocapteur lidar extraite de (Kiehn et al., 2002)
Si maintenant nous observons le choix d’architecture monocapteur de Jida (2008) présenté en figure I.13.
On remarque que l’architecture est simplifiée au niveau des capteurs, a contrario elle se complique fortement
au niveau de l’unité de traitement. Dans cette thèse (Jida, 2008), l’auteur cherche à estimer les paramètres
dynamiques des objets observés sur une scène afin de mettre en place un système d’aide au conducteur.
Pour cela, il part du constat que la nature du suivi multi-objets implique d’associer, efficacement et à chaque
instant, les mesures disponibles à chaque objet présent dans la scène pour permettre une estimation de leurs
paramètres dynamiques. Dans un premier temps, les paramètres prédéfinis des objets sont extraits par trois
phases :
– une phase d’acquisition des signaux qui utilise un capteur rotatif laser,
– une phase de prétraitement qui met en forme les signaux sous forme de mesures,
– une phase de détection des objets qui identifie des groupes de mesures correspondant à des objets à
suivre selon différents critères et connaissances, a priori, de la forme des obstacles.
Dans un second temps, il met en relation les objets détectés avec les données précédentes. Cela correspond
à l’étape d’association. Il s’en suit une étape d’estimation, de suivi et enfin de prédiction correspondant
notamment aux différentes phases d’un filtre prédictif de Kalman et à la gestion du suivi des objets dans le
temps. Des pistes sont créées (une piste est un ensemble de variables caractérisant les objets suivis), d’autres
sont maintenues et mises à jour en fonction des apparitions et disparitions des objets détectés devant le véhicule,
enfin certaines sont détruites lorsqu’aucune nouvelle observation ne leur a été affectée depuis un temps
prédéfini.Le télémètre laser à balayage : capteur lidar 15
FIGURE I.13. Architecture de traitement monocapteur lidar extraite de Jida (2008)
I.3 Le télémètre laser à balayage : capteur lidar
I.3.1 Principe du télémètre laser à balayage
La technologie laser est directive, elle permet d’envoyer un signal lumineux dans une direction donnée.
Dans les systèmes embarqués, la directivité du signal lumineux a pour conséquence le décrochage régulier
de l’obstacle suivi, qui entre et sort régulièrement de la ligne de tir. Pour pallier cette directivité, les concepteurs
de capteur télémétrique ont, à partir des années 2000, augmenté l’ouverture angulaire horizontale des
capteurs (Fuerstenberg et al., 2001c; Velodyne, 2013; Ogawa et Takagi, 2006). Ainsi le signal balaye la scène
(figure I.14 haut) sur l’ouverture angulaire. Ce balayage est rendu possible par l’utilisation d’un prisme rotatif
couvrant 360˚. La résolution angulaire varie en général de 0,25˚ à 1˚ et dépend de la fréquence du balayage.
La portée du laser dépend de la taille et de la réflectivité de l’objet. Par exemple, pour un objet de forte
réflectivité, la portée peut atteindre 250m à l’inverse pour un objet peu réflectif (5% de réflectivité) la portée
atteint les 40m (Fuerstenberg et Willhoeft, 2001a,b; Fuerstenberg et al., 2001c).
Ces capteurs sont également sensibles au roulis et au tangage du véhicule, dans ce cas, le signal lumineux
change d’inclinaison, cela a pour conséquence le décrochage de l’obstacle suivi, menant comme précédemment
à des pertes du signal. Dans les années 2000−2002 la société IBEO a conçu, à partir d’une première
expérience (capteur laser scanner IBEO LD), une nouvelle génération de capteurs capables de mesurer les
distances sur différents plans verticaux de balayage (IBEO LDML). Ceci correspond au balayage vertical
(figure I.14 bas) de la scène et permet d’être moins sensible au tangage du véhicule (Fuerstenberg et al.,
2002a,b, 2003). Le capteur balaye ainsi la scène suivant deux plans, un vertical et un horizontal.
FIGURE I.14. Principe du balayage horizontal (en haut) et vertical (en bas) extrait de (Besesty, 1999)16 Problématique, capteurs et architectures de traitement
Dans notre contexte d’étude, c’est la technologie laser à balayage qui est donc utilisée. Le laser émet
une onde lumineuse par son émetteur laser et la reçoit via son récepteur comme le montre la figure I.15. La
distance à la cible étant proportionnelle à l’intervalle de temps entre transmission et réception de l’impulsion,
c’est le temps de vol aller et retour de l’émetteur au récepteur en passant par la cible qui donne la distance à
l’objet.
FIGURE I.15. Schéma de fonctionnement du télémètre laser à balayage extrait de (Besesty, 1999)
Selon (Besesty, 1999), il existe deux méthodes pour mesurer les temps de parcours :
– un faisceau lumineux est modulé, dans ce cas, c’est la notion de retard de phase qui est importante
pour la mesure. Cette méthode est le plus souvent employé pour mesurer des distances courtes,
– une impulsion optique courte est générée, le système mesure alors le temps mis par la lumière pour
revenir au récepteur. Cette méthode est la plus souvent utilisée pour déterminer des grandes distances.
La distance correspond alors à :
D =
c
2
(Tstop −Tstart) (I.1)
où D est la distance du capteur à la cible, c est la vitesse de la lumière, Tstart est le temps de départ du
signal et Tstop celui de fin d’émission (comme le montre la figure I.16).
FIGURE I.16. Principe de mesure du temps de vol d’une onde émise par le télémètre laser à balayage extrait
de (Besesty, 1999)Le télémètre laser à balayage : capteur lidar 17
I.3.2 Exemple de mesures lidar issue de capteur monoplan et multiplan
Le capteur lidar est généralement muni d’un système interne de traitement qui permet de transformer
le signal présenté ci-dessus en échos (ρ, θ). Ce sont ces échos qui sont délivrés par le lidar et que nous
étudions, c’est pourquoi nous les présentons, dans cette section.
Les mesures télémétriques d’un lidar décrivent la scène par un ensemble de points, appelés impacts
ou échos, correspondant à la scène qu’il balaye. Dans cette scène, les véhicules présents sont représentés
par des ensembles d’impacts correspondant à la partie visible de leurs contours. Ces ensembles de points
contiennent un nombre variable d’impacts suivant l’orientation et la distance de l’objet. Ils peuvent être
séparés en segment contour du véhicule représentant un ou deux côtés du véhicule (Fuerstenberg et al.,
2003).
Les figures présentées ci-après sont issues d’une simulation, d’un capteur de type télémètre laser à balayage,
avec le logiciel SiVIC (Livic, 2011). Le véhicule porteur du capteur est situé voie centrale. Les
figures I.17 du bas présentent deux types de mesures, converties dans le repère cartésien. La première (à
gauche) représente les mesures de la scène prises par un capteur monoplan et l’autre (à droite) celles prises
par un capteur multiplan. La scène représentée par les deux figures est celle présentée en figure I.17 du haut
où quatre véhicules, situés à des distances différentes, évoluent sur les trois voies de la route.
Sur la figure I.17 de gauche, le capteur lidar monoplan visualise les données de la route sur une ouverture
angulaire de 180˚ avec une résolution angulaire de 0,25˚. La portée du capteur est de 10m à 180m (les
éléments considérés à l’infini sont à 180m). La fréquence d’échantillonnage est de 20Hz. Le capteur lidar
multiplan (à droite) visualise les données de la scène avec les mêmes caractéristiques que le capteur monoplan.
Les tirs capteurs sont effectués suivant une élévation de 0˚ en bleu, 0,4˚ en rouge, 0,8˚ en vert et 1,2˚ en
cyan.
Sur la figure I.18 de gauche, un agrandissement, du véhicule situé en bas à droite de la scène vue par
le capteur lidar multiplan (figure I.17 à droite), permet de montrer les différents plans déterminant un objet.
Ce véhicule est proche du véhicule porteur du capteur, l’élévation du tir permet de voir tous les plans, par
contre pour le véhicule situé voie centrale, seuls les plans d’élévation 0˚ et 0,4˚ sont visibles (figure I.18
de droite ). Cette disparition des informations constitue la principale difficulté de l’étude de ces données
capteurs multiplans.18 Problématique, capteurs et architectures de traitement
−8 −6 −4 −2 0 2 4 6 8
0
20
40
60
80
100
120
140
160
180
x (m)
y (m)
scène monocouche
−60 −50 −40 −30 −20 −10 0 10 20 30
0
20
40
60
80
100
120
140
160
180
x (m)
y (m)
scène multicouche
FIGURE I.17. Image CCD de la scène et le balayage capteur associé vu par le lidar monoplan (en bas à
gauche) et par le lidar multiplan (en bas à droite)
2 2.5 3 3.5 4 4.5 5
15
15.5
16
16.5
17
17.5
18
18.5
19
19.5
20
x (m)
y (m)
zoom véhicule voie de gauche bas de la scène multicouche
−1.5 −1 −0.5 0 0.5 1 1.5
94
94.5
95
95.5
96
96.5
97
97.5
98
98.5
99
x (m)
y (m)
zoom véhicule voie centrale de la scène multicouche
FIGURE I.18. Agrandissement de la représentation de la scène vue par le lidar multiplan (figure I.18 à gauche)
sur le véhicule en bas de la voie droite (à gauche) et sur le véhicule voie centrale (à droite)Le télémètre laser à balayage : capteur lidar 19
I.3.3 Évolution des capteurs lidar
Après avoir vu le fonctionnement des capteurs lidar, nous nous focalisons sur leur évolution, dans le domaine
automobile, en décrivant quelques exemples de capteur. Bien que similaires dans leur fonctionnement,
ils diffèrent par leurs caractéristiques et leurs évolutions. Différents fournisseurs réalisent et commercialisent
des capteurs de type lidar, tel que DENSO, IBEO, SICK et Velodyne.
Dans la littérature, beaucoup d’articles font références aux capteurs de la gamme IBEO. Par contre pour
les fournisseurs DENSO, SICK et velodyne, peu d’articles y font référence et nous trouvons peu d’informations
concernant les capteurs qu’ils réalisent. (com, 2014) donne tout de même une comparaison rapide des
capteurs DENSO, SICK LD-MRS et Velodyne HDL-64E présentés en figure I.19 et tableau I.1.
FIGURE I.19. Présentation des capteurs DENSO, SICK LD-MRS et Velodyne HDL-64E (de gauche à droite)
extrait de (com, 2014)
DENSO SICK LD-MRS Velodyne HDL-64E
Distance 120m > 50m pour 10% de réflectivité
50m pour 10% de réflectivité,
120m pour 80% de
réflectivité
Précision en distance < 10m < 100mm < 20mm
Angle d’ouverture horizontale
36˚ 110˚ (2 plans), 85˚ (4 plans) 360˚
Angle d’ouverture verticale
8˚ 1,6˚ (2 plans) 3,2˚ (4 plans) 26,8˚
Fréquence de balayage 10Hz 12,5Hz, 50Hz 5−15Hz
Résolution angulaire 0,08˚ 0,25˚ (à 12,5Hz) et 0,5˚ (à
50Hz)
0,09˚
Nombre de plan 6 2 ou 4 64
Tableau I.1. Comparaison des capteurs DENSO, SICK LD-MRS et Velodyne HDL-64E extrait de (com,
2014)
Nous choisissons d’étudier les capteurs de la gamme IBEO et leurs évolutions. La société IBEO , créée
en 1998 et située à Hambourg en Allemagne devient « IBEO Automobile Sensor » en devenant filiale de la
société SICK. Son activité est concentrée sur les lasers à balayage pour l’automobile.20 Problématique, capteurs et architectures de traitement
I.3.3.1 Capteur IBEO LD Automotive
Le premier capteur réalisé et commercialisé par IBEO, est un capteur laser à balayage « IBEO LD Automotive
» à forte résolution. Le système mis en place est généralement muni d’un capteur et d’un ordinateur
pour le traitement interne des données. Le champ de vision de ce capteur est ouvert à 270˚, il peut détecter un
véhicule à partir de 3m jusqu’à 250m suivant la réflectivité de l’objet (40m pour un objet à 5% de réflectivité)
avec une précision de ±5cm. Sa résolution varie de 0,25˚ à 1˚ pour une fréquence allant de 10Hz à 40Hz
(Fuerstenberg et Willhoeft, 2001a,b; Fuerstenberg et al., 2001c).
Fuerstenberg et Willhoeft (2001a) partent du constat que la classification des objets détectés est importante
pour estimer la dangerosité des obstacles. Ils constatent, par ailleurs, qu’il est intéressant d’obtenir des
informations sur le risque potentiel des objets environnants afin de protéger les piétons en cas de collision.
Les auteurs présentent, dans cet article, le laser « IBEO LD Automotive » et leurs algorithmes de détection,
suivi et classification. Les mesures brutes, en sortie du capteur, sont divisées en groupes représentant un
même objet. Un filtre de Kalman est utilisé pour estimer la vitesse longitudinale et latérale de l’objet. Enfin,
les objets sont classés suivant les données.
Ce capteur a également été utilisé dans le projet CHAMELEON (« Pre-crash application all around
the vehicle »). Ce projet portait sur le développement d’une plateforme sensorielle de détection de collision
imminente, autour du véhicule et pour tout type de scénario (Fuerstenberg et al., 2001d; Chameleon, 2013).
Dans ce projet, le capteur « IBEO LD Automotive » a été utilisé pour la détection, le suivi et la classification
des objets (voiture, piéton, ...).
I.3.3.2 Capteur IBEO LD-ML (Ladar Digital MultiLayer)
(Fuerstenberg et al., 2002a,b, 2003) partent du constat que le capteur « IBEO LD Automotive » est sensible
aux mouvements du véhicule, perturbant ainsi la détection. La société IBEO présentent alors une nouvelle
génération du capteur IBEO (décrit dans ces articles) permettant de pallier ce problème : le capteur
« IBEO LD-ML » (Ladar Digital MultiLayer). Celui-ci possède des caractéristiques similaires à celle du
capteur « IBEO LD Automotive ». Elles sont présentées en figure I.20.
FIGURE I.20. Le capteur IBEO LD-ML (à gauche) et ses caractéristiques (à droite)
Ce capteur a la capacité de détecter deux distances avec un unique tir laser. Cela se produit si le faisceau
frappe une cible à faible réflectivité et transmission élevée ou des cibles de petites tailles tels que le verre ou
les gouttes de pluie. Dans ce cas, une partie du faisceau est déviée vers le capteur, déclenchant la première
mesure. Par la suite, le faisceau restant frappe une seconde cible, et l’écho de cette cible déclenche la seconde
mesure. Ainsi pour un angle donné, le capteur peut recevoir jusqu’à huit valeurs de distance en prenant en
compte le balayage vertical. Avec un capteur monocible, la réception du faisceau dévié arrêterait la mesure,
et l’objet resterait caché. Concrètement, le capteur « IBEO LD-ML » attend la pulsation du second écho pourLe télémètre laser à balayage : capteur lidar 21
générer la mesure d’un objet. À moins que trop de lumière soit absorbée par la distorsion, ceci permet au
laser à balayage de voir à travers la pluie (Fuerstenberg et al., 2002a,b).
Le capteur laser « IBEO LD-ML » a été développé pour supporter une large gamme d’application automobile,
incluant le freinage d’urgence, le « Stop and Go », la reconnaissance de piéton et le « Pre-Crash »
(Fuerstenberg et al., 2002a).
Une application de ce type de capteur est donnée dans (Gidel et al., 2008). Les auteurs de cet article
présentent une méthode de détection, d’identification et de suivi de piétons à partir d’un unique capteur laser
quatre plans. Pour cela, les points du balayage sont regroupés en différentes classes géométriques, dont le
but est de filtrer le fond de l’image (murs, voiture, ...). Les auteurs utilisent ensuite une méthode exploitant
la technique de fenêtrage de Parzen afin d’isoler les piétons. Enfin, ils utilisent un filtre à particules pour
caractériser la trajectoire du piéton.
I.3.3.3 Capteur ALASCA (Automotive Laser SCAnner)
Le successeur du capteur « IBEO LD-ML » est l’ALASCA (Automotive Laser SCAnner). La version
suivante est l’ALASCA XT. Ces deux capteurs IBEO comptent jusqu’à quatre réflexions par impulsion laser
contrairement au capteur « IBEO LD-ML » qui n’en comptait que deux. Ces capteurs ont la capacité de dé-
terminer si la mesure reçue provient d’un signal retourné par un réflecteur (type plaque d’immatriculation,
...) ou d’une autre surface à moindre pouvoir réfléchissant. En effet, la réflexion totale ou diffuse d’un objet
crée des différences dans le rayonnement de l’impulsion de l’écho. Ces disparités se situent au niveau
du récepteur du capteur et peuvent être mesurées grâce au rayonnement qui provient de la distance et de
l’angle d’incidence de la cible. Cette principale évolution permet d’améliorer le pistage des objets et leur
classification (Fuerstenberg et al., 2004).
FIGURE I.21. Le capteur IBEO ALASCA XT (à gauche) et ses caractéristiques (à droite)
Ce capteur est notamment utilisé dans le projet INTERSAFE qui a débuté en 2004 et s’est terminé en
2007. Il portait sur la création d’une approche Européenne pour augmenter la sécurité aux intersections
(Rössler et Fürstenberg, 2013). L’objectif de celui-ci était d’augmenter la sécurité et réduire (à long terme,
éliminer) les collisions fatales aux intersections (Fuerstenberg, 2005a,b). La méthode est basée sur deux
approches parallèles. La première utilise un capteur et les infrastructures de communication de véhicule. La
communication est bidirectionnelle entre le véhicule et les infrastructures. La seconde utilise un simulateur
de conduite qui analyse les situations potentiellement dangereuses.22 Problématique, capteurs et architectures de traitement
I.4 Conclusion
De nos jours, la sécurité routière est de plus en plus importante. Limiter les risques d’accidents est un
souci permanent tant chez les constructeurs automobiles que pour les nations. Aujourd’hui, les recherches
sont notamment axées sur les systèmes d’aide à la conduite permettant à la fois de prédire une situation
potentiellement dangereuse et d’aider le conducteur à en limiter les conséquences, voire les neutraliser.
Ce chapitre a notamment permis de mettre en évidence les contraintes qu’implique la mise en œuvre
d’un système de détection et de suivi d’obstacle mobile sur route. Le type d’application mis en œuvre est
fonction de l’environnement dans lequel nous nous trouvons, mais également du capteur choisi et des outils.
Nous avons vu que le choix d’un système monocapteur ou multicapteur est complexe et est fortement dé-
pendant du résultat recherché. Dans notre cas, nous cherchons à mettre en place un système proche du temps
réel. L’étude a montré que la multiplicité de capteur peut vite devenir lourde à gérer au niveau mémoire,
temps de transfert des données et temps de traitement. Compte tenu de ces difficultés, nous choisissons de
mettre en place un système monocapteur plus proche de nos besoins, limitant les coûts de traitement.
Une rapide étude des capteurs automobiles a permis de choisir le capteur lidar comme notre source de
données. En effet, sa capacité à détecter tous types d’objets et ce sur une distance pouvant atteindre 120m
pour un balayage de la scène pouvant atteindre 160˚ répond à nos besoins. De plus, ce capteur permet
d’obtenir une grande quantité d’informations concernant la scène et notamment les distances capteur/objet
sans nécessité de traitement. Cependant, une difficulté de ce type de mesure est leur nature spatialement
distribué dans le cas monoplan. Dans le cas multiplan, la difficulté réside dans la disparition d’informations
(due à une élévation du tir trop élevé) sur certain plan.
La section suivante est dédiée à l’état de l’art des techniques de détection et de suivi d’objets multiples à
partir de données de type lidar.Chapitre II
Problème de détection et suivi d’objets
multiples
II.1 Architecture fonctionnelle classique du problème de détection et de suivi
d’obstacles
Les mesures télémétriques d’un lidar décrivent les véhicules par un ensemble de points correspondant
à la partie visible de leurs contours. Une difficulté de ce type de données est leur nature : l’ensemble de
mesures décrivant un véhicule est spatialement corrélé. C’est pourquoi une étape préliminaire d’agrégation
avant le processus de suivi est généralement nécessaire, comme l’illustre la figure II.1.
FIGURE II.1. Étapes classiques d’un algorithme de détection et de suivi
Ainsi, dans un premier temps, les mesures brutes, en sortie du capteur physique, sont utilisées pour
détecter les objets présents dans le champ de vision du capteur. Un module de détection prend en compte
des attributs caractéristiques du capteur et de son environnement pour extraire, des mesures du capteur, les
paramètres d’objets d’intérêt (Nashashibi et Bargetin, 2008).
Dans un deuxième temps, une étape d’association temporelle associe les objets en sortie du module de
détection à ceux en sortie du module de suivi en vue de mettre à jour le module d’estimation et de suivi. Le
module d’association temporelle crée et maintient une liste des objets en cours de suivi. Ceci lui permet de
mettre en relation les objets qui viennent d’être détectés avec ceux de sa liste. Il associe des objets détectés
aux estimés d’objets présents dans la liste et en identifie d’autres comme des objets venant d’apparaître dans
le champ de vision. Enfin, il élimine, de cette liste, les objets identifiés comme étant disparus du champ
de vision du capteur. Plusieurs méthodes ont été proposées pour réaliser cette étape d’association. On peut
citer, parmi les plus populaires, les approches de suivi à hypothèses multiples, Multiple Hypothesis Tracking
(MHT), et celles d’association probabiliste conjointe de données ou Joint Probabilistic Data Association
(JPDA). Les méthodes MHT envisagent, pour un horizon temporel donné, toutes les associations possibles
entre les mesures et les pistes (Reid, 1979). JPDA modélise le problème d’association de manière probabiliste
(Bar-Shalom et Fortmann, 1988; Bank, 2007).
2324 Problème de détection et suivi d’objets multiples
Dans un troisième temps, une étape de filtrage rafraîchit l’estimation des paramètres des objets suivis à
partir des informations d’associations de la liste d’objets, précédemment mises à jours. Elle initie celle des
objets nouvellement détectés à partir des informations de création. Différents filtres peuvent être appliqués
selon la nature de la modélisation du système. Si le système est décrit par un modèle linéaire ou qui a été
rendu linéaire, un filtre de Kalman (Bank, 2007; Sato et al., 2010) ou un filtre de Kalman étendu (Tango
et al., 2008) sera choisi. S’il est décrit par un modèle non-linéaire, un filtre de Kalman sans parfum (Julier
et Uhlmann, 2004; Richter et al., 2008), une approche à base de grille (Homm et al., 2010) ou encore une
approche de Monte Carlo séquentielle sera utilisé. Les approches de Monte Carlo séquentielles, également
connues sous le nom de filtrage particulaire (Doucet et al., 2000a), ont également été plus récemment mises
en œuvre dans des algorithmes de suivi pour des applications routières (Idler et al., 2006; Thuy et Leon,
2009).
Lorsque le système de détection et de suivi comporte plusieurs capteurs de détection d’objets, une étape
de fusion peut être ajoutée entre les capteurs physiques et le module de détection (fusion signal), après les
modules de détection des capteurs physiques (fusion d’objets), ou encore après les modules d’estimation
et de suivi des capteurs logiques (fusion de pistes) (Hall, 1992; Liggins et al., 1997; Herpel et al., 2008;
Nashashibi et Bargetin, 2008; Baig et al., 2011).
II.2 Détection dans les données télémétriques
Les lidars automobiles délivrent un ensemble de mesures (ρ,θ) à chaque nouvelle rotation de leur laser
(balayage capteur t). Ces mesures sont séparées d’une distance angulaire fixe ∆θ (le pas de tir). Le capteur
télémétrique calcule chaque distance ρθ (distance délivrée à l’angle θ) en divisant la vitesse de la lumière
par la mesure du temps qui s’est écoulée entre la date d’émission du signal laser et celle de la réception du
signal réfléchi correspondant (temps de propagation). Chaque ensemble de mesures délivré est un agglomérat
d’échos pouvant être représentatif de différents objets détectés, de pertes de signal et de non détection.
Détecter un objet parmi ces mesures nécessitent donc de les regrouper en une information objet. Pour
cela, généralement on distingue trois étapes (Jida, 2008) :
– le partitionnement des données d’un balayage en groupes de mesures (clustering) ;
– la segmentation de chacune des partitions trouvées, afin d’en extraire des contours d’objets ;
– l’identification et la classification des objets issus de l’étape de segmentation.
Nous considérons, dans la suite de ce document, que chaque tour de rotation du lidar correspond à notre
fréquence d’échantillonnage, ∆t, d’une image capteur. t est l’indice ou numéro du balayage (tour de rotation),
par conséquent, t.∆t est la date du balayage. Nous utilisons, aussi, les expressions des mesures d’un même
échantillon suivantes :
– Zt
l’ensemble des mesures d’un balayage t ;
– Zt = {zθ ;θ ∈ {θmin,θmin +∆θ,...,θmax}} ;
– Pt
l’ensemble des partitions de Zt
;
– Nmax le nombre maximal d’objets d’une image à t d’au moins un point
– Pt =
n
P(n);n ∈ [0,Nmax],Nmax ≤
θmax−θmin
∆θ +1,P(0) = ∅
o
;
– P(n) =
zθ ;θ ∈
θa,θa +∆θ,...,θa+f
, f le nombre de points de P(n) et P(1)
T
...T
P(n) = ∅ ;
– zθ=(ρθ ,θ) lorsque la mesure est exprimée en coordonnées polaires ;
– zθ=(xθ ,yθ ) lorsqu’elle l’est en coordonnées cartésiennes ;
– z
−
θ
indique la mesure de l’impact à l’angle de tir précédent (θ
− = θ −∆θ) ;
– z
+
θ
indique celle de l’impact à l’angle de tir suivant (θ
+ = θ +∆θ) ;
– ∆θ est la résolution angulaire du lidar, c’est-à-dire le pas de tir durant le balayage.
D’autre part, le passage du repère polaire au repère cartésien se fait classiquement selon le systèmeDétection dans les données télémétriques 25
d’équations suivant :
xθ = ρθ cosθ
yθ = ρθ sinθ
(II.1)
II.2.1 Partitionnement de données (clustering)
L’étape de partitionnement de données regroupe, au sein de partitions, les mesures qui partagent un
caractère commun. Dans le cas d’un échantillon de mesures lidar, l’étape de partitionnement consiste à regrouper
les mesures correspondant à un même objet. Les algorithmes de partitionnement reposent alors sur
la comparaison d’un critère de distance avec un critère seuil. Jida (2008) part du constat que les données lidar
sont naturellement ordonnées, lors du balayage de la scène, pour éliminer un certain nombre d’algorithmes
tels que le K-Means basés sur le calcul de centroïdes selon un processus itératif. Il s’intéresse alors aux
approches de partitionnement reposant sur la comparaison de critère de distance entre deux mesures successives.
Nous nous plaçons dans cette continuité et reprenons ci-après la description de la méthode générale de
l’algorithme de partitionnement, puis nous nous intéressons aux déclinaisons adaptatives de Dietmayer et al.
(2001); Santos et al. (2003); Borges et Aldon (2004).
II.2.1.1 Algorithme de partitionnement
L’algorithme de partitionnement consiste en la comparaison, mesure après mesure d’un balayage, de la
distance d(zθ− ,zθ ) entre deux mesures successives à une valeur de distance seuil. Si cette distance d(zθ− ,zθ )
est inférieure à la valeur seuil, alors la mesure zθ au pas de tir courant est affectée à la même partition que la
précédente zθ− . Si ce n’est pas le cas, elle est affectée à un nouveau groupe. La distance la plus utilisée est
la distance euclidienne définie comme suit :
– d(zθ− ,zθ ) = q
ρ
2
θ− +ρ
2
θ −2(ρθ− )(ρθ ) cos(∆θ) lorsqu’elle est déclinée en coordonnées polaires ;
– d(zθ− ,zθ ) = p
(xθ− −xθ )
2 + (yθ− −yθ )
2
lorsqu’elle l’est en coordonnées cartésiennes.
La détermination de la valeur du seuil est la principale difficulté des algorithmes de partitionnement.
Le seuil peut être fixe (algorithme non adaptatif) ou calculé à chaque itération (algorithme adaptatif). Une
valeur de seuil fixe ne tient cependant pas compte des grandes différences de distances qui peuvent être
calculées entre deux points d’un même objet selon l’orientation et la distance au lidar de cet objet. Ceci
est illustré en figure II.2. Ainsi, on préfèrera l’utilisation d’une distance seuil adaptative, qui est calculée à
chaque comparaison entre deux mesures zθ− et zθ consécutives. Dietmayer et al. (2001); Santos et al. (2003)
et Borges et Aldon (2004) proposent différents seuils adaptatifs que nous présentons maintenant.
FIGURE II.2. Seuil SNA fixe d’un algorithme non adaptatif26 Problème de détection et suivi d’objets multiples
II.2.1.2 Seuil adaptatif de Dietmayer et al. (2001)
Dietmayer et al. (2001) définissent une distance seuil qui ne dépend que de la distance entre la surface
d’impact et le repère du télémètre. Sa formulation est la suivante :
SDietmayer = CDietmayer min{ρθ− ,ρθ }+Cbruit
avec
– CDietmayer =
p
2(1−cos(∆θ)) le paramètre de raffinement du partitionnement ;
– Cbruit une constante traduisant l’influence du bruit en distance des impacts sur le calcul du seuil,
classiquement Cbruit = 3σρ où σρ est une donnée constructeur de l’ordre de quelques centimètres
correspondant à l’erreur expérimentale sur la mesure de la distance ρ (Jida, 2008).
Comme le remarque Jida (2008), le calcul du paramètre CDietmayer prend pour hypothèse que la surface
est perpendiculaire à la bissectrice de la droite passant par les points zθ− à zθ . Ainsi, ni l’orientation ni
l’inclinaison de la surface d’impact ne sont considérées et le calcul du seuil est donc très fortement dépendant
de la distance du capteur à la surface d’impact. Il devient alors difficile de séparer les groupes de mesures
lorsque les impacts sont très éloignés du capteur.
II.2.1.3 Seuil adaptatif de Santos et al. (2003)
L’approche de Santos et al. (2003) reprend celle de Dietmayer et al. (2001). Mais, ils y introduisent une
valeur d’angle constante, β, permettant de prendre en compte l’inclinaison maximale de la surface (figure
II.3). β réduit la dépendance du partitionnement, précédemment constatée dans l’approche de Dietmayer
et al. (2001), à la distance entre l’objet et le lidar. La valeur de β est à choisir expérimentalement. Si β est
choisi trop grand, il sera plus difficile de séparer deux objets proches, à l’inverse s’il est choisi trop petit,
deux mesures successives provenant d’un même objet risquent d’être séparées (Santos et al., 2003).
FIGURE II.3. Paramètres du seuil adaptatif SSantos selon Santos et al. (2003)
La distance seuil devient alors :
SSantos =
CDietmayer
cot(β) cos(∆θ/2)−sin(∆θ/2)
min{ρθ− ,ρθ }+Cbruit
avec β angle d’inclinaison maximal de la surface d’impact, fixé expérimentalement, généralement autour
de 60˚ (Jida, 2008).Détection dans les données télémétriques 27
II.2.1.4 Seuil adaptatif de Borges et Aldon (2004)
Borges et Aldon (2004) prennent en compte, comme Santos et al. (2003), l’orientation maximale de
la surface entre les impacts et le capteur télémétrique pour son calcul de la distance seuil. Cependant, ils
n’utilisent pas la mesure de distance zθ de l’angle de tir courant, mais seulement celle zθ− de l’angle de tir
précédent. Ils font en outre intervenir l’angle λ non orienté mais construit, dans le sens trigonométrique, au
niveau du point d’impact sur la surface et à partir de « la droite de tir de l’impact zθ− » (figure II.4). Cet
angle λ joue, en quelque sorte, le rôle « d’angle limite à la surface en deçà duquel le capteur télémétrique
ne pourra délivrer de mesures », car, en deçà, la surface et le faisceau se rapproche du parallélisme et l’angle
de réflexion du signal empêche alors le retour de l’écho vers le capteur. L’angle limite de tir à la surface est
fixée par les constructeurs de lidar aux alentours de 10˚. L’angle λ peut être légèrement supérieur à cette
valeur, jusqu’à 25˚ selon Jida (2008), mais un λ trop grand peut rendre impossible la séparation en partition.
Ce paramètre est donc à régler expérimentalement.
FIGURE II.4. Paramètres du seuil adaptatif SBorges selon Borges et Aldon (2004)
La formulation de la valeur de la distance seuil selon l’approche de Borges et Aldon (2004) est la suivante
:
SBorges = (ρθ− )
sin(∆θ)
sin(λ −∆θ)
+Cbruit
avec λ angle limite en deçà duquel le lidar ne délivre plus de mesure (perte du signal).
II.2.2 Segmentation de partitions
Les algorithmes de partitionnement de mesures ont eu pour objectif de regrouper les mesures partageant
une ou plusieurs caractéristiques communes. Ceux de segmentation ont pour finalité de retrouver des
formes dans ces ensembles de mesures. Afin d’identifier des contours d’objets, nous nous intéressons aux
algorithmes d’extraction de ligne dans des données laser 2D et nous nous appuyons en particulier sur les
travaux de Nguyen et al. (2005, 2007). Nous présentons ainsi ci-après les cinq méthodes de segmentation
répertoriées : l’approche incrémentale, l’approche par décomposition et fusion (Split and merge), l’approche
RANSAC (Random Sample Consensus), l’approche par transformée de Hough et, enfin, l’approche par maximixation
de l’espérance (EM, Expectation-Maximization).28 Problème de détection et suivi d’objets multiples
II.2.2.1 Approche incrémentale
Les approches incrémentales de segmentation sont apparues dans les années 70. Elles consistent en la
recherche de forme, dans un ensemble ordonné P de mesures. À partir des premiers points constituant la
forme, elles vérifient pour chaque nouvelle mesure son appartenance à la forme en cours de construction
selon un critère de décision. Le choix de ces critères repose sur des conditions simplifiées. Un exemple de
critère de décision dans le cas de l’extraction d’une droite est le respect d’une valeur seuil maximale par la
distance orthogonale entre la mesure considérée et la droite. Cette approche est fondée sur le calcul successif
des paramètres de la droite en ajoutant le point zθ+ .
1. Soit un ensemble P de N points P =
zθa
,...,zθa+N
2. Construire une droite (d) entre les deux premiers points
3. Ajouter le point suivant zθ+ au modèle de droite courant (d) et réestimer les paramètres de
la droite (d)
4. Si les conditions de la droite sont satisfaites, retour à l’étape 3,
5. Sinon
– Éliminer le dernier point zθ+ de la droite (d)
– Réestimer les paramètres de la droite (d)
– Mémoriser la droite (d)
– Retour à l’étape 2 avec comme modèle de droite (d) ce dernier point zθ+ et le suivant.
L’algorithme incrémental de segmentation est simple à mettre en œuvre. Les critères de décision sont
facilement modifiables et il ne nécessite pas que l’acquisition des données soit terminée pour être exécuté.
Cependant, avoir un seuil fixe est un inconvénient. Le choisir trop petit implique un morcellement des droites
détectées à une distance très éloignée de la position du capteur. À l’inverse, un seuil trop grand conduit à des
associations aberrantes de points pour des droites détectées à une distance proche du capteur.
II.2.2.2 Approche Split and Merge
L’approche Split and Merge est probablement la plus populaire des méthodes d’extraction de droites.
C’est un algorithme itératif qui provient du traitement d’images, il est ainsi capable de traiter les points
d’échantillonnage d’un balayage laser qui sont peu nombreux par rapport aux pixels d’une image. Il est plus
rapide qu’un algorithme de groupement (Einsele, 1997). Dans la littérature, on retrouve cette technique de
segmentation dans beaucoup de travaux, notamment dans la robotique, sur des données télémétriques de
laser 2D (Einsele, 1997; Borges et Aldon, 2004; Siadat et al., 1997; Zhang et Ghosh, 2000).
Les algorithmes Split and Merge permettent de réaliser des approximations polygonales de lignes par
une succession de division de ces lignes en deux (Split), puis par une phase de fusion (Merge), selon un ou
plusieurs critères de validation. Selon Ray et Ray (1995), le problème fondamental de ces techniques est la
segmentation initiale.
Par exemple, la technique Split and Merge de Pavlidis et Horowitz (1974) (cité dans (Ray et Ray, 1995))
cherche à adapter à un contour des lignes droites dont la définition provient d’une première segmentation.
Elle calcule pour cela l’erreur quadratique des points du contour à la droite. Si l’erreur est trop grande, la
ligne est divisée ; deux lignes seront fusionnées si elle est trop petite.
Dans (Ray et Ray, 1995), des polygones insensibles à l’orientation et à l’échelle de courbes chaînées sont
générés en utilisant trois critères de validation. Le premier est la distance (non perpendiculaire) d’un point k
d’une courbe à un segment de droite i j divisée par la longueur du segment li j afin de la rendre indépendante
à l’échelle (normalisation), critère dki j/li j. Les segments de courbes sont séparés aux points k pour lesquels
dki j/li j atteint un maximum. Le second, le ratio de la longueur de l’arc à la longueur du segment de ligneDétection dans les données télémétriques 29
(ai j/li j), comparé à une valeur seuil, permet de vérifier que les points k de la courbes compris entre i et j
sont colinéaires. En cas de dépassement du seuil, un troisième critère, la somme des dki j/li j pour les points
k de la courbe variant entre (i + 1) et (j − 1), sert à trancher la décision de colinéarité ou non colinéarité.
En fonction de la valeur de ces trois critères, des lignes sont tout d’abord divisées (phase Split). Des lignes
seront par la suite fusionnées selon ces critères (phase Merge).
La phase de division peut utiliser la méthode IEPF (Iterative-End-Point-Fit) (Borges et Aldon, 2000).
Celle-ci permet, si le critère de validation est satisfait, la division des points d’un ensemble ordonné P en
deux sous-ensembles à partir du point de rupture de l’ensemble. Le point candidat au titre de point de rupture
de l’ensemble P est le point pour lequel la distance à la ligne, construite à partir des deux points extrêmes de
P, est maximale (par exemple distance orthogonale à la droite, distance de Mahalanobis...). Si en ce point, la
valeur de la distance est supérieure à une distance seuil, l’ensemble est divisé en deux sous-ensembles en ce
point de rupture. De façon récursive, ces sous-ensembles vont eux-même être divisés tant que le critère de
validation est satisfait.
Borges et Aldon (2000) présentent un algorithme SMF (Split and Merge Fuzzy) dans une liste de droites,
selon un schéma proche de la méthode IEPF. Par contre, ils utilisent un critère de validation basé sur la
dispersion des points supports (i.e. points à l’origine de la définition des droites), aussi bien au moment de la
phase de division que celle de fusion. Les droites de la liste sont, chacune, définies par leurs paramètres en
coordonnées polaires, leur centre de gravité en coordonnées cartésiennes et un vecteur comportant les indices
des points supports. Une droite sera séparée en deux droites lorsque la valeur de dispersion maximale trouvée
en un point support est supérieure à une valeur de dispersion maximale donnée. Lors de la phase de fusion,
pour toute ligne de la liste, on cherche à savoir si deux lignes sont candidates à la fusion. Ce sont les deux
lignes les plus proches en termes de distance entre leur centre de gravité et celui de la ligne initiale. Parmi
les deux possibilités, la ligne fusionnée résultante sera celle dont la dispersion est la plus petite, si toutefois
elle satisfait le critère de dispersion.
Un algorithme Split and Merge basé sur une technique de division IEPF peut être schématisé ainsi :
1. Soit un ensemble P de N points, P =
zθa
,...,zθa+N
2. Placer P dans la liste L
3. Créer une droite (d), selon la méthode choisie, à partir des données de P
4. Chercher le point zθR pour lequel la distance choisie à la droite d(zθR,(d)) est maximale
5. Si d(zθR,(d)) est inférieure à un seuil, retour à l’étape 3
6. Sinon
– Diviser l’ensemble P au niveau de zθR en Pa et Pb
– Remplacer P par Pa et Pb dans L
– Retourner à l’étape 3
7. quand tous les sous-ensembles de L ont été étudiés, fusionner les segments colinéaires selon
le ou les critères de validation choisis.
L’approche Split and Merge est simple à mettre en œuvre. Cependant, cet algorithme récursif ne peut
être exécuté que sur un ensemble de point déterminé. Ceci implique que le traitement ne peut commencer
qu’après la fin de la phase d’acquisition des mesures. Comme pour l’algorithme incrémental, le choix du seuil
est une difficulté. L’article de (Fortin et al., 2012) montre d’ailleurs cette difficulté et propose une nouvelle
méthode qui définit un critère de détection de segments de lignes dépendant uniquement des paramètres
intrinsèques du capteur.30 Problème de détection et suivi d’objets multiples
II.2.2.3 Approche RANSAC (Random Sample Consensus)
L’algorithme RANSAC, publié pour la première fois par Fischler et Bolles (1981), est une méthode
itérative destinée à estimer les paramètres d’un modèle mathématique à partir d’un ensemble de données
observées contenant un grand nombre de valeurs aberrantes (appelées outliers).
L’algorithme RANSAC repose sur deux hypothèses fortes :
– les inliers sont les données dont la distribution peut être expliquée par un ensemble de paramètres du
modèle considéré ;
– les outliers sont des données qui ne correspondent pas au modèle choisi.
RANSAC suppose qu’étant donné un ensemble petit d’inliers, il existe une procédure qui permet d’estimer
les paramètres du modèle de façon à expliquer de manière optimale ces données. L’algorithme cherche
donc à estimer le modèle par ses inliers en éliminant ses outliers, comme le montre la figure II.5.
FIGURE II.5. Exemple de dispersion des inliers et outliers
À l’inverse des techniques conventionnelles qui, à partir d’un grand ensemble de données P, éliminent
les points aberrants, l’algorithme de Ransac utilise le plus petit ensemble de données initiales possible et
l’accroît en associant les données les plus compatibles avec la modélisation antérieurement réalisée à partir
de l’ensemble des données initiales (Fischler et Bolles, 1981).
L’algorithme consiste en deux étapes répétées de manière itérative :
– un ensemble minimal de n points est sélectionné de manière aléatoire dans l’ensemble des données
d’entrée P, à partir duquel les paramètres du modèle sont estimés ;
– chacun des éléments de l’ensemble de données P est testé pour vérifier s’il correspond au modèle.
L’algorithme de Ransac s’arrête lorsque la probabilité de trouver un meilleur sous-ensemble est inférieure à
un seuil (Zuliani, 2012).
Nous considérons maintenant l’exemple de Jida (2008) qui cherche à estimer une droite parmi un ensemble
de points (figure II.5). Deux points (zθa, zθb) sont choisis aléatoirement parmi l’ensemble des données
à traiter. Les paramètres de la droite (d) passant par ces points sont estimés. La distance de chacun des
autres points zθ j à la droite (d) est alors calculée. Un point sera associé à (d) si sa distance à cette droite
est inférieure à un seuil fixé. Ces points sont appelés inliers candidats. Si le nombre des inliers candidats est
suffisant, alors les paramètres de la droite sont réestimés en les prenant en compte. Ces inliers candidats sont
ensuite éliminés du groupe de points initial. On réitère la procédure jusqu’à ce qu’il n’y ait plus suffisamment
de points dans le groupe ou jusqu’au nombre maximum d’itération. L’algorithme est résumé ci-dessous :Détection dans les données télémétriques 31
– Soit un ensemble P de N points P =
zθa
,...,zθa+N
– Répéter :
Choisir aléatoirement deux points (zθa, zθb)
Créer une droite (d) entre ces deux points et estimer ses paramètres
Calculer les distances des autres points à la droite d(zθ j
,(d)) ∀zθ j ∈ P− {zθa, zθb}
Construire l’ensemble des inliers candidats de distance inférieure à un seuil
S’il y a un nombre suffisant d’inliers candidats
– Réestimer les paramètres de la droite (d) en prenant en compte les inliers candidats
– Mémoriser la droite (d)
– Éliminer les inliers candidats de l’ensemble P
– Tant que le maximum de N itérations n’est pas atteint ou que le nombre de points de P soit
insuffisant.
La méthode RANSAC est populaire en vision par ordinateur. Simple à mettre en œuvre, elle oblige cependant
d’attendre la fin de l’acquisition pour démarrer les traitements. Elle permet d’estimer les paramètres
avec un degré élevé de précision, même si une quantité importante d’outliers est présente. Dans notre cas, un
des problèmes est le caractère aléatoire de la recherche des droites, on peut obtenir des droites qui n’ont pas
d’existence réel en termes d’obstacles présents dans le champ de vision du capteur. Cet algorithme nécessite
également de fixer un seuil spécifique au problème traité. Enfin, l’approche RANSAC est une approche à
modèle unique. C’est-à-dire lorsque plusieurs modèles coexistent, l’algorithme n’arrive pas à déterminer les
différents modèles (Forsyth et Ponce, 2003).
II.2.2.4 Transformée de Hough
Selon (Duquenoy et Taleb-Ahmed, 2006), la transformée de Hough permet la détection, dans une image,
de formes décrites analytiquement, formes incluant des lignes droites, cercles et ellipses. Elle permet aussi
sous certaines conditions toute détection de forme quelle qu’en soit leur description. Elle est utilisée dans
de nombreuses applications telles que la détection d’objets, la détection de mouvement, la reconnaissance
de caractère... Duquenoy et Taleb-Ahmed la décrivent ainsi. La transformée de Hough cherche à déterminer
les paramètres géométriques d’une forme au moyen d’une procédure de vote : chaque point de l’image, de
la forme, vote pour un ou plusieurs points dans l’espace des paramètres. La dimension de cet espace dépend
de la forme recherchée (deux dimensions pour une droite, trois pour un cercle). Plusieurs approches de vote
existent. Nous présentons ci-après l’approche décrite dans (Duda et Hart, 1971, 1972), approche qualifiée de
transformation one-to-many par Duquenoy et Taleb-Ahmed.
Duda et Hart (1971) proposent de détecter des lignes (ou des courbes) dans des images en travaillant dans
l’espace des paramètres (Θ,ρ). Dans cet espace, l’équation d’une droite est : ρ = x · cos(Θ) +y ·sin(Θ). En
restreignant Θ à l’intervalle [0,π], toute droite (d) dans le plan xy correspond à un unique point dans le plan
Θρ pour lequel l’angle Θ est l’angle polaire de la normale à la droite (d) (figure II.6). Considérant l’ensemble
de points {(x1,y1),...,(xn,yn)}, ils y cherchent des lignes droites en transformant chaque point (xj
,yj) en une
courbe sinusoïdale dans le plan Θρ, courbe définie par l’expression (II.2).
ρ = xj
· cos(Θ) +yj
·sin(Θ) (II.2)
Les courbes correspondant à des points colinéaires ont un point d’intersection commun dans le plan
Θρ, qui définit la ligne passant par les points colinéaires. Duda et Hart en déduisent que le problème de la
détection de points colinéaires est celui de la recherche des courbes (II.2) concurrentes.
Les intervalles de recherche en ρ et en Θ doivent être quantifiés. Des indices correspondant aux valeurs
de ρ et de Θ définissent les lignes et colonnes d’un tableau, appelé accumulateur. Pour chaque point (xj
,yj)
de l’image, la courbe correspondante, décrite par l’équation (II.2), est enregistrée dans l’accumulateur en
incrémentant le compteur de points des cellules (indΘ,indρ ) traversées par la courbe. Ainsi, une recherche
des cellules dont la valeur du compteur est supérieure à un seuil permet de trouver les paramètres (Θj
,ρj)32 Problème de détection et suivi d’objets multiples
des normales aux droites par lesquelles passent le plus grand nombre de points, à l’erreur de quantification
(∆ρ et ∆Θ) près.
FIGURE II.6. Paramètres (Θ,ρ) tels que Θ est l’angle polaire de la normale à la droite (d) (Duda et Hart,
1971)
L’algorithme est le suivant :
1. Soit un ensemble P de N points, P = {z1,...,zn} où zj = (xj
,yj), ∀ j ∈ [1,n] ;
2. Soit le problème ainsi quantifié : ∀zj
, ρ ∈ [ρmin,ρmax], ρ est arrondi à ∆ρ près, Θ ∈ [0,π]
avec Θ incrémenté de ∆Θ
3. Soit Acc
jρ , jΘ
un tableau de Nρ lignes et de NΘ colonnes, dimensions définies conformé-
ment au choix de quantification du problème.
4. Début
– Pour tout zj
, j ∈ [1,n],
Pour tout Θ ∈ [0,π] incrémenté de ∆Θ
Calculer ρ selon II.2
indρ = f(ρ), où f(ρ) respecte les règles de quantification adoptées
Acc
indρ ,indΘ
+ = 1
Fin pour
– Fin pour
– ∀(indρ ,indΘ), rechercher les valeurs max de Acc
indρ ,indΘ
supérieures à un seuil.
5. Fin
Dans le cas de données issues d’un télémètre le principe est le même. Ainsi Pfister et al. (2003) cherchent
à trouver des droites à partir de chacun des points de l’ensemble P étudié. Chaque point est transformé en
une ligne discrétisée dans l’espace de Hough. Cette transformation est basée sur la paramétrisation d’une
ligne en coordonnées polaires avec une distance normale à l’origine ρ et un angle Θ (figure II.6). De même
que pour l’image, pour chaque point de l’ensemble, les paramètres ρ et Θ de chaque ligne sont calculés
et enregistrés dans un accumulateur. Quand une cellule (indρ ,indΘ) de l’espace de Hough est incrémentée,
la coordonnée du point est associée et sauvegardée. Ainsi, quand un pic est déterminé, les points associés
sont extraits. Dans ce cas, les auteurs peuvent trier les points du balayage en sous-ensembles colinéaires et
déterminer l’orientation du segment de ligne.
La transformée de Hough est une approche récursive, obligeant ainsi d’attendre la fin de l’acquisition
pour démarrer les traitements. Elle est sensible à la quantification choisie. Un échantillonnage trop fin, en ρ
et Θ augmente le temps de calcul. D’autre part, elle ne regarde pas la continuité des points colinéaires. Par
conséquent, la position d’une droite peut être perturbée par la présence de points se trouvant dans une autre
partie de l’image considérée, et donc sans relation avec la forme recherchée.
Techniques visuelles pour la d´etection et le suivi d’objets
2D
Rafiq Sekkal
To cite this version:
Rafiq Sekkal. Techniques visuelles pour la d´etection et le suivi d’objets 2D. Computer Vision
and Pattern Recognition. INSA de Rennes, 2014. French.
HAL Id: tel-00981107
https://tel.archives-ouvertes.fr/tel-00981107
Submitted on 20 Apr 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific
research documents, whether they are published
or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.Techniques visuelles pour
la détection et le suivi
d’objets 2D
N° ordre : 14ISAR02/D14-02
Thèse soutenue le 28/02/2014 devant le jury composé de :
Joseph RONSIN
Professeur à INSA de Rennes / Président
Luc BRUN
Professeur à ENSI de Caen / Rapporteur
Vincent FREMONT
Maître de conférences HDR UT de Compiègne / Rapporteur
Ferran MARQUES
Professeur à UPC Barcelone / Examinateur
Muriel PRESSIGOUT
Maître de conférences à l'INSA de Rennes / Examinatrice
Marie BABEL
Maître de conférences HDR à l'INSA de Rennes / Directrice de thèse
THESE INSA Rennes
sous le sceau de l’Université européenne de Bretagne
pour obtenir le titre de
DOCTEUR DE L’INSA DE RENNES
Spécialité : Traitement de signal et de l’image
présentée par
Rafiq SEKKAL
ECOLE DOCTORALE : MATISSE
LABORATOIRE : IRISA – UMPR6047Techniques visuelles pour
la détection et le suivi
d’objets 2D
Rafiq SEKKAL
Résumé
De nos jours, le traitement et l'analyse d'images trouvent leur
application dans de nombreux domaines. Dans le cas de la
navigation d’un robot mobile (fauteuil roulant) en milieu
intérieur, l’extraction de repères visuels et leur suivi constituent
une étape importante pour la réalisation de tâches robotiques
(localisation, planification, etc.). En particulier, afin de réaliser
une tâche de franchissement de portes, il est indispensable de
détecter et suivre automatiquement toutes les portes qui
existent dans l’environnement. La détection des portes n’est
pas une tâche facile : la variation de l’état des portes (ouvertes
ou fermées), leur apparence (de même couleur ou de couleur
différentes des murs) et leur position par rapport à la caméra
influe sur la robustesse du système. D’autre part, des tâches
comme la détection des zones navigables ou l’évitement
d’obstacles peuvent faire appel à des représentations enrichies
par une sémantique adaptée afin d’interpréter le contenu de la
scène. Pour cela, les techniques de segmentation permettent
d’extraire des régions pseudo-sémantiques de l’image en
fonction de plusieurs critères (couleur, gradient, texture…). En
ajoutant la dimension temporelle, les régions sont alors suivies
à travers des algorithmes de segmentation spatio-temporelle.
Dans cette thèse, des contributions répondant aux besoins cités
sont présentées. Tout d’abord, une technique de détection et de
suivi de portes dans un environnement de type couloir est
proposée : basée sur des descripteurs géométriques dédiés, la
solution offre de bons résultats. Ensuite, une technique
originale de segmentation multirésolution et hiérarchique
permet d’extraire une représentation en régions pseudosémantique.
Enfin, cette technique est étendue pour les
séquences vidéo afin de permettre le suivi des régions à travers
le suivi de leurs contours. La qualité des résultats est
démontrée et s’applique notamment au cas de vidéos de
couloir.
N° d’ordre : XXXXXXXX
Abstract
Nowadays, image processing remains a very important step in
different fields of applications. In an indoor environment, for a
navigation system related to a mobile robot (electrical
wheelchair), visual information detection and tracking is crucial
to perform robotic tasks (localization, planning…). In particular,
when considering passing door task, it is essential to be able to
detect and track automatically all the doors that belong to the
environment. Door detection is not an obvious task: the
variations related to the door status (open or closed), their
appearance (e.g. same color as the walls) and their relative
position to the camera have influence on the results. On the
other hand, tasks such as the detection of navigable areas or
obstacle avoidance may involve a dedicated semantic
representation to interpret the content of the scene.
Segmentation techniques are then used to extract pseudosemantic
regions based on several criteria (color, gradient,
texture...). When adding the temporal dimension, the regions
are tracked then using spatiotemporal segmentation algorithms.
In this thesis, we first present joint door detection and tracking
technique in a corridor environment: based on dedicated
geometrical features, the proposed solution offers interesting
results. Then, we present an original joint hierarchical and
multiresolution segmentation framework able to extract a
pseudo-semantic region representation. Finally, this technique
is extended to video sequences to allow the tracking of regions
along image sequences. Based on contour motion extraction,
this solution has shown relevant results that can be successfully
applied to corridor videos.
Idéalisation d’assemblages CAO pour l’analyse EF de
structures
Flavien Boussuge
To cite this version:
Flavien Boussuge. Id´ealisation d’assemblages CAO pour l’analyse EF de structures. Other.
Universit´e de Grenoble, 2014. French. .
HAL Id: tel-01071560
https://tel.archives-ouvertes.fr/tel-01071560
Submitted on 6 Oct 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific
research documents, whether they are published
or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.THESE `
Pour obtenir le grade de
DOCTEUR DE L’UNIVERSITE DE GRENOBLE ´
Specialit ´ e : ´ Mathematiques et Informatique ´
Arretˆ e minist ´ erial : 7 ao ´ ut 2006 ˆ
Present ´ ee par ´
Flavien Boussuge
These dirig ` ee par ´ Jean-Claude Leon ´
et codirigee par ´ Stefanie Hahmann
prepar ´ ee au sein ´ Laboratoire Jean Kuntzmann - INRIA Grenoble, et
AIRBUS Group Innovations
et de l’Ecole Doctorale Mat ´ ematiques, Sciences et Technologies de ´
l’Information, Informatique
Idealization of CAD assemblies for
FE structural analyses
Idealisation d’assemblages CAO ´
pour l’analyse EF de structures
These soutenue publiquement le ` TBD,
devant le jury compose de : ´
Prof., Cecil Armstrong
Queen’s University Belfast, Rapporteur
Dr., Bruno Levy ´
Directeur de recherche, INRIA Nancy, Rapporteur
Dr., Lionel Fine
AIRBUS Group Innovations, Suresnes, Examinateur
Prof., Jean-Philippe Pernot
Arts et Metiers ParisTech, Aix en Provence, Examinateur ´
Prof., Jean-Claude Leon ´
INP-Grenoble, ENSE3, Directeur de these `
Prof., Stefanie Hahmann
INP-Grenoble, ENSIMAG, Co-Directeur de these `
M., Nicolas Chevassus
AIRBUS Group Innovations, Suresnes, Invite´
M., Franc¸ois Guillaume
AIRBUS Group Innovations, Suresnes, Invite´iiThe research described in this thesis was carried out at the Laboratoire Jean Kuntzmann
LJK-INRIA research team Imagine and the SPID team of AIRBUS Group Innovations.
This work was supported by a CIFRE convention of the ANRT and the French
Ministry of Higher Education and Research.
�c 2014, F. Boussuge, all rights reserved.
iiiivIdealization of CAD assembly for FE structural analysis
Abstract
Aeronautical companies face a significant increase in complexity and size of simulation
models especially at the level of assemblies, sub-systems of their complex products.
Pre-processing of Computer Aided Design (CAD) models derived from the digital
representation of sub-systems, i.e., Digital Mock-Ups (DMUs), into Finite Elements
Analysis (FEA) models requires usually many tedious manual tasks of model preparation
and shape transformations, in particular when idealizations of components or
assemblies have to be produced. Therefore, the purpose of this thesis is to make a
contribution to the robust automation of the time-consuming sequences of assembly
preparation processes.
Starting from an enriched DMU with geometrical interfaces between components
and functional properties, the proposed approach takes DMU enrichment to the next
level by structuring components’ shapes. This approach extracts a construction graph
from B-Rep CAD models so that the corresponding generative processes provide meaningful
volume primitives for idealization application. These primitives form the basis
of a morphological analysis which identifies the sub-domains for idealization in the
components’ shapes and their associated geometric interfaces. Subsequently, models
of components as well as their geometric representation get structured in an enriched
DMU which is contextualized for FEA application.
Based on this enriched DMU, simulation objectives can be used to specify geometric
operators that can be robustly applied to automate components and interfaces shape
transformations during an assembly preparation process. A new idealization process
of standalone components is proposed while benefiting from the decomposition into
sub-domains and their geometric interfaces provided by the morphological analysis of
the component. Interfaces between sub-domains are evaluated to robustly process the
connections between the idealized sub-domains leading to the complete idealization of
the component.
Finally, the scope of the idealization process is extended to shape transformations
at the assembly level and evolves toward a methodology of assembly pre-processing.
This methodology aims at exploiting the functional information of the assembly and interfaces
between components to perform transformations of groups of components and
assembly idealizations. In order to prove the applicability of the proposed methodology,
corresponding operators are developed and successfully tested on industrial use-cases.
Keywords : Assembly, DMU, idealization, CAD-CAE integration, B-Rep model,
generative shape process, morphological analysis
vviId´ealisation d’assemblages CAO pour l’analyse EF de
structures
R´esum´e
Les entreprises a´eronautiques ont un besoin continu de g´en´erer de grands et complexes
mod`eles de simulation, en particulier pour simuler le comportement structurel de soussyst`emes
de leurs produits. Actuellement, le pr´e-traitement des mod`eles de Conception
Assist´ee par Ordinateur (CAO) issus des maquettes num´eriques de ces sous-syst`emes en
Mod`eles El´ements Finis (MEF), est une tˆache qui demande de longues heures de travail
de la part des ing´enieurs de simulation, surtout lorsque des id´ealisations g´eom´etriques
sont n´ecessaires. L’objectif de ce travail de th`ese consiste `a d´efinir les principes et
les op´erateurs constituant la chaˆıne num´erique qui permettra, `a partir de maquettes
num´eriques complexes, de produire des g´eom´etries directement utilisables pour
la g´en´eration de maillages ´el´ements finis d’une simulation m´ecanique.
A partir d’une maquette num´erique enrichie d’information sur les interfaces
g´eom´etriques entre composants et d’information sur les propri´et´es fonctionnelles de
l’assemblage, l’approche propos´ee dans ce manuscrit est d’ajouter un niveau
suppl´ementaire d’enrichissement en fournissant une repr´esentation structurelle de haut
niveau de la forme des composants CAO. Le principe de cet enrichissement est d’extraire
un graphe de construction de mod`eles CAO B-Rep de sorte que les processus de
g´en´eration de forme correspondants fournissent des primitives volumiques directement
adapt´ees `a un processus d’id´ealisation. Ces primitives constituent la base d’une analyse
morphologique qui identifie dans les formes des composants `a la fois des sous-domaines
candidats `a l’id´ealisation mais ´egalement les interfaces g´eom´etriques qui leurs sont associ´ees.
Ainsi, les mod`eles de composants et leurs repr´esentations g´eom´etriques sont
structur´es. Ils sont int´egr´es dans la maquette num´erique enrichie qui est ainsi contextualis´ee
pour la simulation par EF.
De cette maquette num´erique enrichie, les objectifs de simulation peuvent ˆetre
utilis´es pour sp´ecifier les op´erateurs g´eom´etriques adaptant les composants et leurs
interfaces lors de processus automatiques de pr´eparation d’assemblages. Ainsi, un
nouveau proc´ed´e d’id´ealisation de composant unitaire est propos´e. Il b´en´eficie de
l’analyse morphologique faite sur le composant lui fournissant une d´ecomposition en
sous-domaines id´ealisables et en interfaces. Cette d´ecomposition est utilis´ee pour
g´en´erer les mod`eles id´ealis´es de ces sous-domaines et les connecter `a partir de l’analyse
de leurs interfaces, ce qui conduit `a l’id´ealisation compl`ete du composant.
Enfin, le processus d’id´ealisation est ´etendu au niveau de l’assemblage et ´evolue
vers une m´ethodologie de pr´e-traitement automatique de maquettes num´eriques. Cette
m´ethodologie vise `a exploiter l’information fonctionnelle de l’assemblage et les informations
morphologiques des composants afin de transformer `a la fois des groupes de
viicomposants associ´es `a une mˆeme fonction ainsi que de traiter les transformations
d’id´ealisation de l’assemblage. Pour d´emontrer la validit´e de la m´ethodologie, des
op´erateurs g´eom´etriques sont d´evelopp´es et test´es sur des cas d’application industriels.
Mots-cl´es : Assemblage, Maquette Num´erique, int´egration CAO-calcul, mod`ele
B-Rep, graphe de construction , processus g´en´eratif de forme, id´ealisation
viiiTable of contents
Abstract v
R´esum´e vii
Acronyms xxiii
Introduction 1
Context of numerical certification of aeronautical structures . . . . . . . . . 1
Some limits faced in structural simulations . . . . . . . . . . . . . . . . . . . 2
Work Purposes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1 From a Digital Mock Up to Finite Element Assembly Models: Current
practices 5
1.1 Introduction and definition DMU concept . . . . . . . . . . . . . . . . 5
1.2 Geometric representation and modeling of 3D components . . . . . . . 7
1.2.1 Categories of geometric families . . . . . . . . . . . . . . . . . . 7
1.2.2 Digital representation of solids in CAD . . . . . . . . . . . . . . 9
1.2.3 Complementary CAD software capabilities: Feature-based and
parametric modeling . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Representation and modeling of an assembly in a DMU . . . . . . . . . 16
1.3.1 Effective DMU content in aeronautical industry . . . . . . . . . 16
1.3.2 Conventional representation of interfaces in a DMU . . . . . . . 19
1.4 Finite Element Analysis of mechanical structures . . . . . . . . . . . . 22
1.4.1 Formulation of a mechanical analysis . . . . . . . . . . . . . . . 22
1.4.2 The required input data for the FEA of a component . . . . . . 24Table of contents
1.4.3 FE simulations of assemblies of aeronautical structures . . . . . 27
1.5 Difficulties triggering a time consuming DMU adaptation to generate
FE assembly models . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.5.1 DMU adaption for FE analyses . . . . . . . . . . . . . . . . . . 31
1.5.2 Interoperability between CAD and CAE and data consistency . 33
1.5.3 Current operators focus on standalone components . . . . . . . 34
1.5.4 Effects of interactions between components over assembly transformations
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.6 Conclusion and limits of current practices about DMU manual adaption
for FE assembly models generation . . . . . . . . . . . . . . . . . . . . 39
1.7 Research objectives: Speed up the DMU pre-processing to reach the
simulation of large assemblies . . . . . . . . . . . . . . . . . . . . . . . 40
2 Current status of procedural shape transformation methods and tools
for FEA pre-processing 43
2.1 Targeting the data integration level . . . . . . . . . . . . . . . . . . . . 43
2.2 Simplification operators for 3D FEA analysis . . . . . . . . . . . . . . . 45
2.2.1 Classification of details and shape simplification . . . . . . . . . 45
2.2.2 Detail removal and shape simplification based on tessellated models 47
2.2.3 Detail removal and shape simplification on 3D solid models . . . 49
2.2.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.3 Dimensional reduction operators applied to standalone components . . 53
2.3.1 Global dimensional reduction using the MAT . . . . . . . . . . 53
2.3.2 Local mid-surface abstraction . . . . . . . . . . . . . . . . . . . 55
2.3.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.4 About the morphological analysis of components . . . . . . . . . . . . 58
2.4.1 Surface segmentation operators . . . . . . . . . . . . . . . . . . 58
2.4.2 Solid segmentation operators for FEA . . . . . . . . . . . . . . . 60
2.4.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.5 Evolution toward assembly pre-processing . . . . . . . . . . . . . . . . 64
2.6 Conclusion and requirements . . . . . . . . . . . . . . . . . . . . . . . . 67
3 Proposed approach to DMU processing for structural assembly simxTable
of contents
ulations 69
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.2 Main objectives to tackle . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3 Exploiting an enriched DMU . . . . . . . . . . . . . . . . . . . . . . . . 71
3.4 Incorporating a morphological analysis during FEA pre-processing . . . 75
3.4.1 Enriching DMU components with their shape structure as needed
for idealization processes . . . . . . . . . . . . . . . . . . . . . . 77
3.4.2 An automated DMU analysis dedicated to a mechanically consistent
idealization process . . . . . . . . . . . . . . . . . . . . . 78
3.5 Process proposal to automate and robustly generate FEMs from an enriched
DMU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.5.1 A new approach to the idealization of a standalone component . 81
3.5.2 Extension to assembly pre-processing using the morphological
analysis and component interfaces . . . . . . . . . . . . . . . . . 81
3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4 Extraction of generative processes from B-Rep shapes to structure
components up to assemblies 85
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.2 Motivation to seek generative processes . . . . . . . . . . . . . . . . . . 86
4.2.1 Advantages and limits of present CAD construction tree . . . . 87
4.2.2 A new approach to structure a component shape: construction
graph generation . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.3 Shape modeling context and process hypotheses . . . . . . . . . . . . . 91
4.3.1 Shape modeling context . . . . . . . . . . . . . . . . . . . . . . 91
4.3.2 Generative process hypotheses . . . . . . . . . . . . . . . . . . . 93
4.3.3 Intrinsic boundary decomposition using maximal entities . . . . 96
4.4 Generative processes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.4.1 Overall principle to obtain generative processes . . . . . . . . . 98
4.4.2 Extrusion primitives, visibility and attachment . . . . . . . . . . 100
4.4.3 Primitive removal operator to go back in time . . . . . . . . . . 103
4.5 Extracting the generative process graph . . . . . . . . . . . . . . . . . . 107
4.5.1 Filtering out the generative processes . . . . . . . . . . . . . . . 107
xiTable of contents
4.5.2 Generative process graph algorithm . . . . . . . . . . . . . . . . 109
4.6 Results of generative process graph extractions . . . . . . . . . . . . . . 110
4.7 Extension of the component segmentation to assembly structure segmentation
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5 Performing idealizations from construction graphs 119
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.2 The morphological analysis: a filtering approach to idealization processes 120
5.2.1 Morphological analysis objectives for idealization processes based
on a construction graph . . . . . . . . . . . . . . . . . . . . . . 121
5.2.2 Structure of the idealization process . . . . . . . . . . . . . . . . 124
5.3 Applying idealization hypotheses from a construction graph . . . . . . 125
5.3.1 Evaluation of the morphology of primitives to support idealization126
5.3.2 Processing connections between ‘idealizable’ sub-domains Dij . . 133
5.3.3 Extending morphological analyses of Pi to the whole object M . 137
5.4 Influence of external boundary conditions and assembly interfaces . . . 141
5.5 Idealization processes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
5.5.1 Linking interfaces to extrusion information . . . . . . . . . . . . 146
5.5.2 Analysis of GS to generate idealized models . . . . . . . . . . . 147
5.5.3 Generation of idealized models . . . . . . . . . . . . . . . . . . . 153
5.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
6 Toward a methodology to adapt an enriched DMU to FE assembly
models 159
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
6.2 A general methodology to assembly adaptions for FEA . . . . . . . . . 160
6.2.1 From simulation objectives to shape transformations . . . . . . 161
6.2.2 Structuring dependencies between shape transformations as contribution
to a methodology of assembly preparation . . . . . . . 164
6.2.3 Conclusion and methodology implementation . . . . . . . . . . 167
6.3 Template-based geometric transformations resulting from function identifications
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
xiiTable of contents
6.3.1 Overview of the template-based process . . . . . . . . . . . . . . 169
6.3.2 From component functional designation of an enriched DMU to
product functions . . . . . . . . . . . . . . . . . . . . . . . . . . 169
6.3.3 Exploitation of Template-based approach for FE models transformations
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
6.3.4 Example of template-based operator of bolted junctions transformation
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
6.4 Full and robust idealization of an enriched assembly . . . . . . . . . . . 183
6.4.1 Extension of the template approach to idealized fastener generation185
6.4.2 Presentation of a prototype dedicated to the generation of idealized
assemblies . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
6.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
Conclusion and perspectives 191
Bibliography 211
Appendices I
A Illustration of generation processes of CAD components I
A.1 Construction process of an injected plastic part . . . . . . . . . . . . . I
A.2 Construction process of an aeronautical metallic part . . . . . . . . . . I
B Features equivalence IX
C Taxonomy of a primitive morphology XV
D Export to CAE software XIX
xiiiTable of contents
xivList of Figures
1.1 The Digital Mock-Up as the reference representation of a product, courtesy
of Airbus Group Innovations. . . . . . . . . . . . . . . . . . . . . . 6
1.2 Regularized boolean operations of two solids. . . . . . . . . . . . . . . . 9
1.3 CSG and B-Rep representations of a solid. . . . . . . . . . . . . . . . . 10
1.4 Examples of non-manifold geometric models. . . . . . . . . . . . . . . . 12
1.5 CAD construction process using features. . . . . . . . . . . . . . . . . . 15
1.6 Example of an aeronautical CAD assembly: Root joint model (courtesy
of Airbus Group Innovations). . . . . . . . . . . . . . . . . . . . . . . . 16
1.7 Example of complex DMU assembly from Alcas project [ALC08] and
Locomachs project [LOC16]. . . . . . . . . . . . . . . . . . . . . . . . . 18
1.8 Representation of a bolted junction in a structural DMU of an aircraft. 20
1.9 Classification of Conventional Interfaces (CI) under contact, interference
and clearance categories. . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.10 Process flow of a mechanical analysis. . . . . . . . . . . . . . . . . . . . 23
1.11 Example of FE mesh models . . . . . . . . . . . . . . . . . . . . . . . . 24
1.12 Example of a FE fastener simulating the behavior of a bolted junction
using beam elements. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.13 Example of aeronautical FE models. . . . . . . . . . . . . . . . . . . . 31
1.14 Illustration of a shim component which does not appear in the DMU
model. Shim component are directly manufacture when structural components
are assembled. . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.15 Illustration of a manual process to generate an idealized model. . . . . 35
1.16 Example of contact model for a FE simulation. . . . . . . . . . . . . . . 38
2.1 Identification of a skin detail . . . . . . . . . . . . . . . . . . . . . . . . 46
2.2 Illustration of the MAT method . . . . . . . . . . . . . . . . . . . . . . 48
xvLIST OF FIGURES
2.3 Details removal using the MAT and detail size criteria [Arm94]. . . . . 49
2.4 Topology adaption of CAD models for meshing [FCF∗08]. . . . . . . . . 50
2.5 Illustration of CAD defeaturing using CATIA. . . . . . . . . . . . . . . 51
2.6 Illustration of the mixed dimensional modeling using a MAT [RAF11]. 54
2.7 Illustration of mid-surface abstraction [Rez96]. . . . . . . . . . . . . . . 56
2.8 An example of particular geometric configuration not addressed by facepairs
methods. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.9 Illustration of different connection models for idealized components. . . 58
2.10 Mesh Segmentation techniques. . . . . . . . . . . . . . . . . . . . . . . 59
2.11 Automatic decomposition of a solid to identify thick/thin regions and
long and slender ones, from Makem [MAR12]. . . . . . . . . . . . . . . 60
2.12 Idealization using extruded and revolved features in a construction tree,
from [RAM∗06]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.13 Divide-and-conquer approach to idealization processes using a maximal
volume decomposition (by Woo [Woo14]). . . . . . . . . . . . . . . . . 62
2.14 Assembly interface detection of Jourdes et al. [JBH∗14]. . . . . . . . . . 65
2.15 Various configurations of the idealization of a small assembly containing
two components. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.1 Current process to prepare assembly structures. Each component of the
assembly is transformed individually. . . . . . . . . . . . . . . . . . . . 70
3.2 Structuring a DMU model with functional properties. . . . . . . . . . . 73
3.3 DMU enrichment process with assembly interfaces and component functional
designations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.4 Interactions between simulation objectives, hypotheses and shape transformations.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.5 Proposed approach to generate a FEM of an assembly structure from a
DMU. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.1 An example of a shape generation process. . . . . . . . . . . . . . . . . 87
4.2 An example of shape analysis and generative construction graph. . . . . 91
4.3 Modeling hypotheses about primitives to be identified in a B-Rep object. 92
4.4 Entities involved in the definition of an extrusion primitive in a B-Rep
solid. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
xviLIST OF FIGURES
4.5 Illustrations of two additive primitives: (a) an extrusion primitive and
(b) a revolution one. The mid-surfaces of both primitives lie inside their
respective volumes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.6 Example of two possible decompositions into primitives from a solid. . 96
4.7 Pipeline producing and exploiting generative shape processes. . . . . . 97
4.8 Examples of configurations where faces must be merged to produce a
shape-intrinsic boundary decomposition. . . . . . . . . . . . . . . . . . 98
4.9 Overall scheme to obtain generative processes. . . . . . . . . . . . . . . 99
4.10 An example illustrating the successive identification and removal of
primitives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.11 An example illustrating the major steps to identify a primitive and remove
it from an object . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.12 Example of geometric interface . . . . . . . . . . . . . . . . . . . . . . 103
4.13 Example of a collection of primitives identified from a B-Rep object. . . 103
4.14 Illustration of the removal of Pi. . . . . . . . . . . . . . . . . . . . . . . 105
4.15 Illustration of the removal operator for interface of surface type 1a. . . 106
4.16 Illustration of the removal operator for interface of volume type 3. . . . 107
4.17 Illustration of the simplicity concept to filtering out the generative processes.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.18 Criteria of maximal primitives and independent primitives. . . . . . . . 110
4.19 Extraction of generative processes for four different components. . . . . 111
4.20 Result of generative process graph extractions. . . . . . . . . . . . . . . 113
4.21 Illustration of the continuity constraint. . . . . . . . . . . . . . . . . . . 114
4.22 A set of CAD construction trees forming a graph derived from two consecutive
construction graph nodes. . . . . . . . . . . . . . . . . . . . . . 115
4.23 Illustration of the compatibility between the component segmentation (a)
and assembly structure segmentation (b). . . . . . . . . . . . . . . . . . 116
4.24 Insertion of the interface graphs between primitives obtained from component
segmentations into the graph of assembly interfaces between
components. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.1 From a construction graph of a B-Rep shape to a full idealized model
for FEA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
5.2 Global description of an idealization process. . . . . . . . . . . . . . . . 124
xviiLIST OF FIGURES
5.3 Determination of the idealization direction of extrusion primitives using
a 2D MAT applied to their contour . . . . . . . . . . . . . . . . . . . . 126
5.4 Example of the morphological analysis of a component. . . . . . . . . . 129
5.5 Idealization analysis of components. . . . . . . . . . . . . . . . . . . . . 130
5.6 Illustration of primitives’ configurations containing embedded sub-domains
Dik which can be idealized as beams or considered as details. . . . . . . 131
5.7 Example of a beam morphology associated with a MAT medial edge of
a primitive Pi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.8 Synthesis of the process to evaluate the morphology of primitives Pi. . . 134
5.9 Taxonomy of connections between extrusion sub-domains. . . . . . . . 135
5.10 Illustration of propagation of the morphological analysis of two primitives.139
5.11 Propagation of the morphology analysis on Pi to the whole object M. . 140
5.12 Influence of an assembly interface modeling hypothesis over the transformations
of two components . . . . . . . . . . . . . . . . . . . . . . . 141
5.13 Illustration of the inconsistencies between an assembly interface between
two components and its projection onto their idealized representations. 143
5.14 Two possible schemes to incorporate assembly interfaces during the segmentation
process of components. . . . . . . . . . . . . . . . . . . . . . 144
5.15 Illustration of an interface graph derived from the segmentation process
of a component. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
5.16 Illustration of an interface cycle between primitives. . . . . . . . . . . . 148
5.17 Examples of medial surface positioning improvement. (a) Offset of parallel
medial surfaces, (b) offset of L-shaped medial surfaces. . . . . . . . 150
5.18 Example of identification of a group of parallel medial surfaces and border
primitives configurations. . . . . . . . . . . . . . . . . . . . . . . . 151
5.19 Example of a volume detail configuration lying on an idealized primitive. 152
5.20 Interfaces connection operator . . . . . . . . . . . . . . . . . . . . . . . 154
5.21 Illustration of the idealization process of a component that takes advantage
of its interface graph structures. . . . . . . . . . . . . . . . . . . . 155
5.22 Illustration of the successive phases of the idealization process. . . . . . 156
6.1 Setting up an observation area consistent with simulation objectives. . 162
6.2 Entire idealization of two components. . . . . . . . . . . . . . . . . . . 162
6.3 Transformation of groups of components as analytical models. . . . . . 163
xviiiLIST OF FIGURES
6.4 Influence of interfaces over shape transformations of components. . . . 163
6.5 Synthesis of the structure of an assembly simulation preparation process. 166
6.6 Use-Case 1: Simplified solid model with sub-domains decomposition
around bolted junctions. . . . . . . . . . . . . . . . . . . . . . . . . . . 168
6.7 Overview of the main phases of the template-based process. . . . . . . 170
6.8 Subset of TF N , defining a functional structure of an assembly. . . . . . 171
6.9 Principle of the template-based shape transformations. . . . . . . . . . 174
6.10 Compatibility conditions (CC) of shape transformations ST applied to T. 174
6.11 Checking the compatibility of ST (T) with respect to the surrounding
geometry of T. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
6.12 Multi-scale simulation with domain decomposition around bolted junctions,
(courtesy of ROMMA project [ROM14]). . . . . . . . . . . . . . 177
6.13 Template based transformation ST (T) of a bolted junction into simple
mesh model. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
6.14 User interface of a template to transform ‘assembly Bolted Junctions’. . 181
6.15 Results of template-based transformations on CAD assembly models. . 182
6.16 Idealized surface model with FE fasteners to represent bolted junctions. 183
6.17 Illustration of Task 2: Transformation of bolted junction interfaces into
mesh nodes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
6.18 Results of the template-based transformation of bolted junctions. . . . 184
6.19 User interface of the prototype for assembly idealization. . . . . . . . . 187
6.20 Illustration of a component segmentation which extracts extruded volumes
to be idealized in task 3. . . . . . . . . . . . . . . . . . . . . . . . 187
6.21 Illustration of task 4: Identification and transformation of groups of
idealized surfaces connected to the same assembly interfaces. . . . . . . 188
6.22 Final result of the idealized assembly model ready to be meshed in CAE
software. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
A.1 Example of a shape generation process 1/5 . . . . . . . . . . . . . . . . II
A.2 Example of a shape generation process 2/5 . . . . . . . . . . . . . . . . III
A.3 Example of a shape generation process 3/5 . . . . . . . . . . . . . . . . IV
A.4 Example of a shape generation process 4/5 . . . . . . . . . . . . . . . . V
A.5 Example of a shape generation process 5/5 . . . . . . . . . . . . . . . . VI
xixLIST OF FIGURES
A.6 Example of a shape generation process of a simple metallic component VII
B.1 Examples of Sketch-Based Features . . . . . . . . . . . . . . . . . . . . X
B.2 Examples of Sketch-Based Features . . . . . . . . . . . . . . . . . . . . XI
B.3 Examples of Dress-Up Features . . . . . . . . . . . . . . . . . . . . . . XII
B.4 Examples of Boolean operations . . . . . . . . . . . . . . . . . . . . . . XIII
D.1 Illustration of the STEP export of a Bolted Junction with sub-domains
around screw. (a) Product structure open in CATIA software, (b) associated
xml file containing the association between components and
interfaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . XX
D.2 Illustration of the STEP export of a Bolted Junction. Each component
containing volume sub-domains is exported as STEP assembly. . . . . . XX
D.3 Illustration of the STEP export of a Bolted Junction. Each inner interface
between sub-domains is part of the component assembly. . . . . . . XXI
D.4 Illustration of the STEP export of a Bolted Junction. Each outer interface
between components is part of the root assembly. . . . . . . . . . . XXII
D.5 Illustration of the STEP export of the full Root Joint assembly. . . . . XXIII
xxList of Tables
1.1 Categories of Finite Elements for structural analyses. . . . . . . . . . . 25
1.2 Connector entities available in CAE software. . . . . . . . . . . . . . . 28
1.3 Examples of interactions or even dependencies between simulation objectives
and interfaces as well as component shapes. . . . . . . . . . . . 30
5.1 Categorization of the morphology of a primitive using a 2D MAT applied
to its contour. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
C.1 Morphology associated with a MAT medial edge of a primitive Pi. 1/2 XVI
C.2 Morphology associated with a MAT medial edge of a primitive Pi. 2/2 XVII
xxiLIST OF TABLES
xxiiAcronyms
B-Rep Boundary representation. 10–14, 17, 20, 21, 34, 45, 49, 50, 52, 62, 63, 77, 78,
85, 86, 89, 91–93, 96–98, 101, 102, 114, 116–118, 120, 140, 141, 147, 171, 192–195
CAD Computer Aided Design. IX, 2, 3, 5–7, 9–14, 16–19, 21, 24–26, 29, 30, 33–36,
39–41, 43, 44, 47–53, 55, 59, 60, 63, 65, 67, 70, 73, 77–79, 86–93, 97–99, 114, 116,
118–120, 122, 123, 140, 144, 155, 156, 159, 169, 179, 180, 183, 186, 189, 191, 193,
195
CAD-FEA Computer Aided Design to Finite Element Analysis(es). 12, 43, 191–193
CAE Computer Aided Engineering. 11, 12, 23, 25, 26, 33, 35, 37–41, 43–45, 47, 50–53,
67, 77, 123, 156, 165, 180, 189
CSG Constructive Solid Geometry. 9–11, 13, 62, 63
DMU Digital Mock-Up. XIX, 2, 3, 5–8, 11, 12, 16–21, 23, 30–35, 37–41, 43, 64, 67–75,
77–79, 82, 83, 85, 86, 142, 157, 159, 160, 167, 168, 171, 172, 178–180, 183, 189,
191–193, 196
FE Finite Elements. 5, 7, 22, 25, 27–32, 38–41, 44–47, 49, 52, 54, 64, 70, 72, 77, 79,
82, 85, 121–123, 125, 136, 145, 152, 153, 157, 159, 162, 165, 169, 177, 180, 183,
185, 186, 189, 191, 193
FEA Finite Element Analysis(es). 1–3, 5, 7, 12, 22, 28, 30–32, 40, 43, 45, 46, 49, 57,
58, 60, 64, 67–70, 72, 74–79, 83, 85, 87–89, 96, 117, 119–121, 123, 141, 156, 160,
168, 172, 173, 176, 177, 180, 191
FEM Finite Element Models. 1, 22–24, 26, 27, 29, 44, 46, 69–72, 76, 79, 82, 88, 121,
147, 183
KBE Knowledge Based Engineering. 168
MAT Medial Axis Transform. XV, 44, 47–49, 53–57, 60, 126, 128, 131–133, 137, 145,
166, 195
xxiiiAcronyms
PDMS Product Data Management System. 72
PDP Product Development Process. 1–3, 5–7, 9, 12, 19, 32, 39, 44, 46, 88, 89, 180
PLM Product Lifecycle Management. 6, 16, 21, 32, 72
xxivIntroduction
Context of numerical certification of aeronautical structures
Aeronautical companies face increasing needs in simulating the structural behavior of
product sub-assemblies. Numerical simulation plays an important role in the Product
Development Process (PDP) of a mechanical structure: it allows engineers to
numerically simulate the mechanical behavior of this structure submitted to a set of
physical constraints (forces, pressures, thermal field, . . . ). The local or global, linear
or nonlinear, static or dynamic analyses of structural phenomena using Finite Element
Analysis(es) (FEA) simulations are now widespread in industry. These simulations
play an important role to reduce the cost of physical prototyping, to justify and certify
structural design choices. As an example, let us consider the last Airbus Program A350.
There, a major physical test program is still required to support the development and
certification of the aircraft. However, it is based on predictions obtained from Finite
Element Models (FEM). Consequently, the test program validates the internal load
distributions which have been computed numerically.
Today, FEAs are not restricted anymore to the simulation of components alone;
they can be applied to large assemblies of components. Simulation software capabilities
associated with optimized mathematical resolution methods can process very large
numbers of unknowns derived from their initial mechanical problems. Such simulations
require few days of computations, which is an acceptable amount during a product development
process in aeronautics. However, it is important to underline that these
numerical simulations require the setting of a mathematical model from the physical
object or assembly being analyzed. On purpose, the FEA method incorporates simplification
hypotheses applied to the geometric models of components or assemblies
compared to their real shapes and, finally, produces an approximate solution. To obtain
the most faithful results with a minimum bias within a short amount of time,
engineers are encouraged to spend a fair amount of time on the generation of simulation
models. They have to stay critical with respect to the mathematical method used,
the consequences of simplification hypotheses, in order to understand the deviations of
the simulation model compared to the real tests to judge the validity of the simulation
results.
1Introduction
Some limits faced in structural simulations
Numerical simulations of assemblies remain complex and tedious due to the preprocessing
of assembly 3D models available from Digital Mock-Ups(DMUs) that stands
as the virtual product reference in industry. This phase is highly time consuming compared
to the numerical computations’ one. In the past, the use of distinct software
tools between the design and simulation phases required generating once again the
Computer Aided Design (CAD) geometry of a component in the simulation software.
Today, the development and use of DMUs in a PDP, even with a rather small assembly
models, bring 3D models at hand for engineers. The concept of DMU was initially developed
for design and manufacture purposes as a digital representation of an assembly
of mechanical components. Consequently, DMUs are good candidates to support digital
analyses of several PDP processes, e.g. part assembly ones. In industry, DMUs are
widely used during a PDP regarded as the virtual product geometry reference. This
geometric model contains a detailed 3D representation of the whole product structure
that is made available for simulation engineers. To prepare large sub-structure models
for simulation, such as wings or aircraft fuselage sections; the DMU offers a detailed
and precise geometric input model. However, speeding up the simulation model generation
strongly relies on the time required to perform the geometric transformations
needed to adapt a DMU to FEA requirements.
The pre-processing phase implies reworking all DMU 3D data to collect subsets of
components, to remove unnecessary or harmful areas leading to simplified shapes, to
generate adequate FE meshes, to add the boundary conditions and material properties
as needed for a given simulation goal. All these operations, the way they are currently
performed, bring little added value to a PDP. Currently, time and human resources
involved in pre-processing CAD models derived from DMUs into FE models can even
prevent engineers from setting up structural analyses. Very tedious tasks are required
to process the large amount of DMU components and the connections between them,
like contact areas.
Commercial software already provide some answers to the interactions between design
and behavioral simulation processes for single components. Unfortunately, the
operators available are restricted either to interactive geometric transformations, leading
to very tedious tasks, or to automated simulation model generation adapted to
simple models only. A rather automated generation of complex assembly simulation
models still raises real difficulties and it is far too tedious to process groups of components
as well as sub-assemblies. As detailed in Chapter 1, these difficulties arise
because shape transformations are needed since designers and simulation engineers
work with different target models, resulting in the fact that DMUs cannot be easily
used to support the preparation of structural analysis models.
Scientific research work has mainly focused on the use of global geometric transformations
of standalone CAD components. Few contributions have addressed the au-
2Introduction
tomation of assembly pre-processing (see Chapter 2) leaving engineers to interactively
process each assembly component. Aeronautical structures are particularly complex to
transform due to the large amount of transformations on hundred thousands of parts
and interfaces joints. These operators are still not generic enough to be adapted to
engineers’ needs, especially when idealizations of components or assemblies must be
produced. Indeed, it still is a common practice for engineers to generate interactively
their own models because preparation operations are still not generic enough. Consequently,
some simulations are not even addressed because their preparation time cannot
fit within the schedule of a PDP, i.e. simulation results would be available too late.
Work Purposes
To reach the needs of large assembly simulation model preparation, improvements in
processing DMUs are a real challenge in aircraft companies. The contributions in this
thesis are mainly oriented toward the transformation of 3D CAD models extracted from
a DMU, and their associated semantics, for Finite Element analysis of large assembly
structure. To handle large models, it is mandatory that the proposed principles and
operators speed up and to automate as much as possible the DMU transformations
required. This work will be guided by input DMU data defining the exact content of
the simulation models to be built and will use mechanical and geometric criteria for
identifying the necessary geometric adaptation.
This research thesis is divided into 6 chapters:
• Chapter 1 describes the current practices in aeronautical industries about the
generation, from DMUs, of geometric models supporting the generation of simulation
models. It will define the different geometric entities used in CAD software
as well as the notion of mechanical analysis using the FE method. Also, it will
detail the problematic of DMU geometry preparation for FE assembly models;
• Chapter 2 is a current bibliographical and technological status on the methods
and tools proposed for the preparation and adaptation of geometric models for
FEA. This analysis will consider the review of component pre-processing as well
as their assembly counterpart;
• Chapter 3 presents the proposed contribution to assembly pre-processing based on
the recommendations of chapter 1 and the analysis of chapter 2. This approach
uses, as input model, an enriched DMU at an assembly level with geometric
interfaces between its components, functional properties of these components and,
at the component level, a structured volume segmentation using graph structure.
From this enriched model, an analysis framework is able to connect the simulation
hypotheses with the shape transformations. This chapter will also identify the
geometric operators segmenting a component to transform it in accordance with
the user’s simulation requirements;
3Introduction
• Chapter 4 exposes the principles of the geometric enrichment of a component
using a construction graph. An algorithm extracting generative processes from
B-Rep shapes will be detailed. It provides a powerful geometric structure containing
simple primitives and geometric interfaces between them. This structure
contributes to an analysis framework and it remains compatible with an assembly
structure containing components and geometric interfaces;
• Chapter 5 details the analysis framework through the exploitation of the construction
graph to analyze the morphology of component. Then, geometric operators
are specified that can be robustly applied to automate components’ and
interfaces’ shape transformations during an assembly preparation process;
• Chapter 6 extends this approach toward a methodology using the geometric operators
previously described that performs idealizations and template based transformations
of groups of components. Results of this methodology will also be
presented to illustrate it through aeronautical examples that use the transformation
operators developed;
4Chapter 1
From a Digital Mock Up to
Finite Element Assembly
Models: Current practices
This chapter presents the problematic of DMU adaptation for the generation of
Finite Elements (FE) assembly models. In a first step, the technical context
is addressed through the description of the DMU data content. This description
deals with the geometrical entities and concepts used to represent 3D CAD
components as well as with the representation of assemblies currently available
before DMU pre-processing. Then, the notion of mechanical analysis using the
FE method is defined and the main categories of geometric models within FEA
are described. The analysis of current industrial processes and practical DMU
data content highlights the issues regarding assembly simulation model preparation
and points out the lack of tools in industrial software to reach the level
of abstraction required by FEA, especially when idealizations are needed. The
main time consuming shape transformations and the missing information about
components’ interfaces in DMUs are identified as a starting point to improve the
robustness of DMU pre-processing.
1.1 Introduction and definition DMU concept
To speed up a Product Development Process (PDP), as stated in the introduction,
aeronautical, automotive and other companies face increasing needs in setting up FE
simulations of large sub-structures of their products. Their challenge covers the study
of standalone components but it is now expanding to simulate the structural behavior
of large assembly structures containing up to thousands of components.
Today, aeronautical companies have to manage a range of products during their
entire lifecycle, from their early design phase to their manufacture and even up to
their destruction and recycling. The corresponding digital data management concept
5Chapter 1: From a DMU to FE Assembly Models: current practices
Design Manufacturing
Pre-Sales Maintenance
Industrial Means
Digital Mock-Up
(DMU) as a Master
Figure 1.1: The Digital Mock-Up as the reference representation of a product, courtesy of
Airbus Group Innovations.
aggregating all the information about each product is called Product Lifecycle Management
(PLM). This concept includes the management of a digital product definition
for all the functions involved in a PDP. To replace a physical mock up by its digital
counterpart, the concept of a virtual representation of a product has been developed,
i.e., the Digital Mock Up (DMU) (see Figure 1.1). As Drieux [Dri06] explained, a
DMU is an extraction from the PLM of a product at a given time. The DMU was
initially created for design and manufacture purposes as a digital representation of an
assembly of mechanical components. Consequently, DMUs are convenient to support a
virtual analysis of several processes, e.g., part assembly ones. For instance, DMU may
be extracted at the manufacturing level, which let engineers to quickly generate and
simulate trajectories of industrial robots and to set and validate assembly tolerances.
During project reviews of complex products such as an aircraft, DMUs contribute to
the technical analysis of a product, as conducted by engineering teams. Connected to
virtual reality technology, a DMU can be at the basis of efficient immersive tools to
analyze interferences among the various subsystems contained into the corresponding
product [Dri06, IML08].
During the design phase, the DMU is considered as the reference geometry of the
product representation. It provides engineers all the digital information needed during
their PDP. The various CAD models representing different stages of the product during
its development or meta data related to specific applications such as manufacturing are
6Chapter 1: From a DMU to FE Assembly Models: current practices
examples of such information. The development and use of DMUs in a PDP bring 3D
assembly models at hand for engineers. Because this reference model contains detailed
3D geometry, it offers new perspectives for analysts to process more complex shapes
while speeding up their simulation model generation up to the FE mesh. However,
speeding up the simulation model generation strongly relies on the time required to
perform the geometric transformations needed to adapt the DMU to FE requirements.
In order to understand the challenges involved in the preparation phase from DMUs
of large sub-structure models for FE simulations, it seems appropriate to initially
present the various concepts and definitions related to the Finite Element Analysis
(FEA) of mechanical structures as well as those related to the current models and
information available in DMUs. This chapter describes the current practices regarding
shape transformations needed to generate the specific geometric models required for
FEA from a DMUs model. Starting from the theoretical formulation of a mechanical
analysis to the effective shape transformations faced by engineers to generate FE
models, this chapter raises the time consuming preparation process of large assembly
structures as an issue. This is detailed at section 1.5 and refers to the identification of
key information content during current FE simulation preparation processes from two
perspectives: a component point of view as well as an assembly point of view. In the
last section 1.7, the research objectives are presented to give the reader an overview of
the research topic addressed in this thesis.
1.2 Geometric representation and modeling of 3D
components
A DMU is straightforwardly related to the representation of the 3D components contained
in the product. As a starting point, this section outlines the principles of
mathematical and computer modeling of 3D solids used in CAD software. Also, it
describes the common schemes available for designers to generate components through
a construction process. Because a component is used in a DMU as a volume object,
this section focuses on solids’ representations.
1.2.1 Categories of geometric families
Prior to explanations about the common concepts for representing 3D components, it
is important to recall that the geometric model describing a simulation model contains
different categories of geometric entities used in the CAD and FEA software
environments. These entities can be classified, from a mathematical point of view, in
accordance to their manifold dimension.
7Chapter 1: From a DMU to FE Assembly Models: current practices
0-dimensional manifold: Point
These entities, the simplest geometric representation, are not intended to represent
the detailed geometry of components. However, they are often used in structural analysis,
as abstraction of a component, i.e., its center of mass or a key point of a component
where concentrated forces are applied, . . . . They are also frequently encountered to
represent interfaces between aeronautical systems and structures in a DMU. They are
also the lowest level entity in the description of a component’s solid model.
1-dimensional manifold: Line, Circle, Curve
These entities, such as lines, circles and more generally curves, are mainly involved
in the definition of models of higher dimension like surfaces. In structural analysis,
they represent long and slender shapes, e.g., components behaving like beams, with
the complement of section inertia. During a solid modeling process, they are part of the
definition of 2D sketches (see Figure 1.5 for an example of sketch based form feature),
or as profile curves in other shape design processes. Also, they represent the location
of geometric interfaces between components, e.g., the contact of a cylinder onto a plane.
2-dimensional manifold: Surface
Surfaces are used to represent the skin, or boundary, of a 3D object. Initially, they
were introduced to represent complex shapes of an object, commonly designated as
free-form surfaces. Polynomial surfaces like B´ezier, B-Spline, NURBS (Non-Rational
B-Spline), Coons surfaces are commonly used for modeling objects with curved surfaces
and for the creation of simulation models, e.g., CFD simulations for aerodynamics or
simulations using the isogeometric paradigm. Here, surface models will be essentially
reduced to canonical surfaces, i.e., plane, sphere, cylinder, cone, torus, which are also
described by classical implicit functions. This restriction is set for simplicity purposes
though it is not too restrictive for mechanical components because they are heavily
used. In structural analysis, using a surface model is frequent practice to represent
idealized models equivalent a volume component resembling a sheet. The notion of
idealization will be specified in subsection 1.3.2. Even if a surface model can represent
complex shapes, they are not sufficient to represent a 3D object as a volume, which
requires an explicit representation of the notion of inside, or outside.
3-dimensional manifold: Solid
A solid contains all the information to define comprehensively the volume of the
3D object it represents. Based on Requicha’s mathematical definition [Req77, Req80],
a solid is a subset of the 3D Euclidian space. Its principal properties are:
• A solid have a homogeneous three dimensionality. It contains a homogeneous
interior. Solid’s boundary cannot have isolated portions;
8Chapter 1: From a DMU to FE Assembly Models: current practices
A Ç B A È B A - B
A Ç* B A È* B A -* B
Additional
Face
(a)
(b) A
B
A
B
Figure 1.2: Boolean operator of two solids: (a) Conventional boolean operator produce additional
face, unclosed boundary. (b) CAD uses regularized boolean operator producing valid
solid
• A solid must be closed. When applied to solid, rigid motions (translation, rotation)
or operations that add or remove material, must produce others solids;
• The boundary of a solid must determine unambiguously the interior and exterior
of the solid.
To describe a solid, topological properties are mandatory in addition to the geometric
entities defining this object. This requirement is particularly important when
describing complex shapes because they are generated using a process that combines
simple primitives to progressively increase the shape complexity until reaching the desired
solid. Indeed, the principle of generation process exists for complex free-form
surfaces is similar to that of complex solids. During the design process, the constructive
processes used to combine elementary primitives are key information to enable
efficient modification processes that are frequently required during a PDPIt is commonly
admitted that 80% of the design time is spent on modifications processes.
1.2.2 Digital representation of solids in CAD
Geometric modeling is the core activity of a CAD system. It contains all the geometric
information describing 3D objects. Although there are various digital representations
of 3D components falling into the category of solids, the two major representations
used in CAD software are detailed in the following paragraphs.
Constructive Solid Geometry (CSG) representation
This representation designates Constructive Solid Geometry approaches devoted to
the design and generation of 3D components. It is important to note that the ’usual’
set of Boolean operations cannot be directly applied on solid model. Otherwise, it
would create invalid solids. As illustrated on Figure 1.2a, the conventional intersection
9Chapter 1: From a DMU to FE Assembly Models: current practices
+
- CSG Tree
Resulting
Solid
(a)
Face
Edge
Vertex
B-Rep
Decomposition
(b)
Figure 1.3: (a) Representation of the construction tree of a CSG component. (b) B-Rep solid
decomposed into faces, edges and vertices (after Stroud [Str10]).
operator applied to two solids would create a non regular solid with an isolated face,
in Figure 1.2b the intersection of two cubes would generate a face and not a solid or
the empty set. Therefore, it is necessary to define a new set of Boolean operations,
the so-called regularized set intersection, union and difference (see Figure 1.2b). These
operators are a modified version of the conventional operators and will be used in the
algorithm presented in chapters 4 and 5.
The CSG approaches represents a solid as a sequence of Boolean operations of
elementary solids (cylinder, sphere, extrusion, revolution), i.e., primitives (see Figure
1.3a). The modeler stores primitives (cylinders, cubes, . . . ) and operations that
have been applied to them, essentially regularized Boolean operations (union, intersection,
difference). It can be visually represented as a tree structure but a CSG
representation does not necessarily form a binary tree. The advantage of this model
is to give a structure which can be easily modified, if the modification is compatible
with the construction tree. The location of a simple primitive, e.g., a hole created with
the subtraction of a cylinder, can be easily changed without modification of the CSG
structure. Weaknesses are: the difficulty to represent complex geometric shapes with
free-form surfaces, the complete tree re-evaluation under modifications and the non
uniqueness of this tree with regard to a given shape.
Boundary representation (B-Rep)
In a B-Rep representation, the CAD kernel processes the skin of the object and
the inside/outside of material. The B-Rep model contains the result of the operations,
i.e., the information defining the shape of the solid (see Figure 1.3b). The volume of
a solid is represented by a set of surfaces describing its boundary. Two categories of
information are stored in a B-Rep model, a topological structure and a set of geometric
entities:
10Chapter 1: From a DMU to FE Assembly Models: current practices
• The geometric information: it consists into a set of surfaces defining the boundary
of the solid and locating it in 3D space. These surfaces are bounded by trimming
curves;
• The topological information: this datastructure enables the expression of the
mandatory topological properties, i.e., closure, orientation, that leads to the description
of shells, faces, wires, edges, vertices, expressing the adjacency relationships
between the topological entities. It can be represented using incidence
graphs such as face-edge and edge-vertex graphs.
In a B-Rep model, the set of surfaces is closed and Euler operators express the necessary
conditions to preserve the consistency of a solid’s topology during modifications. The
advantage of this representation holds in its ability to use non-canonical surfaces, i.e.,
NURBS, allowing a user to represent more complex shapes than CSG representation.
Among the disadvantages of B-Rep models, the representation of the solid’s boundary
contains information only about its final shape and this boundary is not unique for
given shape. Today, the B-Rep representation is widespread in most of CAD geometric
modelers and it is associated with a history tree to enable the description and use of
parametric models.
Nowadays, CAD modelers incorporate the B-Rep representation as well as Boolean
operators and the B-Rep representation is the main representation used in aeronautical
DMUs. In this thesis, the input CAD model of a 3D component is considered as
extracted from a DMU and defined as a solid via a B-Rep representation.
Representation of manifold and non-manifold geometric models
To understand the different properties used in CAD volume modelers and Computer
Aided Engineering (CAE) modelers, the notions of manifold solid and non-manifold
objects have to be defined. One of the basic properties of a CAD modeler representing
solids is that the geometric models of 3D components have to be two-manifold to define
solids. The condition for an object to be two-manifold is that, ’at every point of its
boundary, an arbitrary small sphere cuts the object’s boundary in a figure homomorphic
to a disc’. This condition ensures that a solid encloses a bounded partition of the 3D
space and represents a physical object. Practically, in a B-Rep representation, the
previous condition reduces partly to the another condition at every edge of a manifold
solid where it must be adjacent to two faces exactly. Because a solid is a two-manifold
object, its B-Rep model always satisfies the Euler-Poincar´e formula as well as all the
associated operators performing the solid’s boundary transformations required during
a modeling process:
v − e + f − h = 2 ∗ (s − g) (1.1)
where v, e, f, h, s and g represent the numbers of vertices, edges, faces, hole-loops and
the numbers of connected components (shells) and the genus of the solid, respectively.
11Chapter 1: From a DMU to FE Assembly Models: current practices
Non-Manifold Connection
Surface
Volume
Line
Figure 1.4: Examples of non-manifold geometric models.
As a difference, an object is said to be non-manifold when it does not satisfy the
conditions to be a manifold. To address the various needs of object representation,
the concept of manifold has been extended to represent a wider range of shapes as
needed through a PDP. As illustrated in Figure 1.4, a non-manifold geometric modeling
kernel incorporates the ability to describe geometric regions of different manifold
dimensions, connected or not along other geometric regions of lower manifold dimensions.
Consequently, an edge can be adjacent to more than two faces. However, some
basic properties of solids are no longer valid, which increases the difficulty in defining
the consistency of such models. In the context of the Computer Aided Design
to Finite Element Analysis(es) (CAD-FEA), this also referred to as ‘cellular modeling’
[TNRA14] and few geometric modeling kernels, natively incorporate this category
of models [CAS14] These models are commonly used in structural analysis where surfaces
often intersect along more than one edge (see Figure 1.11c). Therefore, CAE
software proposes datastructures to generate non-manifold geometry. However, most
of the commercial FEA softwares contains manifold geometric modelers with extensions
to be able to model non-manifold objects, which does not bring the desired end-user
performances. Here, the input CAD models are considered as manifold solids and the
generated models for FEA can be non-manifold.
1.2.3 Complementary CAD software capabilities: Feature-based
and parametric modeling
CAD software incorporate a volume geometric modeling kernel to create manifold solids
and a surface modeler to enable the generation of two-manifold objects with free-form
surfaces, i.e., two-manifold with boundary objects. CAD tools are essential for the
generation of DMU because they are used to design and to virtually represent the
components of a product. In addition to the presentation of the geometric models used
in CAD software, (see Section 1.2.2), it is also crucial to mention some CAD practices
contributing to the design of mechanical components. This will help understanding the
additional information associated to B-Rep models which are also available in a DMU.
12Chapter 1: From a DMU to FE Assembly Models: current practices
Concept of feature:
As stated in Section 1.2.2, B-Rep models only describe the final shape of solids.
To ease the generation process of 3D mechanical models and to generate a modeling
history, CAD software uses pre-defined form features as primary geometric regions of
the object [Sha95]. A feature is a generic concept that contains shape and parametric
information about a geometric region of a solid. The features can represent machining
operations such as holes, pockets, protrusions or more generic areas contributing to the
design process of 3D components like extrusions or revolutions.
Generative processes:
The following chapters of this thesis use the term ”generative processes” to represent
an ordered sequence of processes emphasizing the shape evolution of the B-Rep
representation of a CAD component. Each generative process corresponds to the generation
of a set of volume primitives to be added or to be removed from a 3D solid
representing the object at one step of its construction.
Features Taxonomy: The features of solid modeling processes can be categorized
into two sets [Fou07]:
• Features independent from any application:
– Geometric entities: points, axes, curves, sketches;
– Adding/removing material: extrusion, revolution, sweeping. Boolean operators;
– Surface operations: fillets, chamfers, fillings;
– Repetitions, symmetries.
• Features related to an application (hole drilling, sheetmetal forming, welding).
As an example, a material addition extrusion feature is illustrated in Figure 1.5. Its
generative process consists in drawing a 2D sketch using lines, circles or planar curves
to define a planar face and then, to submit it to a translation using an extrusion vector
to generate a volume.
The principle of feature-based modeling is to construct a part ”from a simple shape
to a complex one” and it is similar to the CSG principle. As illustrated in Figure 1.5
and, more generally, in Appendix A where a complete part design is represented, the
user starts with the design of simple volumes to represent the overall solid’s shape of a
component and to add progressively shape details such as fillets and holes to reach its
final shape. This qualitative morphological approach to a solid’s construction process
13Chapter 1: From a DMU to FE Assembly Models: current practices
can be partly prescribed by company modeling rules but a user stays particularly free
to choose the features and their sequence during a construction process. This is a
consequence of a design process enabling the user to monitor step by step, with simple
features, the construction process of a solid.
In CAD software, the sequence of features to create a component is represented and
stored in a construction tree (see Figure 1.5).
Dependences between features and construction tree:
The construction tree of a solid is connected to the notion of parametric modeling.
In addition to the feature concept, parametric modeling has been introduced in CAD
software to enable the regeneration of a solid when the user wants to apply a local
shape modification. With parametric modeling, the user input defines the geometric
constraints and dimensions of a feature in relation with others. In most cases, the
localization of a new feature is not applied in the global coordinates system of the
solid. A feature uses an existing geometric entity of the solid, e.g., a planar face, as
basis for a new sketch (see Figure 1.5). The sketching face creates another dependency
between features in addition to the parent/ child relationships that are stored in the
construction tree.
Conclusion
Solid modeling is a way to represent a digital geometric model of a 3D component.
The B-Rep representation used in commercial CAD software allows a user to design
complex shapes but it provides only a low level volume description because it does not
give a morphological description of a solid. As a complement, feature modeling is easy
to learn for a CAD user because it allows him, resp.her, to naturally design mechanical
components without an in-depth understanding of CAD modeling kernel. Construction
trees structure a 3D object using simple feature models, extending the use of B-Rep
models with a history representing their construction processes. Parametric modeling
is also efficient to produce a parameterized representation of a solid to enable easy
modifications of some of its dimensions.
14Chapter 1: From a DMU to FE Assembly Models: current practices
16
100
100
50
Extrusion
Extrusion
Cut
Extrusion
Fillet
Fillet
Hole
Mirror
Figure 1.5: CAD construction process using form features. The modeling sequence is stored
in a construction tree.
15Chapter 1: From a DMU to FE Assembly Models: current practices
X 21 X 24 X 45 X 4 X 2
Figure 1.6: Example of an aeronautical CAD assembly: Root joint model (courtesy of Airbus
Group Innovations).
1.3 Representation and modeling of an assembly in
a DMU
Any mechanical system is composed of different components assembled together with
mechanical joints. This section aims at presenting how an assembly is represented
and created in a DMU. It underlines how an assembly is processed with a non-formal
conventional representation. In particular, this section deals with the current content
of a DMU extracted from a PLM in an aeronautic industrial context (data that are
actually available for structural simulation).
1.3.1 Effective DMU content in aeronautical industry
Assembly structure in a CAD environment
In a CAD software, an assembly is a structure that organizes CAD components into
groups. Each component contains the geometrical and topological data as described
in Section 1.2.2. Then, the component is instantiated in the assembly structure as
many times as it should appear. The Figure 1.6 represents an aeronautical structure
(wing fuselage junction of an aircraft) with a sub-assembly for each composite part and
instantiation of standard components such as screws and nuts.
16Chapter 1: From a DMU to FE Assembly Models: current practices
To create an assembly structure in 3D, the user iteratively positions components in
3D space relatively to other components, (axis alignment of holes, surface mating, . . . ).
These connections between components, called position constraints, connect degrees of
freedom from each component involved in the corresponding constraints. However,
these constraints may not represent the common geometric areas connecting the corresponding
components. For instance, to connect a screw with the through hole of a
plate, a coaxiality constraint can be applied between the cylindrical surface axis of the
screw and the hole axis, independently from any contact between the surfaces. The
radii of the cylindrical surfaces of these two components are not involved, i.e., any
screw can be inserted in the hole. This does not match the reality and can lead to
assembly inconsistencies.
In a CAD environment, the assembly structure is stored in a product tree which
connects each of its components to others with assembly constraints. On top of the
B-Rep representation, each component can contain complementary information such as
a name or a product reference, a contextual description of the component’s function,
modification monitoring information, color, material designation. During a product
design process, a CAD environment also offers capabilities to share external references
to other components not directly stored in a product structure, to parameterize components’
dimensions with mathematical formulas, . . .
DMU evolution during a PDP
All along the product construction process in a PDP, its digital representation
evolves. The information related to the product definition such as its 3D geometric
representation gets modified. In addition, the product development process is shared
among several design departments that address different engineering areas: the product
mechanical structure, electrical systems, . . . All these areas have to share their design
information and sub-assemblies definitions. Whether it is geometry or parameters,
this information should be integrated in a common product representation. The DMU
concept is a means to support the geometric definition and evolution of components
while maintaining the product assembly updated. As an example, depending on the
maturity of the product, a DMU can be reduced to a simple master geometry at the
early stage of the product design using functional surfaces or, it can contain the full
3D representation of all its components as required for manufacturing.
All these needs require that a Product Data Management System (PDMS) be used
to support the definition and evolution of a DMU. The PDMS structures the successive
versions, adaptions to customer requirements as well as the various technical solutions
that can be collectively designated as variants. A product is represented as a tree referencing
the CAD components and their variants. The various product sub-assemblies
of the design team, initially created in a CAD environment, are transferred and centralized
in the PDMS. It is based on this environment that an engineer can formulate
a request to extract a DMU used as input model for his, resp. her, simulations.
17Chapter 1: From a DMU to FE Assembly Models: current practices
Complex
details
Complex component
geometry
Large number of junctions
in aeronautical products
DMU reduced to a set of
individual component,
no positionning constraints Size constraint
(large number of components)
Various categories
of Bolted junctions
Figure 1.7: Example of complex DMU assembly from Alcas project [ALC08] and Locomachs
project [LOC16].
The DMU content and management in the aeronautical industry: a pragmatic
point of view.
Today, as described previously, a DMU stands for the reference geometric representation
of a product used by structural and systems engineers. A DMU is the input
model to generate their simulation models. In practice however, the information of a
DMU extracted from the PDMS reduces to a set of CAD components positioned in
3D space with respect to a global reference frame and a tree structure representing a
logical structure of this product [Fou07, FL∗10]. This fair loss of information originates
from:
• The size and the fragmented location of a DMU: it contains a large amount of
components (see Figure 1.7) created by different design teams during a PDP, e.g.,
in aeronautics, the extraction of a DMU from the PDMS requires one day (no
centralized data);
• The robustness of a DMU: Positioning constraints between components are not
available. Components are standalone objects in a common reference frame. A
DMU is an extraction from the PDMS at a given time. During the evolution of
a PDP, engineers cannot maintain the interfaces between the geometric models
18Chapter 1: From a DMU to FE Assembly Models: current practices
of the components; the corresponding geometric constraints, if they were set,
have to be removed because their management becomes too complex. As an
example, if a component is removed, the removal of its corresponding geometric
constraints could propagate other modifications throughout the whole assembly.
Additionally, the amount of geometric constraints gets very large for complex
products and their consistency is still an open problem [LSJS13]. It can reach
more than three hundreds for an assembly with less than fifty components. This
is what motivates the solution to locate all components into a global coordinate
system. Consequently, each component is positioned independently of the others,
which increases the robustness of the DMU regarding to its modifications even
though the consistency of the DMU becomes more difficult to preserve.
As a result, if a product is complex and has a large amount of components created by
different design teams during a PDP, the PDMS does not contain information specifying
assemblies. Information about proximity between components is not available. The
relational information between parts in an assembly created in a CAD environment,
e.g., the assembly constraints, is lost during the transfer between the CAD environment
and the PDMS. The DMU is restricted to a set of individual CAD components and
a tree decomposition of a product. As Drieux explained in its DMU analysis [Dri06],
a DMU is a geometric answer to design specifications, it does not contain multiple
representations adapted to the various users’ specifications during a PDP, including
the structural analysis requirements.
1.3.2 Conventional representation of interfaces in a DMU
In order to carry on the pragmatic analysis of a configuration where a simulation engineer
receives a DMU as input model, this section defines the notion of assembly
interfaces between components and their conventional representations in industry.
Lacking conventional representation of components
Shahwan et al. showed [SLF∗13] that the shapes of digital components in a DMU
may differ from the shape of the physical object they represent. These differences
originates from a compromise between the real object shape that can be tedious to
model and the need for their shape simplifications to ease the generation of a DMU. This
is particularly true for standard parts such as components used in junctions (bolted,
riveted). Regarding their large number, each geometric detail, e.g., a threaded area, are
not represented because it would unnecessarily complicate the DMU without improving
its efficiency during a design process. Since there is no standard geometric model of
assembly components used in 3D junctions, each company is likely to set its own
representation.
As illustrated in Figure 1.8, in large aeronautical DMUs, bolted junctions as well as
19Chapter 1: From a DMU to FE Assembly Models: current practices
Line to highlight
The head position
Line defining the shank
of the fasterner
Figure 1.8: Representation of a bolted junction in a structural DMU of an aircraft.
riveted junctions may be represented with a simplified representation defined with two
perpendicular lines. This representation is sufficient to generate an equivalent volume
model using basic information of bolt type, nominal diameter and length. However, no
information exists about the connections between the bolt and the junction’s components
the bolt is related to. There is neither a logical link between the screw and nut
with the plates they connect nor a geometric model of the interface between the screw
and nut forming the junction. More generally, the lack of geometric interface exists
for every interface between assembly components. As explained at Section 1.5.3, this
poor representation complicates the generation of equivalent simulation models. This
complexity issue applies also to deformable components1, which are represented under
an operating configuration.
Definition of interfaces between components
Based on the description of the DMU content given at Section 1.3.1, there is no
explicit information about the geometric interaction between components. Even the
content of geometric interfaces between components can differ from one company to
another. In this thesis, the definition of Conventional Interface (CI) of L´eon et al.
[FL∗10, LST∗12, SLF∗13] is used. From their DMU analysis, they formalized the
representation of conventional interfaces between components. To cover all the possible
interactions between two B-Rep objects C1 and C2, they classified the CIs into three
categories (see Figure 1.9):
1. Contacts: these are configurations where the boundary surfaces of the components
C1 and C2 and relatives positions of these components are such that:
∂C1 ∩ ∂C2 = S �= ∅ and ∂C1 ∩∗ ∂C2 = ∅ where ∂C1 and ∂C2 represent the
boundary surfaces of C1 and C2, respectively. S refers to one or more geometric
1Here, deformable components refer to a category of components with plastic or rubber parts
whose displacements under loading conditions are of a magnitude such that the designer take them
into account when setting up the DMU. This is to oppose to metal parts where their displacements
are neglected.
20Chapter 1: From a DMU to FE Assembly Models: current practices
Surface Interface
δC ∩ δC
Volume Interface
δC ∩* δC
Contact Interference Clearance
C1
C2
1 2 1 2
Figure 1.9: Classification of Conventional Interfaces (CI) under contact, interference and
clearance categories.
elements that can be surface-type, line-type or point-type. Figure 1.9a illustrates
contacts between CAD components;
2. Interferences: these are configurations where the boundary surfaces of the components
C1 and C2 and the relative positions of these components are such that:
∂C1 ∩∗ ∂C2 = C12 �= ∅ where C12 is the intersection volume. Interferences are
detected and analyzed during a DMU review to ensure that there is no physical
integration problem between components. However, according to L´eon et
al., interferences, also named clashes, may occur when components’ shapes are
simplified with respect to their physical models (see Figure 1.9b), or in case of
incorrect relative positions of components. Interferences resulting from these partial
positions make a DMU virtually inconsistent, which requires user’s analysis.
Interferences between standard components generate specific classes of interferences,
which is used to process DMUs in the present work;
3. Clearances: they represent 3D domains without a clear geometric definition,
which is difficult to identify and to represent, (see Figure 1.9c). In this work,
clearances are considered as functional clearances and are identified as design
features.
The concept of CI can be used in our assembly context, since it is independent from
any modeling context. Section 3.3 explains how CI can be extracted from a DMU.
Conclusion
The development and use of DMUs in a PDP bring 3D models at hand for engineers.
The DMU extracted from a PLM contains the complete geometric representation of the
product using a B-Rep representation and CAD construction trees. Complex shapes
are directly available without having to be rebuilt them in a simulation software environment.
However, due to considerations of robustness and size, a DMU is reduced
21Chapter 1: From a DMU to FE Assembly Models: current practices
to a set of isolated components without an explicit geometric representation of the
interfaces between them.
1.4 Finite Element Analysis of mechanical structures
This section aims at introducing some principles of the Finite Element Method (FEM)
for structural analysis. Because the scope of this thesis covers the pre-processing of geometrical
data for FEA, this section does not detail the resolution method but focuses
on the input data required by FEA. First of all, it introduces the concept of mechanical
model for FEA. Then, it enumerates the data needed for FEA ranging from the
geometric model of each component using a FE mesh to the representation of connections
between meshes as required to propagate displacements and stress fields over the
assembly that stand for the mechanical models of the interfaces between components.
Subsequently, it describes the industrial approach to various mechanical analyses of an
aircraft structure at different levels of physical phenomena from large coarse models
representing global deformations to detailed small assemblies devoted to the analysis
of stress distributions, as examples. Within each category, the geometric models
representing the components and their connections are described.
1.4.1 Formulation of a mechanical analysis
The goal of a numerical simulation of the mechanical behavior of a structure is to anticipate
or even supersede a physical test. It allows engineers to simulate a mechanical
behavior of a virtual structure, i.e., without the existence of the real structure.
The mechanical analysis process
Independently from a resolution method, e.g., the finite element analysis or the
finite difference method, as stated in Fine [Fin01], the mechanical analysis process
may be split into three main steps (see Figure 1.10):
1. The formulation of the model behavior:
Just as in a physical test, each virtual simulation has a specific objective: a
simulation objective (type of behavior to be observed such as displacements in a
particular area, maximal loads under a prescribed mechanical behavior, accuracy
of the expected results, . . . ). As Szabo [Sza96] describes, the first formulation
phase consists in building a theoretical model integrating the mechanical behavior
laws representative of the physical system. The analyst specifies and identifies
the key attributes of the physical system and the characteristic values of the
mechanical behavior: the simulation hypotheses. Then, the analyst applies a
22Chapter 1: From a DMU to FE Assembly Models: current practices
Pre-processing
Formulate the model mechanical behaviour from hypotheses relative to
the simulation objective. Adapt the input DMU data (geometry, physical
properties, boundary condition) to resolution method requirements.
01
step
Apply the resolution method (e.g. Finite Element Method) to the
simulation model and obtain results
Resolution
Analyse the results. Determine the accuracy, discuss with design team,
validate and integrate in the PDP
Post-processing.
03
step
02
step
Figure 1.10: Process flow of a mechanical analysis.
set of modeling rules related to the simulation hypotheses in order to create a
reduced numerical simulation model ready to be sent to the resolution system.
The choice of the modeling rules implies decisions on the mechanical behavior
of the structure. When defining the shape of the structure derived from its
real shape (see Section 1.4.2) and setting up the constraints and hypotheses
related to analytical resolution methods, the mechanical engineer limits its range
of observations to the simulation objectives. In practice, the formulation of the
model behavior may be viewed as the transformation of the DMU input, which is
regarded as the digital representation of the physical structure, into the numerical
simulation model. Section 1.5 gives details of this crucial integration phase;
2. The resolution of the model behavior:
Once the simulation model is generated, the mechanical engineer launches the
resolution process. This phase is performed automatically by the CAE software.
Currently, the main resolution method used for structural analysis is the FEM,
which sets specific constraints at the level of the mesh generation process;
3. The results analysis:
Once the resolution process has ended, the mechanical engineer has to analyze
the results, i.e., the solutions fields computed and the output parameters that can
be derived from these fields. He, resp. she, determines the solutions’s accuracy,
discusses with design teams to decide about shape modifications, validates and
integrates the results in the PDP.
23Chapter 1: From a DMU to FE Assembly Models: current practices
CAD Model Volume Mesh Shell Mesh
(a) (b) (c)
Figure 1.11: Example of FE mesh models: (a) CAD initial model of a structure, (b) Meshed
model with 3D volume elements,(c) Meshed model with idealized 2D shell elements.
1.4.2 The required input data for the FEA of a component
Although other resolution methods exist (analytical or numerical, e.g., finite difference
method), in mechanical simulation, the FEM is a method widespread in industry.
The FEM is a general numerical method dedicated to the resolution of partial differential
equations and its applicability is not restricted to structural simulation, it
covers thermal, electromagnetism, thermodynamics, . . . Many documents exist which
relate in detail the principles of this method, reference books of Zienkiewicz [ZT00],
Bathe [Bat96] are among them. This section concentrates on the data requirements
of the method to formulate a simulation model and addresses pragmatically how the
engineer can collect/generate these data.
Geometry: Finite Element Mesh
To solve partial differential equations applied to a continuum, i.e., a continuous
medium, the FEM defines an equivalent integral formulation on a discretized domain.
This discrete domain is called a Finite Element Mesh and is produced by decomposing
the CAD model representing the structure into geometric elements of simple and well
known geometry, i.e., triangles, tetrahedra forming the finite elements, . . . , whose
individual physical behavior reduces to a simple model (see Figure 1.11). When the
structure is subjected to a set of physical constraints, the equilibrium equations of the
overall structure percolate through all the elements once they have been assembled
under a matrix form.
The model size, i.e., the number of finite elements, has a direct influence on the
computation time to obtain the solution fields and it may introduce approximation
errors if not set correctly. The engineer must efficiently identify the right level of mesh
refinement related to the mechanical phenomenon he, resp. she, wants to observe. In
practice, to ease the meshing phase, the input CAD geometry is simplified to adapt
its shape to the simulation objectives and the mesh generation requirements. If this
24Chapter 1: From a DMU to FE Assembly Models: current practices
Finite
Element
Geometry Morphological properties
1D-element:
Beam
<< L
l ,l << L 1 2 L
l2 l1
L
Long and slender sub domain having
two dimensions that are small enough
compared to the third one. These two
dimensions define the beam section parameters.
2D-element:
Shell, plate,
membrane
e
l 1
l 2
2 e << l ,l 1 Thin sub domain having one dimension
which is small compared to the two others.
This dimension defines the thickness
parameter.
3D-element:
Volume
Sub domain without any specific morphological
property that must be processed
with a three-dimensional mechanical
behavior.
Table 1.1: Categories of Finite Elements for structural analyses.
simplification is carried out properly, it would not only generate a good mesh but this
mesh is obtained quickly also. This simplification phase incorporates shape transformations
and all their inherent issues are discussed in Section 1.5.
Finite Element Choice and families
When setting up a simulation model, the choice of finite elements is essential. Each
finite element has an approximation function (polynomial function) which has to locally
approximate at best the desired solution. As explained in Section 1.4.1, it is the engineer
who chooses the type of finite element in adequacy with the prescribed simulation
objectives. There are many types of finite elements to suit various applications and
their selection is conducted during the early phase of the CAD model pre-processing.
It is a matter of compromise between the geometry of the components, the desired
accuracy of the simulation results as well as the computation time required to reach
this accuracy.
Figure 1.1 presents the main categories of finite elements classified in accordance
with their manifold properties (see Section 1.2.1).
Idealized elements
Based on the shell theory of Timoschenko [TWKW59], specific finite elements are
available in CAE software to represent a thin volume, e.g., shell elements. These elements
can significantly reduce the number of unknowns in FE models, leading to
25Chapter 1: From a DMU to FE Assembly Models: current practices
a shorter computation time compared to volume models. Also, using shell elements
rather than volume ones gives access to different mechanical parameters: section rotation
and stress distribution in the thickness is implicitly described in the element.
Rather than discretizing a volume into small volume elements, it is represented by its
medial surface (see Table 1.1 2D-element). The thickness becomes a numerical parameter
associated with the element. Long and slender sub domains can be processed
analogously. A beam element is well suited to represent these volume sub domains
using an equivalent medial line (see Table 1.1 1D-element). From the sections of these
volumes, their inertia parameters are extracted and they become numerical parameters
assigned to the beam elements.
Such elements imply a dimensional reduction of the initial volume, a 1-dimensional
reduction for shells and 2-dimensional reduction for beams. This modeling hypothesis
is called idealization. In a CAD-CAE context, the idealization refers to the geometric
transformation converting a initial CAD solid into an equivalent medial surface or
medial line which handles the mechanical behavior of a plate, a shell or a beam, respectively.
This geometrically transformed model is called idealized model. Such an
example is given on Figure 1.11c. Idealized sub domains are particularly suited to aeronautical
structures, which contain lots of long and thin components (panels, stringers,
. . . ). Using idealized representations of these components can even become mandatory
to enable large assembly simulations because software license upper bounds (in terms of
number of unknowns) are exceeded when these components are not idealized. However,
Section 1.5.3 illustrates that the practical application of such an idealization process
is not straightforward. The sub domains candidates for idealization are subjected to
physical hypotheses:
• The simulation objectives must be compatible with the observed displacements
or stress field distributions over the entire idealized sub-domains, i.e., there is no
simulation objective related to a local phenomenon taking place in the thickness
or section of an idealized domain;
• The sub domains satisfy the morphological constraints of idealization hypotheses,
e.g., a component thickness must be at least 10 times smaller than the other two
dimensions of its corresponding sub domain.
Material data, loads and boundary conditions
On top of the definition of a mesh geometry and its associated physical properties,
e.g., sections, thickness, inertias, the FEM requires the definition of material parameters,
loads and boundary conditions.
Material data are associated with each finite element in order to generate the global
stiffness matrix of the equivalent discretized sub domains representing the initial CAD
model. The material properties (homogeneity, isotropy, linearity, . . . ) are themselves
inherent to the model of constitutive law representative of the component’s mechanical
26Chapter 1: From a DMU to FE Assembly Models: current practices
behavior. In case of a component made of composite material, the spatial distribution
of the different layers of fibers should be carefully represented in the meshed model of
this component.
Loads and boundary conditions are essential settings of a mechanical simulation
to describe the mechanical effects of other components on the ones of interest. Consequently,
loads and boundary conditions are also part of the mechanical simulation
pre-processing. A load can be a punctual force applied at a finite element node, a
pressure distributed over the surface of a set of finite elements or even a force field,
e.g., gravity force. Similarly, boundary conditions have to be attached to a particular
set of nodes. Boundary condition settings interact with idealization processes (see
Section 1.5.3), e.g., a force acting on an elongated side of a long slender volume is
applied to a linear sequence of nodes of the idealized equivalent model defined as a
beam model. Consequently, the boundary condition is also dimensionally reduced. In
practice, an engineer defines the loads and boundary conditions areas over a component
using partitioning operators prior to mesh the component.
1.4.3 FE simulations of assemblies of aeronautical structures
The FEM issues have been extensively addressed for standalone components and integrated
in a PDP. However, the FE simulation target is now evolving toward assembly
structures, which are under focus in the next section.
An assembly can be regarded as a set of components interacting with each other
through their interfaces. These interfaces contribute to mechanical functions of components
or sub-assemblies [BKR∗12, KWMN04, SLF∗13]. An assembly simulation model
derives from shape transformations interacting with these functions to produce a mechanical
model containing a set of sub domains discretized into FEs and connected
together to form a discretized representation of a continuous medium.
Interactions between sub domains in assembly models and associated hypotheses
An assembly simulation model is not just a set of meshed sub domains positioned
geometrically in a global coordinate system. These sub domains must be connected
to each other to generate global displacement and stress fields over the assembly. To
process every assembly interface (see Section 1.3.2), the user should decide which mechanical
behavior to apply. Connections between components through their interfaces
can be of type kinematic or physical and associated with physical data (stiffness, friction
coefficient, . . . ) and material parameters, as necessary. The selection of connector
types is subjected to user’s hypotheses regarding the relative behavior of sub domains
representing the components, e.g., motion and/or relative interpenetration. Here, a
sub domain designates either an entire component or a subset of it when it has been
27Chapter 1: From a DMU to FE Assembly Models: current practices
With relative motion Without relative motion
With interpenetration
Deformable junctions models:
used to model complete mechanical
connections with deformable
connectors elements,
i.e., springs, dampers, . . .
Rigid junctions models: used to
model rigid connections, i.e., ball
joints, welds, rivets, bolts, . . .
Deformable fastener Hinge
Junction
Without interpenetration
Normal and tangential contact:
Used to model the normal
and tangential stresses (friction)
transmitted between two solids
in contact during the simulation.
Kinematic constraints: used to
model relationships expressed as
displacement/velocity between
nodes, e.g., tie constraints, rigid
body, . . .
Contact
Kinematic
Constraint
Table 1.2: Connector entities available in CAE software.
idealized. The connection types are synthesized in Figure 1.2.
The introduction in a FEA of a relative motion between components (contacts condition)
considerably increases the complexity of this analysis. Indeed, a contact is not
a linear phenomenon and requires the use of a specific nonlinear computational model,
which slows down the simulation time. Setting up a contact is a strong hypothesis,
which leads to the definition of the potential contact areas on both components. The
sets of FEs in contact must be carefully specified. On the one hand, they should contain
sufficient elements, i.e., degrees of freedom, to cover the local phenomenon while
limiting the interpenetration between meshes. On the other hand, they should not
contain too many elements to avoid increasing unnecessarily the computation time.
During the early design phases, in addition to idealized models of components, it
is common to perform simulations using simplified representation of junctions. In this
case, the junction simulation objectives aim at transferring plate loads throughout the
whole assembly and FE beam elements are sufficient to model the bolts’ behavior.
In this configuration, the whole group of components taking part of the junction is
replaced by a unique idealized model (see Figure 1.12). When applied to a FEA of
large aeronautical structures, these models are called FE connections with fasteners
and they are widely used to integrate component interactions with or without contact
conditions. A fastener connection may be applied either to mesh nodes or may be
28Chapter 1: From a DMU to FE Assembly Models: current practices
A
Fastening point defined
with region of
influence
FE Fastener Bolted Junction
Beam
connection
B
C
A
B
C Region
of Influence
Figure 1.12: Example of a FE fastener simulating the behavior of a bolted junction using
beam elements.
mesh-independent, i.e., a point to point connection is defined between surfaces prior
to the mesh generation process.
Interactions between simulation objectives and the simulation model preparation
process
Simulation objectives drive the shape transformations of CAD solids and interact
with the simulation hypotheses to model connections between components. During a
PDP, simulations may be used at various steps of a design process to provide different
informations about the mechanical behavior of components and sub systems. Based on
Troussier’s [Tro99] classification, three simulation objectives are taken as examples in
Table 1.3 to illustrate how simulation objectives influence the idealization process and
the models of interactions between components as part of different simulation models.
As an illustration of the influence of simulation objectives on the generation of
different simulation models, Figure 1.13 presents two FE models derived from the
same assembly structure of Figure 1.6:
• A simplified model used at a design stage of pre-dimensioning and design choices
(see Figure 1.13a). The simulation objective is to estimate globally the load
transfer between plates through the bolted junctions and to identify the critical
junctions. This model contains idealized components with shell FE in order to
reduce the number of degrees of freedom. The junctions are modeled with FE
fasteners containing beam elements and a specific stiffness model, i.e., the Huth’s
law [Hut86]. This model contains 145 000 degrees of freedom and solving it takes
15 minutes, which allows the engineer to test various bolted junctions layouts,
part thicknesses and material characteristics;
• A full 3D FEM to validate design choices and check conformity with the certi-
fication process prior to physical testing (see Figure 1.13b). The simulation objectives
contain the validation of the load transfer distribution among the bolted
junctions and the determination of the admissible extreme loads throughout the
structure. To adapt the FE model to these simulation objectives while repre-
29Chapter 1: From a DMU to FE Assembly Models: current practices
Element of
a
simulation
process
Pre-dimensioning and
design choices
Validation of
mechanical tests
Contribution to
phenomenon
understanding
Simulation
objectives
Determine of the number
of junctions, a component
thickness or material, . . .
Analyze the distribution
of the stress field in a
structure. Locate possible
weaknesses.
Understand the behavior
of the structure to correlate
with results after
physical tests
Internal
Connections
(Interfaces)
Physical junction simpli-
fied, no contact (rivet and
pin models associated to
fasteners).
Physical junction simpli-
fied or use of volume patch
model. Contact interactions
between components.
Complete physical junction,
use of volume model
with contact interactions.
Components’
shape
Large number of components.
Idealized: thin
parts represented as shell
models.
Simplified (shell models)
for large assemblies, volume
model or mixed dimensional
model accepted
if rather small number of
components.
Small number of components.
Complete volume
model.
Simulation
model
Linear Linear or nonlinear Nonlinear
Table 1.3: Examples of interactions or even dependencies between simulation objectives and
interfaces as well as component shapes.
senting the physical behavior of the structure, an efficient domain decomposition
approach [CBG08, Cha12] uses a coarse 3D mesh (tetrahedral FE) far enough
from each bolted junction and a specific sub domain around each bolted junction
(structured hexahedral mesh) where friction and pretension phenomena are part
of the simulation model. Here, the objective is not to generate a detailed stress
distribution everywhere in this assembly but to observe the load distribution areas
among bolts using the mechanical models set in the sub domain, i.e., the
patch, around each bolt. This model contains 2.1106 degrees of freedom and is
solved in 14 hours. Only one such model is generated that corresponds to the
physical test.
Conclusion
This section described the main categories of geometric models used in the FEA of
structures. The simulation objectives drive the generation of the simulation models,
i.e., FE meshes, boundary conditions, . . . , used as input data for solving the FE models.
In addition to each component definition, a FE assembly must integrate connection
models between meshed components. In Section 1.5, the different modeling hypotheses
are analyzed with regard to the geometric transformations applied on the DMU input in
order to obtain a new adapted CAD model that can be used to support the generation
of a FE mesh model.
30Chapter 1: From a DMU to FE Assembly Models: current practices
Full 3D FEM
Volume Model
Idealized FEM
Shell model
(a)
(b)
Fastener
Refined Mesh
in subdomains
around junction
Figure 1.13: Example of aeronautical FE models: (a) an idealized model with fasteners, (b)
a full 3D model with a decomposition of plates around each bolted junction and a fine mesh
in the resulting sub domain around each bolted junction.
1.5 Difficulties triggering a time consuming DMU
adaptation to generate FE assembly models
This section aims at illustrating the complexity of the generation of FE models from
DMUs. It highlights the differences between a component’s shape in a DMU with
respect to the level of abstraction required for a given FEA, especially when a FEA
requires an idealization process. This section characterizes and analyzes some specific
issues about assembly simulation model preparation and exposes the lack of tools in
industrial software, which leads engineers to process manually all the shape transformations
and strongly limit the complexity of assemblies that can be processed in a
reasonable amount of time.
1.5.1 DMU adaption for FE analyses
Today mechanical structures used in mechanical simulations contain a large number of
components, each with a complex shape, binded together with mechanical junctions.
In the aeronautic industry, the dimensioning and validation of such structures leads
engineers to face two digital challenges:
• The formulation of mechanical simulation models, as developed in Section 1.4,
31Chapter 1: From a DMU to FE Assembly Models: current practices
that can simulate the mechanical behavior of a structure lead to the components’
dimensioning as well as the validation of the joint technologies selected (bolting,
welding, riveting). During this phase, the engineers have to determine the most
adapted simulation model regarding the physical phenomena to observe. They
need to set up a FEA and its associated simulation hypotheses that produce the
FE model which best meets the simulation objectives with the simulation software
environment and technologies available. In practice, a simulation engineer
supervises the DMU extraction processes to specify the components to be extracted
and/or those having negligible mechanical influences with respect to the
simulation objectives. Yet, this assessment is qualitative and is strongly dependent
upon the engineer’s know-how. Another issue about data extraction stands
in the component updates during the PDP. Any geometrical change of a DMU
component has to be analyzed by the simulation engineer. Due to the tedious
interactive transformations required, a trade-off has to be reached between the
time required for the shape update in the FE model and the mechanical influence
of the component with respect to the simulation objectives. Here, we face
a qualitative judgment;
• The generation of appropriate component shapes from a DMUs to support the
generation of simulation models. As explained at Section 1.1, the DMU stands for
the geometric reference of a product definition. Through the PLM software, engineers
have typically access to DMUs containing the geometry of the 3D assembly
defining the product and additional information, essentially about the material
properties of each component. However, the extracted DMU representation is not
directly suited for numerical FE simulations. Shape transformations are mandatory
because designers and mechanical engineers work with different component
shapes, resulting in the fact that a DMUs cannot directly support the mesh generation
of structural analysis models. These models must meet the requirements
of the simulation hypotheses, which have been established when setting up the
simulation objectives and the specifications of the mechanical model as part of
the FEA. The component shapes generated for the FEA have to be adapted to
the level of idealization derived from the specifications of the desired mechanical
model, the shape partitioning required for the application of the boundary conditions
and loads as well as the level of details of the shape with respect to the FE
size required when generating the FE mesh. During the generation of mechanical
assembly models, the engineer must also take into account the total number of
components, the representation of multiple interfaces between components and a
higher level of idealization and larger details than for standalone components, to
produce coarse enough assembly models.
To increase the scope of physical assembly simulations, these two challenges lead
engineers to use models with simplified 3D representations using idealized shells rather
than representations using solids, from a geometric point of view and, from a compu-
32Chapter 1: From a DMU to FE Assembly Models: current practices
tational mechanics point of view, models with specific component interfaces models.
These targets require specific treatments during the preparation process of a simulation.
Now, the purpose is to describe the major difficulties encountered by engineers
during the preparation of assembly simulation models.
1.5.2 Interoperability between CAD and CAE and data consistency
The first difficulty to generate assembly simulation models derives from the interoperability
between the CAD and CAE systems. CAD tools have been initially developed
in the 60s to help designers modeling solids for applications such as machining or freeform
surfaces. CAD has evolved along with CAM (Computer Assisted Manufacturing),
driving the functionalities of CAD software. However, simulation software has evolved
independently. CAD systems do not support a full native integration of simulation
preparation modules. The current practice is to export a DMU to subcontracting
companies in charge of the simulation pre-processing, which themselves use specialized
CAE software to read and transform the CAD components geometry. Each of these
two software, (CAD and CAE), efficiently supports its key process. CAD software are
efficient to manage robustly and intuitively modify B-rep solids, to generate large assembly
models but they contain basic meshing strategies and most of them are able to
model non-manifold objects. CAE software are dedicated to simulation processes, they
provide capabilities to describe non-manifold geometry (useful for idealized models) but
are limited in modeling non-manifold models. They incorporate robust meshing tools
(with topological adaption capabilities) and extensive capabilities to describe contact
behaviors, material constitutive laws, . . . . However, CAE software relies on a different
geometric kernel than CAD, which breaks the link between them and leaves open the
needs for shape transformation operators.
Also, a transfer of a component from a CAD to a CAE environment has a severe
impact on the transferred information. The geometry has to be translated during its
import/export between softwares that use different datastructures and operators. This
translation can be achieved through a neutral format like STEP (Standard for The
Exchange of Product model data) [ISO94, ISO03]. However, this translation may lead
to solid model inconsistencies resulting from different tolerance values used in the respective
geometric modeling kernels of CAD and CAE software. These inconsistencies
may prevent the use of some transformation operators, involving manual corrections.
Additionally, the coherence of the input assembly data is crucial. An assembly containing
imprecise spatial locations of components and/or components shapes that do
not produce consistent CIs (see Section 1.3.2) between components or even the non existence
of a geometric model of some components (such as shim components which are
not always designed as illustrated in Figure 1.14) implies their manual repositioning or
even their redesign to meet the requirements of the simulation model. In the proposed
33Chapter 1: From a DMU to FE Assembly Models: current practices
Functional Gap to
assemble components
Shim component
(not design in DMU)
to fill the gap
Figure 1.14: Illustration of a shim component which does not appear in the DMU model.
Shim component are directly manufacture when structural components are assembled.
approach, the input DMU is assumed to be free of the previous inconsistencies and
therefore, it is considered as coherent.
1.5.3 Current operators focus on standalone components
To transform the shape of an initial B-Rep CAD model of a standalone component
into a new one as required for its simulation model, the mechanical engineer in charge
of the simulation pre-treatment sequentially applies different stages of shape analysis
and geometric transformations. His, resp. her, objectives is to produce a new CAD
model that can support the mesh generation process. This mesh must be consistent
with respect to the simulation objectives and produced in a reasonable amount of time.
Based on the simulation objectives reduced to this component, the engineer evaluates
qualitatively and a priori, the interactions between its boundary conditions and
its areas of simulation observation, e.g., areas of maximum displacements or maximum
stresses, to define whether or not some sub domains of this component should be suppressed,
idealized. Currently, engineering practices iteratively apply interactive shape
transformations:
1. Idealizations, which are the starting transformations, because they are of highest
shape transformation level since they perform manifold dimension reductions;
2. Details removal comes after with topological and skin detail categories [Fin01]
that can be also grouped together under the common concept of form feature;
3. Mesh generation requirements leading to solid boundary and volume partitioning
are the last step of shape transformations that can be achieved with the socalled
‘virtual topology’ operators or, more generally, meshing constraints [She01,
FCF∗08].
34Chapter 1: From a DMU to FE Assembly Models: current practices
1 : Extract Pair of faces
from CAD geometry
2 : Generate medial face from
Pair of Faces (Automatic)
3 : Connect all medial
faces together
4: Assign thickness/offset
to medial surface
P1
P2
P3
P1
P2
P3
P1
P2
P3
P1
P2
P3
x 14
Shell model with
thickness
3D initial model
Repetitive Process on
each Medial Surface
connections
(a)
(b)
Figure 1.15: Illustration of a manual process to generate an idealized model: (a) initial solid
superimposed with its idealized model, (b) iterative process using face pairing identification
and mid-surface extensions to connect mid-surfaces.
Commercial softwares already provide some of these operators to adapt DMUs to
CAE processes but they are restricted to simple configurations of standalone components.
Fewer software, like Gpure [GPu14], offer capabilities to process specific
DMU configurations using large facetted geometric models. Component shape transformations,
which is the current target of high level operators, are reduced to manual
interactions to apply defeaturing operations on CAD parts such as blend removal
[ZM02, VSR02], shape simplifications [LAPL05] or to directly remove features
on polyhedral models [MCC98, Tau01, LF05]. In all cases, the flow of interactions
is monitored by the engineer. This results in very tedious and time consuming tasks
requiring a fair amount of resources.
When an idealization is required, engineers can create the resulting mid-surface
with a manual and qualitative identification of face pairs [Rez96] or using a medial axis
surface generation process [ABD∗98, AMP∗02]. However, information in between idealizable
areas is not available and the engineer has to manually create the connections
by extending and trimming mid-surfaces, which is highly tedious and relies also on
his, resp. her, mechanical interpretation. Figure 1.15 illustrates a manual idealization
process where the user identifies faces pairs, then generates mid-surfaces and creates
manually new faces to connect medial faces together while locating the idealized object
as much as possible inside the initial volume. Applied to complex shapes, e.g., aircraft
structure machined parts, this process flow is highly time consuming as a consequence
of the numerous connection areas required and can be hardly automated because slight
35Chapter 1: From a DMU to FE Assembly Models: current practices
shape modifications strongly influence the process flow. Creating idealized domains in
areas where face paring cannot be applied rather than leaving a volume domain in these
areas, is a common industrial practice to reduce the number of degrees of freedom of a
simulation model and reduce the use of mix dimensional models, thus avoiding transfers
between shell and volume finite elements because it is not recognized as a good
mechanical model. A volume mesh in connection areas is only beneficial if it brings a
gain in accuracy, pre-processing or simulation time. Today, generating volume meshes
in connection areas requires lots of manual interventions because these volume shapes
can be quite complex. Often, the main difficulty is to partition the initial object into
simple volumes to generate structured meshes.
The lack of robust and generic operators results in a very time consuming CAD
pre-processing task. These geometric operators are analyzed in detail in Chapter 2 to
understand why they are not generic and robust enough.
1.5.4 Effects of interactions between components over assembly
transformations
The amount of shape transformations to be performed significantly increases when
processing an assembly. The engineer has to reiterate numerous similar interactive
operations on series of components, the amount of such components being large.
Unlike modeling a standalone component having no adjacent component, an assembly
model must be able to transmit displacements/stresses from one component to
another. Therefore, the preparation of an assembly model compared to a standalone
component implies a preparation process of their geometric interfaces. Consequently,
to obtain a continuous medium, the engineer must be able to monitor the stress distribution
across components by adding either kinematic constraints between components
or prescribing a non-interpenetration hypothesis between them by adding physical contact
models. Thus, modeling hypotheses must be expressed by the engineer at each
component interface of an assembly.
Today, the interactive preparation of the assembly depicted at Figure 1.13 requires a
5 days preparation to produce either an idealized model or a model based on simplified
solids. When looking at this model, some repetitive patterns of groups of components
can be observed. Indeed, these patterns are 45 bolted junctions that can be further
subdivided into 3 groups of identical bolt junctions, i.e., same diameter. Each group
can be further subdivided in accordance with the number of components tightened.
The components forming each of these attachments belong to a same function: holding
tight in position and transferring forces between the plates belonging to the wing and
the fuselage. While a standalone component contributes to a function, an assembly is
a set of components that fulfill several functions between them. During an interactive
simulation preparation process, even if the engineer has visually identified repetitive
36Chapter 1: From a DMU to FE Assembly Models: current practices
configurations of bolts, he, resp. she, has to transform successively each component
of each bolt. A property, by which some components share similar interactions than
others and could be grouped together because they contribute to the same function,
cannot be exploited because there is no such functional information in the DMU and
the geometric models of the components are not structured with their appropriate
boundary decomposition to set up the connection with their function, e.g., imprint of
contact areas are not generated on each component boundary and the contact areas
are connected to a function. Thus, the engineer has to repeat similar shape transformations
for each component. However, if the geometric entities contributing to the
same function are available, grouped together and connected to their function before
applying shape transformations, the preparation process could be improved. For instance,
bolted junctions would be located and transformed directly into a fastener
model through a single operator. Further than repetitive configurations, it is here
the impossibility to identify and locate the components and geometric entities forming
these repetitive patterns that reduces the efficiency of the preparation process.
Processing contacts
Hypothesizing the non-interpenetration of assembly components produces non linearity
and discontinuities of the simulation model. In this case, the engineer must
locate the potential areas of interpenetration during the analysis. Due to the lack of
explicit interfaces between components in the DMU, all these contact areas must be
processed interactively. At each contact interface, the analyst has to manually subdivide
the boundary of each component to generate their geometric interface and then,
assign mechanical parameters, such as a friction coefficient, to this interface. In the
use-case represented in Figure 1.6, every bolted junction contains between 5 and 7 geometric
interfaces at each of the 45 junctions, which amounts to 320 potential contact
conditions to define interactively. To avoid these tedious operations, in a context of
non linear computations, there is a real need to automate the generation of contacts
models in assembly simulations. This automation can be applied to a DMUs with the:
• Determination of geometric interface areas between components, i.e.,
– Localize geometric interfaces between components likely to interpenetrate
during the simulation;
– Estimate and generate the extent of contact areas over component boundaries.
Meshed areas of the two components can be compatible or not depending
on the capabilities of CAE software;
• Generation of functional information to set the intrinsic properties of contact
models, i.e.
– Define the friction parameters;
37Chapter 1: From a DMU to FE Assembly Models: current practices
Functional Tolerance
Loose fit Fitted Snug fit
User’s choice
Mechanical
components DMU
Nominal diameter
for bearing and shaft
CAE
Preprocessing Virtualization
Simplified representation
of a bearing
Shaft Contact Area
Bearing Simulation Model
with Friction contact
Figure 1.16: Example of contact model for a FE simulation.
– Define the kinematic relations between component meshes in contact areas
with respect to the dimensional tolerances between surfaces. Figure 1.16
exemplifies a contact between a shaft and a bearing. Commonly, a DMU
exhibits CIs [SLF∗12, SLF∗13] where components’ representations can share
the same nominal diameter while they can fulfill different functions according
to their fitting (clearance, loose fit, snug fit), thus requiring different settings
in their FE respective contact models.
As a result, DMUs do not contain enough information to automate the generation of
contact models. FE models need geometric and functional information about components
interfaces to delineate contact areas as well as to assign contact model parameters.
Contribution of component functions to the simulation preparation
To automatically handle these repetitive configurations related to components contributing
to the same function in an assembly, the simulation preparation process must
be able to identify these functions from the input DMU. Currently, the engineer is
unable to automate these repetitive tasks because he, resp. she, has no information
readily identifying connections in the assembly.
Simulation models chosen by the engineer in a CAE library to replace the junctions
are geometrically simple and basic interactive operators are available to achieve
the necessary shape transformations. As shown in Figure 1.12, an idealized model of
a bolted connection modeled with a fastener consists in a set of points connected by
line elements to describe the fastener. Using a mesh-independent fastener, the points
representing the centers of the bolt holes in the tightened components do not even
need to coincide with a surface mesh node. These idealization transformations are
rather simple locally, given the component shapes. Hence, the challenge is neither the
38Chapter 1: From a DMU to FE Assembly Models: current practices
geometric complexity nor the mesh generation. Indeed, it holds in the term ‘bolted
junction’ to identify this geometric set of components and generate geometric relationships
between areas of their boundaries. The issue consists in determining the function
of each component in an assembly in order to group them in accordance with identical
functions and to make decisions about modeling hypotheses (simplification, idealization)
on component shapes associated with these identified functions.
Conclusion
Shape transformations taking place during an assembly simulation preparation process
interact with simulation objectives, hypotheses and functions attached to components
and to their interfaces. To improve the robustness of the geometric operators
applied during simulation preparation, and to make them applicable not only to components
but also to assemblies, is a first objective to reduce the amount of time spent
on assembly pre-processing.
1.6 Conclusion and limits of current practices about
DMU manual adaption for FE assembly models
generation
Currently, configuring rather complex assembly models for simulations is difficult to
handle within the time scale prescribed by an industrial PDP. The pre-processing of
CAD models derived from DMUs to produce FE models is far too long compared
to the simulation time, it may represent 60% of the whole simulation process (see
Section 1.4.1). Consequently, some simulations are not even addressed because their
preparation time cannot fit within the schedule of a PDP, i.e., simulation results would
be available too late.
Because the shape of CAD models obtained from the engineering design processes
is neither adapted to the simulation requirements nor to the simulation solvers, shape
transformations are mandatory to generate the simulation models. Consequently,
DMUs cannot directly support the preparation process of structural analysis models.
Today, the operators available in CAD/CAE software allow an engineer to perform
either interactive geometric transformations leading to very tedious tasks or automated
model generation adapted to simple models only or models containing only a restricted
set of form features [TBG09, RG03, SGZ10, CSKL04, LF05, LAPL05, ABA02, SSM∗10,
DAP00]. Unfortunately, these operators are still not generic enough to be adapted to
analysts’ needs and a rather automated generation of complex component simulation
models still raises numerous difficulties, especially when component idealizations must
be performed.
39Chapter 1: From a DMU to FE Assembly Models: current practices
To generate assembly simulation models, in addition to its component transformations,
the engineers need to generate all the connections between its components. Simulation
models for assemblies strongly need geometric interfaces between components
to be able to set up boundary conditions between them and/or meshing constraints,
e.g., to satisfy conformal mesh requirements. Studying the content and structure of an
assembly model, as available in a PDMS, reveals that product assemblies or DMUs are
reduced to a set of components located in 3D space without geometric relationships
between them. The information about the interfaces between components are generally
very poor or nonexistent, i.e., real contact surfaces are not identified or not part
of each component boundary. As a consequence, it is common practice for engineers to
generate interactively the connections between components, which is error prone, due
to the large number of repetitive configurations such as junction transformation.
Finally, processing complex DMUs for the simulation of large assembly models is a
real challenge for aircraft companies. The DMUs, used in large industrial groups such
as Airbus Group, consist in hundreds of thousands of components. Thus, engineers in
charge of such simulations can hardly consider applying the usual methods involving
manual processing of all components as well as their interfaces. To meet the needs
for large assembly simulation models, improvements in processing DMUs are a real
challenge in aircraft companies and it is mandatory to robustly speed up and automate,
as much as possible, the DMU transformations required.
1.7 Research objectives: Speed up the DMU preprocessing
to reach the simulation of large assemblies
To improve the simulation preparation process of large assembly simulation models,
this thesis aims at defining the principles that can be set up to automate the shape
adaption of CAD models for the simulation of large assembly structures and developing
the associated shape transformation operators. The range of CAD models addressed is
not restricted to standalone components but covers also large assembly structures. The
tasks planned are mainly oriented toward the transformation of 3D geometric models
and the exploitation of their associated semantics for the FEA of structural assemblies
applicable to static and dynamic analyses. The task breakdown is as follows:
• Analyze FE simulation rules to extract and classify modeling criteria related to
user-defined simulation objectives;
• Based on CAE discipline’s rules, specifications and process structure, formalize
shape transformations operators to increase the level of automation of component
transformations as well as the transformation of its geometric interfaces;
40Chapter 1: From a DMU to FE Assembly Models: current practices
• Implement and validate idealization operators to transform assembly component
shapes and assembly interfaces between components while preserving the semantics
of the mechanical behavior intended for this assembly;
• Specify the transformation process monitoring and the methodology contributing
to the generation of mechanical (CAE) models exploiting a functionally enriched
DMUs.
Prior to any automation, a first step outlined in Chapter 2 analyzes in detail the
available operators and scientific contributions in the field of data integration and shape
transformations for mechanical simulations. The objective is to understand why the
current operators and approaches are not robust enough to be applied to aeronautical
assemblies. From this analysis, Chapter 3 refines the thesis objectives and exposes a
new approach to speed up the shape adaption of CAD assembly models derived from
DMUs as needed for FE assembly models. The proposed method is able to adapt a
component shape to the simulation objectives and meshing constraints. It incorporates
the automation of tedious tasks part of the CAD component idealization process,
specifically the treatment of connections between idealizable areas. The proposed algorithms
detailed in Chapters 4 and 5 have to be robust, applicable for CAD aeronautical
components and preserve the semantic of the mechanical behaviors targeted. These
operators contribute to an assembly analysis methodology, presented in Chapter 6,
that definitively generalizes assembly transformation requirements in order to prove
the capacity of the proposed approach to challenge the generation of large assembly
simulation models.
41Chapter 1: From a DMU to FE Assembly Models: current practices
42Chapter 2
Current status of procedural
shape transformation methods
and tools for FEA
pre-processing
The transformation of DMUs into structural analysis models requires the implementation
of methods and tools to efficiently adapt the geometric model and its
associated information. Therefore, this chapter proposes a review of the current
CAD-FEA integration related to data integration and shape transformations. In
this review, the procedural transformations of CAD components are analyzed,
from the identification of details to the dimensional reduction operations leading
to idealized representations. The geometrical operators are also analyzed with
regard to the problem of assembly simulation preparation. Moreover, this chapter
identifies that current geometric operators are lacking application criteria of
simplification hypotheses.
2.1 Targeting the data integration level
Chapter 1 described the industrial needs to reduce the time spent on assembly preparation
pre-processing for FEA, now the objective of this chapter is to understand why
the available procedural geometric modeling methods and operators still do not meet
the engineers’ requirements, leading them to generate interactively their own models.
Different approaches have been proposed for a better interoperability between CAD
and CAE, which can be mainly classified into two categories [DLG∗07, HLG∗08]:
• Integration taking place at a task level: It refers to the integration of activities of
design and structural engineers, hence it relates to design and FEA methodologies
and knowledge capitalization in simulation data management;
43Chapter 2: Current status of methods and tools for FEA pre-processing
• Data integration level: It addresses data structures and algorithms performing
shape transformations on 3D models of standalone components. More generally,
these data structures and operators help connecting CAD and CAE software.
To support the integration of simulation tasks into a PDP, Troussier [Tro99] explains
that the knowledge involved in the generation of geometric models is not explicitly
formalized. The simulation model definition and generation are based on the collective
knowledge of some structure engineers. Therefore, the objective of CAD/CAE
integration is not only to reduce the pre-processing time but also to decrease the level
of expertise needed to choose and apply the correct transformations to CAD models.
Eckard [Eck00] showed that the early integration of structural simulation in a design
process could improve a PDP leading to a shorter time-to-market, which applies to assembly
processing as well as to standalone components. Badin et al. [Bad11, BCGM11]
proposed a specific method of knowledge management used in several interacting activities
within a design process. According to them, structure engineers and designers
collaborate and exchange design information. However, the authors assume that
relationships between dimensional parameters of CAD and simulation models of components
are available, which is not necessarily the case. Additionally, they refer to
configurations where the shapes of components are identical in both the design and
simulation contexts, which is not common practice for standalone components and
hardly applicable to assemblies where the reduction of complexity is a strong issue. To
help structure engineers, Bellenger [BBT08], Troussier [Tro99] and Peak [PFNO98] formalized
simulation objectives and hypotheses attached to design models when setting
up simulations. These objectives and hypotheses are subsequently used for capitalization
and reuse in future model preparations. This integration at a task level underlines
the influence of simulation objectives and hypotheses without setting up formal connections
with the shape transformations required.
Since the industrial problems addressed in this thesis focus on the robust automation
of shape transformations, it seems appropriate to concentrate the analysis of prior
research on the data integration level. These research contributions can categorized in:
• Detail removals performed either before or after meshing a component [LF05,
LAPL05, FMLG09, GZL∗10];
• Shape simplifications applied to facetted models [FRL00, ABA02];
• Idealization of standalone components [CSKL04, SRX07, SSM∗10, RAF11, Woo14]
using surface pairing or Medial Axis Transform (MAT) operators.
Section 2.2 analyzes the two first categories of shape simplifications and Sections 2.3
concentrates on the specific transformation of dimensional reduction, which is widely
used to generate assembly FEMs as illustrated in Section 1.4. Section 2.4 explores
morphological approaches such as the geometric analysis and volume decomposition
of 3D solids to enforce the robustness of FE models generation. Finally, Section 2.5
44Chapter 2: Current status of methods and tools for FEA pre-processing
addresses the evolution of the procedural simplification and idealization during component
pre-processing from standalone components toward an assembly context.
2.2 Simplification operators for 3D FEA analysis
In CAE applications, the removal of details to simplify a component before meshing it
has led to local shape transformations based on B-Rep or polyhedral representations.
These transformations create new geometric entities that can incorporate acceptable
deviations of a FEA w.r.t. reference results. This section analyzes the different operators
and methods aiming at identifying and removing the regions considered as details
on 3D solids.
2.2.1 Classification of details and shape simplification
As explained in Section 1.4, the level of detail of a solid shape required for its FE
mesh is related to the desired accuracy of its FEA. The removal or simplification
of a sub-domain of a solid is valid depending when its associated FEA results meet
the accuracy constraint. Armstrong and Donaghy [DAP00] and Fine [Fin01] define
details as geometric features which do not significantly influence the results of an FE
simulation. Starting from this definition, Fine [Fin01] classifies the details under three
categories:
• Skin details: They represent geometric regions which can be removed without
changing neither the 3-dimensional manifold property of the solid (see Section
1.2.1) nor its topology (see Section 1.2.2). This category includes the removal
of fillets, chamfers, bosses, . . . ;
• Topological details: This category represents geometric regions which can be
removed without changing the 3-dimensional manifold property of the solid but
their removal modifies the solid’s topology. For example, removing a through
hole changes the topology of the solid and the number of hole-loops in the EulerPoincar´e
formula decreases;
• Dimensional details: This category represents geometric regions which can be
removed and reduce locally the manifold dimension of the solid along with a
modification of its topology. This category is related to the idealization process
where entire solid models can be represented either with surfaces (dimensional
reduction of 1), lines (dimensional reduction of 2) or may even be replaced by a
point (dimension reduction of 3).
In this categorization L´eon and Fine [LF05] define the concept of detail from a
physical point of view. According to them, the result of a FEA can be evaluated with
45Chapter 2: Current status of methods and tools for FEA pre-processing
CAD Model
FEM Volume
FEM idealized
Volume region which does not
influence the result of FE simulation
➱ to be considered as detail
Volume which is not
represented in idealized model
➱ cannot be considered as detail
using idealized FEM model
Figure 2.1: Identification of a skin detail related to the accuracy of a FE volume model. With
an idealized model, a skin detail cannot be characterized.
‘a posteriori error estimators’ [EF11, BR78, LL83]. These error estimators characterize
the influence of a discretization process, i.e., the FE mesh generation, over the solution
of the partial differential equations describing a structure behavior. However, as
explained in Section 1.4.3, the behavior simulation of large assemblies is heavily based
on idealized models to reduce the size, as much as possible, of simulation models and
improve their use during a PDP. In this context, skin and topological details cannot
be related to the accuracy of the FEA since the error estimators cannot be applied to
shape transformations subjected to a dimensional reduction. Indeed, a volume region
which does not satisfy the idealization conditions (see Section 1.4.2) is part of an idealized
model but not dimensionally reduced. Therefore, as illustrated in Figure 2.1,
evaluating the physical influence of small volume details using an idealized FEM has no
meaning because the notion of discretization process is not meaningful over the entire
model. When considering idealizations, there is currently no ‘error estimators’ to evaluate
the influence of the dimensional reductions achieved through these transformations.
The definition of skin and topological details has to be discussed and extended in the
context of dimensionally reduced models.
Even if this classification cannot address idealized models, the simplification operators
have to be studied to determine the geometry they are able to process and the
information they are able to provide to reduce the complexity of an idealization process.
Effectively, it is important to evaluate into which extent skin and topological simpli-
fication operators should be applied prior to dimensional reduction or if dimensional
reduction takes place first and further simplifications should operate on the dimensionally
reduced model. Therefore, the next sections detail the principles of the geometric
operators identifying and removing details and determine their suitability to interact
with a dimensional reduction process. As mentioned in [Fou07], these operators aim
at identifying the geometric regions on the 3D object considered as details and then,
remove them from the object in order to generate a simplified model. Approaches to
detail removals can be subdivided in two categories depending on the geometric model
46Chapter 2: Current status of methods and tools for FEA pre-processing
describing the component: those which act on tessellated models1 and those which
modify an initial CAD model.
2.2.2 Detail removal and shape simplification based on tessellated
models
Although a tessellated object is a simplified representation of an initial CAD model,
its geometric model is a collection of planar facets, which can be processed more generically
than CAD models. Therefore, the operators based on tessellated models are
generic enough to cover a large range of geometric configurations. In what follows,
shape simplification operators applicable to the object skin are analyzed first then, a
particular attention is paid to the Medial Axis Transform (MAT) operator which extracts
an object structure.
Shape simplification
Different approaches have been proposed to simplify the shape of a CAD component
using an intermediate faceted model or modifying a FE mesh of this component. These
approaches can be synthesized as follows:
• Dey [DSG97] and Shephard [SBO98] improve directly the FE mesh quality by
eliminating small model features based on distance criteria compared to the targeted
level of mesh refinement. The objective is to avoid poorly-shaped elements
and over-densified mesh areas and the treatments proposed are generic;
• Clean-up operators [JB95, BS96, RBO02] repair the degeneracies of CAD models
when they have lost information during a transfer between CAD/CAE environments
or when they contain incorrect entity connections. Their main issue is
the computational cost to recalculate new geometries more suitable for analysis
[LPA∗03] and the ability of the algorithms to process a wide range of con-
figurations. Furthermore, the geometric transformations are inherently small
compared to the model size, which may not be the case for simulation details;
• Others methods [BWS03, HC03, Fin01, QO12] generate and transform an intermediate
tessellated model derived from the CAD component. Fine [Fin01]
analyses this tessellated geometry using a ‘tolerance envelope’ to identify and
then, remove skin details. Andujar [ABA02] generates new, topologically simpli-
fied, models by discretizing the solid object input using an octree decomposition.
The advantage of these approaches, dedicated to 3D volume FE, holds in their
1Here, it is referred to tessellated models rather than meshes, as commonly used in computer
graphics, to distinguish faceted models used in computer graphics from FE meshes that are subjected
to specific constraints for FE simulations. Here, the term mesh is devoted to FE mesh.
47Chapter 2: Current status of methods and tools for FEA pre-processing
(a) MAT 2D (b) MAT 3D
Medial Axis
Medial Surface
Figure 2.2: Illustration of the MAT: (a) in 2D, (b) in 3D.
independence with respect to the CAD design model. These approaches can support
of a wide variety of shapes while avoiding inherent CAD systems issues, i.e.,
surfaces connections, tolerances, . . . . Nevertheless, any shape modification of the
CAD model cannot be taken into account easily and trigger new iterations of the
simplification process;
• Hamri and L´eon [OH04] propose an intermediate structure, the High Level Topology,
in order to preserve a connection between the tessellated model and the CAD
model. As a result, bi-directional mappings can be set between these models, e.g.,
boundary conditions, B-rep surface types, . . . . However, the shape transformations
are still performed on the tessellated model.
Detail removal using the MAT
To identify shape details in sketches, Armstrong [Arm94, ARM∗95] uses the MAT.
The MAT has been initiated by Blum [B∗67] and represents, in 2D, the shape defined by
the locus of centroids of the maximal inscribed circles in a contour (see Figure 2.2a) or,
in 3D, by the maximal spheres inscribed in a solid (see Figure 2.2b). The combination of
the centerlines and the diameter of the inscribed circle on these centerlines, respectively
the center-surfaces in 3D, forms the skeleton-like representation of the contour in 2D,
respectively the solid in 3D, called MAT.
As described in [ARM∗95], The MAT operator is particularly suited to provide
simplification operators with geometric proximity information in 3D and to identify
geometric details on planar domains. The authors use a size criterion to identify:
• Details in 2D sketches using the ratio between the length of boundary sketch
edges and the radius of the adjacent maximal circle;
• Narrow regions using an aspect ratio between the length of the medial edge to the
maximal disk diameter on this local medial edge. A region is regarded as narrow
when this ratio is lower than a given threshold. In addition, the authors refer to
48Chapter 2: Current status of methods and tools for FEA pre-processing
Geometric model Simplified model
remove
remove
Groove reduced to line
Hole reduced to point
Inner MA
Outer MA
Figure 2.3: Details removal using the MAT and detail size criteria [Arm94].
the principle of Saint-Venant that relates to the boundary conditions location, to
categorize a region as a detail.
This method demonstrates the efficiency of the MAT in 2D to analyze, a priori, the
morphology of sketch contours. It can compare and identify local regions smaller
than their neighborhood. Figure 2.3 illustrates the analysis of a 2D sketch with the
MAT [Arm94] to identify details to be removed or idealized. Here, the MAT is addressed
as a detail removal operator because the manifold dimension of the 2D domain
is not reduced. Nevertheless, it can act also as a dimensional reduction operator.
An analysis of the pros and cons of the MAT as a dimensional reduction operator is
performed in Section 2.3.1.
Operators based on tessellated models may be applied to a large range of configurations
because the input model uses a simple polyhedral definition to represent surfaces
in 3D. These operators are efficient to remove skin details before meshing. Yet, large
modifications of CAD models are difficult to take into account.
2.2.3 Detail removal and shape simplification on 3D solid models
As explained in the introduction of this chapter, simplifying CAD solids before meshing
is a way to enable a robust mesh generation and to obtain directly the shape
required for a FEA without local adjustments of the FE mesh. Transformations can be
classified into two complementary categories: transformations modifying the boundary
decomposition of a B-Rep model without changing the model’s shape, transformations
modifying the shape as well as its boundary decomposition.
Topology adaption
Virtual topology approaches [SBBC00, She01, IIY∗01, LPA∗03, ARM∗95] have been
developed to apply topological transformations to the boundary of an initial B-Rep
49Chapter 2: Current status of methods and tools for FEA pre-processing
Narrow regions
Edge deletion
Face
simplification
(a) (b) (c)
Figure 2.4: Topology adaption of CAD models for meshing [FCF∗08]: (a) CAD model, (b)
Meshing Constraint Topology obtained with the adaption process, (c) Mesh model generated
with respect to Meshing Constraint Topology.
model in order to generate a new boundary decomposition that meet the simulation
objectives of this B-Rep model and express the minimum required constraints for mesh
generation. Virtual topology approaches belong to the first category of transformations.
To anticipate the poorly-shaped mesh elements resulting from B-rep surfaces having a
small area, the operation include splitting, merging edges and clustering faces. Anyhow,
the objective is to contribute to the generation of a boundary decomposition of
a B-Rep model that is intrinsic to the simulation objectives rather being tied to the
decomposition constraints of a geometric modeling kernel. Foucault et al. [FCF∗08]
propose a complementary topology structure called ‘Meshing Constraint Topology’
with automated adaption operators to enable the transformation of CAD boundary
decomposition with mesh-relevant faces, edges and vertices for the mesh generation
process (see Figure 2.4). In addition to the topological transformations (edge deletion,
vertex deletion, edge collapsing and merging of vertices), the data structure remains
intrinsic to the initial object which makes it independent from any CAD kernel representations.
Topology adaption is an efficient operator before mesh generation and
it is available in most CAE software. However, virtual topology operators are neither
generic across CAE software nor they form a complete set of transformations.
Form feature extraction
The main category of solid model simplification is the extraction or recognition of
features (holes, bosses, ribs, . . . ). Different application domains’ requirements lead to a
wide variety of feature definitions. Here, a feature is defined as in [Sha95] and refers to
a primary geometric region to be removed from a B-Rep object and hence, simplifies its
shape. The corresponding operators belong to the second category of transformations.
The simplification techniques initially define a set of explicit geometric areas identified
on an object. Then, specific criteria are applied, for example metrics, to evaluate
and select the candidate features to remove. The construction tree resulting from
components’ design (see Section 1.3) directly provides features that can be evaluated.
50Chapter 2: Current status of methods and tools for FEA pre-processing
(a) (b)
Figure 2.5: Illustration of CAD defeaturing using CATIA: (a) CAD initial model, (b) Simplified
CAD model with holes, fillets and chamfers suppressions.
However, this approach relies on the availability of this tree, which is not always the
case (see Section 1.5.2 on interoperability). Feature recognition approaches are based
on the fact that the construction tree is not transferred from a CAD to a CAE system,
and they process directly the B-rep model to recognize features.
A reference survey of CAD model simplification covering feature recognition techniques
has been performed by Thakur [TBG09]. For specific discussions on geometric
feature recognition see Shah et al. [AKJ01]. A particular domain, mostly studied in
the 80-90s is the recognition of machining features. The methods [JC88, VR93, JG00,
JD03] in this field are efficient in recognizing, classifying and removing negative features
such as holes, slots or pockets. Han et al. [HPR00] give an overview of the
state-of-the-art in manufacturing features recognition. Machining feature recognition
has been pioneered by Vandenbrande [VR93]. Woo et al. [WS02, Woo03] contributed
with a volume decomposition approach using a concept of maximal volume and observed
that some of them may not be meaningful as machining primitives. In the
field of visualization, Lee et al. [LLKK04] address a progressive solid model generation.
Seo [SSK∗05] proposes a multi-step operator, called wrap-around, to simplify CAD
component. To reduce the complexity of assembly models, Kim [KLH∗05] uses this
operator and proposes a multi-resolution decomposition of an initial B-rep assembly
model for visualization purposes. These operators simplify the parts after detecting
and removing small or negative features and idealize thin volume regions using face
pairing. Simplification is based on local information, i.e., edge convexity/concavity,
inner loops, . . . The obtained features are structured in a feature tree depending on the
level of simplification. A wide range of shapes is generated with three basic operators.
However, the multi-resolution model is subjected to visualization criteria, which may
not produce shape transformations reflecting the application of simulation hypotheses,
in general. Lockett [LG05] proposes to recognize specific positive injection molding
features. Her method relies on an already generated Medial Axis (MA) to find features
from idealized models. However, it is difficult to obtain a MA in a wide range of configurations.
Tautges [Tau01] uses size measures and virtual topology to robustly identify
geometric regions considered as details but is limited to local surface modification.
51Chapter 2: Current status of methods and tools for FEA pre-processing
One common obstacle of feature recognition approaches is their difficulty to set
feature definitions that can be general enough to process a large range of configurations.
This is often mentioned by authors when features are interacting with each other
because the diversity of interactions can lead to a wide range of configurations that
cannot be easily identified and structured. In addition, in most cases, the definition
of the geometric regions considered as features is based on a particular set of surfaces,
edges and vertices extracted from the boundary of the B-Rep object. The assumption
is that the detection operations based on the neighboring entities of the features
are sufficient to construct both the volume of the features and the simplified object.
However, the validity of this assumption is difficult to determine in a general setting,
e.g., additional faces may be required to obtain a valid solid, which fairly reduces the
robustness of these approaches.
Blend removal
Removal of blends can be viewed as a particular application of features recognition.
Automatic blend features removal, and more precisely, finding sequences of blend
features in an initial shape, is relevant to FE pre-processing and characterizes shape
construction steps. Regarding blends removal, Zhu and Menq [ZM02] and Venkataraman
[VSR02] detect and classify fillet/round features in order to create a suppression
order for removing these features from a CAD model. CAD software has already proposed
blend removal operators and it is these operators that are considered in this
thesis (see Figure 2.5 for a example of a CAD component defeaturing result). In general,
blend removal can be viewed as a first phase to prepare the model for further
extraction and suppression of features.
2.2.4 Conclusion
This section has shown that detail removals essentially address 3D volume simulations
of standalone components. The suitability of these simplification operators for assembly
structures has not been investigated, up to now. Additionally, the approaches to
the automation of detail removal have not been developed for idealization. The definition
of details addresses essentially volume domains and refers to the concept of
discretization error that can be evaluated with posteriori error estimators. As a result,
the relationship between detail removal and idealization has not been addressed.
Approaches based on tessellated models produce a robust volume equivalent model
but incorporating them with idealization processes, which are often refering to B-Rep
NURBS models, does not seem an easy task. Many features-based approaches exist
but they are not generic enough to process a wide range of shapes.
The operators presented in this section can be employed in a context of CAD to CAE
adaption, provided the areas being transformed are clearly delineated. The difficulty
is to determine the relevant operator or sequence of operators in relation to the user
52Chapter 2: Current status of methods and tools for FEA pre-processing
simulation objective. For now, only operators simplifying surfaces of 3D objects have
been presented, in the following section idealization operators introduce categories of
complexity with the dimensional reduction of standalone components.
2.3 Dimensional reduction operators applied to standalone
components
As explained in Section 1.4, to generate idealized models, operators are required to
reduce the manifold dimension of 3D solids to surfaces or lines. Different approaches
have been proposed to generate automatically idealized models of components for CAE.
These approaches can be divided into two categories:
• Global dimensional reduction. These approaches refer to the application of a
geometric operator over the whole 3D object, e.g., using the MAT that can be
globally applied to this object, to generate an overall set of medial surfaces;
• Local mid-surface abstraction. Mid-surface abstraction addresses the identification
of local configurations characterizing individual medial surfaces (using face
pairs, deflation) on CAD models and, subsequently, handles ithe connection of
these medial surfaces to generate an idealized model.
2.3.1 Global dimensional reduction using the MAT
Armstrong et al. [DMB∗96, ABD∗98, RAF11] come up with the MAT to generate
idealized models from 2D sketches and 3D solids. To identify geometric regions in
shell models, which may be represented in an FE analysis with a 1D beam, Armstrong
et al. [ARM∗95, DMB∗96, DAP00] analyze a skeleton-based representation generated
with the MAT. Although the MAT produces a dimensionally reduced geometry of an
input 2D contour, local perturbations (end regions, connections) need to be identified
and transformed to obtain a model suitable for FEA. As for the details identification of
Section 2.2, an aspect ratio (ratio of the minimum length between the medial edge and
its boundary edges to the inscribed maximum disk along this medial edge) and a taper
criterion (maximum rate of diameter change with respect to medial edge length) are
computed to automatically identify entities that must be either reduced or suppressed.
Based on a user input threshold for aspect ratio and taper, the corresponding areas of
the MAT are categorized into regions idealized either as 1D beam element, or regions
kept as 2D elements, or regions idealized as 0D element (concentrated mass). Beam
ends, that differ from the resulting MAT methodology, are also identified through the
topology of the MAT in order to extend the idealizable regions.
More recently, Robinson and Armstrong [RAM∗06, RAF11] generalize the approach
to 3D solid to identify 3D regions which, potentially, could be idealized as 2D shell
53Chapter 2: Current status of methods and tools for FEA pre-processing
Volume Mesh
in Interface area Idealized
areas
Interface offset
for coupling
Perturbation
in ends MA
(a) (b) (c)
Figure 2.6: Illustration of the mixed dimensional modeling using a MAT [RAF11]: (a) the
MAT representation, (b) the model partitioned into thin and perturbations features, (c) the
resulting mixed dimensional model.
elements. In a first step, a 3D MAT is used to identify potential volume regions. Then,
the MATs of these regions are analyzed by a second 2D MAT to determine the inner
sub-regions which fully meet an aspect ratio between their local thickness and MAT
dimensions. The final candidates for idealization should satisfy the 2D ratio within the
face resulting from the 3D MAT as well as the 3D ratio. Similarly to 2D end regions
derived from a 2D MAT, the residual boundary faces from the MAT 3D are extended.
Some limitations of the MAT with respect to idealization processes are:
• The generation of the MAT. Although progress has been made in MAT generation
techniques for 3D objects, the computation of an accurate 3D MAT is still
a research topic [RAF11]. Even if approaches [CBL11, RG03] exist which enable
the computation of a MAT as a G0 geometric object, 3D MAT from free-form surfaces
[RG10, BCL12], B-splines surfaces [MCD11] and planar polyhedra [SRX07],
the most efficient algorithms are still based on a discrete representations. The
most efficient way to obtain a MAT derives from Voronoi diagrams or from distance
fields [FLM03]. An efficient implementation of an algorithm has been proposed
by Amenta [ACK01] and, more recently, by Miklos [MGP10]. However, the
result is also a discrete representation, which has to be somehow approximated
to produce a more global geometric object;
• The need for processing local perturbations (see Figure 2.6b). For mechanical
analysis purposes, the topological features in ending regions have to be modified
to extend the medial surfaces. These undesirable regions complicate and restrain
the analysis domain of the MAT;
• The connection areas. The MAT generates complex configurations in connection
areas. Armstrong and Robinson [RAF11] produce mixed dimensional FE models
with idealized surfaces or lines and volume domains in the connections between
54Chapter 2: Current status of methods and tools for FEA pre-processing
these regions (see Figure 2.6). These mixed dimensional models, which involve
specific simulation techniques using mixed dimensional coupling, do not contain
idealized models in connections areas. In addition, to ensure an accurate load
transfer from one surface to another, they increase the dimensions of volume
connections based on the Saint-Venant’s principle (see Figure 2.6c). As a result,
the idealized areas are reduced. However, the current industrial practice, as
explained in Section 1.4.3, aims at generating fully idealized models incorporating
idealized connections. This practice reduces the computational time, reducing
the number of degrees of freedom, and ensures a minimum model accuracy based
on user’s know-how. In this context, the major limit of MAT methods is the
processing of these connections areas which do not contain proper information to
link medial surfaces.
2.3.2 Local mid-surface abstraction
To generate fully idealized models, alternative approaches to MAT identify sets of
boundary entities of the CAD models as potential regions to idealize. Then, midsurfaces
are extracted from these areas and connected together.
Face pairing techniques
Rezayat [Rez96] initiated the research in mid-surface abstraction from solid models.
His objective was to combine the geometric and topologic information of the B-rep
model to robustly produce idealized models while transforming geometric areas. This
method starts with the identification of surfaces which can be paired based on a distance
criterion between them. During this identification phase, an adjacency graph is
generated representing the neighbouring links between face-pairs. This graph uses the
topological relationships of the initial B-rep model. Then, for each face-pair, a midsurface
is generated as the interpolation of this geometric configuration, as illustrated
in Figure 2.7a. During the final step,the mid-surfaces are connected together using the
adjacency graph of the B-Rep model (see Figure 2.7b). Although this method generates
fully idealized models close to manually created ones, the underlying issue is the
identification of areas that could potentially be idealized. Indeed, the identification
of face-pairs does not ensure that the thickness, i.e., the distance between face-pairs,
is as least ten times smaller than the other two directions (see idealization conditions
described in Section 1.4.2). The areas corresponding to these face pairs is designated
here as tagged areas. In addition, the connection between mid-surfaces requires the
definition of new geometric entities which result from an intersection operator. This
intersection operator solely relies on the boundary of the areas to be connected, i.e, the
face-pairs. There is no information about the boundary of the regions to be idealized
as well as the interface areas between their mid-surfaces, e.g., limits of valid connections
areas. As illustrated in Figure 2.8d, this information does not appear directly
55Chapter 2: Current status of methods and tools for FEA pre-processing
F2
F1
Mid-surface
(a) (b)
Figure 2.7: Illustration of mid-surface abstraction [Rez96], (a) creation of mid-surfaces from
face-pairs, (b) connection of mid-surfaces to generate a fully idealized model.
F1 F2 F3
F5 F4
F6
F1
F3
F4
F6
F3
F6
F1 F2 F3
F5 F4
F6
Fi / Fj
Invalid face pair
Valid face pair
Fi / Fj
F1
F3
F4
F6
Tagged boundary
Non-tagged boundary
Interface between regions to be idealized
Regions to be idealized
Rejected
configuration
Rejected
configuration
Accepted
configuration
CAD
Mid-surface results
Face-pair information
(a)
(b)
(c)
(d)
Figure 2.8: An example of particular geometric configuration not addressed by face-pairs
methods: (a) Valid configuration without mid-surface connection, (b) and (c) rejection of
an invalid face-pair due the overlapping criterion, (d) information on non-tagged areas and
interfaces between idealizable regions that are not evaluated with face-pairs methods.
on the initial model. These areas are the complement of tagged areas with respect
to the boundary of the initial model; they are named non-tagged areas. As a result,
mid-surface abstraction are reduced to specific geometric configurations when the facepairs
overlap each other. As depicted in Figure 2.8, the face-pairs F3-F6 and F2-F5
are rejected due to the overlapping criterion. So, the idealized configurations 2.8b and
c are rejected whereas they could be suitable for FEA.
In order to improve the robustness of idealized areas processing, Lee and al. [LNP07a]
use a propagation algorithm through the B-rep model topology to identify face-pairs.
However, this approach is limited to configurations where the face-pairs can be connected
in accordance with predefined schemes. Ramanathan and Gurumoorthy [RG04]
identify face-pairs through the analysis of mid-curve relationships of all the faces of the
solid model. For each face, its mid-curve is generated using a 2D MAT. This generation
is followed by the analysis of the mid-curve graph in order to identify face-pairs.
The resulting mid-faces, derived from face-pairs, are then connected to each other in
56Chapter 2: Current status of methods and tools for FEA pre-processing
accordance with the mid-curve adjacency graph. This method increases the robustness
of face-pairing, indirectly using the morphology of the paired faces. Analyzing the midcurve
relationships of adjacent faces enables a morphological comparison of adjacent
faces. Since mid-curves have been obtained through a MAT, the face-pairs identifi-
cation depends on the accuracy of this mid-curve generation. This method comes up
with face-pairs close to each other and sufficiently large along the two other directions
to meet the idealization hypothesis. However, this approach is limited to planar areas.
Negative offsetting operations
Sheen et al. [SSR∗07, SSM∗10] propose a different approach to generate mid-surfaces:
the solid deflation. The authors assume that a solid model can be seen as the result of
the inflation of a shell model. Their principle is to deflate the solid model, shrinking it
down to a degenerated solid with a minimum distance between faces close to zero. This
generates a very thin solid model looking like an idealized model. In a next step, faces
are extracted and sewed together to create a non-manifold connected surface model.
The issue of this method lies in the generation of the deflated model. Indeed, a facepairs
detection is used to generate the mid-surfaces input to the shrinking operation.
This face-pair detection does not cover configurations with a thickness variation, which
is common for aeronautical parts and other mechanical components. This approach is
similar to a straightforward MAT generation [AA96, AAAG96], which applies a negative
offset to boundary lines in 2D, surfaces in 3D, respectively, in order to obtain a
skeleton representation. Yet, this representation being an approximation of the MAT,
it does not meet everywhere the equal distance property of a mid-surface and does not
provide an answer for all polyhedral solids [BEGV08].
2.3.3 Conclusion
As explained in Section 1.4 and 1.5, the shape of a component submitted to a mesh
generation depends on the user’s simulation objectives. This analysis of dimensional
reduction operators highlighted the lack of idealization-specific information to delimit
their conditions of application. All geometric regions do not satisfy the idealization
conditions and hence, these idealization operators cannot produce correct results in
these areas. A purely geometric approach cannot produce directly a fully idealized
model adapted to FEA requirements. An analysis process is necessary to evaluate the
validity of the idealization hypotheses and determine the boundary and interfaces of
the regions to be idealized.
The MAT is a good basis to produce a 3D skeleton structure and provides geometric
proximity information between non adjacent faces. However, it is difficult to obtain in
3D and requires post-processing local perturbations and connection areas. Face-pair
techniques are efficient in specific configurations, especially for planar objects. Yet,
their main issues remain in their validity with respect to the idealization hypotheses and
57Chapter 2: Current status of methods and tools for FEA pre-processing
1
2
Kinematic
connection Shortest distance
Offset connection
Perpendicular
connection
1
2
Figure 2.9: Illustration of different connection models for idealized components.
difficulties to process the connection between mid-faces. As illustrated in Figure 2.9,
the connection areas derive from specific modeling hypotheses. The user may decide on
the connection model that is most appropriate for his, resp. her, simulation objectives.
To improve the dimensional reduction of components, the objectives are expressed
as:
1. Identify the volume sub-domains candidate to idealization, i.e., the regions that
meet the idealization hypotheses;
2. Obtain additional information on interfaces between sub-domains to generate
robust connections there.
2.4 About the morphological analysis of components
As a conclusion of the previous Section 2.3, geometric operators require a pre-analysis
of a component shape to determine their validity conditions. Shape decomposition is a
frequent approach to analyze and then structure objects. This section aims at studying
the operators dedicated to a volume decomposition of 3D objects with an application
to FEA.
2.4.1 Surface segmentation operators
There are many methods of 3D mesh2 segmentation developed in the field of computer
graphics. They are mainly dedicated to the extraction of geometric features from these
3D meshes. A comparative study of segmentation approaches of 3D meshes, including
2The word mesh is used in the computer graphics context, which refers to a faceted model with no
constraint similar to FE meshes.
58Chapter 2: Current status of methods and tools for FEA pre-processing
(a) (b)
Figure 2.10: Mesh Segmentation: (a) face clustering of Attene [AFS06], (b) shape diameter
function of Shapira [SSCO08].
CAD components, is proposed by Attene et al. [AKM∗06]. Reference work by Hilaga
[HSKK01] applies a Reeb-graph approach to find similarities between 3D shapes.
Watershed [KT03, Kos03], spectral analysis [LZ04], face clustering [AFS06], regions
growing [ZPK∗02, LDB05], shape diameter functions [SSCO08] are other techniques
to subdivide a 3D mesh for shape recognition, part instantiation, or data compression.
Figure 2.10 illustrates two mesh segmentation techniques [AFS06, SSCO08] on
a mechanical part. These algorithms are not subjected to parameterization issues like
B-Rep CAD models are. They partition a mesh model into surface regions but do
not give a segmentation into volume sub-domains and region boundaries are sensitive
to the discretization quality. A post-processing of the surface segmentation has to be
applied to obtain volume partitions.
The main objective of the methods cited above is to divide the object in accordance
with a “minima rule” principle introduced by Hoffman and Richards [HR84]. This rule
consists in dividing this object to conform to the human perception of segmentation.
The authors state that human vision defines the edges of an object along areas of high
negative curvature. Hence, the segmentation techniques divide a surface into parts
along contours of negative curvature discontinuity. In these areas, the quality of an
algorithm is based on its ability to meet this “minima rule”. Searching for regions
of high concavity, algorithms are sensitive to local curvature changes. Depending on
the threshold value of extreme curvature, the object may be either over-segmented
or under-segmented. Even if this threshold is easier to monitor for CAD components
because they contain many sharp edges, the curvature criterion is not related to the
definition of idealized areas. Consequently, the methods using this criterion do not
produce a segmentation into regions satisfying the idealization hypotheses and regions
that can be regarded as volumes.
This section has covered surface segmentation operators that are not appropriate
in the context of a segmentation for idealization. The next section studies volume
segmentation operators producing directly a decomposition of a solid model into volume
partitions.
59Chapter 2: Current status of methods and tools for FEA pre-processing
Thin-sheet
region in green
(thin-sheet meshable)
(a) (b)
Semi-structured
hybrid mesh
of thick region
(c)
Long/slender region in blue
(swept mesh)
Complex region in yellow
(unstructured mesh)
Figure 2.11: Automatic decomposition of a solid to identify thick/thin regions and long
and slender ones, from Makem [MAR12]: (a) initial solid model, (b) segmented model, (c)
semi-structured hybrid mesh of thick regions.
2.4.2 Solid segmentation operators for FEA
Recently, researches concentrated on the identification of specific regions to automatically
subdivide a complex shape before meshing. They address shape transformations
of complex parts. The automatic segmentation of a mechanical component into volume
regions creates a positive feature decomposition, i.e., the component shape can be
generated by the successive merge of the volume regions. This principle particularly
applies to dimensional reduction processes, i.e, idealizations.
Volume region identification for meshing
In FEA, solid segmentation methods have been developed to simplify the meshing
process. The methods of Lu et al. [LGT01] and Liu and Gadh [LG97] use edge loops
to find convex and sweepable sub-volumes for hex-meshing. More recently, the method
proposed by Makem [MAR12] automatically identifies long, slender regions (see Figure
2.11). Makem [MAR12] shows that the decomposition criteria have to differ from
the machining ones. Heuristics are set up to define the cutting strategy and to shape
the sub-domains based on loops characterizing the interaction between sub domains.
Setting up these heuristics is difficult due to the large diversity of interactions between
sub-domains. Criteria for loop generation aim at generating a unique decomposition
and are not able to evaluate alternatives that could improve the meshing scheme.
To reduce the complexity of detecting candidate areas for dimensional reduction,
Robinson and al. [RAM∗06] use preliminary CAD information to identify 2D sketches
employed during the generation of revolving or sweepable volume primitives in construction
trees. Figure 2.12 illustrates this process: the sketches are extracted from the
construction tree, analyzed with a MAT to determine thin and thick areas forming a
feature. Then, this feature is reused as an idealized profile to generate a mixed dimensional
model. However, in industry, even if the construction tree information exists in a
native CAD model, the creation of features depend on the designer’s modeling choices,
60Chapter 2: Current status of methods and tools for FEA pre-processing
2D Sketch of
a revolution feature
Slender regions
to revolve as surface
3D CAD Component
(volume)
Mix dimensional Model
(volumes and surfaces)
Figure 2.12: Idealization using extruded and revolved features in a construction tree,
from [RAM∗06].
which do not ensure to obtain appropriate sketches mandatory to get efficient results.
Divide-and-conquer approaches
An alternative to the complexity of the idealization process can be found in divideand-conquer
approaches. Firstly, the solid is broken down into volume sub-domains,
which are smaller to process. Then, idealizing these sub-components and combining
them together produces the final idealized model.
Chong [CSKL04] proposes operators to decompose solid models based on shape
concavity properties prior to mid-surface extractions that reduce the model’s manifold
dimension. Mid-surfaces are identified from closed loops of split edges and sub-domains
are processed using mid-surfaces. The solid model decomposition algorithm detects
thin configurations if edge pairs exist in the initial model and matches an absolute
thickness tolerance value. Some volume regions remain not idealized because of the
nonexistence of edges-pairs on the initial object.
In the feature recognition area, Woo et al. [WS02, Woo03] set a volume decomposition
approach using a concept of maximal volume. Their decomposition is based
on local criteria, i.e., concave edges, to produce the cell decomposition. Consequently,
Woo et al. observe that some maximal volumes may not be meaningful as machining
primitives and further processing is required in this case to obtain machinable
sub-domains. Recently, Woo [Woo14] describes a divide-and-conquer approach for
mid-surface abstraction (see Figure 2.13). A solid model is initially decomposed into
simple volumes using the method of maximal volume decomposition [WS02, Woo03] as
well as feature recognition of Sakurai [Sak95, SD96]. The mid-surfaces are extracted
from these simple volumes using face-pairing. Then, face-pairs are connected using a
union Boolean operation, thus creating a non-manifold surface model. Finally, a ge-
61Chapter 2: Current status of methods and tools for FEA pre-processing
Figure 2.13: Divide-and-conquer approach to idealization processes using a maximal volume
decomposition (by Woo [Woo14]).
ometric operator identifies and removes local perturbations of mid-surfaces which do
not correspond to the faces of the original model. The major objective of this approach
is the complexity reduction of the initial mid-surface abstraction. It increases the robustness
of the face paring algorithm by applying it on simpler volumes. However, the
connections between mid-surfaces are based on the topology of the initial solid without
any analysis of its shape related to the user’s simulation objectives. Some solids
can be topologically identical but differ in their morphology. Consequently, a morphological
analysis of their shape is mandatory to identify the sub-domains subjected to
dimensional reduction and to understand the interactions between these sub-domains
through their interfaces. Here, the idealization processes are still restricted to a purely
geometrical operator that does not integrate user’s simulation objectives. Additionally,
this method faces difficulties to handle general configurations and connections between
idealized sub-domains through mid-surface extension operations.
B-Rep decomposition through feature trees
As observed in Section 2.2, the feature recognition techniques are a way to extract
volume sub-domains from B-Rep solids. They support segmentation processes for detail
removal but do not provide construction process structures of these B-Rep solids. To
this ens, different approaches have been proposed to decompose an object shape into
a feature tree.
Shapiro [SV93] and Buchele [BC04] address the B-Rep to CSG conversion as a
means to associate a construction tree with a B-Rep model. Buchele [BC04] applies this
principle to reverse engineering configurations. CSG tree representations can be categorized
into either half-space or bounded solid decompositions. In [SV93, BC04] B-Rep
to half-space CSG representation is studied and it has been demonstrated that half-
62Chapter 2: Current status of methods and tools for FEA pre-processing
spaces solely derived from a volume boundary cannot always be integrated into a CSG
tree forming a valid solid. In Buchele [BC04], Shapiro and Vossler’s approach [SV93]
is complemented to generate a CSG representation from scanned objects and to obtain
both its geometry and topology. There, additional algorithms must be added to
produce complementary half-spaces. Moreover, the meaning of half-space aggregations
is not addressed, i.e., there is no connection between the volume faces and primitives
that can be used to create it.
Li and al. [LLM06, LLM10] introduce a regularity feature tree used to highlight
symmetry in a solid that differs from CSG and construction trees. This tree structure
is used to highlight symmetry properties in the object but it neither provides a CSG
tree nor primitive entities that could serve as basis for idealization applications. Belaziz
et al. [BBB00] propose a morphological analysis of solid models based on form features
and B-Rep transformations that are able to simplify the shape of an object and enable
simplifications and idealizations. Somehow, this method is close to B-Rep to CSG
conversion where the CSG operators are defined as a set of shape modifiers instead of
Boolean operators. Indeed, the shape modifiers are elementary B-Rep operators that
do not convey peculiar shape information and each stage of the morphological analysis
produces a single tree structure that may not be adequate for all simplifications and
idealizations.
All the approaches generating a CSG type tree structure from a B-Rep bring a
higher level shape analysis with connections to a higher level monitoring of shape transformations,
symmetry properties. . . However, the corresponding framework of B-Rep
to CSG conversion must be carefully applied to avoid unresolvable boundary configurations.
Furthermore, producing a single tree structure appears too restrictive to cover
a wide range of shape transformation requirements.
2.4.3 Conclusion
Solid segmentation operators directly provide a volume decomposition of the initial
object. A segmentation brings a higher level of geometric information to the initial
B-Rep solid. Previous methods have shown the possibility to generate a segmentation
or, even construction processes, from an initial CAD model. Therefore, the current
operators:
• do not always produce a complete segmentation, e.g., not all features are identified,
and this segmentation is not necessarily suited for idealization due to
algorithms focusing on other application areas;
• may be reduced to simple configurations due to a fairly restrictive definition of the
geometric areas being removed from the solid. Furthermore, if these operators
generate also a construction process, it is restricted to a single process for a
component;
63Chapter 2: Current status of methods and tools for FEA pre-processing
• could produce a complete segmentation, e.g., divide and conquer approaches,
but they do not ensure that the volume partitions are also simple to process and
usable for mid-surfacing.
A more general approach to volume decomposition should be considered to depart
from a too restrictive feature definition while producing volume partitions relevant for
idealization purposes. Therefore, the difficulty is to find adequate criteria to enable a
segmentation for dimensional reduction and connections operators.
The previous sections have presented the main methods and tools for FEA preprocessing
and, more specifically, for idealization processes in a context of standalone
components. The next section describes the evolution of these operators toward an
assembly context.
2.5 Evolution toward assembly pre-processing
Currently, the industrial need is to address the simulation of assembly structures. However,
few contributions address the automation of assembly pre-processing. Automated
simplifications of assembly for collaborative environment like the multi-resolution approach
of Kim [KWMN04] or surface simplification of Andujar [ABA02] transform assembly
components independently from each other. This is insufficient to pre-process
FE assembly models because mechanical joints and interfaces tightening the different
components must take part to these pre-treatment (see Chapter 1.4).
Group of components transformations
In the assembly simplification method of Russ et al. [RDCG12], the authors propose
to set component dependencies to remove groups of components having no influence
on a simulation, or to replace them by defeatured, equivalent ones. However, the
parent/child relationships created from constraint placement of components does not
guarantee to obtain the entire neighborhood of a component because these constraints
are not necessarily related to the components’ geometric interfaces. As explained in
Section 1.3.1, these positioning constraints are not necessarily equivalent to the geometric
areas of connections between components. Additionally, DMUs don’t contain
components’ location constraints when assemblies are complex, which is the case in
the automotive and aeronautic industries to ease design modifications during a PDP.
Moreover, part naming identification used in this approach is not sufficient because it
locates individual components contained in the assembly, only. Relations with their
adjacent components and their associate geometric model are not available, i.e., replacing
a bolted junction with an idealized fastener implies the simplification of its nut
and its screw as well as the hole needed to connect them in the tightened components.
64Chapter 2: Current status of methods and tools for FEA pre-processing
Small areas
difficult to mesh
(c) (d) (e)
(a) (b)
Figure 2.14: Assembly interface detection of Jourdes et al. [JBH∗14]: (a) CAD bolted junction
with three major plates, (b) some interfaces, (c) cut through of a bolt of this junction, (d)
corresponding interfaces, (e) detail of a small geometric area between an interface and the
boundary of the component.
Interface detection
To provide mesh compatibility connectivity, i.e., an interface between two components
ensures the same mesh distribution in the interface area of each component,
Lou [LPMV10] and Chouadria [CV06] propose to identify and re-mesh contact interfaces.
Quadros [QVB∗10] establishes sizing functions to control assembly meshes. Yet,
these methods are used directly on already meshed models and address specific PDP
configurations where CAD models are not readily available. Clark [CHE08] detects
interfaces in CAD assemblies to create non-manifold models before mesh generation
but he does not consider the interactions between interfaces and component shape
transformation processes. In [BLHF12], it is underlined that if a component is simplified
or idealized, its shape transformation has an influence on the transformation of
its neighbors, e.g., a component idealized as a concentrated mass impacts its interfaces
with its neighboring components.
Assembly operators available in commercial software are reduced to, when robust
enough, the automated detection of geometric interfaces between components. However,
their algorithms use a global proximity tolerance to find face-pairs of components
and they don’t produce explicitly the geometric contact areas. From a STEP representation
of an assembly model, Jourdes and al. [JBH∗14] describe a GPU approach
65Chapter 2: Current status of methods and tools for FEA pre-processing
1 2
1 2
1 2
1
Idealized with contact V1
Assembly
interfaces
Component 1
interfaces
CAD assembly of two
components
Idealizable areas of
components
FEM models
Full idealized
Mix dimensional with contact
Specific Connector
1 2 1 2
1
Idealized with contact V2
1 2
Idealized with contact V3
1 2
Idealized with contact V4
Kinematic connection
Figure 2.15: Various configurations of the idealization of a small assembly containing two
components.
to automatically detect the exact geometric regions of interfaces between components
(see Figure 2.14). The results of this technique are used in this thesis as input assembly
interfaces data. Yet, obtaining the geometric regions of interfaces is not sufficient, they
have to be analyzed to evaluate their suitability with respect to meshing constraints.
Figure 2.14e shows the creation of small surfaces, which are difficult to mesh, resulting
from the location of an interface close to the boundary of component surfaces.
To reach the requirements of assembly idealizations, the current geometric operators
have to take into account the role of assembly interfaces between components,
with respect to the shape transformations of groups of components. Figure 2.15 shows
the idealization of an assembly containing two components. The idealization of ‘component
1’ interacts with the idealization of ‘component 2’, and both interact with the
user’s choice regarding the assembly interface transformation. Depending on the simulation
objectives, the user may obtain either an idealized model of the two components
with contact definition, or a globally idealized model from the fusion of the two component.
The user may even apply a specific connector model which does not require
any geometry other than its two extreme points.
Assemblies bring a new complexity level into idealization processes since the shape
of the components and their interactions with their neighbors have to be analyzed
before applying geometric operators.
66Chapter 2: Current status of methods and tools for FEA pre-processing
2.6 Conclusion and requirements
The research review in this chapter combined with the context described in Chapter
1 shows that CAD/CAE integration is mainly oriented toward the data integration
of standalone components, preparations of assembly models under global simulation
objectives require an in-depth analysis and corresponding contributions.
Regarding standalone component processing, although automated operators exist,
they are currently effective on simple configurations only. To process complex models,
the engineer interactively modifies the component using shape transformation operators
according to his/her a priori expertise and evaluation of the simulation model being
created. These specific operators, among which some of them are already available in
CAE software, have to be selected and monitored by the engineer. Their applications
still require lots of manual interactions to identify the regions to transform and correct
unintended geometric perturbations. Because of the diversity of simulation contexts,
the preconceived idea of applying a generic geometric operator to every component
to perform any simplification or idealization, is not valid and must evolve toward
simulation context-dependent operators.
The selection of mechanical hypotheses, because of their impact on the DMU model,
should also be part of the automation of a mechanical analysis pre-processing. This
issue is particularly crucial when performing dimensional reductions on a component.
Generating an idealized equivalent model cannot be reduced to the simple application of
a dimensional reduction operator. The effects of idealization hypotheses are supposed
to have established the connection between the component shape and its simulation
objectives. This connection can be made through the identification of geometric areas
candidates to idealizations and associated with the connections between idealized subdomains.
An analysis of the component shape, subdividing it into idealizable areas
and interfaces between them (see Figure 2.15), is a means to enrich the input CAD
solid and prepare the geometry input to dimensional reduction operators. The current
volume segmentation operators are restricted to configurations focusing on particular
application domains. They often produce a single segmentation into sub-volumes and
instantiate the same problem on rather simple configurations. Achieving good quality
connections between idealized sub-domains in a robust manner is still a bottleneck of
many approaches processing CAD solids for FEA, which requires new developments.
Regarding assembly model processing, there is currently a real lack in scientific
research and software capabilities, both. To reach the objective of large assembly
structural simulation, pre-processing the DMU, which conveys the product definition,
has also to be automated. Assembly simulation models, not only require the availability
of the geometric model of each component, but they must also take into account the
kinematics and physics of the entire assembly to reach the simulation objectives. This
suggests that the entire assembly must be considered when specifying shape transformations
rather than reducing the preparation process to a sequence of individu-
67Chapter 2: Current status of methods and tools for FEA pre-processing
ally prepared components that are correctly located in 3D space. As mentioned in
Section 1.5.4, to adapt an assembly to FEA requirements, it is mandatory to derive
geometric transformations of groups of components from simulation objectives and
component functions. As it results from Chapter 1, the knowledge of interface’s geometries
and additional functional information on components and their interfaces is a
good basis to specify these geometry transformation operators on assemblies. In addition,
to perform assembly idealizations, structuring geometric models of components in
areas to be idealized and component interfaces, is consistent with the assembly structure,
i.e., its components and their interfaces. Such a component geometric structure
helps preserving the DMU consistency.
68Chapter 3
Proposed approach to DMU
processing for structural
assembly simulations
This chapter sets the objectives of the proposed approach to DMU pre-processing
for the simulation of FE structural assembly models. To obtain an efficient transformation
of a DMU into a FEM requires geometric operators that process input
geometric models which have been structured and enriched with additional functional
information. With respect to the objectives set up, the proposed approach
uses this enriched DMU, both at 3D solid and assembly levels, to analyze its
geometry and connect it to the simulation hypotheses with the required shape
transformations.
3.1 Introduction
Chapter 1 has pointed out the industrial context and identified the general problem
definition addressed in this thesis. The current practices about model generation for
structural mechanical analyses have been described, especially when the resolution is
performed using the FE method. Chapter 2 has analyzed the approaches of academia
that investigate the automation of FE models generation. The need for shape analysis
as a basis of robust geometric transformation operators has been underlined and the
lack of research in assembly pre-processing has been pointed out. Figure 3.1 summarizes
the manual processes of a DMU transformation for the FEA of assembly structures.
The analysis of the ongoing practices has been stated in Section 1.5. A main issue,
observed in the aeronautical industry, is the manual and isolated application of geometric
transformations on each component of the assembly. An assembly component is
considered as a standalone part and the user iterates his, resp. her, global simulation
objective on each component as well as on each assembly interface. As a result, the
69Chapter 3: Proposed approach to DMU processing for structural assembly simulations
· Pure CAD geometric model;
· No contact;
· Junction considered as
individual component.
DMU EXTRATION PREPROCESSING
· Manual transformation of individual
component (idealization);
· Manual definition of contacts
between components;
SIMULATION
x45
x45
DMU FEM
CAD/CAE
weak link
Non standardized processes
and tools for all category of
assembly component
Lessons learned
Simulation
Objective
Simulation
Objective
Simulation
Objective
DATA
PROCESSES
: Processes
: Data
Figure 3.1: Current process to prepare assembly structures. Each component of the assembly
is transformed individually.
use of FEA in aeronautical industry is bounded by the time required to set up its associated
FEM. Now, the major challenge is the automation of some FEA preparation
tasks so that more simulations can be performed on assembly models.
3.2 Main objectives to tackle
As stated in Chapter 2: ‘generating an idealized equivalent model cannot be reduced
to the simple application of a dimensional reduction operator’. Indeed:
1. Generating simulation models from DMUs requires the selection of the CAD components
having an influence on the mechanical behavior the engineer wants to
analyze. Setting up the simulation requires, as input, not only the 3D geometric
model of component shapes but also their functional information that help
selecting the appropriate components (see Section 1.5.4);
2. A DMU assembly is defined by a set of 3D components and by the interactions
between them. To automate the preparation of FE assembly models, it is mandatory
to take into account the interfaces between components (see Section 1.4.3).
An assembly interface, not only contains the geometric information delimiting
the contact/interference areas on each component, but contains also the ‘functional’
information characterizing the behavior of the interface, e.g., clamping,
friction, . . . ;
70Chapter 3: Proposed approach to DMU processing for structural assembly simulations
3. To generate idealized components, i.e., the dimensional reduction process of 3D
volumes into equivalent medial surfaces/lines, two main aspects have to be considered:
• A 3D shape is generally complex and requires different idealizations over
local areas depending on the morphology of each of these areas (see Section
2.3);
• Interfaces between components have an influence on the choice made for
these local idealizations. Therefore, the idealization operator has to take
into account this information as a constraint, which is not the case of current
idealization operators (see Section 2.5).
To address the problem of the FEM preparation of large assembly structures, this
chapter introduces an analysis-oriented approach to provide enriched DMUs before geometric
transformations. The following sections explain the principles and contributions
of this approach, which are subsequently detailed in the next chapters:
• Section 3.3: This section shows that existing approaches are able to provide a
certain level of functional information. Two main approaches have been exploited.
The method of Jourdes et al. [JBH∗14] generates assembly interfaces from DMU
models and the method of Shahwan et al. [SLF∗12, SLF∗13] provides functional
designation of components. These methods can be used in our current preprocessing
approach to provide enriched DMUs before geometric transformations
take place. Nevertheless, some improvements are proposed to take into account
the geometric structure of components required for an idealization process;
• Section 3.4: idealization operators necessitate an estimation of the impact of
the idealization hypotheses over a component shape, i.e., the identification of
areas candidate to idealization. This section sets our objectives to achieve a
robust assembly idealization process. They consist in structuring a component’s
shape and taking advantage of this structure to perform a morphological analysis
to identify areas conforming to the user’s simulation hypotheses. Subsequently,
these hypotheses are used to trigger the appropriate idealization operator over
each area;
• Section 3.5: this section outlines the proposed processes exploiting an enriched
DMU to robustly automate the major time-consuming tasks of a DMU preparation.
3.3 Exploiting an enriched DMU
Efforts have been made to improve:
71Chapter 3: Proposed approach to DMU processing for structural assembly simulations
• the coordination between engineers in charge of structure behavior simulations
and designers;
• the use of simulation results during a design process.
However, as described in Section 1.3, the DMUs automatically extracted from the
PLM are not suited for FE simulations. Because of the product structure, DMUs do
not contain structural components, only. DMU components have to be filtered during
the early phase of FEA pre-processing to avoid unnecessary geometric treatments on
components which are considered as details at the assembly level. As explained in
Section 1.5.1, this process is based on a qualitative judgment exploiting engineers’
know-how. A way to increase robustness of this extraction process, is to have available
more useful information for the engineers. At least, this information must contain the
functional properties of components.
In addition, considering that the extracted DMU is coherent and contains the exact
set of components subjected to shape transformations, the amount of information
which can be extracted from the PLM system is not sufficient to set up a robust and
automated pre-processing approach to simulations. Even though the extraction of additional
meta-data can be improved (see Section 1.5.4), FEM pre-processing requires
the exact interface areas between components as well as the functional designation of
each component, which are not available in PLM systems, at present.
A main objective of this thesis is to prove that a quantitative reasoning can be made
from an enriched and structured DMU to help engineers determining the mechanical
influence of components under specific simulation objectives.
Benefiting from existing methods that identify functional interfaces and
functional designation of components in DMUs
The method of Jourdes et al. [JBH∗14] presented in Section 2.5, detects geometric
interfaces between components. Starting from an input B-Rep model, i.e.,
a STEP [ISO94, ISO03] representation of an assembly, the algorithm identifies two
categories of interfaces as defined in Section 1.3.2: surface and linear contacts, and
interferences.
The information regarding assembly interfaces are used by Shahwan et al. [SLF∗13]
to provide, through a procedural way, functional information linked to DMUs.
Even if Product Data Management System (PDMS) technology provides the component
with names referring to their designation, this information is usually not suf-
ficient to clearly identify the functions of components in an assembly. For example,
in AIRBUS’s PLM, a component starting with ‘ASNA 2536’ refers to a screw of type
‘Hi-Lite’ with a 16mm diameter. This component designation can be associated under
specific conditions to an ‘elementary function’, e.g., fastening function in the case of
‘ASNA 2536’. However, information about each component designation does not iden-
72Chapter 3: Proposed approach to DMU processing for structural assembly simulations
Bolted junction
Nut
Counter nut
Planar Support
Planar Support
Planar Support
Threaded Link
Cap-screw
Initial Geometry Functional Interfaces Functional Designation
Head
Tightened
Components
Thread Shaft
Figure 3.2: Structuring a DMU model with functional properties after analyzing the assembly
geometric interfaces and assigning a functional designation to each component (from Shahwan
et al. [SLF∗12, SLF∗13]).
tify its relation with other components inside the scope of a given function, i.e., the
geometric model of a component is not structured with respect to its function. How
an algorithm can determine which component is attached to another one to form a
junction? Which screw is associated with which nut? Additionally, there is a large
range of screw shapes in CAD component libraries. How to identify specific areas on
these screws through names only? Also, the word screw is not a functional designation;
it does not uniquely refer to a function because a screw can be a set screw, a
cap screw, . . . Therefore, to determine rigorously the functional designation of components,
Shahwan et al. [SLF∗12, SLF∗13] inserted a qualitative reasoning process that
can relate geometric interfaces up to the functional designation of components, thus
creating a robust and automated connection between 3D geometric entities and functional
designations of components. This is a bottom-up approach that fits with our
current requirements.
The complete description of a DMU functional enrichment can be found in [SLF∗13].
Figure 3.2 shows the result of the functional enrichment of the aeronautical root-joint
use-case presented in Figure 1.6. Initially, the DMU was a purely geometric model.
Now, it is enriched with the functional designation of components. Using the definition
of Shahwan et al. [SLF∗13], a functional designation of a component is an unambiguous
denomination that functionally distinguishes one class of components from another.
It relates the geometric model of a component with its functional interfaces (derived
from the conventional interfaces described in Section 1.3.2) and with the functional
73Chapter 3: Proposed approach to DMU processing for structural assembly simulations
DMU 1 DMU 1 2 DMU 1 2 3
C1
C2
C3
C1
C2
C3
CAD
+ PLM
Product Structure
3- Functional
designations
1- PLM
information
2- Assembly
interfaces
I1/3
I2/3 S1
S2
S3.1
C2 S3.2
C1
C3
Fct.1
C3
C1 C2
S1 S2
I1/3
S3.1 S3.1
I2/3
Graph of assembly
interfaces and functions
CAD + assembly interfaces +
component functional designation
Fct.1 C1 C2 C3
C1 : Plate
C2 : Plate
C3 : Screw
C1 C2
S1 S2
Imprint
of interface
CAD + assembly
interfaces
C1 C2
S1 S2
I1/2
Graph of assembly
interfaces
Interface
Figure 3.3: DMU enrichment process with assembly interfaces and component functional
designations.
interfaces of its functionally related components. The functional designation of a component
binds its 3D model and functional interfaces to a symbolic representation of its
functions. Regarding screws, illustrative examples of functional designations are: cap
screw, locked cap screw, set screw, stop screw, . . .
As a result, a component model as well as its geometric model gets structured. As
illustrated in Figure 3.3, its B-Rep model contains imprints of its functional interfaces
and geometric relationships with functional interfaces of functionally related components.
The functional interfaces contain the lowest symbolic information describing
the elementary functions of a component and each functional designation expresses
uniquely the necessary relations between these elementary functions.
Functional analysis and quantitative reasoning
This enriched DMUs makes available information required to perform a functional
analysis of the assembly being prepared for FEA. This analysis allows us to implement
a quantitative reasoning which can be used to increase the robustness of the automation
of shape transformations of components and their interfaces during an assembly
preparation process. Geometric entities locating functional interfaces combined with
the functional designation of each component enable the identification and location
of groups of components to meet the requirements specified in Section 1.5.4. In the
research work described in the following chapters, the fully enriched functional DMU
74Chapter 3: Proposed approach to DMU processing for structural assembly simulations
Simulation
Objectives Hypotheses
Components
Components’
interfaces
Shape
transformations
Shape
transformations
: Affect
: Interact
Figure 3.4: Interactions between simulation objectives, hypotheses and shape transformations.
with functional interfaces stands as input data to geometric transformations.
Need to extend the DMU enrichment to a lower level: the component shape
Thanks to a better extraction and functional enrichment of the geometric models of
DMU components, new operators are able to identify components and their interfaces
that will be subjected to shape transformations. However, this enrichment is not suffi-
cient to determine the geometric areas to be idealized or transformed in the assembly
(see Section 2.3). Prior to any shape transformation, we propose to extend this functional
assembly enrichment up to the component level. This enrichment is driven by
the component’s shape and its interaction with the simulation objectives and related
hypotheses. The next section highlights the requirements of this enrichment approach.
3.4 Incorporating a morphological analysis during
FEA pre-processing
According to Chapter 1, component shapes involved in assembly simulation preparation
processes interact with simulation objectives, hypotheses, and shape transformations
applied to components and their interfaces. Figure 3.4 shows interactions between
shape transformations and FEA modeling hypotheses. To be able to specify the shape
analysis tools required, the interactions between shape transformations acting on components
as well as on assemblies, on the one hand, and FEA hypotheses, on the other
hand, should be formalized. The suggested analysis framework’s objective is the reconciliation
of simulation hypotheses with geometric transformations.
A morphological analysis driven by idealization needs
As stated in Chapter 2, a morphological analysis dedicated to assembly components
can improve the robustness of a geometric idealization process.
75Chapter 3: Proposed approach to DMU processing for structural assembly simulations
The natural way would be to automate the user’s approach. Indeed, during the current
generation of FE meshes, as explained in Section 1.5, this morphological analysis
phase is conducted by the engineer, on each component, individually. Based on his,
resp. her, own experience, the engineer visually analyzes the component shape and selects
the areas to preserve, to suppress, or to modify. Troussier [Tro99] highlighted the
lack of tools helping engineers to build and validate their models. She proposed to refer
to previous case studies and make them available to the engineer when a new model
has to be built. This knowledge capitalization-based method helps engineers analyze
their models through the comparison of the current simulation target with respect to
the previously generated simulation models. Indeed, referring to already pre-processed
FEM enforces the capitalization principle set up.
However, even if the engineer is able to formalize the simulation hypotheses, one dif-
ficulty remains regarding the concrete application of the shape transformations derived
from these hypotheses. A visual interpretation of the required geometric transformations,
based on past experiences, is feasible for simple components with more or less
the same morphology than previous models.
A complex geometry contains numerous regions with their own specific simplification
hypotheses. These regions can interact with each other, leading the engineer to
reach compromises about the adequate model to generate. For example, many variants
of mechanical interactions can appear in interface areas between sub-domains generated
for idealized components (see Figure 2.15). It can be difficult for the engineer to get a
global understanding of all the possible connections between medial surfaces. As long
as no precise mechanical rule exists in these connection areas, each person could have
his, resp. her, own interpretation of the hypotheses to apply there. When processing
assembly configurations, as illustrated in Section 2.5, its assembly interfaces influence
the idealization of the components interacting there. In the case of large assembly
structures, on top of the huge amount of time required to analyze all the repetitive
configurations, an engineer can hardly anticipate all the interactions between components.
Such an interactive analysis process, using the engineer’s know-how, does not
seem tractable.
Beyond potential lessons learned from previous FEA cases and because current
automatic analysis tools are not suited to engineers’ needs (see Section 2.4), it is
of great interest to develop new automated shape analyzing tools in order to help
engineers understand the application of their simplification hypotheses on new shapes.
The following objectives derive from this target.
76Chapter 3: Proposed approach to DMU processing for structural assembly simulations
3.4.1 Enriching DMU components with their shape structure
as needed for idealization processes
A shape analysis-based approach derives from the information available upstream, i.e.,
the DMU geometry content before FEA pre-processing that reduces to CAD components.
Due to the interoperability issue between CAD and CAE software (see Section
1.5.2), the prevailing practice extracts the B-Rep representation of each component.
During component design, successive primitive shapes, or form features, are sequentially
added into a construction tree describing a specific modeling process (see
Section 1.2.2). This tree structure is editable and could be analyzed further to identify,
in this construction tree, a shape closer to the FE requirements than the final one in
order to reduce the amount of geometric transformations to be applied. Often, this
modeling process relies on the technology used to manufacture the solid. From this
perspective, a machined metal component design process differs, for example, from a
sheet metal component one. This difference appears in CAD systems with different
workshops, or design modules, targeting each of these processes. As an example, the
solid model of a sheet metal component can be obtained from an initial surface using
an offset operator. This surface is close to the medial surface that can be used as
an idealized representation of this component. However, directly extracting a simpler
shape from a construction tree is not a generic and robust procedure for arbitrary
components. Such a procedure:
• cannot eliminate all the geometric transformations required to generate a FE
model;
• is strongly dependent upon the modeling process of each component;
• and is specific to each CAD software.
Above all and independently of the extracted geometry, it is essential to analyze a
component shape before applying it any geometric transformation.
To achieve a robust shape processing, the component shape needs to be structured
into regions that can be easily connected to the simulation hypotheses.
Proposal of a volume segmentation of a solid as a component shape structure
Following the recommendations of Section 2.4, we propose to set up a volume
segmentation of a 3D solid to structure it as an enriched input model to generate a
robust morphological analysis dedicated to mechanical simulations.
As stated in the conclusion of Section 2.4, the generic methods for 3D object decomposition
segment mesh1 models only. Volume decompositions of B-Rep models are
1In the computer graphics context.
77Chapter 3: Proposed approach to DMU processing for structural assembly simulations
restricted to specific applications that do not cover the FEA needs.
Here, the objective is set on a proposal of a robust segmentation of a B-Rep solids
to enrich them. Because the robust generation of quality connections between idealized
sub-domains is still a bottleneck of many approaches that process CAD solids for FEA,
the proposed segmentation should incorporate the determination of interfaces between
the volumes resulting from the segmentation. The proposed method is based on the
generation of a construction graph from a B-Rep shape. This contribution is detailed
in Chapter 4.
3.4.2 An automated DMU analysis dedicated to a mechanically
consistent idealization process
An analysis can cover multiple purposes: physical prediction, experimental correlation,.
. . The proposed analysis framework is oriented toward the geometric issues about
the idealization of assemblies for FEA. Section 2.3 has revealed that a major difficulty
encountered by automated methods originates from their lack of identification of the
geometric extent where simplification and idealization operators should be applied.
Using the new structure of a component shape, our objective is placed on a morphological
analysis process able to characterize the idealization transformations that can
take place on a component shape. Therefore, this process should incorporate, during
the pre-processing of DMU models, a set of operators that analyze the initial CAD
geometry in order to connect it to simulation hypotheses and determine the geometric
extent of these hypotheses. Chapter 5 is dedicated to this contribution. The objectives
of this morphological analysis enumerate:
• The identification of regions considered as details with respect to the simulation
objectives. The DMU adapted to FEA should contain only the relevant geometric
regions which have an influence on the mechanical behavior of the structure;
• The identification of relevant regions for idealization compared to regions regarded
as volumes. The morphology of a component has to be analyzed in order
to determine the thin regions to be transformed into mid-surfaces and the long
and slender regions to be transformed into beams. Also, this morphological analysis
has to provide the engineer with a segmentation of components into volume
sub-domains which have to be expanded into the whole assembly;
• The characterization of interfaces between idealizable regions. These interfaces
contain significant information regarding the interaction between idealizable regions.
They are used to connect medial surfaces among each other.
78Chapter 3: Proposed approach to DMU processing for structural assembly simulations
Finally, the DMU enrichment process is completed with assembly information as
well as information about the shape structure of each component. Consequently, this
enriched DMU is geometrically structured. It is now the purpose the next section to
carry on setting up objectives to achieve a robust pre-processing from DMU to FEM.
3.5 Process proposal to automate and robustly generate
FEMs from an enriched DMU
Figure 3.5 summarizes the corresponding bottom-up approach proposed in this thesis.
The first phase uses the methods Jourdes et al. [JBH∗14] and Shahwan et al. [SLF∗12,
SLF∗13] to enrich the DMU with assembly interfaces and functional designations of
components as recommended in Section 1.5.4. The initial CAD solids representing
components are also enhanced with a volume decomposition as suggested in Section 2.4
to prepare a morphological analysis required to process the idealization hypotheses.
The second phase analyses this newly enriched DMU to segment it in accordance
with the engineer’s simulation objectives (see Section 3.4), i.e., to identify areas that
can be idealized or removed when they are regarded as details. This results in the
generation of a so-called contextualized DMU.
Providing the engineer with a new contextualized DMU does not completely fulfill
his, rep. her, current needs to create geometric models for structural analysis. Consequently,
the proposed scheme should not only develop and validate methods and
tools to structure and analyze a DMU up to its component level, but also contain processes
to effectively generate FE assembly models. In the third phase, the functional
and morphological analyses lead to the definition of the assembly transformation process
as planed in the second phase, i.e., the transformation of groups of components
including dimensional reduction operations.
Exploiting the contextualized DMU, it is proposed to develop a two level adaption
process of a DMU for FEA as follows:
• One process is dedicated to standalone geometric component idealization. The
objective of this new operator is the exploitation of the morphological analysis
and hence, to provide the engineer with a robust and innovative approach to 3D
shape idealization;
• Another process extending the idealization operator to assembly idealization.
This operator is a generalization of the standalone operator adapted to assembly
transformation requirements. To implement this process, we set up a generic
methodology taking into account the simulation requirements, the functional assembly
analysis and assembly interfaces.
79Chapter 3: Proposed approach to DMU processing for structural assembly simulations
1- PLM
information
DMU EXTRATION
Contextualized DMU
for mechanical
simulation
Enriched DMU
Adapted DMU
for FEA
DMU
ENRICHMENT
4- Volume segmentation
of 3D Solid
2- Assembly interfaces
3- Functional
designations
...
FEM
Lessons learned
DATA
PROCESSES
Analysis-based
Pre-processing
SIMULATION
1
: Processes
: Data
Phase 1 Phase 2 Phase 3
Proposed Approach
Settings of geometric process
transformations
Definition of assembly process
transformations
ANALYSIS DMU TRANSFORMATION
DMU
DMU 1 2 3 4
Morphological analysis
Functional assembly
analysis
Operators
Library
Simulation
Objective
Contributions
Figure 3.5: Proposed approach to generate a FEM of an assembly structure from a DMU.
80Chapter 3: Proposed approach to DMU processing for structural assembly simulations
3.5.1 A new approach to the idealization of a standalone component
When components have to be fully idealized, their pre-processing requires the development
of a robust idealization process containing a dimensional reduction operator
associated with a robust one that connects medial surfaces. As shown in Section 2.3,
existing approaches face two issues:
• The extraction of a mid-surface/medial line from an idealized sub-domain. Current
dimensional reduction operators focus directly on the generation of midsurface/medial
line without having completely evaluated the idealization hypotheses
and determined the sub-regions associated to these hypotheses;
• The connection of the set of extracted mid-surfaces/medial lines. Current operators
encounter difficulties to generate consistent idealized models in connections
areas, i.e., regions which usually do not satisfy the idealization conditions.
To cover these issues, we propose to analyze the morphology of the shape before
applying a dimensional reduction operator. Therefore, this operator focuses on the
extraction of medial surfaces only in the sub-domains morphologically identified as
plate/shell models and on the extraction of medial lines in the sub-domains morphologically
identified as beam models. Simultaneously, this morphological analysis is
used to provide information on internal interfaces between sub-domains to be idealized.
We propose to exploit this new information within the idealization operator to
produce consistent geometric models, i.e., on-purpose idealization of sub-domains with
on-purpose connections between them. This process is detailed in Section 5.5.
3.5.2 Extension to assembly pre-processing using the morphological
analysis and component interfaces
The second process required addresses the transformation of assembly models. The
proposed operators have to be applicable to volume sub-domains, which can originate
from components or from a group of components.
Evolving the concept of details in the context of assembly structures
Section 2.2 has shown that the relationship between detail removal and idealization
processes has not been investigated. The definition of details stated in [LF05, RAF11]
addresses essentially volume domains and refers to the concept of discretization error
that can be evaluated with a posteriori error estimators.
Assemblies add another complexity to the evaluation of details. It is related to the
existence of interfaces between components. As illustrated in Section 1.5.4, interfaces
81Chapter 3: Proposed approach to DMU processing for structural assembly simulations
are subjected to hypotheses to define their simulation model and Table 1.2 points
out the diversity of mechanical models that can be expressed with simulation entities.
Recently, Bellec [BLNF07] described some aspects of this problem. Yet, comparing the
respective influences of rigid versus contact interface models is similar to the evaluation
of idealization transformations: this is also a complex issue.
The concept of detail, apart from referring to the real physical behavior of a product,
is difficult to characterize for assembly idealization. The structural engineer’s knowhow
is crucial to identify and remove them with interactive shape transformations.
Benefiting from the morphological analysis of components’ shapes, another objective
of this thesis is to provide the user with tools that show areas that cannot be regarded
as details (see Sections 5.3.1 and 5.5.2). This way, the concept of details evolves from
standalone component to assembly level pre-processing.
Automated transformations of groups of components
As explained in Section 1.5.4, the transformation of groups of components, e.g.,
junctions, by pre-defined FE simplified geometry, e.g., fasteners, is a top requirement
to reduce the FEM preparation time.
Focusing on these specific configurations, the main issue remains the robust identifi-
cation of the components and assembly interfaces to be transformed. Another objective
of this thesis is also to provide a robust operator to identify and transform configurations
of groups of components involved in the same assembly function, which is detailed
in Chapter 6.
From the analysis of DMU transformation requirements for FE assembly model
preparation [BLHF12], the proposed method relies on a qualitative reasoning process
based on the enriched DMU as input. From this enriched model, it is shown that
further enrichment is needed to reach a level of product functions where simulation
objectives can be used to specify new geometric operators that can be robustly applied
to automate component and assembly interface shape transformations. To prove the
validity of this approach, Section 6.3 presents a template-based operator to automate
shape transformations of bolted junctions. The method anticipates the mesh generation
constraints around the bolts, which also minimizes the engineer’s involvement.
3.6 Conclusion
This chapter has introduced the main principles and objectives of the proposed analysisoriented
approach of DMU pre-processing for the simulation of FE structural assembly
models. This approach covers:
• The enrichment of the input geometry, both at 3D solid and assembly levels.
82Chapter 3: Proposed approach to DMU processing for structural assembly simulations
It is critical to provide a volume decomposition of the geometric model of each
component in order to access and fully exploit their shape. This structure is
a good starting point for the identification of areas of interest for idealization
hypotheses. At the assembly level, the DMU is enriched with geometric interfaces
between its components, i.e., contacts and interferences, and with the functional
designation of components;
• The development of an analysis framework for the simulation of mechanical structures.
From the enriched DMU model, the analysis framework can be used to
specify geometric operators that can be robustly applied to automate component
and interface shape transformations during an assembly preparation process. In
accordance with the context of structural simulations, this framework evaluates
the conditions of application of idealization hypotheses. It provides the engineer
with the operators dedicated to shape adaption after idealizable volume subdomains
have been identified. Also, after the areas considered as details have
been identified and information about sub-domains interfaces have been added,
the user’s modeling rules can be applied in connection areas;
• The specification of geometric operators for the idealization of B-rep shapes and
operators transforming groups of components, such as bolted junctions, bene-
fiting from the previously structured DMU. Through the development of such
operators, the proposed approach can be sequenced and demonstrated on aeronautical
use-cases.
The next chapters are organized in accordance with the proposed approach, as
described in the current one. Chapter 4 details the B-Rep volume decomposition
using the extraction of generative construction processes. Chapter 5 describes the
concepts of the FEA framework using a construction graph to analyze the morphology
of components and derive idealized equivalent models. Chapter 6 extends this approach
to a methodology for assembly idealization and introduces a template-based operator
to transform groups of components.
83Chapter 3: Proposed approach to DMU processing for structural assembly simulations
84Chapter 4
Extraction of generative
processes from B-Rep shapes
to structure components up to
assemblies
Following the global description of the proposed approach to robustly process
DMUs for structural assembly simulation, this chapter exposes the principles
of the geometric enrichment of components using a construction graph. This
enrichment method extracts generative processes from a given B-Rep shape as a
high-level shape description and represents it as a graph while containing all non
trivial construction trees. Advantageously, the proposed approach is primitivebased
and provides a powerful geometric structure including simple primitives and
geometric interfaces between them. This high-level object description is fitted to
idealizations of primitives and to robust connections between them and remains
compatible with an assembly structure containing components and geometric
interfaces.
4.1 Introduction
Based on the analysis of DMU transformation requirements for FE assembly model
preparation in Chapter 1 as well as the analysis of prior research work in Chapter 2,
two procedures are essential to generate the mechanical model for the FEA of thin
structures:
• The identification of regions supporting geometric transformations such as simplifications
or idealizations. In Section 1.4.2, the analysis of thin mechanical
shell structures introduces a modeling hypothesis stating that there is no normal
stress in the thickness direction. This hypothesis is derived from the shape of
85Chapter 4: Extraction of generative processes from B-Rep shapes
the object where its thin volume is represented by an equivalent medial surface.
The idealization process connects this hypothesis with the object shape. Section
2.3 illustrates that idealization operators require a shape analysis to check
the idealization hypothesis on the shape structure and to delimit the regions to
be idealized;
• The determination of interface areas between regions to be idealized. Section 2.3
showed that the interface areas contain the key information to robustly connect
idealized regions. In addition to idealizable areas, the determination of interfaces
is also essential to produce fully idealized models of components.
The proposed pre-processing approach, described in Chapter 3, is based on the
enrichment of the input DMU data. More precisely, the B-rep representation of each
CAD component has to be geometrically structured to decompose the complexity of
their initial shape into simpler ones. At the component level, we propose to create
a 3D solid decomposition into elementary volume sub-domains. The objective of this
decomposition is to provide an efficient enrichment of the component shape input to
apply the idealization hypotheses.
This chapter is dedicated to a shape decomposition method using the extraction of
a construction graph from B-Rep models [BLHF14b, BLHF14a]. Section 4.2 justifies
the extraction of generative construction processes suited for idealization processes1.
Section 4.3 sets the modeling context and the hypotheses of the proposed approach.
Section 4.4 describes how to obtain generative processes of CAD components, starting
from the identification of volume primitives from a B-Rep object to the removal process
of these primitives. Finally, Section 4.5 defines the criteria to select the generative
processes generating a construction graph for idealization purposes. This construction
graph will be used in Chapter 5 to derive idealized models. In a next step, the component
perspective is extended to address large assembly models. Consequently, the
segmentation approach is analyzed with respect to CAD assembly representation in
Section 4.7.
4.2 Motivation to seek generative processes
This section presents the benefits of modeling processes to structure a B-Rep component.
It shows the limits of CAD construction trees in mechanical design and explains
why it is mandatory to set-up generative processes adapted to idealization processes.
1 generative processes represent ordered sequences of processes emphasizing the shape evolution of
the B-Rep representation of a CAD component.
86Chapter 4: Extraction of generative processes from B-Rep shapes
4.2.1 Advantages and limits of present CAD construction tree
As observed in Section 1.2.3, a mechanical part is progressively designed in a CAD software
using successive form features. This initial generation of the component shape
can be regarded as the task where the component shape structure is generated. Usually,
this object structure is described by a binary construction tree containing the
elementary features, or primitives, generating the object. This construction tree is
very efficient to produce a parameterized model of a CAD object. Effectively, the user
can easily update the shape of the object when modifying parameters defined within
a user-selected feature and then, re-processing the subset of the construction tree located
after this primitive. As illustrated in Section 2.4, Robinson et al. [RAM∗06] show
that a construction tree with adapted features for FEA can be used to easily generate
idealized models.
1 3
(b)
(a)
St
B B
6
T
8 11
15 17 18 20
B T
B T T T
23 33 34
T B
T B
2 4 - 5 7 9 - 10
16 19
21
12 ® 14
22 24 ® 32
Figure 4.1: An example of a shape generation process: (a) final object obtained after 34
modeling steps and viewed from top (T) and bottom (B), (b) some intermediate shapes
obtained after the i
th modeling step. The letter T or B appearing with step number indicates
whether the object is viewed from top or bottom.
87Chapter 4: Extraction of generative processes from B-Rep shapes
However, the construction tree produced during the design phase may not be suited
for the shape decomposition taking place at other stages of a PDP, e.g., during process
planning and FEA. Three main issues are preventing the use of current CAD
construction trees from FEM pre-processing:
• The complexity of the final object shape and feature dependencies.
The concept of feature-based design eases the generation of an object shape by
adding progressively, and one by one, simple form features. This way, the user
starts from a simple solid, i.e., a primitive, and adds or removes volumes using
pre-defined features (extrusion, revolution, sweeping, . . . ) one after the other until
he, resp. she, has reached the desired shape of the object. As a consequence of
this principle “from simple to complicated”, the resulting construction tree can
be complex and contains numerous features. Because, the user inserts one form
feature at a time, the construction tree is necessarily binary, i.e., each tree node
contains one form feature and the object shape obtained after combining this
form feature with the object resulting from the previous tree node. As an example,
Figure 4.1 illustrates this configuration with a rather complex component
where the user’s entire modeling process consists of 37 steps, some of them containing
multiple contours producing simultaneously several features. Two views,
defined as top and bottom in Figure 4.1b, show the major details of the object
shape. Figure 4.1a depicts some of the 34 steps involving either extrusion or
revolution operations and incorporating either material addition or removal as
complementary effects when shaping this object. The parent/child dependencies
between form features further increase the complexity of this construction
process. The suppression or modification of a parent feature is not always possible
due to geometric inconsistencies generated in subsequent tree steps when
parent/child dependencies cannot be maintained or when the object boundary
cannot produce a solid. This is particularly inconvenient in the context of FEM
pre-processing which aims at eliminating detail features to simplify component
shapes;
• The non-uniqueness and user dependence. Construction trees are not
unique, i.e., different users often generate different construction trees for the
same final shape. The choice of the sequence of features is made by the designer
and depends on his, resp. her, own interpretation of the shape structure of the
final object. In current industrial practices, specific modeling rules limit the
differences in construction tree generation but they are not dedicated to FEM
requirements as explained in Section 3.3;
• The construction tree availability. Construction trees contain information
which is very specific to each CAD system and each software has its own data
structures to represent this construction scheme. Most of the time, this information
is lost when transferring objects across CAD systems or even across the
88Chapter 4: Extraction of generative processes from B-Rep shapes
different phases of a PDP. Practically, when using STEP neutral format [ISO94,
ISO03], definition of construction tree structures associated with parametric modeling
are not preserved. Indeed, to edit and to modify a shape, the parametric
relations taking part to the construction tree would need also to be exported. This
is difficult to obtain, e.g., even during the upgrade of CATIA software [CAT14]
from V4 to V5, the transfer was not fully automatic and some information in
construction trees was lost.
As it appears in Figure 4.1, a shape generative process can be rather complex and,
even if it is available, there is no straightforward use or transformation of this process
to idealize this object (even though its shape contains stiffeners and thin areas that
can be modeled with plate or shell elements rather than volume ones). With respect to
the idealization objectives, it appears mandatory to set-up another generative process
that could incorporate features or primitives with their shapes being close enough to
that of stiffeners and thin wall areas.
4.2.2 A new approach to structure a component shape: construction
graph generation
Construction trees are important because an object submitted to a FEA preparation
process can be subjected to different simplifications at different levels of its construction
process. One key issue of these trees is their use of primitives that are available
in common industrial CAD software. Another problem lies in the storage of the shape
evolution from the initial simple primitive shape to the final object. This principle ‘from
simple to complicated’ matches the objective of using the tree contents for idealization
and simplification purposes. Indeed, obtaining simpler shapes through construction
processes could already reduce the number of geometric transformations. However,
because the CAD construction tree is presently unique, not always available and complicated
to modify, its use is difficult. The proposed approach here, structuring the
shape of a component, consists in producing generative processes of its B-Rep model
that contain sets of volume primitives so that their shapes are convenient for FE simulation.
The benefits of extracting new generative processes, as ordered sequences
of processes emphasizing the shape evolution of the B-Rep representation of a CAD
component, are:
• To propose a compact shape decomposition adapted to the idealization
objectives. Extraction of compact generative processes aims at reducing their
complexity while getting a maximum of information about their intrinsic form
features. The proposed geometric structure decomposes an object into volume
sub-domains which are independent from each other and close enough to regions
that can be idealized. This segmentation method differs from the divide and conquer
approaches of [Woo14] because generative processes contain volume prim-
89Chapter 4: Extraction of generative processes from B-Rep shapes
itives having particular geometric properties, e.g., extruded, revolved or swept
features. The advantage of these primitives is to ease the validation of the idealization
criteria. Indeed, one of their main dimensional characteristics is readily
available. For example, the extrusion distance, revolve angle or sweep curve, reduces
the primitive analysis to the 2D sketch of the feature. Moreover, interfaces
between primitives are identified during the extraction of each generative process
to extend the analysis of individual primitives through the whole object and to
enable the use of the engineer’s FE connection requirements between idealizable
regions;
• To offer the user series of construction processes. In a CAD system, a
feature tree is the unique available definition of the component’s construction but
is only one among various construction processes possible. Furthermore, in a simulation
context, it is difficult to get an adequate representation of the simulation
model which is best matching the simulation requirements because the engineer’s
know-how takes part to the simulation model generation (see Section 3.4). Consequently,
the engineer may need to refer to several construction processes to
meet the simulation objectives as well as his, resp. her, shape transformation
requirements. Providing the engineer with several construction processes helps
him, resp. her, generate easily a simulation model. The engineer will be able
to navigate shape construction processes and obtain a simpler one within a construction
tree that meets the idealization requirements in the best possible way;
• To produce a shape parameterization independent from any construction
tree. The construction tree is a well-known concept for a user. Parent/child
dependencies between features, generated through sketches and their reference
planes, ease the interactive design process for the user but creates geometric dependencies
difficult to understand for the user. Performing modifications of a
complex shape remains difficult to understand for the user, e.g., the cross influence
between features located far away in the construction tree is not easy to
anticipate. Considering the generation of a construction graph, the proposed approach
does not refer to parent/child dependencies between features, i.e., features
are geometrically independent each other. The morphological analysis required
(see Section 3.4) does not refer to a need for a parameterized representation of
components, i.e., each primitive does not need to refer to dependencies between
sketch planes. Components can be modified in a CAD software and their new geometry
can be processed again to generate a construction graph without referring
to the aforementioned dependencies.
As a conclusion, one can state that enabling shape navigation using primitive features
similar to that of CAD software is an efficient complement to algorithmic approaches
reviewed in Chapter 2 and construction trees. More globally, construction
graphs can support both efficiently.
90Chapter 4: Extraction of generative processes from B-Rep shapes
Shape modeling processes
Segmentation
CAD Mesh
Idealization
M M-1 M-2
Pi(M/M ) -1 Pi(M /M ) -1 -2 Pi(M ) -2
Figure 4.2: An example of shape analysis and generative construction graph.
To this end, this chapter proposes to extract a construction graph from B-Rep
CAD models so that the corresponding generative processes are useful for mechanical
analysis, particularly when idealization processes are necessary. The graph is extracted
using a primitive removal operator that simplifies progressively the object’s shape.
One could says that the principle is to go ‘backward over time’. This characteristic
of construction trees is consistent with the objective of simplification and idealization
because the shapes obtained after these operations should get simpler. Figure 4.2
illustrates the extraction of a shape modeling process of a CAD component. Primitives
Pi are extracted from a sequence of B-Rep objects Mi which become simpler over time.
The set of primitives Pi generates a segmented representation of the initial object which
is used to derive idealized FE models.
The following sections detail the whole process of extraction of generative processes
from B-Rep shapes.
4.3 Shape modeling context and process hypotheses
Before describing the principles of the extraction of generative processes from a BRep
shape, this section sets the modeling context and the hypotheses of the proposed
approach.
4.3.1 Shape modeling context
As a first step, the focus is placed on B-Rep mechanical components being designed
using solid modelers. Looking at feature-based modeling functions in industrial CAD
systems, they all contain extrusion and revolve operations which are combined with
addition or removal of volume domains (see Figure 4.3a). The most common version of
the extrusion, as available in all CAD software, is defined with an extrusion direction
91Chapter 4: Extraction of generative processes from B-Rep shapes
variant with
material removal
material
blend as part of addition
extrusion contour
blend variable
radius
V
H
Extrusion Contour
(a) (b)
(c) (d)
Slanted
extrusion Cutting
Plane
Figure 4.3: (a) Set of basic volume modeling operators, (b) sketch defining an extrusion
primitive in (a), (c) higher level volume primitive (slanted extrusion), (d) reference primitive
and its first ‘cut’ transformation to generate the object in (c).
orthogonal to a plane containing the primitive contour. Such an extrusion, as well as
the revolution, are defined here as the reference primitives. These feature-based B-Rep
operations can be seen as equivalent to regularized Boolean operations as available also
in common hybrid CAD modelers, i.e., same primitive shapes combined with union or
subtraction operators. Modelers also offer other primitives to model solids, e.g., draft
surfaces, stiffeners, or free-form surfaces from multiple sections. Even though we don’t
address these primitives here, it is not a limitation of our method. Indeed, draft surfaces,
stiffeners, and similar features can be modeled with a set of reference primitives
when extending our method to extrusion operations with material removal and revolutions.
Appendix B illustrates the simple features and boolean operations available
in CAD software and show that it can mainly be reduced to additive/removal extrusion/revolution
features in order to cover the present software capabilities . Figure 4.3c
illustrates some examples, e.g., an extrusion feature where the extrusion direction is
not orthogonal to the sketching plane used for its definition. However, the resulting
shape can be decomposed into an extrusion orthogonal to a sketching plane and ‘cuts’
(see Figure 4.3d) if the generation of a slanted extrusion is not available or not used
straightforwardly. Indeed, these construction processes are equivalent with respect to
the resulting shape.
Another category of form features available from B-Rep CAD modelers are blending
radii. Generally, they have no simple equivalence with extrusions and revolutions.
Generated from B-Rep edges, they can be classified into two categories:
1- constant radius blends that can produce cylindrical, toroidal or spherical surfaces;
92Chapter 4: Extraction of generative processes from B-Rep shapes
2- constant radius blends attached to curvilinear edges and variable radius blends.
Category 1 blends include extrusion and revolution primitives and can be incorporated
in their corresponding sketch (see Figure 4.3a). This family of objects is part of
the current approach. Category 2 blends are not yet addressed and are left for future
work. Prior work in this field [VSR02, ZM02, LMTS∗05] can be used to derive M from
the initial object MI to be analyzed, possibly with user’s interactions.
In summary, all reference primitives considered here are generated from a sketching
step in a plane defining at least one closed contour. The contour is composed of line
segments and arcs of circles, (see Figure 4.3b). This is a consequence of the previous
hypothesis reducing the shapes addressed to closed surfaces bounded by planes, cylinders,
cones, spheres, tori, and excluding free-form shapes in the definition of the object
boundary. This is not really restrictive for a wide range of mechanical components
except for blending radii. The object M to be analyzed for shape decomposition is
assumed to be free of blending radii and chamfers that cannot be incorporated into
sketched contours. The generative processes are therefore concentrated on extrusion
primitives, in a first place, in order to reduce the complexity of the proposed approach.
Further hypotheses are stated in the following sections.
4.3.2 Generative process hypotheses
Given a target object M to be analyzed, let us first consider the object independently
of the modeling context stated above. M is obtained through a set of primitives
combined together by adding or removing material. Combinations of primitives thus
create interactions between their bounding surfaces, which, in turn, produce intersection
curves that form edges of the B-Rep M. Consequently, edges of M contain
traces of generative processes that produced its primitives. Hence, following Leyton’s
approach [Ley01], these edges can be seen as memory of generation processes where
primitives are sequentially combined.
Current CAD modelers are based on strictly sequential processes because the user
can hardly generate simultaneous primitives without looking at intermediate results
to see how they combine/interact together. Consequently, B-Rep operators in CAD
modelers are only binary operators and, during a design process, the user-selected one
combines the latest primitive generated to the existing shape of M at the stage t of this
generative process. Additionally, CAD modelers providing regularized Boolean operators
reduce them to binary operators, even though they are n-ary ones, as classically
defined in the CSG approaches [Man88]. Here, the proposed approach does not make
any restriction on the amount of primitives possibly generated ‘in parallel’, i.e., the
arity of the combination operators is n ≥ 2. The generated processes benefit from this
hypothesis by compacting the construction trees nodes. This property is illustrated in
the result Section 4.6 of this chapter in Figure 4.22.
93Chapter 4: Extraction of generative processes from B-Rep shapes
d
(a)
(b) Top Bottom (c)
IG (face 2)
contour edge
(convex)
lateral face (transparent)
Fb2
contour edge
(concave)
Fb1 (transparent)
IG (face 1)
fictive lateral edge
lateral edge
Attachment
contour( , )
Fb1
Fb2
Figure 4.4: a) Entities involved in an extrusion primitive. Visible extrusion feature with its
two identical base faces F b1 and F b2. (b) Visible extrusion feature with its two different
base faces F b1 and F b2. (c) Visible extrusion feature with a unique base face F b1 (detail of
Figure 4.1a - 34B).
Hypothesis 1: Maximal primitives
The number of possible generative processes producing M can be arbitrary large,
e.g., even a cube can be obtained from an arbitrary large number of extrusions of
arbitrary small extent combined together with a union operator. Therefore, the concept
of maximal primitives is introduced so that the number of primitives is finite and as
small as possible for generating M.
A valid primitive Pi identified at a stage t using a base face Fb1 is said to be
maximal when no other valid primitive Pj at that stage having F�
b1 as base face
can be entirely inserted in Pi (see Section 4.4.2 and Figure 4.4a): ∀Pj , Pj �⊂ Pi.
Fb1 is a maximal face as defined at Section 4.3.3.
Maximal primitives imply that the contour of a sketch can be arbitrary complex,
which is not the case in current engineering practice, where the use of simple primitives
eases the interactive modeling process, the parameterization, and geometric constraint
assignments to contours. The concept of maximal primitive is analog to the concept of
maximal volume used in [WS02, Woo03, Woo14]. Yet, this concept is no used in feature
recognition techniques [JG00]. Even if making use of maximal primitives considerably
reduces the number of possible generative processes, they are far from being unique for
M.
Hypothesis 2: Additive processes
94Chapter 4: Extraction of generative processes from B-Rep shapes
(a) (b)
Extrusion
contour
Extrusion Revolution
Mid-surface
Mid-surface
d Direction
of extrusion Revolution
contour
Angle
of revolution
Figure 4.5: Illustrations of two additive primitives: (a) an extrusion primitive and (b) a
revolution one. The mid-surfaces of both primitives lie inside their respective volumes.
We therefore make the further hypothesis that the generative processes we are
looking for are principally of type additive, i.e., they are purely based on a regularized
Boolean union operator when combining primitives at each stage t of generative modeling
processes. This hypothesis is particularly advantageous when intending to tailor
a set of generative processes that best fit the needs of idealization processes. Indeed,
idealized structures, such as mid-surfaces, lie inside such primitives, and connections
between primitives locate also the connections between their idealized representatives.
Figure 4.5 illustrates an extrusion and a revolution primitives. With both of them, the
3D solid of the primitive includes its mid-surface. Therefore, the idealized representation
of M can be essentially derived from each Pi and its connections, independently
of the other primitives in case of additive combinations. Figure 4.6 gives an example
where M can be decomposed into two primitives combined with a union (b). M in
Figure 4.6, (b) can thus be idealized directly from these two primitives and their interface.
On the contrary, when allowing material removal, idealization transformations
are more complex to process, while the resulting volume shapes are identical. Figure
4.6c shows two primitives which, combined by Boolean subtraction, result also in
object (a). However, computing an idealization of (a) by combining idealizations of its
primitives in (c) is not possible.
Performing the idealization of M from its primitives strengthens this process compared
to previous work on idealization [CSKL04, Rez96, SSM∗10] of solids presented
in Section 2.3.1 for two reasons. Firstly, each Pi and its connections bound the 3D
location of and the connections with other idealized primitives. Secondly, different categories
of connections can be defined, which is important because idealization processes
still rely on the user’s know-how to process connections significantly differing from reference
ones. The next Chapter 5 explains in details how to connect mid-surfaces using
a taxonomy of connections between extrusion primitives.
Hypothesis 3: Non trivial variants of generative processes
To further reduce the number of possible generative processes, the processes described
should be non trivial variants of processes already identified. For example, the
95Chapter 4: Extraction of generative processes from B-Rep shapes
(a)
(b) (c)
+ - OR
Figure 4.6: a) Simple shape with idealizable sub-domains, (b) Primitives to obtain (a) with
an additive process, (c) Primitives to obtain (a) with a removal process.
same rectangular block can be extruded with three different face contours and directions
but they create the same volume. Two primitives generating the same shape are
considered as the same non-trivial primitive. If the resulting shape of two processes at
the jth-level of a construction is the same then, these two processes are said equivalent
and are reduced to a single one and the object shape at the (j−1)th-level is also unique.
These equivalent processes can be detected when comparing the geometric properties of
the contours generating this same shape. Other similar observations will be addressed
in the following sections when describing the criteria to select meaningful generative
processes.
The above hypotheses aim at reducing the number of generative processes producing
the same object M while containing primitives suited to idealization transformations,
independently of the design process initially set up by engineers.
Conclusion
The overall approach can be synthesized through the process flow of Figure 4.7.
The input STEP file contains the B-Rep model M. A set of generative processes is
extracted that form sets of construction trees, possibly producing a graph. To this
end, application dependent criteria are used to identify one or more construction trees
depending on the application needs. Here, we focus on criteria related to idealization
for FEA.
4.3.3 Intrinsic boundary decomposition using maximal entities
In order to extract generative processes from the B-Rep decomposition of M, it is
important to have a decomposition of M, i.e., topology description, that is intrinsic to
96Chapter 4: Extraction of generative processes from B-Rep shapes
Selection of generative process(es) Application dependent criteria
STEP file (input Model)
Generation of generative process graph
Shape transformations (idealization)
Figure 4.7: Pipeline producing and exploiting generative shape processes.
its shape. A B-Rep decomposition of an object is however not unique (and thus not
suitable), because it is subjected to two influences:
• Its modeling process, whether it is addressed forward during a design process
or backward as in the present work. Indeed, each operation involving a primitive
splits/joins boundary faces and edges of the solid. When joining adjacent
faces or edges, their corresponding surfaces or curves can be identical. Their
decomposition is thus not unique. However, CAD modelers may not merge the
corresponding entities, thus producing a boundary decomposition that is not
changing the object shape (see Figure 4.8a). For the proposed approach purposes,
such configurations of faces and edges must lead to a merging process so
that the object boundary decomposition is unique for a given shape, i.e., it is
intrinsic to the object shape;
• The necessary topological properties to setup a consistent paving of an object
boundary, i.e., the boundary decomposition must be a CW-complex. Consequently,
curved surfaces need to be partitioned. As an example, a cylinder is
decomposed into two half cylinders in most CAD modelers or is described with
a self connected patch sewed along a generatrix (see Figure 4.8b). In either case,
the edge(s) connecting the cylindrical patches are adjacent to the same cylindrical
surface and are not meaningful from a shape point of view. Hence, for the
proposed approach purposes, they must not participate to the intrinsic boundary
decomposition of the object.
Following these observations, the concepts of maximal faces and edges introduced
by [FCF∗08] is used here as a means to produce an intrinsic and unique boundary
decomposition for a given object M. Maximal faces are identified first. For each face
of M, a maximal face F is obtained by repeatedly merging an adjacent face Fa sharing
a common edge with F when Fa is a surface of same type and same parameters than
F, i.e., same underlying surface. F is maximal when no more face Fa can be merged
with F. Indeed, maximal faces coincide with ‘c-faces’ defined in [Sil81] that have been
proved to uniquely defined M. Similarly, for each edge of M, a maximal edge E with
97Chapter 4: Extraction of generative processes from B-Rep shapes
(a) (b)
Couples of faces that can be merged
Figure 4.8: Examples of configurations where faces must be merged to produce a shapeintrinsic
boundary decomposition: (a) face decomposition due to the modeling process, (b)
face decomposition due to topological requirements.
adjacent faces F1 and F2 is obtained by repeatedly merging an adjacent edge Ea when
Ea is also adjacent to F1 and F2. Again, E is maximal when no more edge Ea can
be merged with E. As a consequence of these merging processes, it is possible to
end up with closed edges having no vertex or with closed faces having no edge. An
example for the first case is obtained when generating the maximal face of the cylinder
in Figure 4.8b. A sphere described with a single face without any edge and vertex is
an example for the second case.
Because of maximal edges without vertices and faces without edges, merging operations
are performed topologically only, i.e., the object’s B-Rep representation is left
unchanged. Maximal faces and edges are generated not only for the initial model M
but also after the removal of each primitive when identifying the graph of generative
processes. Consequently, maximal primitives (see Hypothesis 1) are based on maximal
faces and edges even if not explicitly mentioned throughout this document. Using the
concept of maximal faces and edges the final object decomposition is independent of
the sequence of modeling operators.
4.4 Generative processes
Having define the modeling hypotheses and context in the previous Section 4.3, this
section presents the principles of the construction of generative processes from B-Rep
object. It explains how the primitives are identified and how to remove them from an
object M.
4.4.1 Overall principle to obtain generative processes
Preliminary phase
As stated in Section 4.3.1, a preliminary step of the method is to transform it into a
blending radii-free object M. To this end, defeaturing functions available in most CAD
98Chapter 4: Extraction of generative processes from B-Rep shapes
Identification of extrusion primitives Pi
Going back
over time
Generating M
from primitives
Object M
M®M’
Removal of primitives from M’
M’ empty? No Yes End
Set of construction
trees producing M
Set of extrusion primitives Pi
Construction graph of primitives
Figure 4.9: Overall scheme to obtain generative processes.
Object M
End
Object M-1
Object M-2
Removal of Pi
Identification of extrusion
primitives Pi in M
Identification of extrusion
primitives Pi in M-1
Identification of extrusion
primitives Pi in M-2
Pi
Removal of Pi
Figure 4.10: An example illustrating the successive identification and removal of primitives.
systems are applied. This operation is a consequence of the modeling context defined
in Section 4.3.1. Even though these functions may not be sufficient and robust enough,
this is the current working configuration. In contrast to blending radii, most chamfers
are included in the present approach because they can be part of extrusion primitives
and hence, included in the sketched contours used to define extrusion primitives. Even
if CAD software provide specific functions for chamfers, they are devoted to the design
context but basic operators of extrusion with material addition or removal could produce
the same result, in general. This analysis regarding chamfers shows the effect of
the concept of maximal primitives (see Hypothesis 1).
Main phase
Starting with the solid M, the generative processes are obtained through two phases:
99Chapter 4: Extraction of generative processes from B-Rep shapes
• M is processed by iterative identification and removal of primitives. The objective
of this phase is to ‘go back in time’ until reaching root primitives for generative
processes. The result of this phase is a set of primitives;
• Based on hypotheses of Section 4.3.2, a set of generative processes is produced using
the primitives obtained at the end of the first phase to meet the requirements
of an application: here idealization (see Chapter 5).
Finally, the decomposition D of M into extrusion primitives is not limited to a single
construction tree but it produces a construction graph GD iteratively generated from
M. GD contains all possible non trivial construction trees of M (see Hypothesis 3).
The process termination holds whenever M is effectively decomposable into a set of
extrusion primitives. Otherwise, D is only partial and its termination produces either
one or a set of volume partitions describing the most simplest objects D can reach.
Figure 4.9 summarizes the overall scheme just described previously. When generating
GD, we refer to M = M0 and evolutions M−j of it backward at the jth step of D.
Figure 4.10 illustrates the major steps of the extraction of a generative process graph,
i.e., from the primitive identification up to its removal from M, and will be further
explained in Sections 4.4.2 and 4.4.3.
4.4.2 Extrusion primitives, visibility and attachment
In order to identify extrusion primitives Pi in M = M0 and evolution M−j of it, backward
at the jth step of the generation of the generative process graph, it is mandatory
to define its geometric parameters as well as the hypotheses taken in the present work
(see Figure 4.4).
First of all, let us notice that a ‘reference primitive’ Pi is never appearing entirely
in M or M−j unless it is isolated like a root of a construction tree, i.e., Pi = M or
Pi = M−j . Apart from these particular cases, Pi are only partly visible, i.e., not all
faces of Pi are exactly matching faces of M−j . For simplicity, we refer to such Pi as
‘visible primitives’. Pi is the memory of a generative process that took place between
M−j and M−(j+1). Extracting Pi significantly differs compared to feature recognition
approaches [Rez96, LGT01, WS02, SSM∗10, JG00]. In feature recognition approaches,
Pi is identified through validity constraints with its neighboring attachment in M, i.e.,
faces and edges around Pi. These constraints limits the number of possible primitives
by looking to the best interpretation of some visible boundaries of the object M. Here,
identifying visible primitives enables the generation of reference ones having simpler
contours. Only the visible part of the primitive is used to identify the primitive in M,
without restricting the primitive to the visible boundaries of M. The proposed identi-
fication process of Pi is more general, it does not integrate any validity constraint on
100Chapter 4: Extraction of generative processes from B-Rep shapes
the attachment of Pi with M. This constraint released, this process enables the identi-
fication of a greater number of primitives which can be compared with each other not
only through their attachment to M but also through their intrinsic shape complexity.
Definition of the primitive
The parameters involved in a reference extrusion Pi are the two base faces, F b1 and
F b2, that are planar and contain the same sketched contour where the extrusion takes
place. Considering extrusions that add volume to a pre-existing object, the edges of F bi
are called contour edges which are all convex. Indeed, Pi being standalone primitive,
all its contour edges are convex. A convex edge is such that the outward normals of
its adjacent faces define an angle α where: 0 < α < π. When Pi belongs to M−j ,
the contour edges along which Pi is attached to M−j can be either convex or concave
depending on the neighborhood of Pi in M−j (see Figure 4.4a).
In the direction d of the extrusion, all the edges are straight line segments parallel
to each other and orthogonal to F bi. These edges are named lateral edges. Faces adjacent
to F bi are called lateral faces. They are bounded by four edges, two of them being
lateral edges. Lateral edges can be fictive lateral edges when a lateral face coincides
with a face of M−j adjacent to Pi (see Figure 4.4a). When lateral faces of Pi coincide
with adjacent faces in M−j , there cannot be edges separating Pi from M−(j+1) because
of the definition of maximal faces. Such a configuration refers to fictive base edges (see
Figure 4.11 with the definition of primitive P1).
Principle of primitive identification: Visibility
The visibility of Pi depends on its insertion in M−j and sets the conditions to identify
Pi in ∂M−j
2. An extrusion primitive Pi can be visible in different ways depending on
its insertion in a current object M−j . The simplest visibility is obtained when Pi’s base
faces F bi in M−j exist and when at least one lateral edge connects F bi in M−j (see
Figure 4.4a and 4.11(step1)).
More generally, the contour of F b1 and F b2 may differ from each other (see Figure
4.4b) or the primitive may have only one base face F b1 visible in M−j together
with one existing lateral edge that defines the minimal extrusion distance of F b1 (see
Figure 4.4c). Our two hypotheses on extrusion visibility thus state as follows:
• First, at least one base face F bi is visible in M−j , i.e., the contour of either F b1
or F b2 coincides with a subset of the attachment contour of Pi in M−j ;
• Second, one lateral edge exists that connects F bi in M−j . This edge is shared by
two lateral faces and one of its extreme vertices is shared by F bi.
2∂M−j is the boundary of the volume object M, i.e., the B-Rep representation
101Chapter 4: Extraction of generative processes from B-Rep shapes
d d
P1 P2
Primitive
to Remove Interface
Identical Faces Volume to remove
from Primitive
Reduced Primitive
Included in Solid
Simplified Solid
1 - Find Extrusion
Primitives
2 - Keep included
Primitives
3 - Find Interfaces
4 - Remove Primitives
from Solid
Fb1 contour edge
P1 P2
P1
P1
Not Included in Solid
Figure 4.11: An example illustrating the major steps to identify a primitive Pi and remove
it from the current model M−j .
Pi is entirely defined by F bi and the extrusion length obtained the maximum length
of the generatrix of Pi extracted from its lateral faces partly or entirely visible in M−j .
Notice that the lateral edges mentioned may not be maximal edges when lateral faces
are cylindrical because maximal faces may remove all B-Rep edges along a cylindrical
area. These conditions of definition of extrusion distance restricts the range of extrusion
primitives addressed compared to the use of the longest lateral segment existing
in the lateral faces attached to F bi. However, it is a first step enabling to address a
fair set of mechanical components and validate the major concepts of the proposed
approach. This generalization is left for future work. Figure 4.4b, c give examples
involving two or one visible base faces, respectively.
Attachment
An extrusion primitive Pi is attached to M−j in accordance to its visibility in M−j .
The attachment defines a geometric interface, IG, between Pi and M−(j+1), i.e., IG =
Pi ∩ M−(j+1). This interface can be a surface or a volume or both, i.e., a nonmanifold
model. One of the simplest attachments occurs when Pi has its base faces
F b1 and F b2 visible. This means that Pi is connected to M−(j+1) through lateral faces
only. Consequently, IG is a surface defined by the set of lateral faces not visible in
Pi. Figure 4.4a illustrates such a type of interface (IG contains two faces depicted in
yellow).
Simple examples of attachment IG between Pi and M−(j+1) are given in Figure 4.4.
102Chapter 4: Extraction of generative processes from B-Rep shapes
(b)
Pi
M-(j+1) IG
S
e1
e2
(a)
Pi
M-(j+1) IG
Volume Interface
Figure 4.12: Example of geometric interface IG between Pi and M−(j+1): (a) surface type,
(b) volume type.
M-j
Valid Primitives
Primitive (Pi)
Non Valid
Primitive
Direction
of extrusion
(a)
(b)
Fb1
Figure 4.13: Collection of primitives identified from M−j : (a) Valid primitives included in
M−j , (b) invalid primitive because it is not fully included in M−j . Green edges identify the
contour of the base face of the primitive.
4.4a involves a surface interface and 4.4b illustrates a volume one. Let us notice that
the interface between Pi and M−(j+1) in 4.4b contains also a surface interface located
at the bottom of the primitive that is not highlighted. However, as we will see in
Section 4.5, all possible variants of IG must be evaluated to process the acceptable
ones.
In a first step, Pi can be translated directly into an algorithm to identify them
(procedure f ind visible extrusion of algorithm 1). The visibility of Pi does not refer to
its neighboring faces in M−j . Next, they are subjected to validity conditions described
in the following section.
4.4.3 Primitive removal operator to go back in time
The purpose is now to describe the removal operator that produces a new model M−(j+1)
anterior to M−j . This removal operator is defined as a binary operator with Pi and
M−j as operands and M−(j+1) as result. In the context of a generative process, M−j
relates to a step j and M−(j+1) to a step (j + 1).
103Chapter 4: Extraction of generative processes from B-Rep shapes
Characterization of interfaces
In order to be able to generate M−(j+1) once Pi is identified, it is necessary to reconstruct
faces adjacent to Pi in M−j so that M−(j+1) defines a volume. To this end, the
faces of M−j adjacent to Pi and IG must be characterized. Here, Pi is considered to be
adjacent to other subsets of primitives through one edge at least. The removal operator
depends on the type of IG. Due to manifold property of M, two main categories of
interfaces have been identified:
1- IG is of surface type. In this category, the removal operator will have to create
lateral faces and/or the extension of F b2 so that the extended face coincides with
F b1. Indeed, this category needs to be subdivided into two sub categories:
a- IG contains lateral faces of Pi only (see Figure 4.4a) or IG contains also an
extension of F b2 and edges of this extension are concave edges in M−(j+1);
b- IG may contains lateral faces of Pi but it contains an extension of F b2 and
the edges of this extension are fictive base edges in M−j . These edges would
be convex edges in M−(j+1), (see P1 in Figure 4.11);
2- IG contains at least one volume sub-domain.
In addition, considering that F b1 at least is visible and Pi is also visible (see Section
4.4.2), the attachment contour may not be entirely available to form one or more
edge loops (see Figure 4.4a). Also, IG can contain more than one connected component
when Pi is resembling a handle connected to M−(j+1), which produces more than one
edge loop to describe the attachment of Pi to M−(j+1) in IG.
Validity
Whatever the category of interface, once Pi is identified and its parameters are set
(contour and extrusion distance), it is necessary to validate it prior to define its interface
(step 2 of Figure 4.11). Let Pi designates the volume of the reference primitive, i.e.,
the entire extrusion Pi. To ensure that Pi is indeed a primitive of M−j , the necessary
condition is formally expressed using regularized Boolean operators between these two
volumes:
(M−j ∪∗ Pi) −∗ M−j = φ. (4.1)
This equation states that Pi intersects M−j only along the edge loops forming its attachment
to M−(j+1), i.e., Pi does not cross the boundary of M−j at other location than
its attachment. The regularized Boolean subtraction states that limit configurations
producing common points, curve segments or surface areas between Pi and M−j at
other locations than the attachment of Pi are acceptable. This condition strongly reduces
the number of primitives over time. Figure 4.13 illustrates the list of 9 primitives
identified from an object M−j . 8 primitives in 4.13a satisfy the validity criterion as
they are included in M−j . The primitive in 4.13b is not fully included in M−j and is
104Chapter 4: Extraction of generative processes from B-Rep shapes
IG
( type 1a surface )
(a)
(b)
(c)
IG
( type 1b surface )
IG
( type 2 volume )
Pi
Pi
Pi
Fictive edge
e1
e2
Figure 4.14: Illustration of the removal of Pi with three different interface types: (a) type
1a, (b) type 1b, (c) type 2.
removed from the set. Another example in Figure 4.11 at step 2 shows that primitives
P2 and P3 can be discarded.
Removal of Pi
The next step is the generation of M−(j+1) once Pi has been identified and removed
from M−j . Depending of the type of IG, some faces of Pi may be added to ensure that
M−(j+1) is a volume (see Figure 4.11 steps 3 and 4). For each category of interface
between Pi and M−j , the removal operation is described as follow:
• Type 1a: If IG is of type 1a, then the faces adjacent to the contour edges of F b1
are orthogonal to F b1. These faces are either planar or cylindrical. IG contains
the faces extending these faces, Fa1 , to form the lateral faces of Pi that were
‘hidden in M−j ’. Edges of the attachment of Pi belonging to lateral faces of Pi
can be lateral edges (either real or fictive ones) or arbitrary ones. Lateral edges
bound faces in Fa1 , arbitrary edges bound the extension of the partly visible
lateral faces of Pi, they belong to: Fa2 . Then, IG may contain the extension of
F b2 called Fa3 such that: F b2 ∪ Fa3 = F b1. Then:
∂M−(j+1) = (∂M−j − ∂Pi) ∪ (Fa1 ∪ Fa2 ∪ Fa3 ), (4.2)
where ∂M−j is the set of connected faces bounding M−j , ∂Pi is the set of connected
faces bounding the visible part of Pi. ∂M−(j+1) defines a closed, orientable
surface, without self intersection. M−(j+1) is therefore a volume. Figure 4.14 a
and Figure 4.15 illustrate this process for interface of type 1a;
• Type 1b: If IG is of type 1b, IG contains a set of faces extending lateral faces of
Pi: Fa1 . To reduce the description of the various configurations, let us focus on
the key aspect related to the extension of F b2 contained in IG. If this extension
105Chapter 4: Extraction of generative processes from B-Rep shapes
Fb1
Partly visible
base face Fb2
Partly visible
lateral face of Pi
Visible lateral
faces of Pi
Fa1
Fa3
Fa2
Lateral edge
¶M_ j (¶M_ j - ¶Pi) ¶M_ (j+1)
Figure 4.15: Illustration of the removal of Pi for interface of surface type 1a and generation
of ∂M−(j+1) with the extension of lateral and base faces.
can be defined like Fa3 above, it has to be observed that fictive edges of this
extension in M−j are replaced by convex edges in M−(j+1), i.e., edges of the
same type (convex) as their corresponding edges in F b1 (see Figure 4.11 step 3
left image). Without going into details, these fictive edges can be removed to
simplify the contour of Pi since they bring unnecessary complexity to Pi and
does not affect the complexity of M−(j+1). In addition to simplify progressively
the object’s shape, reducing the complexity of primitives’ contours is a way to
obtain primitives having a form as simple as possible. The corresponding effect
is illustrated on Figure 4.11 steps 3 and 4 and on Figure 4.14b. This contour
simplification can influence the contents of the sets Fa1 and Fa3 above but it has
no impact on the integrity of the volume M−(j+1) obtained;
• Type 2: If IG belongs to category 2, it contains at least one volume sub-domain.
Here again the diversity of configurations can be rather large and it is not intended
to give a detailed description of this category. A first condition to generate a
volume interface relates to surfaces adjacent to Pi. If S is the extension of such
a surface and S ∩∗ Pi �= φ, S may contribute to the generation of a volume
sub-domain. Then, each of these surfaces has to be processed. To this end, all
the edges attaching Pi in M−(j+1) and bounding the same surface in M−(j+1)
are grouped together since they form a subset of the contour of faces possibly
contributing to a volume sub-domain. These groups are named Ea. Such an
example of edge grouping is given in Figure 4.14b where e1 and e2 are grouped
because of their adjacency between Pi and the same cylindrical surface. Ea,
together with other sets of edges are used to identify loops in S that define a
volume sub-domain of IG that must satisfy validity conditions not described here
for sake of conciseness. Figure 4.16 illustrates the identification of a volume
interface, S divides Pi into two volume sub-domains and generates a volume
interface.
There may be several valid volume sub-domains defining alternative sets of faces
to replace the visible part of Pi, ∂Pi, in ∂M−j by sets of faces that promote either the
106Chapter 4: Extraction of generative processes from B-Rep shapes
Fb1
¶M_ j (¶M_ j - ¶Pi)
Pi
S
+
Volume
interface
type 2
Surface
interface type 1a
¶M_ (j+1)
=
Ea1
Ea2
Ea3
Figure 4.16: Illustration of the removal of Pi containing a volume interface of type 2.
extension of surfaces adjacent to Pi or the imprint of Pi in M−(j+1) with the use of faces
belonging to the hidden part of Pi in M−j . All the variants are processed to evaluate
their possible contribution to the generative process graph.
If, in a general setting, there may be several variants of IG to define M−(j+1),
these variants always produce a realizable volume, which differs from the half-space
decomposition approaches studied in [SV93, BC04] where complement to the halfspaces
derived from their initial boundary were needed to produce a realizable volume.
4.5 Extracting the generative process graph
Having defined the primitive removal operator, the purpose is now to incorporate constraints
on variants of IG so that a meaningful set of models M−j , j > 0, can be
generated to produce a generative process graph.
4.5.1 Filtering out the generative processes
As mentioned earlier, the principle of the proposed approach is to ‘go back in time’
from model M to single primitives forming the roots of possible construction trees. The
main process to select primitives to be removed from M−j is based on a simplification
criterion.
Primitive selection based on a shape simplicity concept
107Chapter 4: Extraction of generative processes from B-Rep shapes
nj = 8
F1
F2
F5
F3
F4
F8
F6
F1
F3 F2
F4
F4
F7
n(j+1) = 4 1
n(j+1) = 7 2
n(j+1) = 6 3
F1
F6 F5
F2 F3
F7
F1 F2
F3 F4
F5
F6
Volume Interface
P1
P2
P3
M-j
M-(j+1)
M-(j+1)
M-(j+1)
2
3
1
δj1 = 4
δj1 = 1
δj1 = 2
Figure 4.17: Illustration of the simplicity concept to filtering out the generative processes.
The number of maximal faces of is greatly reduced with P1 than P2 and P3.
Any acceptable primitive removal at step j of the graph generation must produce a
transformation of M−j into k objects M−(j+1)k using IGk , one of the variants of IG, such
that M−(j+1)k is simpler than M−j . This simplicity concept is a necessary condition
for the graph generation to converge toward a set of construction trees having a single
primitive as root. Consequently, the simplicity concept applied to the transition between
M−j and M−(j+1)k is sufficient to ensure the convergence of the graph generation
process.
The shape simplification occurring between M−j and M−(j+1)k can be defined as
follows. First of all, it has to be considered that ∂M−j and ∂M−(j+1)k contain maximal
faces and edges. In fact, after Pi is removed and replaced by IGk to produce M−(j+1)k ,
its boundary decomposition is re-evaluated to contain maximal faces and edges only.
Then, let nj be the number of (maximal) faces in M−j and n(j+1)k be the same quantity
for M−(j+1)k , the quantity δjk:
δjk = nj − n(j+1)k (4.3)
characterizes the shape simplification under the variant IGk if:
δjk ≥ 0. (4.4)
This condition is justified because it enforces a ‘diminishing number of maximal faces
over time’, which is an intrinsic quantity to each shape.
Figure 4.17 illustrates the simplicity criterion between three primitives P1, P2, and
P3 to be removed from a solid M−j . M−j , the initial solid, contains nj = 8 (maximal)
faces. When removing P1 from M−j , the resulting solid M−(j+1)1 contains n(j+1)1 = 4
(maximal) faces. Identically, the resulting solids from P2 and P3 contains respectively
n(j+1)2 = 7 and n(j+1)3 = 6 (maximal) faces. As a result, the primitive P1 is selected
because the quantity δj1 = 4 is greater than δj2 and δj3. By removing P1, the resulting
object M−j is simpler than with P2 or P3.
108Chapter 4: Extraction of generative processes from B-Rep shapes
4.5.2 Generative process graph algorithm
Having defined the condition to evolve backward in the generative process graph, the
graph generation is summarized with algorithm 1.
Algorithm 1 Extract generative process graph
1: procedure Extract graph � The main procedure to extract generative processes of a solid M
2: inputM
3: node list ← root; current node ← root;
4: arc list ← nil; current arc ← nil; node list(0) = M
5: while size(node list) > 0 do � Stop when all solids M−j reach a terminal primitive root
6: current node = last element of list(node list)
7: M−j = get solid(current node)
8: conf ig list = P rocess variant(M−j )
9: compare conf ig(get all conf ig(graph), conf ig list) � Compare new variants with the existing graph nodes
10: for each conf ig in conf ig list do
11: M−(j+1) = remove primitives(M−j , conf ig) � Remove the identified primitives from M−j
12: node = generate node(M−(j+1), conf ig)
13: add node(graph, node)
14: arc = generate arc(node, current node)
15: add arc(graph, arc)
16: append(node list, node)
17: end for
18: remove element from list(node list, current node)
19: end while
20: end procedure
21: procedure conf ig list = P rocess variant(M−j ) � Process each variant M−j to go ’backward in time’
22: initialize primitive list(prim list)
23: ext list = f ind extrusion(M−j )
24: for each Pi in ext list do
25: Pi = simplif y prim contour(Pi, M−j )
26: interf list = generate geom interfaces(Pi, M−j )
27: interf list = discard complex(interf list, Pi, M−j )
28: if size(interf list) = 0 then
29: remove from list(Pi, ext list);
30: end if
31: append(prim list, interf list(i))
32: end for
33: sort primitive(prim list)
34: conf ig list = generate independent ext(prim list, M−j , )
35: end procedure
36: procedure ext list = f ind extrusion(M−j ) � Find sets of primitives to be removed from M−j
37: ext list = f ind visible extrusions(M−j );
38: ext list = remove ext outside model(M−j , ext list); � Reject primitives not totally included in M−j
39: ext list = remove ext included ext(ext list); � Process only maximal primitives
40: end procedure
The main procedure Extract graph of the algorithm 1 processes the node list containing
the current variants of the model at the current step ‘backward in time’ using
the procedure P rocess variant and compares the new variants to the existing graph
nodes using compare conf ig. If variants are identical, graph nodes are merged, which
creates cycles. Then, Extract graph adds a tree structure to a given variant corresponding
to the new simpler variants derived from M−j . The graph is completed when
there is no more variant to process, i.e., node list is empty. Here, the purpose is to
remove (using remove primitives) the largest possible amount of primitives Pi whose
interfaces IGk are not overlapping each other, i.e., ∀(i, j, k, l), i �= j, IGk ∈ Pi, IGl ∈ Pj ,
109Chapter 4: Extraction of generative processes from B-Rep shapes
P1 P2 P3
(a) (b)
Criterion of Maximal Primitive Criterion of Independence
dependent
edges
independent
edges
Figure 4.18: Selection of primitives: (a) Maximal primitive criterion not valid for P2 and P3
because they are included in P1, (b) two dependent primitives with common edges in red.
IGl ∩ IGk = φ, otherwise δjk would not be meaningful. Selecting the largest possible
amount of Pi and assigning them to a graph node is mandatory to produce a compact
graph. Each such node expresses the fact that all its Pi could be removed, one by one,
in an arbitrary order, which avoids describing trivial ordering changes. The primitive
removal operator, described in Section 4.4.3, generates not only simpler solids’ shapes
but also simplify the primitives’ contours (using simplify prim contour). Both simpli-
fication effects reduce considerably the complexity of the extracted generative processes
compared to the initial construction tree of the CAD component.
To process each variant M−j of M, P rocess variant starts with the identification
of valid visible extrusion primitives in M−j using f ind extrusion (see Sections 4.4.2
and 4.4.3 respectively). However, to produce maximal primitives (see Hypothesis 1),
all valid primitives which can be included into others (because their contour or their
extrusion distance is smaller than the others) are removed (remove ext included ext).
Figure 4.18a shows two primitives P2 and P3 included in a maximal primitive (see
Hypothesis 1) P1.
Once valid maximal primitives (see Hypothesis 1) have been identified, processing
the current variant M−j carries on with contour simplification: simplify prim contour,
if it does not impact the shape complexity of M−(j+1) (see Section 4.4.3). Then, all the
valid geometric interfaces IGk of each primitive are generated with
generate geom interf aces (see Section 4.4.3) and interfaces IGk increasing the shape
complexity are discarded with discard complex to ensure the convergence (see Section
4.5.1). Sets of independent primitives are ordered to ease the user’s navigation in
the graph. As illustrated in Figure 4.18, two primitives are independent if there is no
geometric intersection between them.
4.6 Results of generative process graph extractions
The previous process described in Section 4.5 has been applied to a set of components
whose shapes are compatible with extrusion processes to stay consistent with
110Chapter 4: Extraction of generative processes from B-Rep shapes
(c) (d)
(a)
T
T
T
B
T
T
B
T
T
T
(b)
Figure 4.19: Extraction of generative processes for four different components: a, b, c, d.
Orange sub-domains highlight the set of visible primitives removed at each step of the graph
generation. Construction graph reduces to a tree for each of these components: (a) T and B
indicate Top and Bottom views to locate easily the primitives removed. Other components
use a single view.
111Chapter 4: Extraction of generative processes from B-Rep shapes
algorithm 1 though they are industrial components. The results have been obtained
automatically using algorithm 1 implemented using Python and bindings with Open
Cascade (OCC) library [CAS14]. The complexity of Algorithm 1 is O(n2). Regarding
time, most consuming operations refer to the procedure f ind extrusion which uses
boolean operations to verify the validity of each primitive. Therefore, the practical
performance of the algorithm is dependent on the robustness and complexity of the
boolean operators. Statistics given are the amount of calls to a generic Boolean type
operator available in the OCC [CAS14] library, the total number of visible primitives
(f ind visible extrusions), nv, and the final number of Pi in the graph, np.
Results on industrial shapes
Figure 4.19 shows the generative processes extracted from four different and rather
simple components. They are characterized by triples (nB; nv; np), (2183; 220; 8),
(9353; 240; 31), (8246; 225; 15), (1544; 132; 6), for (a), (b), (c) and (d), respectively.
The graph structure reduces to a tree one for each of them. It shows that merging all
extrusions in parallel into a single node can be achieved and results into a compact
representation. These results also show the need for a constraint that we can formalize
as follows: configurations produced by generate independent ext must be such that
each variant M−(j+1)k generated from M−j must contain a unique connected component
as it is with M. However, this has not been implemented yet. This continuity constraint
expresses the fact that M is a continuous medium and its design process follows this
concept too. Figure 4.21 illustrates this constraint on the construction graph of a
simple solid. The object M−11 is composed of 5 solids which represent a non continuum
domain. Consequently, any of its transformation stages must be so to ensure that any
simplified model, i.e., any graph node, can stand as basis for an idealization process.
Then, it is up to the idealizations and their hypotheses to remove such a constraint,
e.g., when replacing a primitive by kinematic boundary conditions to express a rigid
body behavior attached to one or more primitives in the graph.
Figure 4.20 shows the graph extracted from the component analyzed in Figure 4.1.
It is characterized by (111789; 1440; 62). Two variants appear at step 4 and lead to
the same intermediate shape at step 8. It effectively produces a graph structure. It
can be observed that the construction histories are easier to understand for a user than
the one effectively used to model the object (see Figure 4.1). Clearly, the extrusion
primitives better meet the requirements of an idealization process and they are also
better suited to dimension modification processes as mentioned in Section 4.1. The
current implementation of Algorithm 1 uses high-level operators, e.g., boolean operations,
rather than dedicated ones. This implementation limits the time reduction which
could be achieved compared to the interactive transformations. Issues also lies in the
robustness of CAD boolean operators which use quite complex modeling techniques.
In a future work, instead of boolean operators, specific operators can be developed for
an efficient implementation.
112Chapter 4: Extraction of generative processes from B-Rep shapes
M
M-1
M-2
M-3 M-3
M-8
M-42
M-52
M-62
M-72
M-7 1
M-6 1
M-5 1
M-4 1
L2 L1
Figure 4.20: Construction graph GD of a component. Orange sub-domains indicate the
removed primitives Pi at each node of GD. Labels M−jk indicate the step number j when
‘going back over time’ and the existence of variants k, if any. Arrows described the successive
steps of D. Arcs of GD are obtained by reversing these arrows to produce construction trees.
Steps M−61 and M−62 differ because of distinct lengths L1 and L2.
113Chapter 4: Extraction of generative processes from B-Rep shapes
M
M-1 M 2 -11
Non continuous
medium ( 5 solids)
Continuous
medium ( 1 solid)
Figure 4.21: Illustration of the continuity constraint with two construction processes of an
object M. The generated object M−11 is composed of 5 independent solids which represent
a non continuum domain. Object M−12 contains one solid which represents a continuum
domain.
Equivalence between a graph representation and a set of construction trees
Also, GD is a compact representation of a set of construction processes. Figure 4.22
illustrates the equivalence between a set of construction trees and the graph representation
GD. There, the set of primitives removed from M−j to obtain M−(j+1) is characterized
by the edge α−j,−(j+1) of GD that connects these two models. The cardinality
of this set of primitives is nj . If these nj primitives are related to different sketching
planes, they must be attached to nj different steps of a construction tree in a CAD
software. Without any complementary criterion, the ordering of these nj primitives
can be achieved in nj ! different ways involving nj additional nodes and edges in GD
to represent the corresponding construction tree. Here, it is compacted into a single
graph edge α−j,−(j+1) in GD between M−j and M−(j+1). Furthermore, the description of
this set of tree structures requires the expansion of α−j,−(j+1) into the nj ! construction
tree structures ending up to M−j . This modification of GD generates new cycles in GD
between M−j and M−(j+1). Indeed, the graph structure of GD is a much more compact
structure than the construction tree of CAD software. All the previous results and
observations show that GD is a promising basis for getting a better insight about a
shape structure and evaluating its adequacy for idealizations.
4.7 Extension of the component segmentation to
assembly structure segmentation
This section explains how the generative processes used for single B-Rep component
can be adapted to assembly structures of several B-Rep components.
114Chapter 4: Extraction of generative processes from B-Rep shapes
M-j M-(j+1)
Contruction Trees
Graph GD
Compact
representation
of nj primitives
in one edge α-j,-(j+1)
1 - 4
5
7
6
8
9 9
7 - 8
1 - 6
7
1 - 6
7
9
8
...
!nj ordering possibilities corresponding the nj primitives
Figure 4.22: A set of CAD construction trees forming a graph derived from two consecutive
construction graph nodes.
115Chapter 4: Extraction of generative processes from B-Rep shapes
P7
P3
P17
P1
P2
P4
P6
P8
P9
P10 P11 P12 P13
P14 P15
P16 P18
P5
Interface Graph
between primitives
C1
C2
C3
C4
Interface Graph
between components
(a) Component (b) Assembly
Figure 4.23: Illustration of the compatibility between the component segmentation (a) and
assembly structure segmentation (b).
Equivalence between generative processes of components and assembly structures
As explained in 1.3.1, a CAD assembly structure contains a set of volume B-Rep
components located in a global reference frame. The method of Jourdes et al. [JBH∗14]
enriches the assembly with geometric interfaces between components. Shahwan et
al. [SLF∗12, SLF∗13] further enrich the results of Jourdes et al. with functional designation
of components. As a result, the final assembly model is composed of a set of
3D solid components connected to each other through functional interfaces.
An equivalence can be made between this enriched assembly structure (see Figure
4.23b) and generative processes of components. Indeed, a solid decomposition
of each component can be derived from its generative processes expressed with GD.
It provides intrinsic structures of components made of 3D solid primitives linked by
geometric interfaces (see Figure 4.23a). These structures are compatible with the assembly
structure also described using 3D solids and interfaces. The decomposition of
each component, GD, can be integrated into an assembly graph structure. Figure 4.24a
illustrates an assembly of two components C1 and C2 connected by one assembly interface
I1,2. In 4.24b, each component is subdivided into two primitives (P1,1, P1,2) and
(P2,1, P2,2), respectively, linked by geometric interfaces I11,12 and I21,22 , respectively.
Now, the assembly structure can be represented by a graph GA where nodes represent
the assembly components and edges contains functional assembly interfaces. Each solid
decomposition of a component Ci also constitutes a graph structure GDi which can be
nested into the nodes of GA, see 4.24c, in a first place.
116Chapter 4: Extraction of generative processes from B-Rep shapes
Graph of the final enriched
assembly model
P1.1 P1.2
C1
C2
I1/2 I1/2
P1.1
P1.2
P2.2
P2.1
I1.1/1.2
P2.1
P2.2
I1/2
I2.1/2.2
I1.1/1.2
Assembly structure Components segmentation
(a) (b) (c)
Figure 4.24: Insertion of the interface graphs between primitives obtained from component
segmentations into the graph of assembly interfaces between components GA: (a) The assembly
structure with its components and assembly interfaces between these components, (b) the
components segmented into primitives and interfaces between these primitives forming GDi ,
(c) the graph of the final enriched assembly model.
Advantages for the shape analysis of components and assemblies
The compatibility of the component segmentation with the assembly graph structure
is a great benefit for the analysis algorithms dedicated to the determination of
the simulation modeling hypotheses. Considering sub-domains and interfaces as input
data to a general framework enabling the description of standalone components as
well as assemblies, the analysis algorithms can be applied at the level of a standalone
component as well as at the assembly level. This property extends the capabilities
of the proposed FEA pre-processing methods and tools from the level of standalone
components to an assembly level and contributes to the generation of FE analyses of
assembly structures.
However, it has to be pointed out that the nesting mechanism of GA and GDi
has been briefly sketched and a detailed study is required to process configurations
in which component interfaces are not exactly nested into component primitive faces,
e.g., interface I1,2 that covers faces of P2,1 and P2,2. Additionally, interfaces used for
illustration are all of type surface, whereas interfaces between primitives can be of
types surface or volume and geometric interfaces between components can be of type
contact or interference. If, in both cases, this leads to common surfaces or volumes,
the detailed study of these configurations is left to future work to obtain a thorough
validation.
4.8 Conclusion
This chapter has described a new approach to decompose a B-Rep shape into volume
sub-domains corresponding to primitive shapes, in order to obtain a description that
is intrinsic to this B-Rep shape while standing for a set of modeling actions that will
be used to identify idealizable sub-domains.
117Chapter 4: Extraction of generative processes from B-Rep shapes
Construction trees and shape generation processes are common approaches to model
mechanical components. Here, it has been shown that construction trees can be extracted
from the B-Rep model of a component. Starting with a B-Rep object free of
blends, the proposed approach processes it by iteratively identifying and removing a
set of volume extrusion primitives from the current shape. The objective of this phase
is to ‘go back in time’ until reaching root primitives of generative processes. As a
result, a set of non-trivial generative processes (construction trees) is produced using
the primitives obtained at the end of this first phase.
It has been shown that construction trees are structured through a graph to represent
the non trivial collection of generative processes that produce the input B-Rep
model. This graph contains non trivial construction trees in the sense that neither
variants of extrusion directions producing the same primitive are encoded nor are the
combinatorial variants describing the binary construction trees of CAD software, i.e.,
material addition operations that can be conducted in parallel are grouped into a single
graph node to avoid the description of combinatorial combinations when primitives are
added sequentially as in CAD software. Thus, each node in the construction graph
can be associated with simple algorithms to generate the trivial construction variants
of the input object.
The proposed method includes criteria which generate primitives with simple shapes
and which ensure that the shape of intermediate objects is simplified after each primitive
suppression. These properties guarantee the algorithm to be convergent.
Finally, a graph of generative processes of a B-Rep component is a promising basis to
gain a better insight of a shape structure and to evaluate its adequacy for idealizations.
It has been illustrated that this process can also be extended to the assembly context
with the nesting of the primitive-interface structure with respect to the componentinterface
one. The next Chapter 5 describes how a construction graph can be efficiently
used in an idealization process.
118Chapter 5
Performing idealizations from
construction graphs
Benefiting from the enrichment of a component shape with its construction graph,
this chapter details the proposed morphological approach and the idealization
process to generate idealized representations of a component shape’ primitives.
Based on this automated decomposition, each primitive is analyzed in order to
define whether it can be idealized or not. Subsequently, geometric interfaces
between primitives are taken into account to determine more precisely the idealizable
sub-domains. These interfaces are further used to process the connections
between the idealized sub-domains generated from these primitives to finally
produce the idealized model of the initial object. Also it is described how the
idealization process can be extended to assembly models.
5.1 Introduction
According to Section 1.5.4, shape transformations taking place during an assembly simulation
preparation process interact with simulation objectives, hypotheses, and shape
transformations applied to standalone components and to their assembly interfaces.
Section 2.3 underlines the value of a shape analysis prior to the application of these
transformations to characterize their relationship with geometry adaption and FEA
modeling hypotheses, especially in the scope of idealization processes which need to
identify the candidate regions for idealization.
As explained in Chapter 2, prior research work has concentrated on identifying idealizable
areas rather than producing simple connections between sub-domains [LNP07b,
SSM∗10, MAR12, RAF11]. Recent approaches [CSKL04, Woo14] subdivide the input
CAD model into simpler sub-domains. However, these segmentation algorithms do not
aim at verifying the mechanical hypotheses of idealization processes and the identified
features found do not necessarily produce appropriate solids for dimensional reduction
operators. The idealization process proposed in this chapter benefits from the shape
119Chapter 5: Performing idealizations from construction graphs
IP2/P3
C1
IP2/P3
Graph of volume
primitives of C1
P1 P2
P3
IP1/P3
P3
P1 P2
IP1/P3
Component C1
Medial
Surfaces
e1 e2
e3
P1 P2
P3
Idealizable
subdomains
Non idealizable
subdomains
e1 e2
e3
Thickness
Morphological
analysis of component
Full idealized
CAD model
Construction graph
Figure 5.1: From a construction graph of a B-Rep shape to a full idealized model for FEA.
structure produced by construction graphs generated from a component as a result of
the process described in Chapter 4 and containing volumes extrusion primitives which
can be already suited to idealization processes. This construction graph directly offers
the engineer different segmentation alternatives to test various idealization configurations.
Starting from a construction graph of a B-Rep model, this chapter describes a
morphological analysis approach to formalize the modeling hypotheses for the idealization
of a CAD component. This formalization leads to the generation of a new
geometric structure of a component that is now dedicated to the idealization process.
Figure 5.1 illustrates the overall process which is then described in the following sections.
Section 5.2 explains the advantages of applying a morphological analysis on a
component shape and states the main categories of morphology that needs to be located.
Section 5.3 describes the general algorithm proposed to analyze the morphology
of a B-Rep shape from its generative processes containing extrusion primitives. The
algorithm evaluates each primitive morphology and process interfaces between these
primitives to extend the morphological analysis to the whole object. Section 5.4 studies
the influence of external boundary conditions and of assembly interfaces on the
new component structure. There, the objective is to determine the adequacy of the
proposed approach with an assembly structure. Section 5.5 illustrates the process to
derive idealized models from a set of extrusion primitives and geometric interfaces.
5.2 The morphological analysis: a filtering approach
to idealization processes
A common industrial principle of the FEA of mechanical structures is to process the
analysis step-by-step using a top-down approach. To simulate large assembly struc-
120Chapter 5: Performing idealizations from construction graphs
tures, i.e., aeronautical assemblies, a first complete idealized mesh model is generated
to evaluate the global behavior of the structure. Then, new local models are set up
to refine the global analysis in critical areas. At each step of this methodology, the
main purpose of the pre-processing task is to generate, as quickly as possible, a well
suited FE model. In the industry, guidelines have been formalized to help engineers
defining these FE models and correctly applying the required shape transformations.
Although these guidelines are available for various simulation objectives, there are still
difficulties about:
• The model accuracy needed to capture the mechanical phenomenon to be evaluated.
An over-defined model would require too many resources and thus, would
delay the results. In case of large assemblies, the rules set in the guidelines are
very generic to make sure a global model can be simulated in practice. This way,
the FEM is not really optimized. As an example, the mesh size is set to a constant
value across all geometric regions of the components and is not refined in
strategic areas. Section 1.4 points out current engineering practices to generate
large FE assembly models;
• The application of modeling rules. The engineer in charge of the FEM creation
has difficulties when identifying the regions potentially influencing or not the
mechanical behavior of the structure, prior to the FEA computation results. In
addition, evaluating the geometric extent of the regions to be idealized as well
as determining the cross influences of geometric areas on each other are difficult
tasks for the engineer because they can be performed only mentally, which is even
harder for 3D objects. Section 2.3 highlights the lack of idealization operators to
delimit their conditions of application.
In case of large assembly data preparation, automated tools are required (due to
model size and time consuming tasks). These tools have to produce simulation models
in line with the two previous challenges (model accuracy and rule-based modeling).
In the following sections, we introduce approaches to deal with such challenges using
morphological analysis tools. These tools support the engineers when comparing the
manufactured shape of a component with the simplification and idealization hypotheses
needed to meet some simulation hypotheses.
5.2.1 Morphological analysis objectives for idealization processes
based on a construction graph
As introduced in Chapter 3, a major objective of this thesis aims at improving the
robustness of FE pre-processing using a shape analysis of each component before the
application of shape transformation operators. For a simulation engineer, the purpose
is to understand the shape, support the localization of transformations, and to build
121Chapter 5: Performing idealizations from construction graphs
the different areas to transform in the initial CAD models. This scheme contributes to
an a priori approach that illustrates the application of modeling hypotheses, especially
the idealization hypotheses. In addition, this approach is purely morphological, i.e., it
does not depend on discretization parameters like FE sizes.
Morphological categories identified in solid models
The first requirement of the idealization process is to identify which geometric regions
of the object contain proportions representing a predefined mechanical behavior.
In the scope of structural simulations, the predefined categories representing a specific
mechanical behavior correspond to the major finite element families listed in Table 1.1.
These categories can be listed as follows:
• Beam: a geometric sub-domain of an object with two dimensions being signifi-
cantly smaller than the third one. These two dimensions define the beam cross
section;
• Plate and shell: a geometric sub-domain of an object with one dimension being
significantly smaller than the two others. This dimension defines the thickness
of the plate or the shell, respectively;
• 3D thick domain: a geometric sub-domain that does not benefit from any of the
previous morphological properties and that should be modeled with a general 3D
general continuum medium behavior.
From a geometric perspective, the principle of the idealization process corresponds
to a dimensional reduction of the manifold representing a sub-domain of the solid object,
as defined in 1.2.1. A detailed description of the idealization hypotheses is available
in Section 1.4.2. To construct fully idealized models derived from an object M,
geometric connection operations between idealized sub-domains must be performed.
As stated in Chapter 2, automated geometric transformations do not produce accurate
results in connections areas. The main issue lies in the determination of the geometric
boundaries where the connection operators must process the idealized sub-domains
(see Figure 2.8). Currently, the engineer applies these operators manually to define the
direction and the extent of the connection areas (see Figure 1.15 illustrating a manual
process to connect medial surfaces). The proposed idealization process benefits from
an enriched initial component model with a volume segmentation into sub-domains
and into interfaces between them that contain new geometric information to make the
connections operators robust. This segmentation gives the engineer, a visual understanding
of the impact of simulation hypotheses on the component geometry. Additionally,
the proposed analysis framework identifies the regions that can be regarded as
details, independently of the resolution method. These regions represents areas having
no significant mechanical influence with respect to the morphological category of their
neighboring regions.
122Chapter 5: Performing idealizations from construction graphs
In case of assembly structures, the categories presented above are still valid at
the difference that the identified geometric domains are not anymore a sub-domain
restricted to a single solid. Indeed, a group of components can be considered as a
unique beam, plate, or shell element. In this case, if the interfaces between a group of
connected sub-domains from different components have been defined as mechanically
rigid connections by the engineer, this group of sub-domains can also be identified as
a unique continuum, hence distinguishing components is not necessary anymore. The
effects of assembly interfaces are detailed in Section 5.4.
Adequacy of generative construction graphs with respect to the morphological
analysis
A shape decomposition is a frequent approach to analyze and structure objects
for FEA requirements. Section 2.4 has highlighted the limits of current morphological
analysis methods and underlined the need of more robust automatic techniques adapted
to FE model generation. The proposed approach uses the generative construction
graph GD to perform a morphological analysis of CAD components adapted to FEA
requirements. Section 4.2 has addressed the advantages of construction graphs to
structure the shape of a component. It proposes a compact shape decomposition of
primitives containing a fair amount of information that is intrinsic to this shape. The
geometric structure of GD with sub-domains and associated interfaces is close to the
structure described in Section 5.2.1 with regions candidate to idealization. GD also
offers various construction processes which enable the engineer to construct and study
various simulation models that can be derived from the same component using different
construction processes.
Generating the idealization of an object M from a set of primitives, obtained from
its construction graph GD, is more robust compared to the prior idealization methods
for three reasons:
• The information contained in GD is intrinsic to the definition of primitives. Each
maximal primitive Pi ∈ GD and its associated interfaces determine both the
3D location of the idealized representation of Pi and its connections with its
neighboring idealized primitives;
• The effective use of connections between sub-domains to be idealized. A taxonomy
of categories of connections can be defined. This classification determines
the most suitable geometric operator to process each connection. Currently, the
idealization process still relies on the engineer’s expertise to manage complex
connections whereas a CAD or a CAE software is bound to much simpler connections;
• Shape modification processes of components. When a component shape modification
is performed, only the impacted primitives have to be revised in its
123Chapter 5: Performing idealizations from construction graphs
· Global morphological analysis of each primitive Pi using extrusion distance
· Morphological analysis of the extrusion contour of each primitive Pi and determination of the geometric
sub-domains Dj(Pi)to be idealized in Pi
Morphological analysis of the primitives Pi
01
step
Extension of the morphological analysis of primitives Pi to the whole object
02
step
· Categorization of the interfaces IG between primitives Pi
· Segmentation of the primitives Pi in new partitions P’ based on the interfaces IG typology
· Merge or make independent the new partitions P’ with the primitives Pi to obtain a segmentation which is
most suited for idealization
Idealization of the primitives Pi and processing connections
· Generation of mid-surface and mid-lines of the primitives Pi to be idealized
· Connections of the idealized models of the primitives Pi
03
step
Figure 5.2: Global description of an idealization process.
construction graph. Therefore, the idealization process can be locally updated
and does not have to be restarted over from its shape decomposition.
The next section details the structure of the proposed idealization process from the
exploitation of the geometric information provided with the construction graph GD of
a component to the generation of its idealized models.
5.2.2 Structure of the idealization process
The idealization process of an object M is based on morphological analysis operations,
idealization transformations and connections between idealized sub-domains. Its
objective is to produce the idealized model, denoted by MI , of the initial object M.
Figure 5.2 contains a comprehensive chart illustrating the various steps of the proposed
idealization process. In a first step, the decomposition of M into primitives Pi,
described in the graph GD, leads to a first morphological analysis of each primitive Pi.
For each extrusion primitive, this morphological analysis determines whether Pi has a
morphology of type plate, shell, or a morphology of type thick 3D solid (see Section 5.2
describing the morphology categories). This first step is described in Section 5.3.1.
Then, a second morphological analysis is applied to each primitive Pi to determine
whether or not it can be subdivided into sub-domains Dij , morphologically different
from the one assigned to Pi. This analysis is performed using the 2D extrusion contour
124Chapter 5: Performing idealizations from construction graphs
of the primitive Pi. The resulting decomposition of Pi generates new interfaces IG,
integrated in GD.
In a second phase, using a typology of connections between the different categories
of idealizations, the interfaces IG between Dij are used to propagate and/or update
the boundary of the primitives Pi. This step, described in Section 5.3.3, results in
the decomposition of the object M into sub-domains with a morphology of type beam,
plate/shell, or 3D thick solid. The third phase consists in generating the idealization of
each primitive Pi and then, it connects the idealized domains of Pi using the typology
and the location of the interfaces IG. During this operation, the morphology of each
Pi, combined with the typology of each of its interfaces IG, is used to identify regions
to be considered as details, independently from any FE size. The generation of an
idealized model is described in Section 5.5.
Overall, the different phases illustrated in Figure 5.2 fit into an automated process.
The engineer can be involved in it to select some connection model between idealized
sub-domains or some boundary adjustment category of idealized sub-domain depending
on its types of connections. The next sections detail each step of the proposed
idealization process.
5.3 Applying idealization hypotheses from a construction
graph
The purpose of this section is to illustrate how the construction graph GD of an object
M obtained with the algorithm described at Section 4.5.2 can be used in shape idealization
processes. In fact, idealization processes are high level operations that interact
with the concept of detail because the idealization of sub-domains, i.e., Pi obtained
from GD, triggers their dimensional reduction, which, in turn, influences the shape
of areas around IGs, the geometric interfaces between these sub-domains. Here, the
proposed approach is purely morphological, i.e., it does not depend on discretization
parameters like FE sizes. It is divided into two steps. Firstly, each Pi of GD is evaluated
with respect to an idealization criterion. Secondly, according to IGs between Pis,
the ‘idealizability’ of each Pi is propagated in GD through the construction graph up
to the shape of M. As a result, an engineer can evaluate effective idealizable areas.
Also, it will be shown how variants of construction trees in GD can influence an idealization
process. Because the idealization process of an object is strongly depending
on the engineer’s know-how, it is the principle of the proposed approach to give the
engineer access to the whole range of idealization variants. Finally, some shape details
will appear subsequently to the idealization process when the engineer will define FE
sizes to mesh the idealized representation of M.
125Chapter 5: Performing idealizations from construction graphs
e
Thickness
Max Diameter
d
d
(a) (b)
e
Figure 5.3: Determination of the idealization direction of extrusion primitives using a 2D
MAT applied to their contour. (a) Configuration with an extrusion distance (i.e., thickness d
= e) much smaller than the maximal diameter obtained with the 2D MAT on the extrusion
contour, the idealization direction corresponds to the extrusion direction (b) Configuration
with an extrusion distance much larger than the maximal diameter obtained with the 2D MAT
on the extrusion contour, the idealization direction is included in the extrusion contour.
5.3.1 Evaluation of the morphology of primitives to support
idealization
Global morphological analysis of each primitive Pi
In a first step, each primitive Pi extracted from GD is subjected to a morphological
analysis to evaluate its adequacy for idealization transformation into a plate or a shell.
Because the primitives are all extrusions and add material, analyzing their morphology
can be performed with a MAT [MAR12, RAM∗06, SSM∗10].
A MAT is particularly suited to extrusion primitives having constant thickness since
it can be applied in 2D. Furthermore, it can be used to decide whether or not subdomains
of Pi can be assigned a plate or shell mechanical behavior. In the present case,
the extrusion primitives obtained lead to two distinct configurations (see Figure 5.3).
Figure 5.3a shows a configuration with a thin extrusion, i.e., the maximal diameter Φ
obtained with the MAT from Pi’s contour is much larger than Pi’s thickness defined by
the extrusion distance d. Then, the idealized representation of Pi would be a surface
parallel to the base face having Pi’s contour. Figure 5.3b shows a configuration where
the morphology of Pi leads to an idealization that would be based on the content of
the MAT because d is much larger than Φ.
To idealize a sub-domain in mechanics [TWKW59], a commonly accepted reference
proportion used to decide whether a sub-domain is idealizable or not is a ratio of ten
between the in-plane dimensions of the sub-domain and its thickness, i.e., xr = 10.
Here, this can be formalized with the morphological analysis of Pi obtained from the
MAT using: x = max((max Φ/d),(d/max Φ)). Consequently, the ratio x is applicable
for all morphologies of extrusion primitives.
126Chapter 5: Performing idealizations from construction graphs
d: extrusion distance
d = 2
(b)
(c)
d < max Ø
x =
d > max Ø
x d =
max Ø
max Ø Ratio x
MAT 2D
d = 35
0 3
xu xr
1.5 < <25
x 1.5 = 25 = 16.6 d = 1.5
(a)
Max Diameter Ø = 25
Max Diameter Ø = 10
d = 25
Max Diameter Ø = 25
Primitive Morphology
(d)
35 > 10
x 10 = 35 = 3.5
2 < 10
x 2 = 10 = 5
25 = 25
x 25 = 25 = 1
10
Max Diameter Ø = 10
d
Table 5.1: Categorization of the morphology of a primitive using a 2D MAT applied to the
contour of extrusion primitives. Violet indicates sub-domains that cannot be idealized as
plates or shells (see component d), green ones can be idealized (see component a) and yellow
ones can be subjected to user decision (see component b and c).
127Chapter 5: Performing idealizations from construction graphs
Because idealization processes are heavily know-how dependent, using this reference
ratio as unique threshold does not seem sufficient to help an engineer analyze
sub-domains, at least because xr does take precisely into account the morphology of
Pi’s contour. To let the engineer tune the morphological analysis and decide when Pi
can/cannot be idealized a second, user-defined threshold, xu < xr, is introduced that
lies in the interval ]0, xr[. Figure 5.3b illustrates a configuration where the morphological
analysis does not produce a ratio x > xr though a user might idealize Pi as a
plate.
Let xu = 3 be this user-defined value, Table 5.1 shows the application of the 2D
MAT to the contours of four extrusion primitives. This table indicates the three categories
made available to the engineer to visualize the morphology of Pi. Primitives
with a ratio of x > xr, e.g., primitive (a), are considered to be idealizable and are
colored in green. Primitives with a ratio of xu < x < xr, e.g., primitives (b) and (c),
are subjected to a user’s decision for idealization and are colored in yellow. Finally,
primitives with a ratio x < xu, e.g., primitive(d), indicate sub-domains that cannot be
idealized and are colored in violet.
Figure 5.4 illustrates the evaluation of the morphology of the primitives of a component
prior to its idealization. The component has been initially segmented into
15 extrusion primitives using the algorithm presented at Section 4.5.2. Then, the 2D
MAT has been applied to the extrusion contour of each primitive to determine the
maximal diameter Φ. Finally, this diameter is compared to the extrusion distance of
the corresponding primitive to determine the ratio x. Three morphological evaluations
are presented in Figure 5.4 that correspond to different values of the thresholds xu and
xr, which are set to (a) (3, 10), (b) (6, 10), and (c) (2, 10), respectively.
Figure 5.5 shows the result of the interactive analysis the user can perform from the
graphs GD obtained with the components analyzed in Figures 5.5a, b, c, and d. It has
to be mentioned that the morphological analysis is applied to GD rather than to a single
construction tree structure so that the engineer can evaluate the influence of D with
respect to the idealization processes. However, the result obtained on the component
in Figure 4.20 shows that the variants in GD have no influence with respect to the
morphological analysis criterion, in the present case. Consequently, Figure 5.5 displays
the morphological analysis obtained from the variant M−j2 in Figure 4.20. Results
on components in 5.5a, c also show the clear use of this criterion because some nonidealizable
sub-domains (see indications in Figure 5.5 regarding violet sub-domains)
are indeed well proportioned to be idealized with beams.
Now, considering the morphological classification of sub-domains stated in Section
5.2.1, this first morphological analysis of Pi acts as a necessary condition for Pi to
fall into a category of:
• plate/shell but Pi can contain sub-domains Dij where Φ can get small enough
to produce a beam-like shape embedded in Pi, see Figure 5.6a. In any case, Pi
128Chapter 5: Performing idealizations from construction graphs
Ø
0
3
10
x
Ø
Ø
Ø
Max Diameter Ø
Extrusion distance d
xr
xu
v
0
6
x
xr
xu
Ratio x
0
2
x
xr
xu
10 10
Ø
Ø Ø Ø
Ø
Evaluation of sub domain for idealization
Identification of Maximal
diameter in 2D sketch
using MAT
Segmentation from
Construction Graph
d < max Ø
x =
d > max Ø
x d =
max Ø
max Ø
d
(a) (b) (c)
Figure 5.4: Example of the morphological evaluation of the extrusion primitives extracted
during the construction process of a component. Violet indicates sub-domains that cannot
be idealized as plates or shells, green ones can be idealized and yellow ones are up to the
user’s decision.
129Chapter 5: Performing idealizations from construction graphs
T
T
B
B
sub domains idealizable as beams
(a) (c) T B
0
3
10
x
xr
xu
T B (b)
(d)
Figure 5.5: Idealization analysis of components. T and B indicate Top and Bottom views of
the component, respectively. The decomposition of a is shown in Figure 4.20 and decompositions
of b, c and d are shown in Figure 4.19. Violet indicates sub-domains that cannot be
idealized as plates or shells, green ones can be idealized and yellow ones can be subjected to
user’s decisions.
130Chapter 5: Performing idealizations from construction graphs
Beam
local sub-domain to idealize as beam
local sub-domain
to consider as detail
local sub-domain
to idealize as beam
Beam
Primitive Pi
Dij
Dik
d
local Ø ≈ d << max Ø
max Ø
local Ø
local Ø ≈ d << max Ø
d
d
local Ø << d ≈ max Ø
Detail
(a)
(b)
(c)
Figure 5.6: Illustration of primitives’ configurations containing embedded sub-domains Dik
which can be idealized as beams or considered as details. (a) Primitive morphologically identified
as a plate which contains a beam sub-domain, (b) primitive morphologically identified
as a plate which contains a volume sub-domain to be considered as a detail, (c) primitive
morphologically identified as a thick domain which contains a beam sub-domain
cannot contain a sub-domain of type 3D thick domain because the dominant
sub-domain Dij is morphologically a plate/shell. If there exists a sub-domain
Dik, adjacent to Dij , such that x < xu, i.e., it is morphologically thick, Dik is
not mechanically of type 3D thick domain because it is adjacent to Dij . Indeed,
Dik can be regarded as a detail compared to Dij since the thickness of Dij will
be part of the dimensional reduction process. Figure 5.6b shows an example of
such configuration;
• 3D thick domain because Pi contains at least one dominant sub-domain Dij
of this category. However, it does not mean that Pi does not contain other subdomains
Dik that can be morphologically of type plate/shell or beam. Figure 5.6b
illustrates a beam embedded in a 3D thick domain.
Indeed, all green sub-domains and yellow ones validated by the engineer can proceed
with the next step of the morphological analysis. Similarly, violet sub-domains cannot
be readily classified as non idealizable. Such configurations show that the classification
described in Section 5.2.1 has to take into account the relative position of sub-domains
Dij of Pi and they are clearly calling for complementary criteria that are part of the
next morphological analysis where Pi needs to be decomposed into sub-domains Dij to
refine its morphology using information from its MAT.
131Chapter 5: Performing idealizations from construction graphs
Determination of geometric sub-domains Dij to be idealized in Pi
Then, in a second step, another morphological analysis determines in each primitive
Pi if some of its areas, i.e., sub-domains Dij , can be associated with beams and, therefore,
admit further dimensional reduction. Indeed, the previous ratio x determines
only one morphological characteristic of a sub-domain Dij , i.e., the dominant one, of
Pi because the location of the MAT, where x is defined, is not necessarily reduced to a
point. For example, Figure 5.7 illustrates a configuration where x holds along a medial
edge of the MAT of the extrusion contour. Similarly to the detail removal using MAT
conducted by Armstrong et al. [Arm94], a new ratio y is introduced to compare the
length of the medial edge to the maximal disk diameter along this local medial edge.
The parameter y is representative of a local elongation of Pi in its contour plane and
distinguishes the morphology of type beam located inside a morphology of type plate
or shell when the starting configuration is of type similar to Figure 5.3a. If Pi is similar
to Figure 5.3b, then the dominant Dij is of type beam if x appears punctually or of
type plate/shell if x appears along a medial edge of the MAT of the extrusion contour
of Pi.
Appendix C provides two Tables C.1 and C.2 with 18 morphological configurations
associated with a MAT medial edge of a primitive Pi. The two tables differ according
to whether the idealization direction of Pi corresponds to the extrusion direction, see
Table C.1 (type similar to Figure 5.3a), or whether the idealization direction of Pi is
included in the extrusion contour, see Table C.2 (type similar to Figure 5.3b). The
reference ratio xr and user ratio xu are used to specify, in each table, the intervals of
morphology differentiating beams, plates or shells and 3D thick domains. Therefore,
nine configurations are presented in Table C.1 illustrating the elongation of the extrusion
contour of Pi. Table C.1 allows both the elongation of the extrusion distance
and the elongation of the extrusion contour, this produces also nine configurations.
These tables illustrates 18 morphological possible configurations when the medial edge
represents a straight line with a constant radius for the inscribed circles of the MAT.
Other configurations can be found when the medial edge is a circle, or more generally,
a curve or when the radius is changing along the medial edge. These configurations
have not been studied in detail and are left for future work.
L1
L2
max Ø
x = L1 / max Ø
y = L2 / max Ø
xu = 10 (user threshold)
L1 < xu . max Ø
L2 > xu . max Ø
Figure 5.7: Example of a beam morphology associated with a MAT medial edge of a primitive
Pi.
132Chapter 5: Performing idealizations from construction graphs
Tables C.1, C.2 of Appendix C represents a morphological taxonomy associated
with one segment of the MAT of Pi. Because the extrusion contour of Pi consists
in line segments and arcs of circles, the associated MAT has straight and curvilinear
medial edges which can be categorized as follows:
1. Medial edges with one of their end point located on the extrusion contour of Pi,
the other one being connected to another medial edge;
2. Medial edges with their two end points connected to other medial edges. In the
special case of a segment having no end point, e.g., when the extrusion contour
is a circular ring, its MAT reduces to a closed circle and falls into this category.
Segments of category 1 are deleted and the morphological analysis focuses on the
segments of category 2 which are noted Sij . On each of these edges, the ratio y includes
a maximum located at an isolated point or it is constant along the entire edge. ymax
represents this maximum and is assigned to the corresponding medial edge, Sij . The
set of edges Sij is automatically classified using the taxonomy of Tables C.1, C.2 or
some of them can be specified by the engineer wherever yu < y < yr. This is the
interactive part left to the engineer to take into account his, resp. her, know-how.
Pi is segmented based on the changes in the morphological classification of the
edges Sij . This decomposition generates a set of sub-domains Dij of each primitive Pi.
These sub-domains Dij are inserted with their respective morphological status and their
geometric interfaces in the graph GD. Figure 5.8 summarizes the different phases of the
morphological analysis of each extrusion primitive Pi extracted from the construction
graph GD of on object M. Because each sub-domain Dij is part of only one primitive
Pi, it can also be considered as a new primitive Pk. To reduce the complexity in the
following process, the sub-domains Dij are regarded as independent primitives Pk.
These results are already helpful for an engineer but it is up to him, or her, to
evaluate the mechanical effect of IGs between primitives Pi. To support the engineer
in processing the stiffening effects of IGs, the morphological analysis is extended by a
second step described as follows.
5.3.2 Processing connections between ‘idealizable’ sub-domains
Dij
The morphological analysis of standalone primitives Pi is the first application of GD.
Also, the decomposition obtained can be used to take into account the stiffening effect
of interfaces IG between Pi or, more generally, between Dij , when Pi
1 are iteratively
1From now on Pi designates sub-domains that correspond to primitives Pi obtain from the segmentation
of M or one subdivision domain Dkj of a primitive Pk decomposed after the morphological
analysis described at Section 5.3.1.
133Chapter 5: Performing idealizations from construction graphs
For each extrusion primitivePi
MAT 2D on extrusion contour of Pi
Input: set of primitives Pi from construction graph GD of an object M
Output: set of sub-domains Dij of morphology type beams, plates or shells and 3D thick domains
Determination of Pi global morphology (x =max((max Φ / d), (d / max Φ))
For each medial edge Sij of the MAT 2D of category 2
Determination of the morphology associated with Sij (y = LSij / max Φ )
If morphology (Sij) ≠ morphology (Pi)
and Sij not a detail
Segmentation of Pi in sub-domains Dij and insertion in GD
Primitive Pi
Figure 5.8: Synthesis of the process to evaluate the morphology of primitives Pi.
merged together along their IG up to obtain the whole object M. As a result, new
sub-domains will be derived from the primitives Pi and the morphological analysis will
be available on M as a whole, which will be easier to understand for the engineer. To
this end, a taxonomy of connections between extrusion sub-domains is mandatory.
Taxonomy of connections between extrusion sub-domains to be idealized
This taxonomy, in case of ”plate sub-domain connections”, is summarized in Figure
5.9a. It refers to parallel and orthogonal configurations for simplicity but these
configurations can be extended to process a larger range of angles, i.e., if Figure 5.9
refers to interfaces IG of surface type, these configurations can be extended to interfaces
IG of volume type when the sub-domains S1 and S2 are rotated w.r.t. each other.
More specifically, it can be noticed that the configuration where IG is orthogonal to
the medial surfaces of S1 and S2 both is lacking of robust solutions [Rez96, SSM∗10]
and other connections can require deviation from medial surface location to improve
the mesh quality. Figure 5.18c illustrates such configurations and further details are
given in Section 5.5.2.
Figure 5.9 describes all the valid configurations of IG between two sub-domains S1
and S2 when a thickness parameter can be attached to each Pi, which is presently the
case with extrusion primitives.
Figure 5.9a depicts the four valid configurations: named type (1), (2), (3), (4).
These configurations can be structured into two groups: type (1) and type (4) form the
134Chapter 5: Performing idealizations from construction graphs
(b)
S2 S2
S1
S1
S2
S1
S2
S1
(c)
Fb1S1
Fb1S2
Fb1S2
IG
IG
Orthogonal to S1
and Parallel to S2:
Orthogonal:
Parallel:
Parallel: S1 // S2 Orthogonal:
Medial Surface S1
vs Medial Surface S2
Interface IG
vs Medial Surface S1 & S2
S1
S1
S1
S1
S2
S2 S2
S2
IG
IG
IG
IG
IG ^ S1
IG // S2
type (1)
I'G
I'G
I'G I'G
IG ^ S1
IG ^ S2
IG // S1
IG // S2
type (1) e1
e2
e1
e1
e1
e2
e2
e2
e1+e2
e1+e2
e1+e2
I'G
I'G
S'1
S'2
S'3
type (4)
e2
e1
e2
e1
e2
I'G I'G
S''21 S''22
S'21 S'22
type (2)
(a)
type (2)
type (3)
type (4)
type (2)
type (2)
type (2)
type (1)
type (4)
C2
C1
C1
C2
Figure 5.9: (a) Taxonomy of connections between extrusion sub-domains Pi. (b) Decomposition
of configurations type(1) and type(4) into sub-domains Pi showing that the decomposition
produced reduces to configurations type (2) only. (c) example configurations of types (1)
and (4) where S1 and S2 have arbitrary angular positions that generate volume interfaces
IG where base faces Fb1S1 and Fb1S2 are intersection free in configuration type (1) and Fb1S2
only is intersection free in configuration type (4). 135Chapter 5: Performing idealizations from construction graphs
group C1, and (2) and type (3) form the group C2. Figure 5.9b illustrates the effect
of the decomposition of configurations type (1) and type (4) that produces configurations
(2) only.
Reduced set of configurations using the taxonomy of connections
Configuration type (1) of C1 is such that the thicknesses e1 and e2 of S1 and S2 respectively,
are influenced by IG, i.e., their overlapping area acts as a thickness increase
that stiffens each of them. This stiffening effect can be important to be incorporated
into a FE model as a thickness variation to better fit the real behavior of the corresponding
structure. Their overlapping area can be assigned to either S1 or S2 or form
an independent sub-domain with a thickness (e1 + e2). If S1 and S2 are rotated w.r.t.
each other and generate a volume IG, the overlapping area still exists but behaves with
a varying thickness. Whatever the solution chosen to represent mechanically this area,
the sub-domains S1 and S2 get modified and need to be decomposed. The extent of
S2 is reduced to produce S�
2 now bounded by I�
G. Similarly, the extent of S1 is reduced
to S�
1 now bounded by another interface I�
G. A new sub-domain S�
3 is created that
contains IG and relates to the thickness (e1 + e2) (see Figure 5.9b). Indeed, with this
new decomposition IG is no longer of interest and the new interfaces I�
G between the
sub-domains S�
i produce configurations of type (2) only.
Similarly, configuration (4) is such that S2 can be stiffened by S1 depending on the
thickness of S1 and/or the 2D shape of IG (see examples in Figure 5.11). In this case,
the stiffening effect on S2 can partition S2 into smaller sub-domains and its IG produces
a configuration of type (2) with interfaces I�
G when S2 is cut by S1. The corresponding
decomposition is illustrated in Figure 5.9b and Figure 5.10. This time, IG is still
contributing to the decomposition of S1 and S2 but S2 can be decomposed in several
ways (S�
21 , S�
22 ) or (S��
21 , S��
22 ) producing interfaces I�
G. Whatever, the decomposition
selected to represent mechanically this area, the key point is that I�
G located on the
resulting decomposition are all of same type that corresponds to configuration (2).
Configuration (1) reduces the areas of S1 and S2 of constant thicknesses e1 and e2,
which can influence their ‘idealizability’. Configuration (4) reduces the area of S2 of
thickness e2 but it is not reducing that of S1, which influences the ‘idealizability’ of
S2 only. As a result, it can be observed that processing configurations in C1 produce
new configurations that always belong to C2. Now, considering configurations in C2,
none of them is producing stiffening effects similar to C1. Consequently, the set of
configurations in Figure 5.9a is a closed set under the decomposition process producing
the interfaces I�
G. More precisely, there is no additional processing needed for C2 and
processing all configurations in C1 produces configurations in C2, which outlines the
algorithm for processing iteratively interfaces between Pi and shows that the algorithm
always terminates.
Figure 5.9a and b refers to interfaces IG of surface type. Indeed, GD can produce
136Chapter 5: Performing idealizations from construction graphs
interfaces of volume type between Pi. This is equivalent to configurations where S1 and
S2 departs from parallel or orthogonal settings as depicted in Figure 5.9. Such general
configurations can fit into either set C1 or C2 as follows. In the 2D representations of
Figure 5.9a, b, the outlines of S1 and S2 define the base faces Fb1 and Fb2 of each Pi.
What distinguishes C1 from C2 is the fact that configurations (1) and (4) each, contains
at least S2 such that one of its base face (Fb1S2 in Figure 5.9c) does not intersect S1 and
this observation applies also for S1 in configuration (1) (Fb1S1 in Figure 5.9c). When
configurations differ from orthogonal and parallel ones, a first subset of configurations
can be classified into one of the four configurations using the distinction observed, i.e.,
if a base face of either S1 or S2 does not intersect a base face of its connected subdomain,
this configuration belongs to C1 and if this property holds for sub-domains S1
and S2 both, the corresponding configuration is of type (1). Some other configurations
of type (4) exist but are not detailed here since the purpose of the above analysis
is to show how the reference configurations of Figure 5.9a can be extended. The
completeness of configurations has not been entirely investigated yet.
5.3.3 Extending morphological analyses of Pi to the whole object
M
Now, the purpose is to use the stiffening influence of some connections as analyzed in
Section 5.3.2 to process all the IG between Pi, to be able to propagate and update the
‘idealizability’ of each Pi when merging Pis. This process ends up with a new subdivision
of some Pi as described in the previous section and a decomposition of M into
a new set of sub-domains Pi
2, each of them having an evaluation of its ‘idealizability’
so that the engineer can evaluate more easily the sub-domains he, or she, wants to
effectively idealize.
The corresponding algorithm can be synthesized as follows (see algorithm 2). The
principle of this algorithm is to classify IG between two Pi such that if IG belongs
to C1 (configurations 1 and 4 in algorithm 2), it must be processed to produce new
interface(s) I�
G and new sub-domains that must be evaluated for idealization (procedure
Propagate morphology analysis). Depending on the connection configuration between
the two primitives Pi, one of them or both are cut along the contour of IG to produce the
new sub-domains. Then, the MAT is applied to these new sub-domains to update their
morphology parameter (procedure MA morphology analysis) that reflects the effect of
the corresponding merging operation taking place between the two Pi along IG that
stiffens some areas of the two primitives Pi involved. The algorithm terminates when
all configurations of C1 have been processed.
Among the key features of this algorithm, it has to be observed that the influence
2Here again like in Section 5.3.1, Pi designates also the set of sub-domains Dkj that can result
from the decomposition of a primitive Pk when merging it with some other Pl sharing an interface
with Pk.
137Chapter 5: Performing idealizations from construction graphs
Algorithm 2 Global morphological analysis
1: procedure P ropagate morphologyanalysis(GD, xu) � The main procedure to extend morphological analyses of
sub-domains to the whole object
2: for each P in list prims(GD) do
3: if P.x > xu then � If the primitive has to be idealized
4: for each IG in list interfaces prim(P) do
5: P ngh = Get connectedprimitive(P, IG)
6: if IG.conf ig = 1 or IG.conf ig = 4 then
7: interV ol = Get interfaceV ol(P, P ngh, IG)
8: Pr = Remove interfaceV ol(P, interV ol) � Update the primitive by removing the volume
resulting from interfaces with neighbors
9: for i = 1 to Card(Pr) do � New morphological analysis of the partitions Pr
10: P� = Extract partition(i, Pr)
11: P�
.x = MA morpho analysis(P�
)
12: P ngh.x = MA morph analysis(P ngh)
13: if IG.conf ig = 1 then
14: if P ngh.x > xu then
15: P rngh = Remove interV ol(P ngh, interV ol)
16: interV ol.x = MA morph analysis(interV ol)
17: for j = 1 to Card(P rngh) do
18: P� ngh = Extract partition(j, P rngh)
19: P� ngh.x = MA morpho analysis(P� ngh)
20: if interV ol.x < xu then � If the interVolume is ‘idealizable’
21: Merge(P, P ngh, interV ol) � Merge the intervolume either with P or P ngh
22: end if
23: end for
24: else � If the interVolume is not ‘idealizable’
25: P = P�
26: Merge(P ngh, interV ol) � Merge the interVolume with the neighboring primitive
which is non ‘idealizable’
27: end if
28: Remove prim(P ngh, list prims(GD))
29: end if
30: if P�
.x < xu then � if a partition is not ‘idealizable’
31: Merge(P ngh, P�
) � Merge the partition with the non ‘idealizable’ primitive neighbor
32: end if
33: end for
34: end if
35: end for
36: end if
37: end for
38: end procedure
39: procedure MA morphology analysis(Pi) � Procedure using the 2D MAT on the extrusion contour of a primitive
40: Cont = Get Contour(Pi)
41: listof pts = Discretize contour(Cont)
42: vor = V oronoi(listof pts) � MAT generated using Voronoi diagram of a set of points
43: maxR = Get max radius of inscribed Circles(vor)
44: x = Set primitive idealizableT ype(maxR, Pi)
45: return x
46: end procedure
138Chapter 5: Performing idealizations from construction graphs
Init CAD model
Modeling
processes Evaluation of sub
domains morphology
Same results of
morphology analysis
IG
(4)
(4)
IG
A
B
Modeling
processes
OR
New
Sub domains
Volume Interface I’G
New
Sub domains
Volume Interface I’G
Figure 5.10: Propagation of the morphology analysis of each Pi to the whole object M. A
and B illustrates two different sets of primitives decomposing M and numbers in brackets
refer to the configuration category of interfaces (see Section 5.3.2.)
of the primitive neighbor Pngh of Pi, is taken into account with the update of Pi that
becomes Pr. Indeed, Pr can contain several volume partitions, when Card(Pr) > 1,
depending on the shapes of Pi and Pngh. Each partition P� of Pr may exhibit a different
morphology than that of Pi, which is a more precise idealization indication for the
engineer. In case of configuration 1, the overlapping area between Pngh and Pi must
be analyzed too, as well as its influence over Pngh that becomes Prngh . Here again,
Prngh may exhibit several partitions, i.e., Card(Prngh ≥ 1), and the morphology of
each partition P�
ngh must be analyzed. If the common volume of P�
ngh and P� is not
idealizable, it is merged with either of the stiffest sub-domains Pngh or Pi to preserve
the sub-domain the most suited for idealization. In case a partition P� of Pr is not
idealizable in configuration 4, this partition can be merged with Pngh if it has a similar
morphological status.
Figure 5.10 illustrates this approach with two modeling processes of a simple component.
Both processes contain two primitives to be idealized by plate elements and
interacting with a surface interface of type (4). The stiffening effect of one primitive on
the other creates three sub-domains with interfaces I�
G of type (2). The sub-domain in
violet, interacting with both sub-domains to be idealized, can be merged with each of
the other sub-domains to create a fully idealized geometry or it can be modeled with
a specific connection defined by the user.
Full examples of the extension of the morphological analysis to the whole object
M using the interfaces IG between the primitives of GD, are given in Figure 5.11.
Figures 5.11a, b and c show the sub-domain decomposition obtained after processing
the interfaces IG between primitives Pi of each object M. The same figures illustrate
also the update of the morphology criterion on each of these sub-domains when they
are iteratively merged through algorithm 2 to form their initial object M. Areas A
and B show the stiffening effect of configurations of category (1) on the morphology
139Chapter 5: Performing idealizations from construction graphs
(a) (b)
T T
B B
(c) C
A
D
B
T T B B
Figure 5.11: Propagation of the morphology analysis on Pi to the whole object M. a, b and c
illustrate the influence of the morphology analysis propagation. The analyzed sub-domains
are iteratively connected together to form the initial object. T and B indicate the top and
bottom views ob the same object, respectively.
of sub-domains of M. Areas C and D are examples of the subdivision produced with
configurations of type (4) and the stiffening effects obtained that are characterized by
changes in the morphology criterion values.
After applying algorithm 2, one can notice that every sub-domain strictly bounded
by one interface IG of C2 or by one interface I�
G produced by this algorithm gives a
precise idealization information about an area of M. Areas exhibiting connections of
type (1) on one or two opposite faces of a sub-domain give also precise information,
which is the case for examples of Figure 5.11. However, if there are more piled up
configurations of type (1), further analysis is required and will be addressed in the
future.
Conclusion
This section has shown how a CAD component can be prepared for idealization. The
initial B-Rep geometry has been segmented into a set of extrusion primitives Pi using
its construction graph GD. Using a taxonomy of geometric interfaces, a morphological
analysis has been applied to these primitives to identify the ‘idealizable’ areas over
the whole object. As a result, the geometric model is partitioned into volume subdomains
which can be either idealized by shell or beams or not idealized at all. At
that stage, only a segmentation of a standalone component has been analyzed. Neither
the compatibility with an assembly structure nor the influence of external boundary
conditions have been addressed yet, as this is the purpose of the next section.
140Chapter 5: Performing idealizations from construction graphs
C1
C2
I1/2
Assembly interface
F Boundary condition:
Load F =500N
Boundary condition:
rigid condition to wall
C3
C3 = C1 U C2
F
Assembly interface considered
as a rigid connection
between C1 and C2
Figure 5.12: Influence of an assembly interface modeling hypothesis over the transformations
of two components
5.4 Influence of external boundary conditions and
assembly interfaces
As explained in Section 4.7, an assembly model is composed of a set of 3D solid components
linked to each other through functional interfaces. A boundary condition that is
external to the assembly, as defined in Section 1.4.2, also acts as an interface between
the object and its external environment. Figure 5.12 illustrates two types of boundary
conditions, a load acting on component C1 and a rigid connection with the environment
on C2. These areas are defined by the user and are represented as a geometric
region on its B-Rep surface which is equivalent to an assembly interface, except that
the interface is only represented on one component.
Each component of the assembly can be segmented using respective construction
graphs. However, the segmentation of components generates new geometric interfaces
between primitives which can be influenced by the assembly interfaces. Therefore, this
section aims at studying the role of assembly interfaces and boundary conditions in the
idealization process. They can be analyzed either before the morphological analysis as
input data or after the segmentation of components.
Impact of the interface modeling hypotheses
Depending on the simulation objectives, the engineer decides if he, resp. she, wants
to apply some mechanical behavior over some assembly interfaces (see Table 1.2).
This first choice highly influences the components’ idealization. As it is highlighted
in Section 6.2.1, the engineer may decide not to apply any mechanical behavior at a
common interface between two components, e.g., with the definition of rigid connections
between their two mesh areas to simulate a continuous medium between components
at this interface. This modeling hypothesis at assembly interfaces influences directly
the geometric transformations of components. As illustrated in Figure 5.12, a set of
components connected by rigid connections can be seen as a unique component after
merging them. Therefore, to reduce the complexity of the FEA pre-processing, the
141Chapter 5: Performing idealizations from construction graphs
morphological analysis can be applied to this unique component instead of applying it
to each component individually.
In case the engineer wants to assign a mechanical behavior to interfaces between
components, these interfaces ought to appear in the final idealized model. Now, defining
when this assignment can take place during the pre-processing enumerates:
a) at the end of the idealization process, i.e., once the components have been idealized;
b) during the segmentation process, i.e., during the construction graph generation
of each component or during their morphological analysis.
These two options are addressed in the following parts of this section. In this section,
only the geometric aspect of assembly interfaces is addressed. The transfer of
meta-information, e.g., friction coefficient, contact pressure is not discussed here.
Applying assembly interfaces information after components’ idealization
In a first step, this part of the section studies the consequences of integrating assembly
interfaces at the end of the idealization process, i.e., option (a) mentioned above.
These assembly interfaces represent information that is geometrically defined by the
interactions between components. These interactions have a physical meaning because
the contacts between components exist physically in the final product though a physical
contact may not be always represented in a DMU as a common area between the
boundaries of two components [SLF∗13] (see Section 1.3.2). For sake of simplicity,
let us consider that physical contacts are simply mapped to common areas between
components. Then, the assembly interfaces are initially prescribed in contrast with
geometric interfaces, IG between primitives of a component that have been created
during its segmentation process and aim at facilitating the geometric transformations
performed during the idealization process of a component.
One can observe that these assembly interfaces have to be maintained during the
dimensional reduction operations of each component. However, these interfaces can
hardly be transferred using the only information provided by the idealized models. For
example, Figure 5.13b shows that a projection of the assembly interface on the idealized
model of C1 could generate narrow areas which would be difficult to mesh and, on that
of C2, could produce areas that fall outside the idealized model of C2. This assembly
interface has been defined on the initial solid models of C1 and C2. If this link is lost
during the idealization process, a geometric operator, i.e., like the projection operator
just discussed, has to recover this information to adapt this interface on the idealized
assembly model. Therefore, to obtain robust transformations of assembly interfaces,
these interfaces have to be preserved during the dimensional reduction processes of each
142Chapter 5: Performing idealizations from construction graphs
Assembly
interface
Generation
of narrow mesh areas
C1
C2
CAD + assembly interfaces Idealized representation
Projection of
assembly interface
(a) (b)
Non-correspondance
between interface
and idealized surfaces
Figure 5.13: Illustration of the inconsistencies between an assembly interface defined between
initial CAD components C1 and C2 (a) and its projection onto their idealized representations
(b).
component. Each of these interfaces, as a portion of the initial solid boundary of a
component, has a corresponding representation in its idealized model. This equivalent
image would have to be obtained through the transformations applied to the initial
solid model of this component to obtain its idealized representation.
Integration of assembly interfaces during the idealization process
In a second step, this part of the section addresses the option (b) mentioned above.
As stated in Section 5.4, assembly interfaces have to be generated before the dimensional
reduction of assembly components. Now, the purpose is to determine at which
stage of the proposed morphological analysis process the interfaces should be integrated.
This analysis incorporates the segmentation process, which prepares a component
shape for idealization and is dedicated to a standalone 3D solid. This approach
can be extended to an assembly model from two perspectives described as follows:
b1) The assembly interfaces and boundary conditions can be used to monitor the
definition of specific primitives, e.g., primitives containing the whole assembly
interface. Figure 5.14a illustrates such a decomposition with two components C1
and C2 fitting the assembly interface with only one primitive in both segmentations.
The benefit of this approach lies in avoiding splitting assembly interfaces
across various component primitives, which would divide this assembly interface
representation across all the primitives boundaries;
b2) The segmentation process is performed independently of the assembly interfaces.
Then, they are introduced as additional information when transforming the set
of primitives derived from each component and these interfaces are incorporated
into the idealized representation of each component. In this case, the intrinsic
143Chapter 5: Performing idealizations from construction graphs
Constrained
extrusion face
Integration of external
interfaces after segmentation
(cat. b2)
(a)
(b)
External
assembly interface
Internal
segmentation interface
Integration of external
interfaces before segmentation
(cat. b1)
P1.1
P1.2
I1/2
I1/2
I1/2
I1.1/1.2
I2.1/2.2
I2.1/2.2 I1.1/1.2
P1.1
P1.2
P2.2
P2.2
P2.1
P2.1
C1
C2
C1
C2
Figure 5.14: Two possible schemes to incorporate assembly interfaces during the segmentation
process of components C1 and C2: (a) The assembly interface is used to identify extrusion
primitives of C1 and C2 containing entirely the assembly interface in one extrusion contour,
(b) The assembly interface is integrated after the segmentation of components C1 and C2
and propagated on each of their primitives.
property of the proposed segmentation approach is preserved and the assembly
interfaces are propagated as external parameters on every primitive they are
respectively related to. Figure 5.14b shows the imprints of the assembly interface
on the primitives derived from the segmentation of components C1 and C2.
As a conclusion of the previous analyses, the choice of the idealization process made
in this thesis falls into category (b2). Though a fully detailed analysis would bring complementary
arguments to each of the previous categories, it appears that category (a)
is less robust than category (b), which is an important point when looking for an automation
of assembly pre-processing. Within category (b), (b1) leads to a solution
that is not intrinsic to the shape of a component, which is the case for (b2). With the
current level of analysis, there is no strong argument favoring (b1) over (b2) and (b2)
is chosen to keep the level of standalone component pre-preprocessing decoupled from
that of the assembly level.
Therefore, assembly interfaces are not constraining the extraction of each the construction
graph GD for each component. During the segmentation process, assembly
interfaces are propagated only. Rigid connections only are assembly interfaces that can
be processed prior the component segmentation process without interfering with it.
Indeed, the first part of this section has shown that these interfaces lead to merge the
components they connect. Consequently, the rigid interfaces only can be removed from
the initial CAD components after the corresponding components have been merged,
which simplifies the geometry to be analyzed. From a mechanical point of view, this
operation is equivalent to extending the continuum medium describing each compo-
144Chapter 5: Performing idealizations from construction graphs
nent because their material parameters and other mechanical parameters are strictly
identical.
Then, the other assembly interfaces and external boundary conditions, where a
mechanical behavior has to be represented, are propagated through the segmentation
process and taken into account during the dimensional reduction process. Chapter 6
carries on with the analysis of interactions between simulation objectives, hypotheses
and shape transformations for assembly pre-processing. This helps structuring the
preparation process of an assembly in terms of methodology and scope of shape transformation
operators. Section 6.4 shows an example of automated idealization of an
aeronautical assembly using the idealization process presented in this chapter which is
also taken into account in the methodology set in Chapter 6.
Now that the roles of assembly interfaces and external boundary conditions have
been clarified, the next section focuses on the dimensional reduction of a set of extrusion
primitives connected through geometric interfaces, IG. The objective is to set up a
robust idealization operator enabling the dimensional reduction of extrusion primitives
and performing idealized connections between medial surfaces through the analysis of
the interface graph GI of an object M.
5.5 Idealization processes
Having decomposed a assembly component M into extrusion primitives Pi, the last
phase of the idealization process consists in the generation and connection of idealized
models of each primitive Pi. Now, the interfaces IG between Pis are precisely identified
and can be used to monitor the required deviations regarding medial surfaces. These
deviations are needed to improve the idealization process and to take into account the
engineer’s know-how when preparing a FE model (see discussions of Chapter 2).
Based on the morphological analysis described in Sections 5.2 and 5.3, each Pi has
a shape which can be classified in idealization categories of type plate, shell, beam or
3D thick solid. Therefore, depending on Pi’s morphological category, a dimensional
reduction operator can be used to generate its idealized representation. The geometric
model of the idealized Pi is:
• A planar medial surface when Pi has been identified as a plate. This surface
corresponds to the extrusion contour offset by half the thickness of this plate
along the extrusion direction;
• A medial surface when the primitive has been identified as a shell (see the detailed
taxonomy in Tables C.1, C.2). This medial surface is generated as the extrusion
of the medial line extracted from the extrusion contour of Pi. This medial line
can be generated by applying the 2D MAT to the extrusion contour, as proposed
145Chapter 5: Performing idealizations from construction graphs
P1
P2
P3
Solid Primitives
P1
P2
P3
Initial CAD model
Interfaces
P7
P3
Interface of type (2)
Interface of type (4)
P17
P1
P2
P4
P6
P8
P9
P10 P11 P12 P13
P14 P15
P16 P18
P5
Interface Graph GI
Figure 5.15: Illustration of an interface graph containing IGs derived from the segmentation
process of M producing GD.
by Robinson et al. [RAM∗06]. The shell thickness varies in accordance with the
diameter of circles inscribed in the extrusion contour;
• A medial line when the primitive has been identified as a beam. This line is
generated through the extrusion of the point representing the barycenter of the
extrusion contour if the beam direction is aligned with the extrusion direction.
If the beam direction is orthogonal to the extrusion direction, the medial line
corresponds to the medial line of the extrusion contour, offset by half of the
extrusion distance;
• The volume domain of Pi when Pi is identified as a 3D thick solid;
since every Pi reduces to an extrusion primitive.
Now that each primitive Pi is idealized individually, the purpose of the following
section is to show how the medial surfaces can be robustly connected based on the
taxonomy of interfaces IG illustrated in Figure 5.9.
5.5.1 Linking interfaces to extrusion information
From the construction graph GD and the geometric interfaces IG between its primitives
Pi, the interface graph GI can be derived. Figure 5.15 illustrates GI for a set of extrusion
primitives extracted from one component of the aeronautical use-case presented
in Figure 1.6.
In GI , each node, named Ni, is a primitive Pi ∈ GD and each arc is a geometric
interface IG between any two primitives Pi and Pj , as IG has appeared during the
segmentation process of M. In a first step, GI is enriched with the imprints of the
146Chapter 5: Performing idealizations from construction graphs
boundary of each IG on each primitive Pi and Pj that defines this IG. The jth boundary
of an IG w.r.t. a primitive Pi is noted Cj(Pi).
A direct relationship can be established between Cj(Pi) and the information related
to the extrusion property of Pi. The interface boundary Cj(Pi) is classified in accordance
with its location over ∂Pi. To this end, each node Ni of GI representing Pi is subdivided
into the subsets: Ni(Fb1), Ni(Fb2), Ni(Fl), that designates its base face Fb1, its base
face Fb2 and its lateral faces Fl, respectively. Then, Cj(Pi) is assigned to the appropriate
subset of Ni. As an example, if Cj(Pi) has its contours located solely on the base face
F b1 of Pi, its is assigned to Ni(Fb1), or if Cj(Pi) belongs to one at least of the lateral
faces Fl, it is assigned to Ni(Fl). Figure 5.16 illustrates the enrichment of the interface
graph GI of a simple model containing three primitives P1, P2 and P3. For example,
the boundary C1(P1), resulting from the interaction between P1 and P3, is assigned to
F b1 of P1. Reciprocally, the equivalent C1(P3) refers to a lateral face of P3.
The following step determines potential interactions of Cj(Pi)s over Pi. When a pair
of Cj(Pi)s shares a common geometric area, i.e., their boolean intersection is not null:
Cj(Pi) ∩ Ck(Pi) �= φ, (5.1)
the resulting intersection produces common points or curve segments that are de-
fined as an interface between the pair of interface boundaries (Cj(Pi), Ck(Pi)) and the
nth interface is noted IDnCj/Ck . Three interfaces between Cj(Pi) have been identified
on the example of Figure 5.16, e.g., ID1C1/C2 represents the common edge interaction
between C1(P1) and C2(P1). These new relations between Cj(Pi)s form a graph structure
GID where the nodes represent the boundary Cj(Pi) and the arcs define the interface
IDnCj/Ck . The graph structure GID related to a primitive Pi is strictly nested into the
i
th node of GI . More globally, the graph structure GID is nested into GI .
The graph structures GID derived from the relations between the boundaries of
interfaces IG of each Pi can be ‘merged’ with the interface graph GI . Let us call GS
this graph (see Figure 5.16d).
5.5.2 Analysis of GS to generate idealized models
Using GS, algorithms may be applied to identify specific configurations of connections
between idealized primitives. These algorithms are derived from the current industrial
practices of idealized FEM generation from B-Rep models. Specific configurations
of interface connections can be identified automatically from GS while allowing the
engineer to locally modify the proposed results based on his, resp. her, simulation
hypotheses. So, nodes in GS can be either of type Cj(Pi) if there exists a path between
Cj(Pi)s in Pi or they are Pis if there is no such path. Arcs are built up on either IGs or
IDnCj/Ck depending on the type of node derived from Cj(Pi) and Pi.
To generate a fully idealized model, i.e., a model where the medial surfaces are
147Chapter 5: Performing idealizations from construction graphs
Fb1
FLs
Fb2
Fb1
Fb2
Fb2
Fb1 Fb2 FLs
Fb2
FLs
C1 (P1) C2 (P1)
C1 (P2)
C2 (3) C2 (P1)
C1 (P3)
IP1/ P3 IP1/ P2
IP2/ P3
ID1 C1/C2
ID3 C1/C2 ID2 C1/C2
IP1/ P3
IP1/ P2
IP2/ P3
P1
P3
P2
Pi
Primitive
Base Faces
Lateral Faces
Interface between
primitives
Interface boundary
on primitive
ID Cm/Cn
Cm (Pi)
I Pi/Pj
FLs
Fb1,2
Interface between
contours
Fb1
FLs
Fb1
FLs
Fb1
FLs
Fb2
P3 P2
P1
P1
P3 P2
IP1/ P2
IP2/ P3
IP1/ P3
Graph GI
Fb1
FLs
Fb2
Fb1
Fb2
Fb2
Fb1 Fb2 FLs
Fb2
FLs
C1 (P1) C2 (P1)
C1 (P2)
C2 (P1)
C2 (3)
C1 (P3)
ID1 C1/C2
ID2 C1/C2 ID3 C1/C2
Fb1
FLs
Fb1
FLs
Fb1
FLs
Fb2 P P3 P2 1
Graph GID of P1 Graph GID of P2 Graph GID of P3
Graph GS
(a) (b)
(c)
(d)
Figure 5.16: Enrichment of the graph GI with the decomposition of each node into subsets
Ni(Fb1), Ni(Fb2), Ni(Fl). Illustration of an interface cycle between primitives P1, P2 and P3
built from GI and GID. (a) Initial primitives segmentation, (b) GI graph, (c) GID for P1,
P2 and P3, (d) GS graph. 148Chapter 5: Performing idealizations from construction graphs
connected, three algorithms have been developed to identify respectively:
• interface cycles;
• groups of parallel medial surfaces;
• and L-shaped primitives configurations.
The locations of medial surfaces are described here with orthogonal or parallel properties
for sake of simplicity. Therefore, each of them can be generalized to arbitrary
angular positions as described in Section 5.3.2. Each algorithm is now briefly described.
Interface cycles
Cycles of interfaces are of particular interest to robustly generate connections among
idealized sub-domains. To shorten their description, the focus is placed on a common
configuration where all the interfaces between primitives are of type (4). To define a
cycle of interfaces of type (4), it is mandatory, in a first step, to identify a cycle in
GI from connections between Pi. In a second step, the structure of connections inside
each Pi, as defined in GID, must contain themselves a path between their interface
boundaries Cj(Pi)s that extends the cycle in GI to a cycle in GS = GI∪GID. An example
of such a cycle is illustrated in Figure 5.16. This level of description of interfaces among
sub-domains indicates dependencies between boundaries of medial surfaces. Indeed,
such a cycle is a key information to the surface extension operator to connect the set of
medial surfaces simultaneously. The medial surfaces perpendicular to their interfaces
IG (of P3 in Figure 5.16) have to be extended not only to the medial surfaces parallel
to their interfaces (of P1 and P2 in Figure 5.16), but they have also to be extended in
accordance with the extrusion directions of their adjacent primitives. For example, to
generate a fully idealized model of the three primitives of Figure 5.16, the corner point
of the medial surface of P3, corresponding to the ID3C1/C2 edge, has to be extended to
intersect the medial surface of P1 as well as to intersect the medial surface of P2. As
described, the information available in an interface cycle enables a precise and robust
generation of connections among idealized sub-domains.
Interface cycles appear as one category of specific idealization processes because
they appear frequently in mechanical products and they fall into one category of connection
types in the taxonomy of Figure 5.9.
Groups of parallel medial surfaces
Connections of parallel medial surfaces can be handled with medial surface repositioning
(see P1 and P2 on Figure 5.17a) corresponding to the adjustment of the material
thickness on both sides of the idealized surface to generate a mechanical model consistent
with the shape of M. This is a current practice in linear analysis that has
been advantageously implemented using the relative position of extrusion primitives.
149Chapter 5: Performing idealizations from construction graphs
P2
P1
Offset of parallel medial surfaces
(a)
(b)
P2
P1
Offset of L-shaped medial surfaces
Figure 5.17: Examples of medial surface positioning improvement. (a) Offset of parallel
medial surfaces, (b) offset of L-shaped medial surfaces.
These groups of parallel medial surfaces can be identified in the graph GI as the set
of connected paths containing edges of type (2) only. Figure 5.18a shows two groups
of parallel medial surfaces extracted from GI presented in Figure 5.16. As a default
processing of these paths, the corresponding parallel medial surfaces are offset to a
common average position of the medial surfaces and weighted by their respective areas.
However, the user can also snap a medial surface to the outer or inner skins of
an extrusion primitive whenever this prescription is compatible with all the primitives
involved in the path. Alternatively, he, or she, may even specify a particular offset position.
Surfaces are offset to the reference plane as long as the surface remains within the
limits of the original volume of the component M. This restriction avoids generating
interferences between the set of parallel primitives and the other neighboring primitives.
For example, in Figure 5.18, the resulting medial surface of the group of parallel
primitives, containing P1 and P2, cannot intersect the volumes of its perpendicular
primitives such as P3. This simple process points out the importance to categorize the
interfaces between primitives.
Like interface cycles, groups of parallel medial surfaces refer to the taxonomy of
Figure 5.9 where they fall into the type (2) category.
L-shaped primitives configurations
When processing an interface of type (4) in GI , if an interface boundary Cj(Pi) is
located either on or close to the boundary of the primitive Pj which is parallel to the
150Chapter 5: Performing idealizations from construction graphs
Independent Medial
Surfaces
P1
P2
P3
P1
P2
P3
Aligned Medial
Surfaces
(c)
d2 d1
d3
P4
Primitives in connection through
only interfaces of type (4)
Border
primitives
P7
Interface of type (2)
P17
P1
P2
P6
P8
P9
P10 P13
P14 P15
Group of parallel medial surfaces
(a)
(b)
Interface Graph GI
P11
P5 P12 P16 P18 P11
P7
P3
Interface of type (2)
Interface of type (4)
P17
P1
P2
P4
P6
P8
P9
P10 P11 P12 P13
P14 P15
P16 P18
P5
P3
P2
P10
P14
P12
P1
P15
P6
P9
P13
P8
P4 P5
P16
P18
P17
P7
P3
Figure 5.18: Example of identification of a group of parallel medial surfaces and border primitives
configurations from the interface graph GI : (a) extraction of type (2) subgraphs from
GI , (b) set of L-shaped primtives extracted from GI , (c) initial and idealized configurations
of M when groups of parallel primitives and L-shaped configurations have been processed.
151Chapter 5: Performing idealizations from construction graphs
Fb2
Fb1
Fb2
FLs
IP1/ P2
P1
C1 (P1)
P2
IP1/ P2
Fb1
C1 (P1)
Fs
C1 (P2)
P1 (surface) P2 (volume)
Figure 5.19: Example of a volume detail configuration lying on an idealized primitive.
interface (see P1 and P2 on Figure 5.17b or P2 and P3 in Figure 5.18c), the medial
surfaces needs to be relocated to avoid meshing narrow areas along one of the subdomain
boundaries (here P3 is moved according to d3). This relocation is mandatory
because Cj(Pi) being on or close to the boundary of Pj , the distance between the
idealized representation of Pi and the boundary of Pj is of the order of magnitude
of the thickness of Pi. Because Pi is idealized, it means that the dimension of FEs
is much larger than the thickness of Pi, hence meshing the areas between Cj(Pi) and
the boundary of Pj would necessarily result in badly shaped FEs. The corresponding
configurations are designated as L-shaped because Pi and Pj are locally orthogonal or
close to orthogonal.
If this configuration refers to mesh generation issues, which have not been addressed
yet, L-shaped configurations where a subset of Cj(Pi) coincides with the boundary of a
connected primitive (see P2 in Figure 5.18c) can be processed unambiguously without
mesh generation parameters, as justified above. Processing configurations where Cj(Pi)
is only close to a primitive contour requires mesh parameters handling and is left for
future work. Primitives connected through interfaces of type (4) only, as illustrated
in Figure 5.18b, are part of L-shaped configurations if they have at least a primitive
contour Cj(Pi) close to Pj boundary. In Figure 5.18b, only P11, which is located in
the middle of P9 and P14, is not considered as an L-shaped primitive. L-shaped con-
figurations can be processed using the precise location of IG so that the repositioning
operated can stay into IG to ensure the consistency of the idealized model.
Identification criteria of Pi details
The relationships between extrusion information and primitive interfaces may also
be combined to analyze more precisely the morphology of standalone primitives, such as
small protrusions that can be considered as details. As an example, Figure 5.19 shows
the interaction between a primitive P1, which can be idealized as a plate and a primitive
P2, morphologically not idealizable. The enriched interface graph with GID indicates
that the boundary C1(P1) lies on a base face, F b1, of P1 whose boundary is used to
idealize P1. Then, if the morphological analysis of F b1 is such that: F = (F b1−∗FC1(P1) )
shows that F is still idealizable, this means that P2 has no morphological influence
152Chapter 5: Performing idealizations from construction graphs
relatively to P1, even though P2 is not idealizable.
As a result, P2 may be considered as a detail of P1 and processed accordingly
when generating the mesh of P1, P2. This simple example illustrates how further
analyses can be derived from the graph structures GID and GI . Identifying details
using the morphological properties of primitives is a way to be independent from the
FE mesh size. With the proposed idealization process, a volume can be considered as
a detail with respect to the surrounding geometry before the operation of dimensional
reduction. This is an a priori approach satisfying the requirement of Section 2.2.1
which stated that a skin detail cannot be directly identified in an idealized model.
Though the criterion described above is not generic, it is illustrative of the ability
of the graph structures GID and GI to serve as basis of other criteria to cover a much
wider range of configurations where skin and topological details could be identified with
respect to the idealization processes. A completely structured approach regarding these
categories of details is part of future work.
5.5.3 Generation of idealized models
To illustrate the benefits of the interface graph analyses of GID and GI , which have been
used to identify specific configurations with the algorithms described in Section 5.5.2,
an operator has been developed to connect the medial surfaces. Once the groups of
parallel medial surfaces have been correctly aligned, the medial surfaces involved in
interfaces of type (4) are connected using an extension operator. Because the precise
locations of the interfaces between primitives Pi and Pj are known through their geometric
imprint Cj(Pi) on these primitives, the surface requiring extension is bounded
by the imprint of Cj(Pi) on the adjacent medial surface. The availability of detailed
interface information in GI and GID increases the robustness of the connection operator
and prevents the generation of inconsistent surfaces located outside interface areas.
Connection operator
Firstly, the connection operator determines the imprints Cj(Pi) on the corresponding
medial surface of the primitive Pj . This image of Cj(Pi) on the medial surface of the
neighbor primitive Pi is noted Img(Cj(Pi)). Figure 5.20a shows, in red, three interface
boundaries on the medial surfaces Img(Cj(Pi)) of the three primitives P1, P2, P3. When
adjusting Cj(Pi), the medial surface boundary of Pi is also transferred on Img(Cj(Pi)).
Such regions, in green in Figure 5.20a, are noted ImgMS(Cj(Pi)). The next step extends
the medial surfaces involved in interfaces of type (4). The medial surfaces are extended
from Img(Cj(Pi)) to ImgMS(Cj(Pi)) (the red lines to the green lines in Figure 5.20a).
The extensions of the medial surfaces split Img(Cj(Pi)) into two or more sub-regions.
The sub-regions which contains edges coincident with edges of the primitive medial
surface are removed to avoid small mesh areas.
153Chapter 5: Performing idealizations from construction graphs
Imprint of interface
on primitive: C1(P2)
Medial surface
boundary
Image of C1(P2)
on medial surface:
Img(C1(P2))
P2
P1
P2
P1
P2
P1
P2
P1
P2
P1
P2
P1
Image of the medial surface
boundary of P2 on the medial
surface of P1 : ImgMS(C1(P2))
Suppression of
non-connected
areas of Img(C1(P2))
Extension of
medial surface
Offset of the
medial surface of P2
Offset of medial
surface image
Idealization
without offset
Idealization
with offset
(b)
C1 (P8) : interface boundary
on primitive
P2
P8
P3
C2 (P2): interface boundary
on primitive
ImgMS (C2 (P2) ): medial Surface representation
on Interface Boundary
Representation of geometric interfaces on Medial Surfaces
(a)
Img(C1(P2)): image of C1 (P8)
on the medial Surface
Figure 5.20: (a) Representation of the interface imprints on primitives and on medial surfaces.
(b)Connection process of two primitives P1 and P2 with and without offsetting their medial
surfaces.
154Chapter 5: Performing idealizations from construction graphs
Mesh Aligned Medial
Surfaces
Independent Medial
Surfaces with Interface
boundary
Connected Medial
Surfaces
· CAD Medial Surfaces
· Interfaces
Figure 5.21: Idealization process of a component that takes advantage of its interface graph
structures GID and GI .
It must be noticed that the regions ImgMS(Cj(Pi)) lie into Pj and can be obtained
easily as a translation of Cj(Pi). Therefore, it is not comparable to a general purpose
projection operator where existence and uniqueness of a solution is a weakness.
Here, ImgMS(Cj(Pi)) always exists and is uniquely defined from Cj(Pi) based on the
properties of extrusion primitives.
The interface cycles previously detected are used to identify intersection points
within ImgMS(Cj(Pi)). Figure 5.20a illustrates the interaction between the three
ImgMS(Cj(Pi)) corresponding to the intersection between the three green lines. When
processing L-shaped primitives, in case the medial surface of Pi is shifted to the boundary
of Pj , the corresponding images Img(Cj(Pi)) and ImgMS(Cj(Pi)) are also shifted
with the same direction and amplitude. This update of these images preserves the
connectivity of the idealized model when extending medial surfaces. Figure 5.20b illustrates
the connection process of two primitives P1 and P2 with and without moving
the medial surface of the primitive P2. This figure shows how the connection between
the idealized representations of P1 and P2 can preserve the connectivity of the idealized
model.
Results of idealized models
As shown in Figure 5.18b and c, the repositioning of medial surfaces inside P1,
P2 and P3 improves their connections and the overall idealized model. Figure 5.21
illustrates the idealization of this component. Firstly, the medial surface of each primitive
is generated. Then, the groups of parallel medial surfaces are aligned before the
generation of a fully connected idealized model.
Finally, the complete idealization process is illustrated in Figure 5.22. The initial
CAD model is segmented using the construction graph generation of Chapter 4 to
produce GD. It produces a set of volume primitives Pi with interfaces between them
resulting in the graph structures GI and GID. A morphological analysis is applied
on each Pi as described in Section 5.3.1. Here, the user has applied a threshold ratio
155Chapter 5: Performing idealizations from construction graphs
Idealized Mesh
model
Init CAD model Segmented model Interfaces
Dimensional
reduction
Analysis of
interfaces
Final CAD
idealized model
Morphological
analysis
Figure 5.22: Illustration of the successive phases of the idealization process (please read from
the left to the right on each of the two rows forming the entire sequence).
xu = 2 and an idealization ratio xr = 10. Using these values, all the primitives are
considered to be idealized as surfaces and lines. The final CAD idealized model is
generated with the algorithms proposed in Section 5.5.3 and exported to a CAE mesh
environment (see Chapter 6).
5.6 Conclusion
In this chapter, an analysis framework dedicated to assembly idealization has been
presented. This process exploits construction graphs of components that produce their
segmentation into primitives. Morphological criteria have been proposed to evaluate
each primitive with respect to their idealization process. The benefits of generative
process graphs have been evaluated in the context of idealization processes as needed
for FEA.
A morphological analysis forms the basis of an analysis of ’idealizability’ of primitives.
This analysis takes advantage of geometric interfaces between primitives to
assess stiffening effects that potentially propagate across the primitives when they are
iteratively merged to regenerate the initial component and to locate idealizable subdomains
over this component. Although the idealization concentrates on shell and
plates, it has been observed that the morphological analysis can be extended to derive
beam idealizations from primitives.
This morphological analysis also supports the characterization of geometric details
in relation to local and to idealizable regions of a component, independently of any nu-
156Chapter 5: Performing idealizations from construction graphs
merical method used to compute solution fields. Overall, the construction graph allows
an engineer to access non trivial variants of the shape decomposition into primitives,
which can be useful to evaluate different idealizations of a component.
Finally, this decomposition produces an accurate description into sub-domains and
into geometric interfaces which can be used to apply dimensional reduction operators.
These operators are effectively robust because interfaces between primitives are
precisely defined and they combine with the primitives to bound their idealized representations
and monitor the connections of the idealized model.
The principle of component segmentation appears also to be compatible with the
more general needs to process assembly models. Indeed, components are sub-domains
of assemblies and interfaces are also required explicitly to be able to let the engineer
assign them specific mechanical behavior as needed to meet the simulation objectives.
The proposed idealization process can now take part to the methodology dedicated
to the adaption of a DMU to FE assembly models, as described in the next chapter.
157Chapter 5: Performing idealizations from construction graphs
158Chapter 6
Toward a methodology to
adapt an enriched DMU to FE
assembly models
Having detailed the idealization process as a high-level operator taking benefits
from a robust shape enrichment, this chapter extends the approach toward a
methodology to adapt an enriched DMU to FE assembly models. Shape transformations
resulting from user-specified hypotheses are analyzed to extract preprocessing
tasks dependencies. These dependencies lead to the specification of
a model preparation methodology that addresses the shape transformation categories
specific to assemblies. To prove the efficiency of the proposed methodology,
corresponding operators have been developed and applied to an industrial DMU.
The obtained results point out a reduction in preparation times compared to
purely interactive processes. This time saved enables the automation of simulation
processes of large assemblies.
6.1 Introduction
Chapter 3 set the objectives of a new approach to efficiently adapt CAD assembly
models derived from DMUs as required for FE assembly models. Chapters 4 and 5
significantly contributed to solve two issues regarding the proposed approach. The
first challenge addresses the internal structure of CAD components that has to be
improved to provide the engineer with a robust segmentation that can be used as basis
for a morphological analysis. The second challenge deals with the implementation
of a robust idealization process automating the tedious tasks of dimensional reduction
operations and particularly the treatment of connections between idealized areas.
Then, the proposed algorithms have been specified to enable the transformations of
solid primitives as well as their associated interfaces. The set of solid primitives can
result either from a component segmentation or an assembly structure decomposed
159Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
into components in turn decomposed into solid primitives. Thus, the method allows an
engineer to transform components’ shapes while integrating the semantics of assembly
interfaces.
This chapter goes even further to widen the scope of shape transformations at the
assembly level and evolve toward a methodology of assembly pre-processing. The aim
is to enforce the ability of the proposed approach to challenge the current practices
to generate large assembly simulation models. The analysis of dependencies among
component shape transformations applied to assemblies will help us to formalize this
methodology. Thanks to the geometric interfaces of components and functional information
expressed as functional designations of components obtained with the method
of Shahwan et al. [SLF∗13] summarized in Section 3.3, new enriched DMU are now
available to engineers. Thanks also to the component segmentation into solid primitives
and their interfaces that can be used to idealize sub-domains as described in
Chapter 5, the models input to FEA pre-processing contains much more information
available to automate the geometric transformations required to meet the simulation
objectives. The method described in Section 6.1 of this chapter uses this enriched
DMU as input to structure the interactions between shape transformations, leading
to a methodology which structures the assembly preparation process. To prove the
validity of the proposed methodology, Sections 6.3 and 6.4 illustrate it with two test
cases of an industrial assembly structure (see Figure 1.6) to create a simplified volume
model and an idealized surface model. To this end, new developments are presented
that are based on operators that perform shape transformations using functional information
to efficiently automate the pre-processing. Section 6.3 develops the concept
of template-based transformation operators to efficiently transform groups of components.
This operator is illustratively applied to an industrial aeronautical use-case with
transformations of bolted junctions. Section 6.4 deploys the methodology using the idealization
algorithms of Chapter 5 to generate a fully idealized assembly model. Finally,
the software platform developed in this thesis is presented at the end of Section 6.4.
6.2 A general methodology to assembly adaptions
for FEA
Chapter 1 pointed out the impact of interactions between components on assembly
transformation. The idealization of components is not the only time consuming task
during assembly preparation. When setting up large structural assembly simulations,
processing contacts between components as well as transforming entire groups of components
are also tedious tasks for the engineer. The conclusion of Section 1.5.4 showed
that the shape transformations taking place during an assembly simulation preparation
process interact with simulation objectives, hypotheses and functions attached to
components and to their interfaces. Therefore, to reduce the amount of time spent
160Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
on assembly pre-processing, the purpose is now to analyze and structure the interactions
between shape transformations. This leads to a methodology that structures the
assembly preparation process.
6.2.1 From simulation objectives to shape transformations
How do shape transformations emerge from simulation objectives and how do they
interact between themselves? This is to be analyzed in the following section. However,
the intention is not to detail interactions but to focus on issues that help to structure
the shape transformations. Transformation criteria related to time that may influence
simulation objectives are not relevant, i.e., manual operations that have been performed
to save time are irrelevant. Indeed, the purpose is to structure shape transformations
to save time and improve the efficiency of preparation processes.
6.2.1.1 Observation areas
From the simulation objectives, the structural engineer derives hypotheses that address
components and/or interfaces among them, hence the concept of observation area.
Even if this engineer has to produce an efficient simplified model of the assembly
to meet performance requirements, anyhow he/she must be able to claim that his/her
result is correct and accurate enough in critical observations areas that are consistent
with the simulation objectives. Therefore, the mechanical model set up in these areas
must remain as close as possible to the real behavior of the assembly. Thus, the
geometric transformations performed in these areas must be addressed in a first place.
As an example, in Figure 6.1, the simulation objective is to observe displacements in
the identified region (circled area) due to the effects of local loading configurations,
the section of the domain being complex. A possible engineers hypothesis can be to
model precisely the 3D deformation in the observation area with a volume model and
a fine mesh and set up a coarse mesh or even idealized sub-domains outside the area
of interest. To explicit this hypothesis over the domain, the circled area should be
delimited before meshing the whole object. During a preparation process, setting up
observation areas and thus, subdividing an assembly into sub-domains, independently
of the component boundaries and their interfaces, acts as a prominent task.
6.2.1.2 Entire idealization of components
Idealizations have inherently a strong impact on shape transformations because of their
dimensional reduction. Applied to a standalone component, idealization is meaningful
to transform 3D domains up to 1D ones. In the context of assemblies, to meet simulation
objectives, performances, and reduce the number of unknowns, the engineer
161Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
Observation Area Geometric
transformation
Surface model
Mixed dimensional
model
(Line + Surface)
Fine Mesh
Coarse Mesh
Idealized element
Load F
Figure 6.1: Setting up an observation area consistent with simulation objectives.
A
B
Analytical model
Global Idealization
A + B
Figure 6.2: Entire idealization of two components.
can idealize a component up to a point (0D), e.g., a concentrated mass, or even replace
it by a pre-defined solution field, e.g., a rigid body behavior or a spring-damper
field. When analytical models are available, some groups of components, like the bolts
in Figure 6.3a, do not appear geometrically in the FE assembly. The planar flange
connected by the bolts forming the major interface is used as location of a section in
the FE assembly model to determine resulting internal forces and moments in that
section. Then, the analytical model is independent of the FE one and it is fed with
these parameters to determine the pre-stress parameters of the bolts. Figure 6.3b illustrates
the complete idealization of pulleys as boundary conditions. This time, an
analytical model has been used prior to the FE assembly model. Such categories of
idealizations can be also applied to a set of connected components (see Figure 6.2). In
either case, such transformations have a strong impact on the interfaces between the
idealized components and their neighboring ones.
Consequently, interfaces between idealized components can no longer be subjected
to other hypotheses, e.g., contact and/or friction. Again, this observation highlights
the prominence of idealization transformations over interfaces ones.
6.2.1.3 Processing Interfaces
Interfaces between components are the location of specific hypotheses (see Table 1.2)
since they characterize junctions between components. Naturally, they interact with
hypotheses and shape transformations applied to the components they connect. Let
162Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
Idealization of
groups of
components
Idealization of
component as BCs
(a) (b)
Figure 6.3: (a) Transformation of groups of components as analytical models and, (b) idealization
of components as BCs (courtesy of ANTECIM).
A C B ABC
Interface Idealization
(a) (b) (c)
A B
C
A
B
C
Figure 6.4: Influence of interfaces over shape transformations of components.
us consider the example of Figure 6.4. In a first place, a simulation objective can
be stated as: modeling the deformation of the assembly with relative movements of
plates A, B, C under friction. Under this objective, hypotheses are derived that require
modeling interfaces (A, C) and (B, C) with contact and friction. Then, even if A, B
and C, as standalone components, can be candidate to idealization transformations,
these idealizations cannot be idealized further because the interfaces would need to
be removed, which is incompatible with the hypotheses. In a second place, another
simulation objective can be stated as: modeling the deformation of the assembly where
the junctions between plates A, B, C are perfect, i.e., they behave like a continuous
medium. There, plates A, B, C can still be idealized as standalone components but the
hypothesis on interfaces enables merging the three domains (Figure 6.4b) and idealizing
further the components to obtain an even simpler model with variable thickness (see
Figure 6.4c).
Thus, there are priorities between shape transformations deriving from the hypotheses
applied to interfaces. Indeed, this indicates that hypotheses and shape transformations
addressing the interfaces should take place before those addressing components
as standalone objects. Effectively, interfaces are part of component boundaries; hence
163Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
their transformations modify these boundaries. It is more efficient to evolve the shape
of interfaces alone first and to process component shapes, as isolated domains, afterwards.
As explained in Section 5.4, once the role of interfaces has been defined in the
assembly according to the user’s simulation objectives and the corresponding transformations
have been performed, each individual component can be transformed on its
own to take into account these interfaces as external boundary conditions during its
idealization/simplification process.
6.2.2 Structuring dependencies between shape transformations
as contribution to a methodology of assembly preparation
Section 6.2.1 has analyzed the relationships between simulation objectives, hypotheses,
and shape transformations of assemblies. One outcome of this section structures the
dependencies between hypotheses and shape transformations that address an assembly
at different levels. The purpose is now to exploit these dependencies to organize the
various steps of an assembly simulation preparation process so that it appears as linear
as possible to be efficiently automatized.
Dependencies of geometric transformations of components and interfaces
upon simulation hypotheses
Section 6.2.1.1 has shown the dependency of observation areas upon the simulation
objectives. Defining observation areas acts as a partitioning operation of an assembly,
independently of its components boundaries. Section 6.2.1.2 introduced the concept of
entire idealization of components and pre-defined solutions fields. Indeed, the shape
transformations derived from Section 6.2.1.2 cover also sub-domains over the assembly
that can be designated as ‘areas of weak interest’. There, the assembly interfaces contained
in these areas are superseded by the transformations of Section 6.2.1.2. From a
complementary point of view, areas of interest, once defined, contain sub-domains, i.e.,
components or parts of components, that can still be subjected to idealizations, especially
transformations of volumes sub-domains into shells/membranes and/or plates.
Consequently, areas of weak interest are regarded as primary sub-domains to be de-
fined. Then, entire idealization of components and pre-defined solutions fields will take
place inside these areas, in a first place (identified as task 1 in Figure 6.5). These areas
are necessarily disjoint from the areas of interest, therefore their processing cannot
interfere with that of areas of interest.
Sections 1.5.4 and 6.2.1.3 have shown that hypotheses about assembly interfaces
influence the transformations of component boundaries. Hence, these hypotheses must
be located outside of areas of weak interest to preserve the consistency of the overall
simulation model. Subsequently, these hypotheses about interfaces are known once the
164Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
areas of weak interest have been specified. Consequently, they come as a task 2, after
the definition of the areas of weak interest and the corresponding shape transformations
of assembly interfaces should be applied at that stage.
As highlighted at Sections 1.5.3, 1.5.4, and 6.2.1.3, idealizations are shape transformations
having an important impact on component shapes. As mentioned at Section
2.2, the order of detail removal operations and idealizations has not been studied
precisely yet. However, once idealizations have been assigned to sub-domains corresponding
to primitives Pi of components, these transformations produce new interfaces
between these sub-domains (see Figure 5.1) in addition to the assembly interfaces originated
from the interactions between components. Independently of skin and topological
details, idealizations can be regarded as task 3 in the preparation process flow.
Effectively, these new interfaces are the consequences of idealizations of sub-domains
that result from idealization processes. Therefore, these new interfaces cannot be processed
during the second task. These new interfaces should be processed in a first
place after the idealizations performed during the third task. The corresponding shape
transformations attached to these new interfaces form task 4.
Now, as pointed out at Section 6.2.1.3, idealizations can interact between themselves
because the idealized sub-domains can be extended/merged in accordance to
their geometric configurations to produce a connected idealized model wherever it is
required by the simulation objectives. This new set of shape transformations can be
regarded as task 5 that could indeed appear as part of an iterative process spanning
tasks three and four. This has not yet been deeply addressed to characterize further
these stages and conclude about a really iterative process or not. Even though
task two addresses hypotheses attached to assembly interfaces and their corresponding
shape transformations, it cannot be swapped with task three to contribute to iterative
processes discussed before. Indeed, task 2 is connected to assembly interfaces between
components and their processing could be influenced by component idealizations, e.g.,
in a shaft/bearing junction, idealizing the shaft influences its contact area with the
bearings that guide its rotational movement.
Hypotheses and shape transformations previously mentioned enable the definition of
a mechanical model over each sub-domain resulting from the tasks described above but
this model must be available among the entities of CAE software. This is mandatory
to take advantage of this software where the FE mesh will be generated. Consequently,
if an engineer defines interface transformations consistent with the simulation hypotheses,
there may be further restrictions to ensure that the shapes and mechanical models
produced are effectively compatible with the targeted CAE software capabilities. For
sake of conciseness, this aspect is not addressed here.
Toward a methodology of assembly model preparation
This section has identified dependencies among shape transformations connected to
165Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
Task1 – Definition of areas of weak interest
Entire idealization of components, pre-defined solution fields
Task2 – Specification and transformations of components interfaces
Task3 – Idealization of sub-domains outside the areas of weak interest
Task4 – Specification and transformations of interfaces resulting from
idealization
Task5 – Interaction and transformations of idealized sub-domains
Task6 – Skin or topological transformations of sub-domains
Figure 6.5: Synthesis of the structure of an assembly simulation preparation process.
simulation objectives and hypotheses. Shape details on components can be identified
using the morphological analysis, as illustrated in Section 5.5.2. This analysis has
shown that the primitives Pi obtained from the construction graph GD could be further
decomposed into sub-domains after analyzing the result of a first MAT. This analysis
has also shown its ability to categorize sub-domains relatively to each other. However,
detail removal, which originates from different components or even represents an entire
component, needs to be identified through a full morphological analysis of the assembly.
This has not been investigated further and is part of future research. Currently, detail
removals can take place after task two but they can be prior or posterior to idealizations.
The definition of areas of interest has connections with the mesh generation process to
monitor the level of discretization of sub-domains. This definition acts as a partitioning
process that can take place at any time during the process flow of Figure 6.5.
166Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
6.2.3 Conclusion and methodology implementation
As a conclusion, the difference between a simulation model of a standalone component
and that of an assembly relates to:
• The interactions between components. The engineer formulates a hypothesis
for each interface between components. These hypotheses derive from assembly
simulation objectives;
• The ordering of shape transformations. The entire idealization of components and
the specification of pre-defined solution fields followed by shape transformations
of component interfaces are prioritized;
• The interactions between idealizations and assembly interface transformations.
To be able to model large assemblies, not only components but groups of components
have to be idealized, which can significantly increase the amount of
interactions between idealizations and transformations of assembly interfaces.
The simulation objectives are expressed through hypotheses that trigger shape
transformations. Studying the interactions between simulation objectives, hypotheses,
and shape transformations has revealed dependencies between categories of shape
transformations. These dependencies have been organized to structure the assembly
simulation model preparation process in terms of methodology and scope of shape
transformation operators. The proposed methodology aims at successfully selecting
and applying the geometric transformation operators corresponding to the simulation
objectives of the engineer.
Starting from an enriched structure of DMU as proposed in Section 3.3, the purpose
of the next sections is to illustrate how this methodology can be applied to industrial
use-cases. Two implementations are proposed and both are based on the exploitation
of functional features of the assembly using the interfaces between components (see
Figures 2.14 and 3.2).
As a first methodology implementation, Section 6.3 develops the concept of templatebased
operators. This concept uses functional information and the geometry of assembly
interfaces to identify configurations such as bolted junctions and to apply specific
simulation hypotheses to transform their assembly interfaces. This transformation
creates a simplified volume model with a sub-domain decomposition around bolted
junctions, as required by the simulation objectives (see Figure 6.6).
The second methodology implementation, presented in Section 6.4, leads to a full
idealization of an assembly use-case. This implementation confirms that the idealization
process of Chapter 5 can be generalized to assembly structures.
167Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
Clearance Fitted
contact
Hypothesis: bolted junctions represented by a
simplified bolt model
Geometric transformations: cylindrical volume
interface representing a screw/hole clearance
transformed into a fitted contact.
(a)
Figure 6.6: Use-Case 1: simplified solid model with sub-domains decomposition around bolted
junctions. Area enlarged (a): Illustration of task 2 that transforms bolted junction interfaces
into fitted contacts.
6.3 Template-based geometric transformations resulting
from function identifications
As illustrated in Section 1.5.4, repetitive configurations, e.g., junctions, and their processing
are critical when preparing assembly structures, justifying the need to automate
the preparation of large assembly models. To improve the efficiency of DMU
transformations for FEA, Section 3.5.2 has proposed to set up relationships between
simulation objectives and geometric transformations through the symbolic representation
of component functions and component interfaces. The method is based on an
enriched DMU as input (see Section 3.3) which contains explicit geometric interfaces
between components (contacts and interferences) as well as their functional designations.
This enriched DMU has been generated based on the research work of Shahwan
et al. [SLF∗12, SLF∗13]. The geometric interfaces feed instances of conventional interfaces
(CI) (see Section 1.3.2) classes structured into a taxonomy, TCI , that binds
geometric and symbolic data, e.g. planar contact, spherical partial contact, cylindrical
interference, . . . Simultaneously, CI and assembly components are organized into a CI
graph: CIG(C, I) where the components C are nodes and CI are arcs.
Starting from this enriched model, Section 6.3.2 extends the functional structure
to reach a level of product functions. Therefore, simulation objectives can be used to
specify new geometric operators using these functions to robustly identify the components
and assembly interfaces to transform [BSL∗14]. If close to Knowledge Based
Engineering (KBE), this scheme is nonetheless more generic and more robust than
KBE approaches due to the fact that functional designations and functions are generic
concepts. KBE aims at structuring engineering knowledge and at processing it with
symbolic representations [CP99, Roc12] using language-based approaches. Here, the
focus is on a robust connection between geometric models and symbolic representations
168Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
featuring functions.
To prove the validity of this approach and of the methodology proposed in Section
6.2.2, this section presents a template-based operator dedicated to the automation
of shape transformations of bolted junctions (see Figure 6.6). The template operator is
described in Section 6.3.3. Using functional information and geometric interfaces, this
operator applies a user-defined template to simplify bolts and sets control sub-domains
around them in their associated tightened components to enable the description of the
friction phenomenon between these components. This template is used to precisely
monitor the mesh generation process while preserving the consistency of contacts and
adapting the assembly model to simulation objectives. Finally, Section 6.3.4 illustrates
the result of the different tasks of the proposed methodology applied to the transformation
of the bolted junctions of the root joint model presented in Figure 1.6.
6.3.1 Overview of the template-based process
The overall principle of the template-based approach is introduced in Figure 6.7. It
uses the available functional information and geometric interfaces, see (1) in Figure 6.7,
as well as a library of pre-defined parametric templates, see (2). From this library, the
templates are selected by the user according to his, resp. her, simulation objectives.
Once the templates have been selected, the operator automatically identifies the functions
in the assembly the templates are related to, see (3). Then, as explained in
Section 6.3.2, the operator identifies in the CAD assembly the components and interfaces
to be transformed, see (4). In (5), the templates definition are fitted to the real
geometry, i.e. the components and interfaces dimensions involved in the geometrical
transformations are updated in the pre-definition of the templates. Section 6.3.3.1
detailed the compatibility conditions required by the templates insertion in the real
geometry. Finally, the real geoemtry is transformed according to the compatibility
conditions and the templates are inserted in the assembly model, see task 6. Section
6.3.4 describes the application of template operator on two aeronautical use-cases.
It results in a new CAD assembly model adapted to simulation objectives.
6.3.2 From component functional designation of an enriched
DMU to product functions
Though the bottom-up approach of Shahwan et al. [SLF∗12, SLF∗13] summarized in
Section 3.3 provides assembly components with a structured model incorporating functional
information that is independent of their dimensions, their functional designation
does not appear as an appropriate entry point to derive shape transformation operators
as required for FE analyses. Indeed, to set up FE assembly models, an engineer looks
for bolted junctions that he, resp. she, wants to transform to express friction phenomena,
pre-stressed state in the screw, . . . Consequently, the functional level needed is not
169Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
Template library:
pre-defined parametric templates
Definition of assembly interfaces
and functional designations
Geometrical adjustment of the
template to real shapes
Functions available
for transformation
Identification of components
and interfaces involved in
selected functions
Adaptation of real shapes with
template insertion
Real shape Template
1 2
3
4
5
6
Adapted assembly
Figure 6.7: Overview of the main phases of the template-based process.
170Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
Assembly
Disassemblable
Obstacle
Bolted adjusted
Screw + nut
Blocked nut
Adherence Dependent function
Dependent function
Bolted
...
...
... Nut
Screw
Plates
Counter nut
Figure 6.8: Subset of TF N , defining a functional structure of an assembly.
the functional designation, which is bound to a single component, it is the product
function itself that is needed to address the corresponding set of components and their
functional interfaces.
To this end, it is mandatory to refer to product functions. This is achieved with a
taxonomy of functions, TF N , that can produce a functional structure of an assembly
(see Figure 6.8). Blue items define the sub-path in TF N hierarchy that characterizes
bolted junctions.
Each instance of a class in TF N contains a set of components identified by their functional
designation, i.e., it contains their structured geometric models and functional
interfaces. As a result of the use of TF N , a component of a DMU can be automatically
identified when it falls into the category of cap screws, nuts, locking nuts, that are
required to define bolted junctions. This means that their B-Rep model incorporates
their geometric interfaces with neighboring components. The graph of assembly interfaces
set up as input to the process of functional designation assignment, identifies the
components contained in a bolted junction. Each component is assigned a functional
designation that intrinsically identifies cap screws, nuts, locking nuts, . . . , and connects
it with an assembly instance in TF N .
It is now the purpose of Section 6.3 to take advantage of this information to set up
the template-based transformations.
6.3.3 Exploitation of Template-based approach for FE models
transformations
As a result of the functional enrichment process, the DMU is now geometrically structured,
components are linked by their geometric interfaces, and groups of components
can be accurately identified and located in the DMU using their function and geo-
171Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
metric structure, e.g., adjusted bolted junctions with (screw+nut) (see Figure 6.8).
Now, the geometric transformations needed to adapt the DMU to FEA objectives are
strengthened because screws, nuts, locking nuts can be robustly identified, groups of
tightened components are also available through the load cycles attached to cap screws
(see Section 3.3).
Two possible accesses are proposed to define a function-based template T related
to an assembly function:
• A component C through a user-defined selection: from it and its functional designation,
a data structure gives access to the functions it contributes to. After
selecting C, the user selects the function of interest among the available functions
attached to C in TF N and compatible with T. Other components are recovered
through the selected function this component participates to;
• The function itself in TF N that can lead to the set of components needed to
define this function and all the instances of this function existing in the targeted
assembly.
These accesses can be subjected to constraints that can help identifying the proper
set of instances. Constraints aim at filtering out instances when a template T is defined
from a function to reduce a set of instances down to the users needs, e.g., assembly
function with bolts ‘constrained with’ 2 tightening plates componenti and component j .
Constraints aim at extending a set of instances when a template is defined from a
component, i.e., a single function instance recovered, and needs to be extended, e.g.,
assembly function with bolts ‘constrained with’ same tightened components and screw
head functional interface of type ‘planar support’ or ‘conical fit’.
6.3.3.1 Function-based template and compatibility conditions of transformations
The previous section has sketched how component functions can be used to identify
sets of components in an assembly. Indeed, this identification is based on classes
appearing in TF N . Here, the purpose is to define more precisely how the template can
be related to TF N and what constraints are set on shape transformations to preserve the
geometric consistency of the components and their assembly. Shape transformations
are application-dependent and the present context is structural mechanics and FEA to
define a range of possible transformations.
The simplest relationship between a template T and TF N is to relate T to a leaf of
TF N . In this case, T covers instances defining sets of components that contain a variable
number of components. T is also dimension independent since it covers any size of
component, i.e., it is a parameterized entity. Shape transformations on T are designated
as ST and the template devoted to an application becomes ST (T). Now, reducing the
172Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
scope to disassemblable assembly functions and more specifically bolted junctions, one
leaf of TF N can be used to define more precisely T and ST (T). Conforming to Figure 6.8,
let us restrict first to the leaf ‘screw+nut’ of TF N . Then, T contains the following
functional interfaces: one threaded link, two or more planar supports (one between nut
and plate and at least one between two plates), either one planar support or one conical
fit between the screw head and a plate, as many cylindrical loose fits as plates between
the screw and plates because the class of junctions is of type adjusted. The shape
transformations ST (T) of T set up to process bolted junctions can be summarized as
(see Figure 6.9):
• ST 1: merging screw and nut (see Section 6.3.3.1);
• ST 2: localization of friction effects with a sub-domain around a screw (see Section
6.3.3.1);
• ST 3: removal of the locking nut if it exists (see Section 6.3.3.2);
• ST 4: screw head transformation for mesh generation purposes (see Section 6.3.3.3);
• ST 5: cylindrical loose fit around the screw shaft to support the contact condition
with tightened plates (see Section 6.3.4).
Each of these transformations are detailed throughout the following sections.
Now, the purpose is to define ST so that ST (T) exists and preserves the consistency
of the components and the assembly. This defines compatibility conditions, CC, between
T and ST that are conceptually close to attachment constraints of form features
on an object [vdBvdMB03] (see Figure 6.9). CC applied to ST are introduced briefly
here. Given the set of components contained in T, this set can be subdivided into two
disjoint subsets as follows:
• IC is the set of components such that each of its components has all its functional
interfaces in T, e.g., the screw belongs to IC. Consequently, components
belonging to IC are entirely in T (see the green rectangle in Figure 6.9);
• PC is the set of components such that each of its components has some of its
functional interfaces in T, e.g., a plate belongs to PC. Components belonging to
PC are partially in T (see the red rectangle in Figure 6.9).
IC can be used to define a 3D sub-domain of T, TI defined as the union of all
components belonging to IC. Now, if a transformation ST takes place in IC and geometrically
lies inside TI , ST (T) is valid because it cannot create interferences with
other components of the assembly, i.e., CC are satisfied.
Let us consider some of these transformations to illustrate some CC. As an objective
of FEA, the purpose of the assembly model is to analyze the stress distribution between
173Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
Functionally
enriched
DMU
CIG
Function
FD
(screw, nut,
locking nut)
FI
CI
Ci Cn
T
Cc
Ic
Pc
Geometric Transformations
ST1 : C’ ← merge (C ,C ) screw nut
i j
ST3
ST5
: remove (C ) locking nut
i
: (C’ ,C’ )←preserve FI(C ,C ) j
screw
i
screw
i j
S : (C’ ,C’ ,…) ← subdivide(C ,C ,...) T2
ST4
i j i j
k
: (C’ i ,C’ j ) ← transform(C ,C ) i j
screw screw
Updated components (C’, C’,...C’ ) i j m
(Automated)
Ci : component i
CI: conventional interface
CIG: conventional interface graph
CC: compatibility conditions between T and ST
;
FD: functional designation of a component;
FI: functional interface
IC: set of components such that each of its components has all its FI in T
PC: set of components such that each of its components has some of its FI in T
ST : shape transformation incorporated in a template, hence ST (T);
T: function-based template performing shape transformations;
Figure 6.9: Principle of the template-based shape transformations. The superscript of a
component C, if it exists, identifies its functional designation.
Threaded
link
Pre- Load
pressure
Friction
IC :
Counter nut
Nut
Screw
PC:
Plates
Domain
decomposition
(CC to verify)
(a) (b) (c) (d) (e)
ST4
(CC to verify)
ST2
(CC satisfied) (CC satisfied)
ST1 ST3
Figure 6.10: Compatibility conditions (CC) of shape transformations ST applied to T. (a)
through (e) are different configurations of CC addressed in Section 6.3.3.
174Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
plates and their interactions with bolts. To this end, the stress distribution around
the threaded link between a screw and a nut is not relevant. Therefore, one shape
transformation, ST 1 is the removal of the threaded link to merge the screw and the nut
(see Figure 6.10c). ST 1 is always compatible since the screw and the nut belong to IC,
hence the CC are always valid.
Now, let us consider another transformation, ST 2, that specifies the localization
of friction effects between plates around the screw shaft and the representation of
the stress distribution nearby the screw shaft. This is modeled with a circular area
centered on the screw axis and a cylindrical sub-domain around the screw shaft (see
Figure 6.10d). Indeed, ST 2, is a domain decomposition [CBG08, Cha12] taking place in
the plates belonging to T. Because the plates belong to PC, CC are not trivial. However,
ST 2, takes place inside the plates so they cannot interfere with other components, rather
they can interfere with the boundary of the plates or they can interfere between them
when several screws are close to each other on the same plate (see Figure 6.11). In this
case, CC can be simply expressed, in a first place, as a non interference constraint.
Other shape transformations are listed when describing one example template in
Section 6.3.4.
6.3.3.2 Shape transformations and function dependency
The previous section has connected T to TF N in the simplest way possible, i.e., using
a leaf that characterizes a single function. The purpose of this section is to analyze
into which extent T can connect to classes of TF N that perform several functions in
the assembly.
In a first place, let us review shortly some concepts of functional analysis [Ull09].
There, it is often referred to several categories of functions that are related to a design
process, i.e., external, internal, auxiliary, . . . However, this does not convey consistency
conditions among these functions, especially from a geometric point of view. Here, the
current content of TF N refers to internal functions, i.e., functions strictly performed by
components of the assembly. The ‘screw+nut’ function, as part of bolted junctions, is
one of them. Bolted junctions can contain other functions. Let us consider the locking
function, i.e., the bolt is locked to avoid any loss of tension in the screw when the
components are subjected to vibrations. The locking process can take place either on
the screw or on the nut. For the purpose of the analysis, we consider here a locking
process on the nut, using a locking nut (see Figure 6.12a). In functional analysis,
this function is designated as auxiliary function but this concept does not characterize
geometric properties of these functions.
From a geometric point of view, it can be observed that functional interfaces of
the screw, nut and locking nut are located in 3D such that the functional interfaces
(planar support) between the nut and locking nut cannot exist if the nut does not
tighten the plates. Consequently, the locking function cannot exist if the tightening
175Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
Interference
No interference
User meshing
tolerance
Ø subdomains =
user ratio ´ Ø screw
Figure 6.11: Checking the compatibility of ST (T) with respect to the surrounding geometry
of T.
function does not exist. Rather than using the designation of auxiliary function, which
is geometrically imprecise, it is referred to dependent function.
The concept of dependent functions is inserted in TF N at different levels of TF N to
attach the corresponding functions when they exist (see Figure 6.8). Based on the concept
of dependent function, it is possible to extend the connection rule between T and
TF N . Rather than connections at the leaf level, higher level classes can be connected to
T if the dependent functions are taken into account in the CC of shape transformations
ST so that ST (T) exists and preserves the consistency of the assembly. As an illustration,
let us consider T connected to ‘Bolted adjusted’ (see Figure 6.8). Now, ST can
cover the class of bolted junctions with locking nut. Let ST 3, be the transformation
that removes the locking nut of a bolted junction, which meets also the FEA objectives
mentioned earlier. Because ST 3, applies to a dependent function of ‘screw+nut’, the
CC are always satisfied and the resulting model has a consistent layout of functional
interfaces, i.e., the removal of the locking nut cannot create new interfaces in the assembly
(see Figure 6.9 and 6.10b). Consequently, T can be effectively connected to
‘Bolted adjusted’, which is a generalization of T.
6.3.3.3 Template generation
T is generated on the basis of the components involved in its associated function in
TF N . T incorporates the objectives of the FEA to specify ST . Here, ST covers all
the transformations described previously, i.e., ST 1, ST 2, ST 3. Figure 6.10 and 6.11
illustrates the key elements of these shape transformations.
Other shape transformations, ST 4, can be defined to cover screw head transformations
and extend the range of screws to flat head ones. However, this may involve
176Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
(a) (b)
Figure 6.12: (a) Multi-scale simulation with domain decomposition around bolted junctions,
(b) Load transfers at critical holes (courtesy of ROMMA project [ROM14]).
geometric transformations where the volume of a screw head gets larger. In this case,
ST 4 takes place in PC and the compatibility conditions are not intrinsic to T (see Figure
6.9). Consequently, it is mandatory to perform an interface/interference checking
with the other components of the assembly to make sure that the transformation is
valid (see Figure 6.10).
Then, the set of shape transformations structures the dialog with the user to allow
him, resp. her, to select some of these transformations. However, the user settings are
applied to instances whenever possible, i.e., when the instance belongs to a class where
the shape transformations are applicable.
6.3.4 Example of template-based operator of bolted junctions
transformation
In an aeronautical company, simulation engineers perform specific FEAs on assembly
sub-structures such as the aircraft junction between wings and fuselage. Based on
pre-existing physical testing performed by ROMMA project [ROM14] partners, this
structure can be subjected to tensile and compressive forces to analyze:
• The distribution of the load transfer among the bolted junctions;
• The admissible extreme loads throughout this structure.
From the physical testing and preliminary numerical models, the following simulation
objectives have been set up that initiate the requirements for the proposed
template-based transformations. To adapt the FE model to these simulation objectives
while representing the physical behavior of the structure, an efficient domain decomposition
approach [CBG08, Cha12] uses a coarse mesh far enough from the bolted
junctions and a specific sub-domain around each bolted junction with friction and preload
phenomena (see Figure 6.12a, b). The objective is not to generate a detailed
stress distribution everywhere in this assembly but to observe the load distribution
areas among bolts using the mechanical models set in the sub-domains.
177Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
The objective of this section is to validate the methodology of Section 6.2 through
the template-based approach. The proposed demonstrator transforms automatically
the bolts into simplified sub-domains ready for meshing with friction areas definition
while preserving the consistency of the assembly. Consequently, there is no area of
weak interest. All the above transformations are aggregated into a parameterized template
whose input is the functional designation of components to locate the cap screws
in the assembly. Then, the template adapts to the screw dimensions, the number of
plates tightened, . . . , to apply the operators covering tasks 2 through 6. The template
features are aligned with the needs for setting up a simulation model able to exhibit
some of the physical phenomena observed during testing and expressed in the above
simulations results.
Operator description
Having enriched the assembly with functional information, the template interface
lets the engineer select a node of TF N that is compatible with T. In this example, the
function to select is: ‘assembly with Bolted junction’ (see Figure 6.14). Now, several
ST are either pre-set or user-accessible.
Figures 6.6a and 6.13 illustrates the task 2 of the methodology. An hypothesis
focuses on the interfaces between screw shafts and plate holes: the clearances there are
regarded as small enough in the DMU to be reduced to a fitted configuration where
shafts and holes are set to the same nominal diameter to produce a conform mesh
with contact condition at these interfaces. To precisely monitor the stress distribution
around bolts and friction between plates, ST 2 is user-selected. It a simplified model of
the Rotschers cone [Bic95] that enables generating a simple mesh pattern around bolts.
In this task also, hypothesizing that locking nuts, nuts, and screws can be reduced to
a single medium leads to the removal of assembly interfaces between them. ST 3 is
user-accessible and set here to remove the dependent function ‘locking with locking
nut’.
Then, there is no idealization taking place, hence no action in tasks 3 and 5. Task 4
connects to a hypothesis addressing the interfaces resulting from task 2, i.e., the interfaces
between plates need not to model contact and friction over the whole interface.
Friction effects can be reduced to a circular area around each screw, which produces
a subdivision of these interfaces. ST 5 is pre-set in T to preserve the cylindrical loose
fit between screw and plates to set up contact friction BCs without inter-penetration
over these functional interfaces. ST 1 is also pre-set as well as ST 4.
Finally, task 6 concentrates on skin and topological transformations. These are
achieved with locking nut, nut, and screw shape transformations. The latter is performed
on the functional interface (planar support) between the screw head/nut and
the plates to obtain a meshing process independent of nut and screw head shapes. Now,
T can cover any bolted junction to merge screw, nut and locking-nut into a single do-
178Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
Rotscher’s
cone
Sub-domains Structured hex
Mesh
(a) (b) (c)
Figure 6.13: Template based transformation ST (T) of a bolted junction into simple mesh
model with friction and contact areas definition around screw and nut. (a) the bolted junction
in the DMU, (b) the bolted junction after simplification to define the simulation model, (c)
the desired FE mesh of the bolted junction.
main, reduce the screw and nut shapes to a simple shape of revolution while preserving
the consistency of its interfaces.
Based on T, ST (T) is fairly generic and parameterized to intelligently select and
transform bolts, i.e., it is independent of the number and thicknesses of plates, of the
screw diameter, the length and head type (cylindrical (see Figure 6.13a) versus flat
ones) in addition to the location of each bolt.
Here, ST (T) contains ST 2, a generation of sub-domains taking into account the
physical effects of the Rotschers cone. This geometric transformation could interact
with plate boundaries to change the shape of these sub-domains and influence the mesh
generation process. Presently, templates are standalone entities and are not taking into
account these effects left for future developments. At present, the engineer can adjust
the sub-domain to avoid these interactions (see Figure 6.14a).
Implementation and results
The developed prototype is based on OpenCascade [CAS14] and Python scripting
language. The DMU is imported as STEP assembly models, the geometric interfaces
between components are represented as independent trimmed CAD faces with
identifiers of the initial face pairs of the functional interfaces. The assembly functional
description is imported as a text file from the specific application performing
the functional enrichment described in [SLF∗13] and linked to the assembly model by
component identifiers.
Figure 6.14a shows the user interface of the prototype. When selecting the ‘assembly
with Bolted Junction’ function, the user has a direct access to the list of bolted
junctions in the assembly. To allow the user filtering his selection, DMU parameters
are extracted from the functional designation of components, e.g., the screw and nut
types, the number of tightened components, or from geometry processing based on
functional interfaces, e.g., screw diameter. Using these parameters, the user is able
179Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
to select bolted junctions within a diameter range, e.g., between 10 and 16 mm (see
Figure 6.14b) or bolted junctions with screw and locking nut (see Figure 6.14c), etc.
The user can monitor the Rotschers cone dimension with a FEA parameter called ‘sub
domain ratio’ that represents the ratio between the screw nominal diameter and the
sub-domain diameter (see Figure 6.14d and e). Then, the user-defined ‘meshing tolerance’
is used during the verification phase to check the compatibility conditions, CC,
between instances and their surrounding geometry (see Figure 6.9 and 6.11).
Figure 6.15 shows two results of the template-based transformations on aircraft
structures:
Aircraft structure 1: A junction between the wing and the fuselage. The assembly
contains 45 bolted junctions with 3 different diameters and 2
different screw heads;
Aircraft structure 2: An engine pylon. The assembly contains over 250 bolted junctions
with identical screws and nuts.
The final CAD assembly (see Figure 6.14b) with simplified bolted junctions has
been exported to a CAE software, i.e., Abaqus [FEA14]. STEP files [ISO94, ISO03]
transfer the geometric model and associated xml files describes the interfaces between
components to trigger meshing strategies with friction area definitions. Appendix D
illustrates the STEP data structure used to transfer the Aircraft structure 1.
Comparing with the process pipeline used with existing industrial software (see
Section 1.4.3), the improvements are as follows. The model preparation from CAD
software to an Abaqus simulation model takes 5 days of interactive work for ‘Aircraft
structure 1’ mentioned above (see Figure 1.13b). Using the pipeline performing the
functional enrichment of the DMU and the proposed template-based shape transformations
to directly produce the meshable model in Abaqus and perform the mesh in
Abaqus, the overall time is reduced to one hour. The adequacy of this model conforms
to the preliminary numerical models set up in ROMMA project [ROM14] and
extending this conformity to testing results is ongoing since the template enables easy
adjustments of the mesh model.
Regarding the ‘Aircraft structure 2’, there is no reference evaluation of its model
preparation time from CAD to mesh generation because it is considered as too complex
to fit into the current industrial PDP. However, it is possible to estimate the time
reduction since the interactive time can be linearly scaled according with the number
of bolted junction. This ends up with 25 days of interactive work compared to 1.5 hour
with the proposed approach where the time is mostly devoted to the mesh generation
phase rather than the template-based transformations.
Though the automation is now very high, the template-based approach still leaves
the engineer with meaningful parameters enabling him/her to adapt the shape transformations
to subsets of bolted junctions when it is part of FE requirements.
180Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
(b) (d)
(c) (e)
(a)
Figure 6.14: (a) User interface of a template to transform ‘assembly Bolted Junctions’. Results
obtained when filtering bolts based on diameters (b) or screw type (c). Results of the
template-based transformations with (d) or without (e) sub-domains around bolts.
181Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
(a) (b) (c)
Aircraft structure 1
Aircraft structure 2
Figure 6.15: Results of template-based transformations on CAD assembly models: (a) CAD
models with functional designations and geometric interfaces, (b) models (a) after applying
ST (T) on bolts, (c) mesh assembly models obtained from (a) with friction area definition.
182Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
DMU
Analysis for idealization
Geometric Operations
CAD Interfaces Simplify fastener
SIMULATION
Volume Segmentation
Assembly Idealization
Assembly analysis
Components Idealization
Interfaces Graph
Idealized
Assembly
· Geometric Interfaces
· Functinal Information
· User Simulation Objectives
· Idealized CAD assembly ready for meshing
· Boundary conditions (contact)
· Physical information (thickness, offset)
Figure 6.16: Illustration of the idealization process of a CAD assembly model. All components
are fully idealized and bolted junctions are represented with FE fasteners. Solid plates and
stiffeners are idealized as surfaces.
6.4 Full and robust idealization of an enriched assembly
The methodology of Section 6.2.2 has also been applied to create an idealized plate
model of the ‘Root joint’ use-case presented in Figure 1.6. The simulation objectives
are set on the global analysis of the stress field in the structure and the analysis
of the maximal loads transferred through the bolted junctions. Consequently (see
Section 1.4.3), the generated FEM contains idealized components with shell FE and
each junction can be simplified with a fastener model (see Figure 6.17). Figure 6.16
illustrates the different data and processes used to transform the initial DMU model into
the final FE mesh model. Once the CAD data associated with functional interfaces
have been imported, all bolted connections are transformed into simplified fastener
models (see Section 6.4.1) in a first step. Then, a second step segments and idealizes all
components in accordance with the method described in Chapter 5 (see Section 6.4.2).
183Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
A
B
C
A
B
C
Hypothesis: bolted junctions represented by
fasteners’ models
Geometric transformations: a cylindral interfaces
transformed into a single mesh node
(a)
Figure 6.17: Illustration of Task 2: Transformation of bolted junction interfaces into mesh
nodes.
Fastener connection points
Figure 6.18: Results of the template-based transformation of bolted junctions. The blue
segment defines the screw axis. Red segments are projections of interfaces between the plates
and the screw. Yellow points are the idealizations of these interfaces to connect the screw to
the plates.
184Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
6.4.1 Extension of the template approach to idealized fastener
generation
Given the above simulation objectives, the first step of transformations is related to the
transfer of plate loads throughout the assembly and FE beam elements are sufficient
to model the bolts behavior. This hypothesis implies, in task 2 of the methodology, a
transformation of cylindrical interfaces between bolts and plate holes into single mesh
nodes (see Figure 6.17a) linked to beam elements that represent the idealized fasteners.
A specific template-based operator has been developed to automate the transformation
of bolted junctions into idealized fasteners. As in Section 6.3, the bolted junctions
are identified among all 3D components through the function they are involved in:
‘adjusted bolted junctions with screw+nut’. Then, the template applies a set of shape
transformations ST to generate the beam elements with their associated connection
points. These shape transformations are described as follows:
• ST 1: merging screw and nut (identical to Section 6.3.3.1);
• ST 2: removal of the locking nut if it exists (identical to Section 6.3.3.2);
• ST 3: screw transformation into beam elements (see Figure 6.18). FE beam elements
are represented by line segments. The axis of the screw is used as location
for the line segments;
• ST 4: transfer of interfaces between plates and screw as points on the line segments.
The blue part in Figure 6.18 represents the whole screw, the red parts are
the projections of the interfaces between the plates and the screw while yellow
points represent the idealization of these interfaces and define the connections
between each plate and the screw;
• ST 5: reduce junction holes in plates to single points. The fastener model used to
represent bolted junctions does not represent holes in the final idealized model
(see Figure 6.19).
Different idealizations, i.e., the set of ST , can be generated to match different
simulation objectives. For instance, one ST can focus on the screw stiffness in addition
to the current simulation objectives. To this end, a new objective can be set up
to compare the mechanical behavior when screws are modeled as beams and when
they are perfectly rigid. Consequently, the screws must now be represented as rigid
bodies. This means that the blue part (see Figure 6.18) representing the FE beam
element is no longer needed. Then, the yellow points (see Figure 6.18) can be used
directly to generate the mesh connection points in the final medial surfaces of the plate
components. These points can be used to set kinematic constraints.
Indeed, the list of previous geometric operations describes a new category of shape
transformation, ST i that would be needed to meet this new simulation objective. Be-
185Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
cause these transformations are close the templates described, this shows how the
principle of the template-based transformations can be extended to be adapted to new
simulation objectives using additional elementary transformations. Here, ST 3 would
be replaced by ST i that would produce the key points needed to express the kinematic
constraints.
Now that the bolted junctions have been simplified into FE fasteners, the next
section illustrates the idealization of the whole assembly.
6.4.2 Presentation of a prototype dedicated to the generation
of idealized assemblies
In order to generalize the idealization approach presented in Chapter 5, a prototype has
been developed to process not only components but also whole assemblies. Likewise the
template demonstrator, the prototype is based on OpenCascade [CAS14] and Python
scripting language. The CAD assembly as well as the geometric interfaces are imported
as STEP models.
Figure 6.19 illustrates the user interface of the prototype. Here, the 3D viewer shows
the result of task 2 where the bolted junctions of the CAD assembly have been transformed
into simple fasteners using the template-based approach. The interface graph
in the graph tag shows all the neighboring relationships between assembly components
(including the fasteners).
Figure 6.20 illustrates task 3 where the assembly components are segmented into
sub-domains according to shape primitives organized into a construction graph. The
set of solid primitives in red is extracted using the algorithm described in Section 4.5.2.
The primitives are then removed from the initial solid to obtain a simpler component
shape. Once the construction graph is generated, the user selects a construction process
which creates a component segmentation into volume sub-domains. Then, each
sub-domain is idealized wherever the primitive extent versus its thickness satisfies the
idealization criterion. The interfaces resulting from this idealization can be associated
with new transformations of assembly interfaces, e.g., a group of parallel idealized
surfaces linked to the same assembly interface can be aligned and connected. The analysis
of interactions between independently idealized sub-domains can guide geometric
transformations such as sub-domain offsets and connections. These transformations
are part of task 4. Figure 6.21 illustrates an intermediate result of the idealization
process of a component (task 5). The graph of primitives’ interfaces has been analyzed
in task 4 to identify and align groups of parallel medial surfaces. For example, the
medial surface highlighted in brown is offset by 2.9 mm from its original position. The
medial surfaces are then connected with the operator described in Section 5.5.3. The
result is a fully idealized representation of the component.
Finally, other idealized components are incorporated in the idealized assembly
186Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
List of
interfaces
List of
components
3D Viewer
Output/ Input
console
Graph of interfaces
Figure 6.19: User interface of the prototype for assembly idealization. The 3D viewer shows
the assembly after the transformation of bolted junctions into FE fasteners.
Configurations
of component’s
segmentation
3D Visualization of a set of
primitives to be removed from solid
Configuration
of the
primitives
extraction
algorithm
Figure 6.20: Illustration of a component segmentation which extract extruded volumes to be
idealized in task 3. The primitives to be removed from the initial solid are highlighted in red.
187Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
List of
interfaces
between
primitives
List of
component’s
primitives
3D Vizualization of
component idealization
Primitive
attributes
Graph of interfaces between primitives
Figure 6.21: Illustration of task 4: Identification and transformation of groups of idealized
surfaces connected to the same assembly interfaces.
model using complementary sub-domain transformations applied to each of them as
illustrated in Figure 6.22.
List of
idealized
components
and fasteners
3D Vizualization of
assembly idealization
Figure 6.22: Final result of the idealized assembly model ready to be meshed in CAE software.
Again, functional information about components and successive decomposition into
188Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
sub-domains as well as idealization processes reduce the preparation process to minutes:
up to approximately ten minutes to process all the components including all the
user interactions required to load each component, select the appropriate template or
process the components subjected to the segmentation process and the morphological
analysis. This is a significant time reduction compared to the days required when
performing interactively the same transformations using tedious interactions with low
level operators existing in current CAE software.
Yet, the constraints related to mesh generation through mesh size constraints, have
not been taken into account in the current analysis of preparation processes. These
constraints have to be addressed in future research work. It has also to be noted
that the process flow of Figure 6.5 turns into a sequential flow in all the simulation
frameworks illustrated.
6.5 Conclusion
In this chapter, dependencies between categories of shape transformations have been
organized to structure the assembly simulation model preparation process in terms
of methodology and scope of shape transformation operators. The proposed methodology
empowers the use of DMUs enriched with geometric interfaces and functional
information to automate CAD assembly pre-processing and to generate a ‘FE-friendly’
equivalence of this assembly.
The template-based method has shown that shape transformations highly benefit
from functional information. Using functional information strengthens the transformation
of complex models like assemblies where many components interact with each
other. The template can be instantiated over the whole assembly to quickly transform
repetitive configurations such as bolted junctions that are highly time-consuming when
processed purely interactively.
The idealization method introduces a robust geometric operator of assembly idealization.
This operator takes advantage of the assembly decomposition into sub-domains
and their associated geometric interfaces as produced in Chapter 5. This structure has
been used successfully to idealize sub-domains and address some general mesh generation
constraints to ensure obtaining high quality meshes.
Finally, a demonstrator has been implemented to prove the validity of the proposed
methodology. This prototype has been applied to an industrial use-case proposed in
ROMMA project [ROM14] to create a simplified solid model and an idealized, surfacebased
model, using the operators currently developed. This use-case has demonstrated
the benefits of the proposed methodology to:
1. Efficiently process real 3D assemblies extracted from large DMU;
189Chapter 6: Toward a methodology to adapt an enriched DMU to FE assembly models
2. Enable the implementation of a robust approach to monitor automated shape
transformations.
Thanks to this methodology, the preparation time can be drastically shortened
compared to purely interactive processes as commonly practiced by today’s engineers.
190Conclusion and perspectives
Assemblies, as sets of components, bring a new complexity level for CAD-FEA data
processing of mechanical structures. Here, new principles and associated operators have
been developed to automate the adaptation of CAD assembly models. The objective
targeted robust transformations to process the large amount of repetitive geometric
configurations of complex assemblies and to reduce the time spent by engineers to
prepare these assemblies.
Summary of conclusions
Now, each of the contributions stated in the previous chapters can be synthesized and
summarized.
In-depth analysis of FE pre-processing rules
The first contribution stands in the analysis of the current pre-processing of CAD
models derived from DMUs to produce FE models. Due to the lack of assembly-related
information in a DMU, very tedious tasks are required to process the large amount of
components as well as their connections. Preparing each component is already a tedious
task, especially when idealizations are necessary, that increases significantly with
the number of components and their interfaces. Additionally, these interfaces form
new entities to be processed. It has been observed that repetitive configurations and
their processing are also an issue of assembly preparation, justifying the need to automate
the preparation of large assembly models. This first analysis has concluded
that the adaption of an assembly to FEA requirements and geometric transformations
derive from simulation objectives and component functions are needed as well to geometrically
transform groups of components. Also, it has been shown that functional
information can be an efficient enrichment of a DMU to identify and process repetitive
configurations.
Challenging assembly models preparation
Studying the current CAD-FEA methods and tools related to data integration
191Conclusion and perspectives
reveals that operators currently available focus on the transformation of standalone
components. One main contribution of this thesis is the proposal of an approach
to assembly model preparation. Rather than reducing the preparation process to a
sequence of separately prepared parts, the entire assembly has been considered when
specifying shape transformations to reach simulation objectives, taking into account the
kinematics and physics associated with assembly interfaces. The proposed approach
to assembly pre-processing uses, as input model, a DMU enriched at an assembly level
with interface geometry between components, additional functional properties of these
components, and, at the component level, a structured volume segmentation using a
graph structure.
Geometrically enriched components
A new approach has been proposed to decompose a B-Rep solid into volume subdomains.
This approach robustly enriches a CAD component using a construction
graph and provides a volume decomposition of each component shape. This construction
graph is generated by iteratively identifying and removing a set of extrusion primitives
from the current B-Rep shape. It has been shown that, compared to any initial
construction process performed by a designer, the extracted graph is unique for a given
object and is intrinsic to its shape because it overcomes modeling, surface decomposition,
and topological constraints. In addition, it provides non trivial construction trees,
i.e., variants of extrusion directions producing the same primitive are not represented
and variants in primitives ordering are grouped into a single node. This generates a
compact representation of a large set of shape construction processes. Moreover, the
proposed approach, while enriching a standalone component shape, can be extended
to assembly structures after they have been enriched with component interfaces. Each
component construction graph can be nested into the component-interface assembly
structure, thus forming a robust data structure for CAD-FEA transformation processes.
Finally, a graph of generative processes of a B-Rep component is a promising
basis to gain a better insight about a shape structure. The criteria used to generate
this graph bring meaningful and simple primitives which can be subsequently used to
support the idealization process of component shapes.
Formalizing a shape idealization process through a morphological analysis
It has been shown that generating a fully idealized model cannot be reduced to a
pure application of a dimensional reduction operator such that this model is a mechanical
equivalence of the initial component. The incorporation of idealization hypotheses
requires the identification of candidate geometric areas associated with the connections
between idealized sub-domains. The proposed idealization process benefits from the
new enrichment of components with their shape structure. The segmentation of the
component into meaningful primitives and interfaces between them has been used as a
first step of a morphological analysis. This analysis evaluates each primitive with re-
192Conclusion and perspectives
spect to its dominant idealized shape. Then, using a taxonomy of geometric interfaces
between idealized sub-domains, this analysis is propagated over the whole component
and results in the decomposition of its shape into ’idealizable’ areas of type ’plate/shell,
beam and ’non-idealizable’ areas. Overall, the morphological analysis is independent
from any resolution method and is able to characterize geometric details in relation
to local and to ’idealizable’ regions of a component. Finally, an idealization operator
has been developed which transforms the sub-domains into medial surfaces/lines and
robustly connects them using the precise geometric definition of interfaces between
primitives.
Laying down the basis of a methodology to assembly preparation
To address the current industrial needs about assembly pre-processing for structural
simulation, the analysis of dependencies between geometric transformations, simulation
objectives, and simplification hypotheses led to a first methodology increasing the
level of automation of FE assembly model pre-processing. Using an enriched DMUs
containing geometric interfaces between components and their primitives as well as
functional information to end up with the generation of a ‘FE-friendly’ equivalence of
this assembly, the methodology is in line with the industrial needs to develop a new
generation of DMU: the Functional DMU. Finally, the development of a prototype platform
has illustrated that the methodology fits well with the methods and tools proposed
in this thesis. The template-based transformation, empowering the use of functional
information, has illustrated how repetitive configurations, such as assembly junctions,
can be automatically transformed. Then, the generation of the complete idealization
of an aeronautical structure has demonstrated the ability of the proposed idealization
approach to efficiently process CAD assemblies extracted from a large DMU.
As a final conclusion, compared to purely geometric operators currently available
in CAD-FEA integration, this thesis has proposed an approach based on a shape analysis
of a enriched DMU model that significantly shortens the time commonly spent
by today’s engineers and robustly performs repetitive idealization transformations of
components and assemblies as well.
Research perspectives
From the proposed approach of DMU pre-processing for structural assembly simulation,
future work can extend and build further on the methods and tools described
in this thesis. The perspectives presented in this section refers to the generation of
construction graph of B-Rep shapes and to the morphological analysis of DMU models.
193Conclusion and perspectives
Construction graph
Regarding the generation of construction graphs from B-Rep shapes, perspectives
are listed as follows:
• Extend the definition of primitive to include material removal as well
as additional operations (revolution, sweep,. . . ). In a first step, to reduce
the complexity of this research work, the choice has been made to concentrate
the extraction of generative processes on extrusion primitives. Primitives are
combined solely using a material addition operator. Clearly, future work will focus
on incorporating material removal operations and revolutions to extend the
range of objects that can be processed. Allowing new definitions of primitives
may increase the amount of primitives. However, the construction graph can
be even more compact. Indeed, groups of extrusion primitives can be replaced
by a unique revolution, or a sweeping primitive in the construction graph. To
reduce the complexity of the dimensional reduction of primitives, the presented
idealization process favored primitives adding material instead of primitives removing
material. Including primitives which removes material can be convenient
for other applications, e.g., to simplify components’ shapes for 3D simulation or
to identify cavities in components for computational fluid simulations.
• Extend the attachment condition of primitives. Regarding the attachment
of a primitive into an object, it has been shown all the benefits to avoid constraining
the primitive identification process with their attachment conditions and to
avoid looking at prioritizing primitives with geometric criteria such as: largest
visible boundaries within the object. Identifying primitives without restriction
on their ’visible’ boundaries is a way to release this constraint. However, to validate
the major concepts of the proposed approach, two restrictions have been
set on the primitive definition. The extrusion distance had to be represented by
a lateral edge and one of the primitive’s base face had to be totally ’visible’. A
future target stands in the generalization of the primitive definition to enlarge
the number of valid primitives and hence, will produce a more generic algorithm;
• Reduce the interaction between primitives. Currently, the computation
time is highly dependent on the number of extracted primitives which are compared
with each others. To reduce the complexity of the algorithm, future work
may integrate the identification of repetitions and symmetries [LFLT14]. It is
not only the global symmetries or repetitions, e.g., reflective symmetries valid at
each point of an object, which may directly reduce the extent of a shape being
analyzed, more frequently partial symmetries and repetitions are more efficient
to identify specific relationships between primitives. Partial symmetries and repetitions
initiated by the location of identical primitives convey a strong meaning
from a shape point of view. They can be used after the extraction of primitives
to generate groups of symmetrical/repetitive primitives or even before that
194Conclusion and perspectives
stage to help identifying primitives, e.g., selecting a set of base faces sharing the
same plane and the same orientation. Finally, symmetries and repetitions are
very relevant to structure an idealized model to propagate these shape structure
information across the mesh generation phase.
• Further applications of construction graphs. A construction graph structures
the shape of a B-Rep object independently from any CAD modeler. Applied
to hex-meshing, a shape intrinsic segmentation into extrusion primitives extracted
from its construction graph can be highly beneficial. Indeed, it directly provides
simple meshable volumes. Moreover, the complementary information about the
connections between primitive interfaces can help to generate a complete component
3D mesh. Applied to 3D direct modeling CAD software, this intrinsic shape
structure can be used to significantly extend this approach with larger shape
modification as well as parametrization capabilities. Because primitives are geometrically
independent of each other, the parametrization of a primitive can be
directly related to the object shape, i.e., the influence of the shape modification
of a primitive can be identified through the interface of this primitive with the
object.
Morphological analysis of assemblies.
The morphological analysis method of Chapter 5 has been presented as a preliminary
step for dimensional reduction operations. The perspectives related to this
morphological analysis are as follows:
• Extend the taxonomy of reference morphologies. The determination of
idealizable volume sub-domains in a component is based on a taxonomy of morphologies.
Each morphology is associated with one medial edge of the MAT
applied to the extrusion contour of a primitive. Clearly, this taxonomy is not
complete. Only morphologies associated with straight medial edges with constant
radius has been studied. To enable the processing of a larger range of
component shapes, this taxonomy can be extended, in a first step, to curved
edges, with or without radius variation, and, in a second step, to other types of
primitives (revolution, sweeping, . . . );
• Extend the taxonomy of connections. Regarding the propagation of the
morphological analysis of primitives to the whole object, the current taxonomy
of connections covers extrusion sub-domains to be idealized with planar medial
surfaces only. The detailed study of these configurations has demonstrated all
the robustness of the proposed approach. Here too, this taxonomy can be enlarged
to process beams, shells, or thick domains. In addition, the taxonomy of
connections is currently restricted to couples of sub-domains. In case of groups
of connected sub-domains, a new level of morphology may emerge, e.g., a set of
piled up thin extrusion primitives forming a beam. Analyzing and formalizing
195Conclusion and perspectives
this new taxonomy of connections between sub-domains will enlarge the shape
configurations which can be processed;
• Extend the approach to the morphological analysis of assemblies. Although
construction graph structures (primitives/interfaces) is compatible with
assembly structures (components/interfaces), the morphological analysis has been
applied on standalone components. When the input model is an assembly structure,
the assembly interfaces brings a new level of information. The influence of
assembly interfaces on the established taxonomies have to be studied to extend
the morphology analysis to assembly. For example, on large assemblies models,
a group of component can be viewed as a unique morphology. Propagating the
morphological analysis of components to the whole assembly will give the user a
complete access to multi-resolution morphological levels of a DMU.
Finally, we can mention the report from a 2013 ASME Panel on Geometric Interoperability
for Advanced Manufacturing [SS14]. The panelists involved had considerable
experience in the use of component geometry throughout various design and manufacturing
softwares. They stated that current CAD systems have hit hard limit with
the representation of 3D products. They came to the same conclusions that we have
highlighted about the need of a better interoperability of geometric models and design
systems with current DMUs. The proposed approaches made in this thesis with
construction graph and morphological analysis of assembly offers new opportunities to
adapt a model to the needs of the different applications involved in a product development
process.
196Bibliography
[AA96] Aichholzer O., Aurenhammer F.: Straight skeletons for general
polygonal figures in the plane. In Computing and Combinatorics, Cai
J.-Y., Wong C., (Eds.), vol. 1090. Springer Berlin Heidelberg, 1996,
pp. 117–126. 57
[AAAG96] Aichholzer O., Aurenhammer F., Alberts D., Grtner B.:
A novel type of skeleton for polygons. In J.UCS The Journal of Universal
Computer Science, Maurer H., Calude C., Salomaa A., (Eds.).
Springer Berlin Heidelberg, 1996, pp. 752–761. 57
[ABA02] Andujar C., Brunet P., Ayala D.: Topology-reducing surface
simplification using a discrete solid representation. ACM Trans.
Graph.. Vol. 21, Num. 2 (avril 2002), 88–105. 39, 44, 47, 64
[ABD∗98] Armstrong C. G., Bridgett S. J., Donaghy R. J., Mccune
R. W., Mckeag R. M., Robinson D. J.: Techniques for interactive
and automatic idealisation of CAD models. In Proceedings
of the Sixth International Conference on Numerical Grid Generation
in Computational Field Simulations (Mississippi State, Mississippi,
39762 USA, 1998), NSF Engineering Research Center for Computational
Field Simulation, ISGG, pp. 643–662. 35, 53
[ACK01] Amenta N., Choi S., Kolluri R. K.: The power crust, unions of
balls, and the medial axis transform. Computational Geometry. Vol.
19, Num. 2 (2001), 127–153. 54
[AFS06] Attene M., Falcidieno B., Spagnuolo M.: Hierarchical mesh
segmentation based on fitting primitives. The Visual Computer. Vol.
22, Num. 3 (2006), 181–193. 59
[AKJ01] Anderson D., Kim Y. S., Joshi S.: A discourse on geometric
feature recognition from cad models. J Comput Inform Sci Eng. Vol.
1, Num. 1 (2001), 440–746. 51
[AKM∗06] Attene M., Katz S., Mortara M., Patane G., Spagnuolo ´
M., Tal A.: Mesh segmentation-a comparative study. In Shape
197BIBLIOGRAPHY
Modeling and Applications, 2006. SMI 2006. IEEE International Conference
on (2006), IEEE, pp. 7–7. 59
[ALC08] ALCAS: Advanced low-cost aircraft structures project. http://
alcas.twisoftware.com/, 2005 – 2008. xv, 18
[AMP∗02] Armstrong C. G., Monaghan D. J., Price M. A., Ou H.,
Lamont J.: Engineering computational technology. Civil-Comp
press, Edinburgh, UK, UK, 2002, ch. Integrating CAE Concepts with
CAD Geometry, pp. 75–104. 35
[Arm94] Armstrong C. G.: Modelling requirements for finite-element analysis.
Computer-aided design. Vol. 26, Num. 7 (1994), 573–578. xvi,
48, 49, 132
[ARM∗95] Armstrong C., Robinson D., McKeag R., Li T., Bridgett
S., Donaghy R., McGleenan C.: Medials for meshing and more.
In Proceedings of the 4th International Meshing Roundtable (1995).
48, 49, 53
[B∗67] Blum H., et al.: A transformation for extracting new descriptors
of shape. Models for the perception of speech and visual form. Vol. 19,
Num. 5 (1967), 362–380. 48
[Bad11] Badin J.: Ing´enierie hautement productive et collaborative `a base
de connaissances m´etier: vers une m´ethodologie et un m´eta-mod`ele
de gestion des connaissances en configurations. PhD thesis, BelfortMontb´eliard,
2011. 44
[Bat96] Bathe K.-J.: Finite element procedures, vol. 2. Englewood Cliffs,
NJ: Prentice-Hall, 1996. 24
[BBB00] Belaziz M., Bouras A., Brun J.-M.: Morphological analysis
for product design. Computer-Aided Design. Vol. 32, Num. 5 (2000),
377–388. 63
[BBT08] Bellenger E., Benhafid Y., Troussier N.: Framework for
controlled cost and quality of assumptions in finite element analysis.
Finite Elements in Analysis and Design. Vol. 45, Num. 1 (2008), 25–
36. 44
[BC04] Buchele S. F., Crawford R. H.: Three-dimensional halfspace
constructive solid geometry tree construction from implicit boundary
representations. CAD. Vol. 36 (2004), 1063–1073. 62, 63, 107
198BIBLIOGRAPHY
[BCGM11] Badin J., Chamoret D., Gomes S., Monticolo D.: Knowledge
configuration management for product design and numerical simulation.
In Proceedings of the 18th International Conference on Engineering
Design (ICED11), Vol. 6 (2011), pp. 161–172. 44
[BCL12] Ba W., Cao L., Liu J.: Research on 3d medial axis transform via
the saddle point programming method. Computer-Aided Design. Vol.
44, Num. 12 (2012), 1161 – 1172. 54
[BEGV08] Barequet G., Eppstein D., Goodrich M. T., Vaxman A.:
Straight skeletons of three-dimensional polyhedra. In Algorithms-ESA
2008. Springer, 2008, pp. 148–160. 57
[Bic95] Bickford J.: An Introduction to the Design and Behavior of Bolted
Joints, Revised and Expanded, vol. 97. CRC press, 1995. 178
[BKR∗12] Barbau R., Krima S., Rachuri S., Narayanan A., Fiorentini
X., Foufou S., Sriram R. D.: Ontostep: Enriching product
model data using ontologies. Computer-Aided Design. Vol. 44, Num.
6 (2012), 575–590. 27
[BLHF12] Boussuge F., Leon J.-C., Hahmann S., Fine L. ´ : An analysis
of DMU transformation requirements for structural assembly simulations.
In The Eighth International Conference on Engineering Computational
Technology (Dubronik, Croatie, 2012), B.H.V. Topping, Civil
Comp Press. 65, 82
[BLHF14a] Boussuge F., Lon J.-C., Hahmann S., Fine L.: Extraction of
generative processes from b-rep shapes and application to idealization
transformations. Computer-Aided Design. Vol. 46, Num. 0 (2014), 79
– 89. 2013 {SIAM} Conference on Geometric and Physical Modeling.
86
[BLHF14b] Boussuge F., Lon J.-C., Hahmann S., Fine L.: Idealized models
for fea derived from generative modeling processes based on extrusion
primitives. In Proceedings of the 22nd International Meshing
Roundtable (2014), Sarrate J., Staten M., (Eds.), Springer International
Publishing, pp. 127–145. 86
[BLNF07] Bellec J., Ladeveze P., N ` eron D., Florentin E. ´ : Robust
computation for stochastic problems with contacts. In International
Conference on Adaptive Modeling and Simulation (2007). 82
[BR78] Babuvˇska I., Rheinboldt W. C.: Error estimates for adaptive
finite element computations. SIAM Journal on Numerical Analysis.
Vol. 15, Num. 4 (1978), 736–754. 46
199BIBLIOGRAPHY
[BS96] Butlin G., Stops C.: Cad data repair. In Proceedings of the 5th
International Meshing Roundtable (1996), pp. 7–12. 47
[BSL∗14] Boussuge F., Shahwan A., Lon J.-C., Hahmann S., Foucault
G., Fine L.: Template-based geometric transformations of a functionally
enriched dmu into fe assembly models. Computer-Aided Design
and Applications. Vol. 11, Num. 4 (2014), 436–449. 168
[BWS03] Beall M. W., Walsh J., Shephard M. S.: Accessing cad geometry
for mesh generation. In IMR (2003), pp. 33–42. 47
[CAS14] CASCADE O.: Open cascade technology, version 6.7.0 [computer
software]. http://www.opencascade.org/, 1990 – 2014. 12, 112, 179,
186
[CAT14] CATIA D.: Dassault syst`emes catia, version v6r2013x [computer
software]. http://www.3ds.com/products-services/catia/, 2008
– 2014. 89, I, IX
[CBG08] Champaney L., Boucard P.-A., Guinard S.: Adaptive multianalysis
strategy for contact problems with friction. Computational
Mechanics. Vol. 42, Num. 2 (2008), 305–315. 30, 175, 177
[CBL11] Cao L., Ba W., Liu J.: Computation of the medial axis of planar
domains based on saddle point programming. Computer-Aided
Design. Vol. 43, Num. 8 (2011), 979 – 988. 54
[Cha12] Champaney L.: A domain decomposition method for studying the
effects of missing fasteners on the behavior of structural assemblies
with contact and friction. Computer Methods in Applied Mechanics
and Engineering. Vol. 205 (2012), 121–129. 30, 175, 177
[CHE08] Clark B. W., Hanks B. W., Ernst C. D.: Conformal assembly
meshing with tolerant imprinting. In Proceedings of the 17th International
Meshing Roundtable. Springer, 2008, pp. 267–280. 65
[CP99] Chapman C., Pinfold M.: Design engineeringa need to rethink
the solution using knowledge based engineering. Knowledge-Based
Systems. Vol. 12, Num. 56 (1999), 257 – 267. 168
[CSKL04] Chong C., Senthil Kumar A., Lee K.: Automatic solid decomposition
and reduction for non-manifold geometric model generation.
Computer-Aided Design. Vol. 36, Num. 13 (2004), 1357–1369. 39, 44,
61, 95, 119
200BIBLIOGRAPHY
[CV06] Chouadria R., Veron P.: Identifying and re-meshing contact
interfaces in a polyhedral assembly for digital mock-up. Engineering
with Computers. Vol. 22, Num. 1 (2006), 47–58. 65
[DAP00] Donaghy R. J., Armstrong C. G., Price M. A.: Dimensional
reduction of surface models for analysis. Engineering with Computers.
Vol. 16, Num. 1 (2000), 24–35. 39, 45, 53
[DLG∗07] Drieux G., Leon J.-C., Guillaume F., Chevassus N., Fine ´
L., Poulat A.: Interfacing product views through a mixed shape
representation. part 2: Model processing description. International
Journal on Interactive Design and Manufacturing (IJIDeM). Vol. 1,
Num. 2 (2007), 67–83. 43
[DMB∗96] Donaghy R., McCune W., Bridgett S., Armstrong D.,
Robinson D., McKeag R.: Dimensional reduction of analysis
models. In Proceedings of the 5th International Meshing Roundtable
(1996). 53
[Dri06] Drieux G.: De la maquette numrique produit vers ses applications
aval : propositions de modles et procds associs. PhD thesis, Institut
National Polytechnique, Grenoble, FRANCE, 2006. 6, 19
[DSG97] Dey S., Shephard M. S., Georges M. K.: Elimination of the
adverse effects of small model features by the local modification of
automatically generated meshes. Engineering with Computers. Vol.
13, Num. 3 (1997), 134–152. 47
[Eck00] Eckard C.: Advantages and disavantadges of fem analysis in an
early state of the design process. In Proc. of the 2nd Worldwide
Automotive Conference, MSC Software Corp, Dearborn, Michigan,
USA (2000). 44
[EF11] E. Florentin S.Guinard P. P.: A simple estimator for stress
errors dedicated to large elastic finite element simulations: Locally
reinforced stress construction. Engineering Computations: Int J for
Computer-Aided Engineering (2011). 46
[FCF∗08] Foucault G., Cuilliere J.-C., Franc¸ois V., L ` eon J.-C., ´
Maranzana R.: Adaptation of cad model topology for finite element
analysis. Computer-Aided Design. Vol. 40, Num. 2 (2008),
176–196. xvi, 34, 50, 97
[FEA14] FEA A. U.: Dassault syst`emes abaqus unified fea, version 6.13
[computer software]. http://www.3ds.com/products-services/
simulia/portfolio/abaqus/overview/, 2005 – 2014. 180, XIX
201BIBLIOGRAPHY
[Fin01] Fine L.: Processus et mthodes d’adaptation et d’idalisation de modles
ddis l’analyse de structures mcaniques. PhD thesis, Institut National
Polytechnique, Grenoble, FRANCE, 2001. 22, 34, 45, 47
[FL∗10] Foucault G., Leon J.-C., et al. ´ : Enriching assembly cad models
with functional and mechanical informations to ease cae. In Proceedings
of the ASME 2010 International Design Engineering Technical
Conferences & Computers and Information in Engineering Conference
IDETC/CIE 2010 August 15-18, 2010, Montr´eal, Canada
(2010). 18, 20
[FLM03] Foskey M., Lin M. C., Manocha D.: Efficient computation of a
simplified medial axis. In Proceedings of the eighth ACM symposium
on Solid modeling and applications (2003), ACM, pp. 96–107. 54
[FMLG09] Ferrandes R., Marin P. M., Leon J. C., Giannini F. ´ : A
posteriori evaluation of simplification details for finite element model
preparation. Comput. Struct.. Vol. 87, Num. 1-2 (janvier 2009), 73–
80. 44
[Fou07] Foucault G.: Adaptation de modles CAO paramtrs en vue d’une
analyse de comportement mcanique par lments finis. PhD thesis, Ecole ´
de technologie sup´erieure, Montreal, CANADA, 2007. 13, 18, 46
[FRL00] Fine L., Remondini L., Leon J.-C.: Automated generation of
fea models through idealization operators. International Journal for
Numerical Methods in Engineering. Vol. 49, Num. 1-2 (2000), 83–108.
44
[GPu14] GPure: Gpure, version 3.4 [computer software]. http://www.
gpure.net, 2011 – 2014. 35
[GZL∗10] Gao S., Zhao W., Lin H., Yang F., Chen X.: Feature suppression
based cad mesh model simplification. Computer-Aided Design.
Vol. 42, Num. 12 (2010), 1178–1188. 44
[HC03] Haimes R., Crawford C.: Unified geometry access for analysis
and design. In IMR (2003), pp. 21–31. 47
[HLG∗08] Hamri O., Leon J.-C., Giannini F., Falcidieno B., Poulat ´
A., Fine L.: Interfacing product views through a mixed shape representation.
part 1: Data structures and operators. International Journal
on Interactive Design and Manufacturing (IJIDeM). Vol. 2, Num.
2 (2008), 69–85. 43
202BIBLIOGRAPHY
[HPR00] Han J., Pratt M., Regli W. C.: Manufacturing feature recognition
from solid models: a status report. Robotics and Automation,
IEEE Transactions on. Vol. 16, Num. 6 (2000), 782–796. 51
[HR84] Hoffman D. D., Richards W. A.: Parts of recognition. Cognition.
Vol. 18, Num. 1 (1984), 65–96. 59
[HSKK01] Hilaga M., Shinagawa Y., Kohmura T., Kunii T. L.: Topology
matching for fully automatic similarity estimation of 3d shapes. In
Proceedings of the 28th annual conference on Computer graphics and
interactive techniques (2001), ACM, pp. 203–212. 59
[Hut86] Huth H.: Influence of fastener flexibility on the prediction of load
transfer and fatigue life for multiple-row joints. Fatigue in mechanically
fastened composite and metallic joints, ASTM STP. Vol. 927
(1986), 221–250. 29
[IIY∗01] Inoue K., Itoh T., Yamada A., Furuhata T., Shimada K.:
Face clustering of a large-scale cad model for surface mesh generation.
Computer-Aided Design. Vol. 33, Num. 3 (2001), 251–261. 49
[IML08] Iacob R., Mitrouchev P., Leon J.-C. ´ : Contact identification
for assembly–disassembly simulation with a haptic device. The Visual
Computer. Vol. 24, Num. 11 (2008), 973–979. 6
[ISO94] ISO:. ISO TC184-SC4: ISO-10303 Part 203 - Application Protocol:
Configuration controlled 3D design of mechanical parts and assemblies,
1994. 33, 72, 89, 180, XIX
[ISO03] ISO:. ISO TC184-SC4: ISO-10303 Part 214 - Application Protocol:
Core data for automotive mechanical design processes, 2003. 33, 72,
89, 180, XIX
[JB95] Jones M.R. M. P., Butlin G.: Geometry management support
for auto-meshing. In Proceedings of the 4th International Meshing
Roundtable (1995), pp. 153–164. 47
[JBH∗14] Jourdes F., Bonneau G.-P., Hahmann S., Leon J.-C., Faure ´
F.: Computation of components interfaces in highly complex assemblies.
Computer-Aided Design. Vol. 46 (2014), 170–178. xvi, 65, 71,
72, 79, 116
[JC88] Joshi S., Chang T.-C.: Graph-based heuristics for recognition of
machined features from a 3d solid model. Computer-Aided Design.
Vol. 20, Num. 2 (1988), 58–66. 51
203BIBLIOGRAPHY
[JD03] Joshi N., Dutta D.: Feature simplification techniques for freeform
surface models. Journal of Computing and Information Science in
Engineering. Vol. 3 (2003), 177. 51
[JG00] Jha K., Gurumoorthy B.: Multiple feature interpretation across
domains. Computers in industry. Vol. 42, Num. 1 (2000), 13–32. 51,
94, 100
[KLH∗05] Kim S., Lee K., Hong T., Kim M., Jung M., Song Y.: An
integrated approach to realize multi-resolution of b-rep model. In
Proceedings of the 2005 ACM symposium on Solid and physical modeling
(2005), ACM, pp. 153–162. 51
[Kos03] Koschan A.: Perception-based 3d triangle mesh segmentation using
fast marching watersheds. In Computer Vision and Pattern Recognition,
2003. Proceedings. 2003 IEEE Computer Society Conference on
(2003), vol. 2, IEEE, pp. II–27. 59
[KT03] Katz S., Tal A.: Hierarchical mesh decomposition using fuzzy
clustering and cuts. ACM Trans. Graph.. Vol. 22, Num. 3 (juillet
2003), 954–961. 59
[KWMN04] Kim K.-Y., Wang Y., Muogboh O. S., Nnaji B. O.: Design
formalism for collaborative assembly design. Computer-Aided Design.
Vol. 36, Num. 9 (2004), 849–871. 27, 64
[LAPL05] Lee K. Y., Armstrong C. G., Price M. A., Lamont J. H.: A
small feature suppression/unsuppression system for preparing b-rep
models for analysis. In Proceedings of the 2005 ACM symposium on
Solid and physical modeling (New York, NY, USA, 2005), SPM ’05,
ACM, pp. 113–124. 35, 39, 44
[LDB05] Lavoue G., Dupont F., Baskurt A. ´ : A new cad mesh segmentation
method, based on curvature tensor analysis. Computer-Aided
Design. Vol. 37, Num. 10 (2005), 975–987. 59
[Ley01] Leyton M.: A Generative Theory of Shape (Lecture Notes in Computer
Science, LNCS 2145). Springer-Verlag, 2001. 93
[LF05] Leon J.-C., Fine L. ´ : A new approach to the preparation of models
for fe analyses. International journal of computer applications in
technology. Vol. 23, Num. 2 (2005), 166–184. 35, 39, 44, 45, 81
[LFLT14] Li K., Foucault G., Leon J.-C., Trlin M.: Fast global and
partial reflective symmetry analyses using boundary surfaces of mechanical
components. Computer-Aided Design, Num. 0 (2014), –. 194
204BIBLIOGRAPHY
[LG97] Liu S.-S., Gadh R.: Automatic hexahedral mesh generation by
recursive convex and swept volume decomposition. In Proceedings
6th International Meshing Roundtable, Sandia National Laboratories
(1997), Citeseer, pp. 217–231. 60
[LG05] Lockett H. L., Guenov M. D.: Graph-based feature recognition
for injection moulding based on a mid-surface approach. ComputerAided
Design. Vol. 37, Num. 2 (2005), 251–262. 51
[LGT01] Lu Y., Gadh R., Tautges T. J.: Feature based hex meshing
methodology: feature recognition and volume decomposition.
Computer-Aided Design. Vol. 33, Num. 3 (2001), 221–232. 60, 100
[LL83] Ladeveze P., Leguillon D.: Error estimate procedure in the
finite element method and applications. SIAM Journal on Numerical
Analysis. Vol. 20, Num. 3 (1983), 485–509. 46
[LLKK04] Lee J. Y., Lee J.-H., Kim H., Kim H.-S.: A cellular topologybased
approach to generating progressive solid models from featurecentric
models. Computer-Aided Design. Vol. 36, Num. 3 (2004),
217–229. 51
[LLM06] Li M., Langbein F. C., Martin R. R.: Constructing regularity
feature trees for solid models. In Geometric Modeling and ProcessingGMP
2006. Springer, 2006, pp. 267–286. 63
[LLM10] Li M., Langbein F. C., Martin R. R.: Detecting design intent
in approximate cad models using symmetry. Computer-Aided Design.
Vol. 42, Num. 3 (2010), 183–201. 63
[LMTS∗05] Lim T., Medellin H., Torres-Sanchez C., Corney J. R.,
Ritchie J. M., Davies J. B. C.: Edge-based identification of
dp-features on free-form solids. Pattern Analysis and Machine Intelligence,
IEEE Transactions on. Vol. 27, Num. 6 (2005), 851–860.
93
[LNP07a] Lee H., Nam Y.-Y., Park S.-W.: Graph-based midsurface extraction
for finite element analysis. In Computer Supported Cooperative
Work in Design, 2007. CSCWD 2007. 11th International Conference
on (2007), pp. 1055–1058. 56
[LNP07b] Lee H., Nam Y.-Y., Park S.-W.: Graph-based midsurface extraction
for finite element analysis. In Computer Supported Cooperative
Work in Design, 2007. CSCWD 2007. 11th International Conference
on (2007), pp. 1055–1058. 119
205BIBLIOGRAPHY
[LOC16] LOCOMACHS: Low cost manufacturing and assembly of composite
and hybrid structures project. http://www.locomachs.eu/, 2012 –
2016. xv, 18
[LPA∗03] Lee K., Price M., Armstrong C., Larson M., Samuelsson
K.: Cad-to-cae integration through automated model simplification
and adaptive modelling. In International Conference on Adaptive
Modeling and Simulation (2003). 47, 49
[LPMV10] Lou R., Pernot J.-P., Mikchevitch A., Veron P. ´ : Merging enriched
finite element triangle meshes for fast prototyping of alternate
solutions in the context of industrial maintenance. Computer-Aided
Design. Vol. 42, Num. 8 (2010), 670–681. 65
[LSJS13] Lee-St John A., Sidman J.: Combinatorics and the rigidity of cad
systems. Computer-Aided Design. Vol. 45, Num. 2 (2013), 473–482.
19
[LST∗12] Li K., Shahwan A., Trlin M., Foucault G., Leon J.-C. ´ : Automated
contextual annotation of b-rep cad mechanical components
deriving technology and symmetry information to support partial retrieval.
In Proceedings of the 5th Eurographics Conference on 3D
Object Retrieval (Aire-la-Ville, Switzerland, Switzerland, 2012), EG
3DOR’12, Eurographics Association, pp. 67–70. 20
[LZ04] Liu R., Zhang H.: Segmentation of 3d meshes through spectral
clustering. In Computer Graphics and Applications, 2004. PG 2004.
Proceedings. 12th Pacific Conference on (2004), IEEE, pp. 298–305.
59
[Man88] Mantyla M.: An Introduction to Solid Modeling. W. H. Freeman
& Co., New York, NY, USA, 1988. 93
[MAR12] Makem J., Armstrong C., Robinson T.: Automatic decomposition
and efficient semi-structured meshing of complex solids. In
Proceedings of the 20th International Meshing Roundtable, Quadros
W., (Ed.). Springer Berlin Heidelberg, 2012, pp. 199–215. xvi, 60,
119, 126
[MCC98] Mobley A. V., Carroll M. P., Canann S. A.: An object
oriented approach to geometry defeaturing for finite element meshing.
In Proceedings of the 7th International Meshing Roundtable, Sandia
National Labs (1998), pp. 547–563. 35
[MCD11] Musuvathy S., Cohen E., Damon J.: Computing medial axes
of generic 3d regions bounded by b-spline surfaces. Computer-Aided
206BIBLIOGRAPHY
Design. Vol. 43, Num. 11 (2011), 1485 – 1495. ¡ce:title¿Solid and
Physical Modeling 2011¡/ce:title¿. 54
[MGP10] Miklos B., Giesen J., Pauly M.: Discrete scale axis representations
for 3d geometry. ACM Transactions on Graphics (TOG). Vol.
29, Num. 4 (2010), 101. 54
[OH04] O. Hamri J-C. Leon F. G.: A new approach of interoperability
between cad and simulation models. In TMCE (2004). 48
[PFNO98] Peak R. S., Fulton R. E., Nishigaki I., Okamoto N.: Integrating
engineering design and analysis using a multi-representation
approach. Engineering with Computers. Vol. 14, Num. 2 (1998), 93–
114. 44
[QO12] Quadros W. R., Owen S. J.: Defeaturing cad models using a
geometry-based size field and facet-based reduction operators. Engineering
with Computers. Vol. 28, Num. 3 (2012), 211–224. 47
[QVB∗10] Quadros W., Vyas V., Brewer M., Owen S., Shimada K.: A
computational framework for automating generation of sizing function
in assembly meshing via disconnected skeletons. Engineering with
Computers. Vol. 26, Num. 3 (2010), 231–247. 65
[RAF11] Robinson T., Armstrong C., Fairey R.: Automated mixed
dimensional modelling from 2d and 3d cad models. Finite Elements
in Analysis and Design. Vol. 47, Num. 2 (2011), 151 – 165. xvi, 44,
53, 54, 81, 119
[RAM∗06] Robinson T. T., Armstrong C. G., McSparron G., Quenardel
A., Ou H., McKeag R. M.: Automated mixed dimensional
modelling for the finite element analysis of swept and revolved
cad features. In Proceedings of the 2006 ACM symposium on Solid
and physical modeling (2006), SPM ’06, pp. 117–128. xvi, 53, 60, 61,
87, 126, 146
[RBO02] Rib R., Bugeda G., Oate E.: Some algorithms to correct a geometry
in order to create a finite element mesh. Computers and Structures.
Vol. 80, Num. 1617 (2002), 1399 – 1408. 47
[RDCG12] Russ B., Dabbeeru M. M., Chorney A. S., Gupta S. K.: Automated
assembly model simplification for finite element analysis. In
ASME 2012 International Design Engineering Technical Conferences
and Computers and Information in Engineering Conference (2012),
American Society of Mechanical Engineers, pp. 197–206. 64
207BIBLIOGRAPHY
[Req77] Requicha A.: Mathematical models of rigid solid objects. Tech.
rep., Technical Memorandum - 28, Rochester Univ., N.Y. Production
Automation Project., 1977. 8
[Req80] Requicha A. G.: Representations for rigid solids: Theory, methods,
and systems. ACM Computing Surveys (CSUR). Vol. 12, Num. 4
(1980), 437–464. 8
[Rez96] Rezayat M.: Midsurface abstraction from 3d solid models: general
theory and applications. Computer-Aided Design. Vol. 28, Num. 11
(1996), 905 – 915. xvi, 35, 55, 56, 95, 100, 134
[RG03] Ramanathan M., Gurumoorthy B.: Constructing medial axis
transform of planar domains with curved boundaries. Computer-Aided
Design. Vol. 35, Num. 7 (2003), 619 – 632. 39, 54
[RG04] Ramanathan M., Gurumoorthy B.: Generating the mid-surface
of a solid using 2d mat of its faces. Computer-Aided Design and
Applications. Vol. 1, Num. 1-4 (2004), 665–674. 56
[RG10] Ramanathan M., Gurumoorthy B.: Interior medial axis
transform computation of 3d objects bound by free-form surfaces.
Computer-Aided Design. Vol. 42, Num. 12 (2010), 1217 – 1231. 54
[Roc12] Rocca G. L.: Knowledge based engineering: Between {AI} and cad.
review of a language based technology to support engineering design.
Advanced Engineering Informatics. Vol. 26, Num. 2 (2012), 159 – 179.
Knowledge based engineering to support complex product design. 168
[ROM14] ROMMA: Robust mechanical models for assemblies. http://romma.
lmt.ens-cachan.fr/, 2010 – 2014. xix, 177, 180, 189
[Sak95] Sakurai H.: Volume decomposition and feature recognition: Part
1polyhedral objects. Computer-Aided Design. Vol. 27, Num. 11
(1995), 833–843. 61
[SBBC00] Sheffer A., Bercovier M., Blacker T., Clements J.: Virtual
topology operators for meshing. International Journal of Computational
Geometry & Applications. Vol. 10, Num. 03 (2000), 309–331.
49
[SBO98] Shephard M. S., Beall M. W., O’Bara R. M.: Revisiting the
elimination of the adverse effects of small model features in automatically
generated meshes. In IMR (1998), pp. 119–131. 47
208BIBLIOGRAPHY
[SD96] Sakurai H., Dave P.: Volume decomposition and feature recognition,
part ii: curved objects. Computer-Aided Design. Vol. 28, Num.
6 (1996), 519–537. 61
[SGZ10] Sun R., Gao S., Zhao W.: An approach to b-rep model simplifi-
cation based on region suppression. Computers & Graphics. Vol. 34,
Num. 5 (2010), 556–564. 39
[Sha95] Shah J. J.: Parametric and feature-based CAD/CAM: concepts,
techniques, and applications. John Wiley & Sons, 1995. 13, 50
[She01] Sheffer A.: Model simplification for meshing using face clustering.
Computer-Aided Design. Vol. 33, Num. 13 (2001), 925–934. 34, 49
[Sil81] Silva C. E.: Alternative definitions of faces in boundary representatives
of solid objects. Tech. rep., Tech. Memo. 36, Production Automation
Project, Univ. of Rochester, Rochester, N.Y., 1981, 1981.
97
[SLF∗12] Shahwan A., Leon J.-C., Fine L., Foucault G., et al. ´ : Reasoning
about functional properties of components based on geometrical
descriptions. In Proceedings of the ninth International Symposium
on Tools and Methods of Competitive Engineering, Karlsruhe, Germany)
(2012), TMCE12. 38, 71, 73, 79, 116, 168, 169
[SLF∗13] Shahwan A., Leon J.-C., Foucault G., Trlin M., Palombi ´
O.: Qualitative behavioral reasoning from components interfaces to
components functions for dmu adaption to fe analyses. ComputerAided
Design. Vol. 45, Num. 2 (2013), 383–394. 19, 20, 27, 38, 71, 72,
73, 79, 116, 142, 160, 168, 169, 179
[SRX07] Stroud I., Renner G., Xirouchakis P.: A divide and conquer
algorithm for medial surface calculation of planar polyhedra.
Computer-Aided Design. Vol. 39, Num. 9 (2007), 794–817. 44, 54
[SS14] Shapiro V., Srinivasan V.: Opinion: Report from a 2013
asme panel on geometric interoperability for advanced manufacturing.
Comput. Aided Des.. Vol. 47 (fvrier 2014), A1–A2. 196
[SSCO08] Shapira L., Shamir A., Cohen-Or D.: Consistent mesh partitioning
and skeletonisation using the shape diameter function. The
Visual Computer. Vol. 24, Num. 4 (2008), 249–259. 59
[SSK∗05] Seo J., Song Y., Kim S., Lee K., Choi Y., Chae S.: Wraparound
operation for multi-resolution cad model. Computer-Aided
Design & Applications. Vol. 2, Num. 1-4 (2005), 67–76. 51
209BIBLIOGRAPHY
[SSM∗10] Sheen D.-P., Son T.-g., Myung D.-K., Ryu C., Lee S. H.,
Lee K., Yeo T. J.: Transformation of a thin-walled solid model
into a surface model via solid deflation. Comput. Aided Des.. Vol. 42,
Num. 8 (aot 2010), 720–730. 39, 44, 57, 95, 100, 119, 126, 134
[SSR∗07] Sheen D.-P., Son T.-g., Ryu C., Lee S. H., Lee K.: Dimension
reduction of solid models by mid-surface generation. International
Journal of CAD/CAM. Vol. 7, Num. 1 (2007). 57
[Str10] Stroud I.: Boundary Representation Modelling Techniques, 1st ed.
Springer Publishing Company, Incorporated, 2010. 10
[SV93] Shapiro V., Vossler D. L.: Separation for boundary to csg conversion.
ACM Trans. Graph.. Vol. 12, Num. 1 (1993), 35–55. 62, 63,
107
[Sza96] Szabo B.: The problem of model selection in numerical simulation.
Advances in computational methods for simulation (1996), 9–16. 22
[Tau01] Tautges T. J.: Automatic detail reduction for mesh generation
applications. In Proceedings 10th International Meshing Roundtable
(2001), pp. 407–418. 35, 51
[TBG09] Thakur A., Banerjee A. G., Gupta S. K.: A survey of {CAD}
model simplification techniques for physics-based simulation applications.
Computer-Aided Design. Vol. 41, Num. 2 (2009), 65 – 80. 39,
51
[TNRA14] Tierney C. M., Nolan D. C., Robinson T. T., Armstrong
C. G.: Managing equivalent representations of design and analysis
models. Computer-Aided Design and Applications. Vol. 11, Num. 2
(2014), 193–205. 12
[Tro99] Troussier N.: Contribution to the integration of mechanical calculation
in engineering design : methodological proposition for the
use and the reuse. PhD thesis, University Joseph Fourier, Grenoble,
FRANCE, 1999. 29, 44, 76
[TWKW59] Timoshenko S., Woinowsky-Krieger S., Woinowsky S.: Theory
of plates and shells, vol. 2. McGraw-hill New York, 1959. 25, 126
[Ull09] Ullman D. G.: The mechanical design process, vol. Fourth Edition.
McGraw-Hill Science/Engineering/Math, 2009. 175
[vdBvdMB03] van den Berg E., van der Meiden H. A., Bronsvoort W. F.:
Specification of freeform features. In Proceedings of the Eighth ACM
210BIBLIOGRAPHY
Symposium on Solid Modeling and Applications (New York, NY, USA,
2003), SM ’03, ACM, pp. 56–64. 173
[VR93] Vandenbrande J. H., Requicha A. A.: Spatial reasoning for the
automatic recognition of machinable features in solid models. Pattern
Analysis and Machine Intelligence, IEEE Transactions on. Vol. 15,
Num. 12 (1993), 1269–1285. 51
[VSR02] Venkataraman S., Sohoni M., Rajadhyaksha R.: Removal of
blends from boundary representation models. In Proceedings of the
seventh ACM symposium on Solid modeling and applications (2002),
ACM, pp. 83–94. 35, 52, 93
[Woo03] Woo Y.: Fast cell-based decomposition and applications to solid
modeling. Computer-Aided Design. Vol. 35, Num. 11 (2003), 969–
977. 51, 61, 94
[Woo14] Woo Y.: Abstraction of mid-surfaces from solid models of thinwalled
parts: A divide-and-conquer approach. Computer-Aided Design.
Vol. 47 (2014), 1–11. xvi, 44, 61, 62, 89, 94, 119
[WS02] Woo Y., Sakurai H.: Recognition of maximal features by volume
decomposition. Computer-Aided Design. Vol. 34, Num. 3 (2002), 195–
207. 51, 61, 94, 100
[ZM02] Zhu H., Menq C.: B-rep model simplification by automatic
fillet/round suppressing for efficient automatic feature recognition.
Computer-Aided Design. Vol. 34, Num. 2 (2002), 109–123. 35, 52,
93
[ZPK∗02] Zhang Y., Paik J., Koschan A., Abidi M. A., Gorsich D.:
Simple and efficient algorithm for part decomposition of 3-d triangulated
models based on curvature analysis. In Image Processing. 2002.
Proceedings. 2002 International Conference on (2002), vol. 3, IEEE,
pp. III–273. 59
[ZT00] Zienkiewicz O. C., Taylor R. L.: The Finite Element Method:
Solid Mechanics, vol. 2. Butterworth-heinemann, 2000. 24
211BIBLIOGRAPHY
212Appendix A
Illustration of generation
processes of CAD components
This appendix shows the construction process of two industrial use-cases. The
components have been designed in CATIA [CAT14] CAD software.
A.1 Construction process of an injected plastic part
The followings figures present the complete shape generation process of the use-case as
shown in Figure 4.1. The component has been designed with the successive application
of 37 modeling features. The used features are:
1. Material addition or removal;
2. Surface operations: fillets, chamfers.
Two views, defined as top and bottom view, are associated with the construction
tree to present all modeling step of the object shape.
A.2 Construction process of an aeronautical metallic
part
The following figures present a complete shape generation of a simple metallic component
which is commonly found in aeronautical structures. The component has been
designed using the successive application of boolean operations of type addition and
removal. This is a common practice for aeronautical metallic design. This technique
shows directly the machining steps in the component design but turn the shape generation
process quite complex. The simple example presented in Figure A.6 contains nine
main operations which could be reduced to three majors operations ( one extrusion
and two hole drillings).
IAppendix A: Illustration of CAD component generation
Construction Tree TOP view BOTTOM view
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
Figure A.1: An example of a shape generation process of an injected plastic part 1/5
IIAppendix A: Illustration of CAD component generation
Construction Tree TOP view BOTTOM view
9
10
11
12
13
14
15
16
9
10
11
12
13
14
15
16
Figure A.2: An example of a shape generation process of an injected plastic part 2/5
IIIAppendix A: Illustration of CAD component generation
Construction Tree TOP view BOTTOM view
17
18 17
18
19
20
21
22
23
24
19
20
21
22
23
24
Figure A.3: An example of a shape generation process of an injected plastic part 3/5
IVAppendix A: Illustration of CAD component generation
Construction Tree TOP view BOTTOM view
25
26
27
28
29
30
31
32
25
26
27
28
29
30
31
32
Figure A.4: An example of a shape generation process of an injected plastic part 4/5
VAppendix A: Illustration of CAD component generation
Construction Tree TOP view BOTTOM view
33
34
35
36
37
33
34
35
36
37
Figure A.5: An example of a shape generation process of an injected plastic part 5/5
VIAppendix A: Illustration of CAD component generation
Main Solid Solids removed or added
with boolean operations
Construction Tree
1
2
3
4
5
6
7
8
9
1
2
3
4
5
6
7
8
9
Figure A.6: An example of a shape generation process of a simple metallic component. The
component has been mainly designed using boolean operations.
VIIAppendix A: Illustration of CAD component generation
VIIIAppendix B
Features equivalence
This appendix illustrates the main modeling features used in CAD software to
design components (Illustrations courtesy of Dassault Syst`emes [CAT14])
IXAppendix B: Features equivalence
Additive
extrusion
Non perpendicular
additive extrusion
Removal
extrusion
Additive
revolution
Removal
revolution
Sketch-Based Features
Figure B.1: Examples of Sketch-Based Features
XAppendix B: Features equivalence
Hole Drilling
1 removal
extrusion or 1
removal
revolution
Equivalent to:
Hole type:
2 Removal
extrusion or 1
removal
revolution
1 removal
revolution
1 removal
revolution
1 removal
revolution
Additive sweep
Removal sweep
Stiffener
Equivalent to additive extrusion
Sketch-Based Features
Figure B.2: Examples of Sketch-Based Features
XIAppendix B: Features equivalence
Fillet
Fillet which can be included
in extrusion contour
Usual fillet
Chamfer
Equivalent to removal extrusion of can be included in
additive extrusion contour
Draft angle feature can be equivalent to various additive and removal extrusions
Draft angle
Simple draft can be included in additive extrusion contour
Shell
Equivalent to removal extrusion
Equivalent to additive extrusion
Thickness
Dress-Up Features
Figure B.3: Examples of Dress-Up Features
XIIAppendix B: Features equivalence
Boolean operations
Difference
Union
Intersection
Figure B.4: Examples of Boolean operations
XIIIAppendix B: Features equivalence
XIVAppendix C
Taxonomy of a primitive
morphology
This appendix illustrates 18 morphological configurations associated with a MAT
medial edge of a volume primitive Pi of type extrusion.
The two tables differ according to whether the idealization direction of Pi corresponds
to the extrusion direction, see Table C.1, or whether the idealization direction
of Pi is included in the extrusion contour, see Table C.2. The reference ratio xr and user
ratio xu are used to specify, in each table, the intervals of morphology differentiating
beams, plates or shells and 3D thick domains.
XVAppendix C: Features equivalence
y = L2 / max Ø
x = max Ø / L1
y < xu
xu < y < xr
xr < y
xr < x xr < x < xu x < xu
L1 < max Ø / xr
max Ø < L2 < xu . max Ø
max Ø / xr < L1 < max Ø / xu
max Ø < L2 < xu . max Ø
xu . max Ø < L1 < max Ø
max Ø < L2 < xu . max Ø
L1 < max Ø / xr
xu . max Ø < L2 < xr . max Ø
L1 < max Ø / xr
xu . max Ø < L2
max Ø / xr < L1 < max Ø / xu
xu . max Ø < L2 < xr . max Ø
xu . max Ø < L1 < max Ø
xu . max Ø < L2 < xr . max Ø
max Ø / xr < L1 < max Ø / xu
xu . max Ø < L2
xu . max Ø < L1 < max Ø
xu . max O < L2
x = max Ø / L1 if max Ø > L1
x = L1 / max Ø if max Ø <= L1
y = L2 / max Ø L1
Ø L2
L1
Ø
L2
Ø
L2
L1 L1
Ø
L2
L1
Ø
L2
L1
Ø L2
L1
Ø L2
L1
Ø L2
L1
Ø
L2
L1
Ø
L2
PLATE THICK PLATE under user
hypothesis (in plane Ø )
BEAM under user
hypothesis (direction L2)
BEAM to PLATE
under user hypothesis
BEAM to BAND
under user hypothesis
PLATE (plane orthogonal Ø ) to BEAM (direction L2)
BAND under user hypothesis
BAND
Table C.1: Morphology associated with a MAT medial edge of a primitive Pi. 1/2
XVIAppendix C: Features equivalence
L1 > 10 . L2
x < xu xu < x < xr xr < x
max Ø < L1 < xu . max Ø
max Ø < L2 < xu . max Ø
L1
Ø
L2
xu . max Ø < L1 < xr . max Ø
max Ø < L2 < xu . max Ø
L1
Ø L2
xr . max Ø < L1
max Ø < L2 < xu . max Ø
L1
L Ø 2
max Ø < L1 < xu . max Ø
xu . max Ø < L2 < xr . max Ø
max Ø < L1 < xu . max Ø
xu . max Ø < L2
xu . max Ø < L1 < xr . max Ø
xu . max Ø < L2 < xr . max Ø
xr . max Ø < L1
xu . max Ø < L2
< xr . max Ø
xu . max Ø < L1 < xr . max Ø
xu . max Ø < L2
xr . max Ø < L1
xu . max Ø < L2
L1
Ø L2
L1
Ø
L2
L1
Ø L2
L1 > 10 . L2
L1
Ø L2
L1
Ø L2
L2 > 10 . L1 BAND
MASSIF BEAM under user
hypothesis (direction L1) BEAM (direction L1)
BEAM (direction L2)
SHELL under user
hypothesis (plane L1/L2)
SHELL (plan L1/L2)
BAND
SHELL under user
hypothesis (plane L1/L2)
BEAM (direction L1)
to SHELL under user
hypothesis (plane L1/L2)
BEAM
L1
Ø L2
y = L2 / max Ø
x = max Ø / L1
y < xu
xu < y < xr
xr < y
x = max Ø / L1 if max Ø > L1
x = L1 / max Ø if max Ø <= L1
y = L2 / max Ø L1
Ø L2
SHELL under user
hypothesis (plane L1/L2)
Ø
Table C.2: Morphology associated with a MAT medial edge of a primitive Pi. 2/2
XVIIAppendix C: Features equivalence
XVIIIAppendix D
Export to CAE software
This appendix illustrates the data structure used to transfer the adapted DMU to
a CAE software, i.e., Abaqus [FEA14]. STEP files [ISO94, ISO03] are used to transfer
the geometric model and associated xml files.
XIXAppendix D: Export to CAE software
BoltedJunction_patch
(a) (b)
Figure D.1: Illustration of the STEP export of a Bolted Junction with sub-domains around
screw. (a) Product structure open in CATIA software, (b) associated xml file containing the
association between components and interfaces
BoltedJunction_patch
Figure D.2: Illustration of the STEP export of a Bolted Junction. Each component containing
volume sub-domains is exported as STEP assembly.
XXAppendix D: Export to CAE software
BoltedJunction_patch
Inner Interfaces
Figure D.3: Illustration of the STEP export of a Bolted Junction. Each inner interface
between sub-domains is part of the component assembly.
XXIAppendix D: Export to CAE software
BoltedJunction_patch
Outer Interfaces
Figure D.4: Illustration of the STEP export of a Bolted Junction. Each outer interface
between components is part of the root assembly.
XXIIAppendix D: Export to CAE software
Root Joint
Patchs CAD assembly
Interfaces
Figure D.5: Illustration of the STEP export of the full Root Joint assembly.
XXIII
Modélisation et d´etection statistiques pour la
criminalistique num´erique des images
Thanh Hai Thai
To cite this version:
Thanh Hai Thai. Mod´elisation et d´etection statistiques pour la criminalistique num´erique des
images. Statistics. Universit´e de Technologie de Troyes, 2014. French.
HAL Id: tel-01072541
https://tel.archives-ouvertes.fr/tel-01072541
Submitted on 8 Oct 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific
research documents, whether they are published
or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.PHD THESIS
to obtain the degree of
DOCTOR of UNIVERSITY
of TECHNOLOGY of TROYES
Speciality: Systems Optimization and Dependability
presented and defended by
Thanh Hai THAI
August 28th 2014
Statistical Modeling and Detection for Digital
Image Forensics
COMMITTEE:
Mrs. Jessica FRIDRICH Professor Reviewer
M. Patrick BAS Chargé de recherche CNRS Reviewer
M. William PUECH Professeur des universités Examinator
M. Igor NIKIFOROV Professeur des universités Examinator
M. Rémi COGRANNE Maître de conférences Examinator
M. Florent RETRAINT Enseignant-Chercheur SupervisorTo my Mom, my Dad, and my little brother,
To Thu Thao, my fiancée,
for their unlimited support, encouragement, and love.iii
Acknowledgments
This work has been carried out within the Laboratory of Systems Modeling and
Dependability (LM2S) at the University of Technology of Troyes (UTT). It is funded
in part by the strategic program COLUMBO.
This work has been accomplished under the supervision of M. Florent RETRAINT.
I would like to express my deepest gratitude to him for his highly professional
guidance and incessant support. He has accompanied with me from my
master’s internship and encouraged me to discover this field. I highly value the
friendly yet professional environment created during my three-year doctoral. The
high confidence he has given to me is possibly the greatest reward of my endeavors.
I am greatly indebted to my PhD co-advisor, M. Rémi COGRANNE who has
assisted me with high efficiency and availability. It was my honor and pleasure to
work with him. His personal and professional help during my doctoral is invaluable.
I would like to express my special thanks to Mrs. Jessica FRIDRICH and M.
Patrick BAS for accepting to review my PhD thesis. I would also like to thank M.
Igor NIKOFOROV and M. William PUECH for agreeing to examine this thesis.
Valuable remarks provided by the respectful experts in this field like them would
improve the thesis’s quality.
I would like to thank the members of LM2S for the friendly and adorable environment
which they have offered me since I joint the LM2S team.v
Résumé
Le XXIème siècle étant le siècle du passage au tout numérique, les médias digitaux
jouent maintenant un rôle de plus en plus important dans la vie de tous les jours. De
la même manière, les logiciels sophistiqués de retouche d’images se sont démocratisés
et permettent aujourd’hui de diffuser facilement des images falsifiées. Ceci pose un
problème sociétal puisqu’il s’agit de savoir si ce que l’on voit a été manipulé. Cette
thèse s’inscrit dans le cadre de la criminalistique des images numériques. Deux
problèmes importants sont abordés : l’identification de l’origine d’une image et la
détection d’informations cachées dans une image. Ces travaux s’inscrivent dans le
cadre de la théorie de la décision statistique et proposent la construction de dé-
tecteurs permettant de respecter une contrainte sur la probabilité de fausse alarme.
Afin d’atteindre une performance de détection élevée, il est proposé d’exploiter les
propriétés des images naturelles en modélisant les principales étapes de la chaîne
d’acquisition d’un appareil photographique. La méthodologie, tout au long de ce
manuscrit, consiste à étudier le détecteur optimal donné par le test du rapport de
vraisemblance dans le contexte idéal où tous les paramètres du modèle sont connus.
Lorsque des paramètres du modèle sont inconnus, ces derniers sont estimés
afin de construire le test du rapport de vraisemblance généralisé dont les performances
statistiques sont analytiquement établies. De nombreuses expérimentations
sur des images simulées et réelles permettent de souligner la pertinence de l’approche
proposée.
Abstract
The twenty-first century witnesses the digital revolution that allows digital media
to become ubiquitous. They play a more and more important role in our everyday
life. Similarly, sophisticated image editing software has been more accessible,
resulting in the fact that falsified images are appearing with a growing frequency
and sophistication. The credibility and trustworthiness of digital images have been
eroded. To restore the trust to digital images, the field of digital image forensics was
born. This thesis is part of the field of digital image forensics. Two important problems
are addressed: image origin identification and hidden data detection. These
problems are cast into the framework of hypothesis testing theory. The approach
proposes to design a statistical test that allows us to guarantee a prescribed false
alarm probability. In order to achieve a high detection performance, it is proposed
to exploit statistical properties of natural images by modeling the main steps of
image processing pipeline of a digital camera. The methodology throughout this
manuscript consists of studying an optimal test given by the Likelihood Ratio Test
in the ideal context where all model parameters are known in advance. When the
model parameters are unknown, a method is proposed for parameter estimation in
order to design a Generalized Likelihood Ratio Test whose statistical performances
are analytically established. Numerical experiments on simulated and real images
highlight the relevance of the proposed approach.Table of Contents
1 General Introduction 1
1.1 General Context and Problem Description . . . . . . . . . . . . . . . 1
1.2 Outline of the Thesis . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Publications and Authors’ Contribution . . . . . . . . . . . . . . . . 6
I Overview on Digital Image Forensics and Statistical Image
Modeling 9
2 Overview on Digital Image Forensics 11
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Image Processing Pipeline of a Digital Camera . . . . . . . . . . . . 12
2.2.1 RAW Image Formation . . . . . . . . . . . . . . . . . . . . . 13
2.2.2 Post-Acquisition Processing . . . . . . . . . . . . . . . . . . . 15
2.2.3 Image Compression . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 Passive Image Origin Identification . . . . . . . . . . . . . . . . . . . 19
2.3.1 Lens Aberration . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3.2 Sensor Imperfections . . . . . . . . . . . . . . . . . . . . . . . 23
2.3.3 CFA Pattern and Interpolation . . . . . . . . . . . . . . . . . 25
2.3.4 Image Compression . . . . . . . . . . . . . . . . . . . . . . . . 26
2.4 Passive Image Forgery Detection . . . . . . . . . . . . . . . . . . . . 27
2.5 Steganography and Steganalysis in Digital Images . . . . . . . . . . . 29
2.5.1 LSB Replacement Paradigm and Jsteg Algorithm . . . . . . . 32
2.5.2 Steganalysis of LSB Replacement in Spatial Domain . . . . . 33
2.5.3 Steganalysis of Jsteg Algorithm . . . . . . . . . . . . . . . . . 38
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3 Overview on Statistical Modeling of Natural Images 41
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2 Spatial-Domain Image Model . . . . . . . . . . . . . . . . . . . . . . 41
3.2.1 Poisson-Gaussian and Heteroscedastic Noise Model . . . . . . 42
3.2.2 Non-Linear Signal-Dependent Noise Model . . . . . . . . . . . 44
3.3 DCT Coefficient Model . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.3.1 First-Order Statistics of DCT Coefficients . . . . . . . . . . . 45
3.3.2 Higher-Order Statistics of DCT Coefficients . . . . . . . . . . 46
3.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46viii Table of Contents
II Statistical Modeling and Estimation for Natural Images from
RAW Format to JPEG Format 47
4 Statistical Image Modeling and Estimation of Model Parameters 49
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.2 Statistical Modeling of RAW Images . . . . . . . . . . . . . . . . . . 50
4.2.1 Heteroscedastic Noise Model . . . . . . . . . . . . . . . . . . . 50
4.2.2 Estimation of Parameters (a, b) in the Heteroscedastic Noise
Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.3 Statistical Modeling of TIFF Images . . . . . . . . . . . . . . . . . . 57
4.3.1 Generalized Noise Model . . . . . . . . . . . . . . . . . . . . . 57
4.3.2 Estimation of Parameters (˜a, ˜b) in the Generalized Noise Model 59
4.3.3 Application to Image Denoising . . . . . . . . . . . . . . . . . 61
4.3.4 Numerical Experiments . . . . . . . . . . . . . . . . . . . . . 62
4.4 Statistical Modeling in DCT Domain . . . . . . . . . . . . . . . . . . 65
4.4.1 Statistical Model of Quantized DCT Coefficients . . . . . . . 65
4.4.2 Estimation of Parameters (α, β) from Unquantized DCT Coefficients
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.4.3 Estimation of Parameters (α, β) from Quantized DCT Coeffi-
cients . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.4.4 Numerical Experiments . . . . . . . . . . . . . . . . . . . . . 71
4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
III Camera Model Identification in Hypothesis Testing Framework
75
5 Camera Model Identification Based on the Heteroscedastic Noise
Model 77
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.2 Camera Fingerprint . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
5.3 Optimal Detector for Camera Model Identification Problem . . . . . 80
5.3.1 Hypothesis Testing Formulation . . . . . . . . . . . . . . . . . 80
5.3.2 LRT for Two Simple Hypotheses . . . . . . . . . . . . . . . . 80
5.4 GLRT with Unknown Image Parameters . . . . . . . . . . . . . . . . 83
5.5 GLRT with Unknown Image and Camera Parameters . . . . . . . . . 86
5.6 Numerical Experiments . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.6.1 Detection Performance on Simulated Database . . . . . . . . 89
5.6.2 Detection Performance on Two Nikon D70 and Nikon D200
Camera Models . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.6.3 Detection Performance on a Large Image Database . . . . . . 91
5.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.8 Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95Table of Contents ix
5.8.1 Expectation and Variance of the GLR Λhet(z
wapp
k,i ) under Hypothesis
Hj . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.8.2 Expectation and Variance of the GLR Λehet(z
wapp
k,i ) under Hypothesis
Hj . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
6 Camera Model Identification Based on the Generalized Noise
Model 99
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.2 Camera Fingerprint . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
6.3 Optimal Detector for Camera Model Identification Problem . . . . . 102
6.3.1 Hypothesis Testing Formulation . . . . . . . . . . . . . . . . . 102
6.3.2 LRT for Two Simple Hypotheses . . . . . . . . . . . . . . . . 103
6.4 Practical Context: GLRT . . . . . . . . . . . . . . . . . . . . . . . . 105
6.4.1 GLRT with Unknown Image Parameters . . . . . . . . . . . . 105
6.4.2 GLRT with Unknown Image and Camera Parameters . . . . . 106
6.5 Numerical Experiments . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.5.1 Detection Performance on Simulated Database . . . . . . . . 108
6.5.2 Detection Performance on Two Nikon D70 and Nikon D200
Camera Models . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.5.3 Detection Performance on a Large Image Database . . . . . . 110
6.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6.7 Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
7 Camera Model Identification Based on DCT Coefficient Statistics115
7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
7.2 Camera Fingerprint . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
7.2.1 Design of Camera Fingerprint . . . . . . . . . . . . . . . . . . 116
7.2.2 Extraction of Camera Fingerprint . . . . . . . . . . . . . . . . 117
7.2.3 Property of Camera Fingerprint . . . . . . . . . . . . . . . . . 119
7.3 Optimal Detector for Camera Model Identification Problem . . . . . 120
7.3.1 Hypothesis Testing Formulation . . . . . . . . . . . . . . . . . 120
7.3.2 LRT for Two Simple Hypotheses . . . . . . . . . . . . . . . . 121
7.4 Practical Context: GLRT . . . . . . . . . . . . . . . . . . . . . . . . 123
7.4.1 GLRT with Unknown Parameters αk . . . . . . . . . . . . . . 123
7.4.2 GLRT with Unknown Parameters (αk, c˜k,1,
˜dk,1) . . . . . . . . 124
7.5 Numerical Experiments . . . . . . . . . . . . . . . . . . . . . . . . . 126
7.5.1 Detection Performance on Simulated Database . . . . . . . . 127
7.5.2 Detection Performance on Two Canon Ixus 70 and Nikon
D200 Camera Models . . . . . . . . . . . . . . . . . . . . . . 128
7.5.3 Detection Performance on a Large Image Database . . . . . . 129
7.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.7 Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.7.1 Relation between the Parameters (˜a, ˜b, γ) and (αu,v, βu,v) . . 132
7.7.2 Laplace’s Approximation of DCT Coefficient Model . . . . . . 133x Table of Contents
7.7.3 Expectation and Variance of the LR Λdct(Ik,i) under Hypothesis
Hj . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
7.7.4 Asymptotic Expectation and Variance of the GLR Λedct(Ik,i)
under Hypothesis Hj . . . . . . . . . . . . . . . . . . . . . . . 135
IV Statistical Detection of Hidden Data in Natural Images 137
8 Statistical Detection of Data Embedded in Least Significant Bits
of Clipped Images 139
8.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
8.2 Cover-Image Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
8.2.1 Non-Clipped Image Model . . . . . . . . . . . . . . . . . . . . 141
8.2.2 Clipped Image Model . . . . . . . . . . . . . . . . . . . . . . 142
8.3 GLRT for Non-Clipped Images . . . . . . . . . . . . . . . . . . . . . 142
8.3.1 Impact of LSB Replacement: Stego-Image Model . . . . . . . 142
8.3.2 Hypothesis Testing Formulation . . . . . . . . . . . . . . . . . 143
8.3.3 ML Estimation of Image Parameters . . . . . . . . . . . . . . 144
8.3.4 Design of GLRT . . . . . . . . . . . . . . . . . . . . . . . . . 145
8.4 GLRT for Clipped Images . . . . . . . . . . . . . . . . . . . . . . . . 148
8.4.1 ML Estimation of Image Parameters . . . . . . . . . . . . . . 148
8.4.2 Design of GLRT . . . . . . . . . . . . . . . . . . . . . . . . . 148
8.5 Numerical Experiments . . . . . . . . . . . . . . . . . . . . . . . . . 151
8.5.1 Detection Performance on Simulated Database . . . . . . . . 151
8.5.2 Detection Performance on Real Image Database . . . . . . . . 153
8.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
8.7 Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
8.7.1 Denoising Filter for Non-Clipped RAW Images Corrupted by
Signal-Dependent Noise . . . . . . . . . . . . . . . . . . . . . 155
8.7.2 Statistical distribution of the GLR Λbncl(Z) under hypothesis
H0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
8.7.3 Statistical distribution of the GLR Λbncl(Z) under hypothesis
H1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
8.7.4 ML Estimation of Parameters in Truncated Gaussian Data . 159
8.7.5 Statistical distribution of the GLR Λbcl(Z) . . . . . . . . . . . 160
9 Steganalysis of Jsteg Algorithm Based on a Novel Statistical Model
of Quantized DCT Coefficients 163
9.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
9.2 Optimal Detector for Steganalysis of Jsteg Algorithm . . . . . . . . . 164
9.2.1 Hypothesis Testing Formulation . . . . . . . . . . . . . . . . . 164
9.2.2 LRT for Two Simple Hypotheses . . . . . . . . . . . . . . . . 165
9.3 Quantitative Steganalysis of Jsteg Algorithm . . . . . . . . . . . . . 168
9.3.1 ML Estimation of Embedding Rate . . . . . . . . . . . . . . . 168Table of Contents xi
9.3.2 Revisiting WS estimator . . . . . . . . . . . . . . . . . . . . . 169
9.4 Numerical Experiments . . . . . . . . . . . . . . . . . . . . . . . . . 169
9.4.1 Detection Performance of the proposed LRT . . . . . . . . . . 169
9.4.2 Accuracy of the Proposed Estimator . . . . . . . . . . . . . . 172
9.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
10 Conclusions and Perspectives 175
10.1 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
10.2 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
10.2.1 Perspectives to Digital Forensics . . . . . . . . . . . . . . . . 178
10.2.2 Perspectives to Statistical Image Modeling . . . . . . . . . . . 180
10.2.3 Perspectives to Statistical Hypothesis Testing Theory Applied
for Digital Forensics . . . . . . . . . . . . . . . . . . . . . . . 180
A Statistical Hypothesis Testing Theory 181
A.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
A.2 Basic Concepts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
A.3 Test between Two Simple Hypotheses . . . . . . . . . . . . . . . . . . 183
A.4 Test between Two Composite Hypotheses . . . . . . . . . . . . . . . 187
A.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
Bibliography 193List of Figures
1.1 Example of falsification. . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Structure of the work presented in this thesis. . . . . . . . . . . . . . 4
2.1 Image processing pipeline of a digital camera. . . . . . . . . . . . . . 13
2.2 Sample color filter arrays. . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 JPEG compression chain. . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4 Typical steganographic system. . . . . . . . . . . . . . . . . . . . . . 29
2.5 Operations of LSB replacement (top) and Jsteg (bottom). . . . . . . 31
2.6 Diagram of transition probabilities between trace subsets under LSB
replacement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.1 Scatter-plot of pixels’ expectation and variance from a natural RAW
image with ISO 200 captured by Nikon D70 and Nikon D200 cameras.
The image is segmented into homogeneous segments. In each
segment, the expectation and variance are calculated and the parameters
(a, b) are estimated as proposed in Section 4.2.2. The dash line
is drawn using the estimated parameters (a, b). Only the red channel
is used in this experiment. . . . . . . . . . . . . . . . . . . . . . . . . 51
4.2 Scatter-plot of pixels’ mean and variance from JPEG images with
ISO 200 issued from Nikon D70 and Nikon D200 cameras. The red
channel is used in this experiment. The image is segmented into
homogeneous segments to estimate local means and variances. The
generalized noise model is used to fit to the data. . . . . . . . . . . . 58
4.3 Estimated parameters (˜a, ˜b) on JPEG images issued from different
camera models in Dresden image database. . . . . . . . . . . . . . . 63
4.4 Comparison between the proposed method and Farid’s for estimation
of gamma factor on JPEG images issued from Nikon D200 camera
model. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.5 Comparison between the Laplacian, GΓ and proposed model of DCT
coefficients. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.6 Comparison between the quantized Laplacian, quantized GΓ and proposed
model for quantized AC coefficient. . . . . . . . . . . . . . . . 68
4.7 Averaged χ
2
test statistics of GG, GΓ and proposed model for 63
quantized AC coefficients . . . . . . . . . . . . . . . . . . . . . . . . 71
5.1 Estimated camera parameters (a, b) on 20 RAW images of different
camera model with ISO 200 and different camera settings. . . . . . . 79
5.2 Estimated camera parameters (a, b) of different devices per camera
model with ISO 200 and different camera settings. . . . . . . . . . . 79xiv List of Figures
5.3 The detection performance of the GLRT δ
?
het with 50 pixels selected
randomly from simulated images. . . . . . . . . . . . . . . . . . . . . 85
5.4 The detection performance of the GLRT δe?
het with 50 pixels selected
randomly on simulated images. . . . . . . . . . . . . . . . . . . . . . 88
5.5 The detection performance of the test δ
?
het with 200 pixels selected
randomly on simulated images for a0 = 0.0115 and different parameters
a1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.6 The detection performance of the test δ
?
het and δe?
het on simulated
images for different numbers of pixels. . . . . . . . . . . . . . . . . . 89
5.7 The detection performance of the GLRTs δ
?
het and δe?
het on the Dresden
database for different numbers of pixels. . . . . . . . . . . . . . . . . 91
5.8 Comparison between the theoretical false alarm probability (FAP)
and the empirical FAP, from real images of Dresden database, plotted
as a function of decision threshold τ . . . . . . . . . . . . . . . . . . . 92
6.1 Empirical distribution of noise residuals z˜
res
k,i in a segment compared
with theoretical Gaussian distribution. . . . . . . . . . . . . . . . . . 101
6.2 Estimated parameters (˜a, ˜b) on JPEG images issued from Canon Ixus
70 camera with different camera settings. . . . . . . . . . . . . . . . 102
6.3 Estimated parameters (˜a, ˜b) on JPEG images issued from different
devices of Canon Ixus 70 model. . . . . . . . . . . . . . . . . . . . . 103
6.4 Detection performance of the proposed tests for 50 and 100 pixels
extracted randomly from simulated JPEG images with quality factor
100. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.5 Detection performance of the GLRT δe?
gen for 100 pixels extracted
randomly from simulated JPEG images with different quality factors. 109
6.6 Detection performance of the GLRT δ
?
gen and δe?
gen for 50 and 100 pixels
extracted randomly from JPEG images of Nikon D70 and Nikon
D200 cameras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6.7 Comparison between the theoretical false alarm probability (FAP)
and the empirical FAP, plotted as a function of decision threshold τ . 111
7.1 Estimated parameters (α, β) at frequency (0, 1) and (8, 8) of uniform
images generated using a˜ = 0.1,
˜b = 2, γ = 2.2. . . . . . . . . . . . . 117
7.2 Estimated parameters (α, β) at frequency (8, 8) of natural JPEG images
issued from Canon Ixus 70 and Nikon D200 camera models. . . 119
7.3 Estimated parameters (˜c, ˜d) at frequency (8, 8) of natural JPEG images
issued from different camera models in Dresden database. . . . . 120
7.4 Detection performance of proposed tests on simulated vectors with
1024 coefficients. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
7.5 Detection performance of proposed tests on simulated vectors with
4096 coefficients. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125List of Figures xv
7.6 Detection performance of proposed GLRTs for 1024 coefficients at
frequency (8, 8) extracted randomly from simulated images with different
quality factors. . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
7.7 Detection performance of proposed tests for different number of coefficients
at frequency (8, 8) of natural JPEG images taken by Canon
Ixus 70 and Nikon D200 camera models. . . . . . . . . . . . . . . . 127
7.8 Detection performance of the GLRT δe?
dct for 4096 coefficients at different
frequencies of natural JPEG images taken by Canon Ixus 70
and Nikon D200 camera models. . . . . . . . . . . . . . . . . . . . . 128
7.9 Comparison between the theoretical false alarm probability (FAP)
and the empirical FAP, plotted as a function of decision threshold τ ,
of the proposed tests at the frequency (8,8) of natural images. . . . . 129
8.1 Detection performance on non-clipped simulated images for embedding
rate R = 0.05. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
8.2 Detection performance on clipped simulated images for embedding
rate R = 0.05. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
8.3 Detection performance on real clipped images for embedding rate
R = 0.2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
8.4 Detection performance on real clipped images for embedding rate
R = 0.4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
8.5 Detection performance on real clipped images for embedding rate
R = 0.6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
8.6 Detection performance on 12-bit images taken by Canon 400D with
ISO 100 from BOSS database for embedding rate R = 0.05. . . . . . 153
8.7 Detection performance on 5000 images from BOSS database for embedding
rate R = 0.05. . . . . . . . . . . . . . . . . . . . . . . . . . . 153
8.8 Empirical false-alarm probability from real images of BOSS database
plotted as a function of decision threshold, compared with theoretical
FAP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
9.1 Detection performance of the test δ
?
jst based on the proposed model
with embedding rate R = 0.05 on the simulated images and real images.167
9.2 Detection performance of the test δ
?
jst based on the quantized Laplacian,
quantized GG, quantized GΓ, and proposed model on the BOSSBase
with embedding rate R = 0.05. . . . . . . . . . . . . . . . . . . 170
9.3 Detection performance of the test δ
?
jst based on the quantized Laplacian,
quantized GG, quantized GΓ, and proposed model on the subset
of 1000 images from the BOSSBase with embedding rate R = 0.05. . 171
9.4 Comparison between the proposed test δ
?
jst, ZMH-Sym detector, ZP
detector, WS detector and quantized Laplacian-based test. . . . . . . 172
9.5 Mean absolute error for all estimators. . . . . . . . . . . . . . . . . . 172
9.6 Mean absolute error for proposed ML estimator, standard WS estimator
and improved WS estimator. . . . . . . . . . . . . . . . . . . . 173xvi List of Figures
9.7 Comparison between the proposed test δ
?
jst, standard WS detector
and improved WS detector. . . . . . . . . . . . . . . . . . . . . . . . 174List of Tables
4.1 Parameter estimation on synthetic images . . . . . . . . . . . . . . . 63
4.2 PSNR of the extended LLMMSE filter . . . . . . . . . . . . . . . . . 64
4.3 χ
2
test statistics of Laplacian, GG, GΓ, and proposed model for the
first 9 quantized coefficients of 3 testing standard images. . . . . . . 71
5.1 Camera Model Used in Experiments (the symbol * indicates our own
camera) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.2 Detection performance of the proposed detector. . . . . . . . . . . . 93
5.3 Detection performance of PRNU-based detector for ISO 200. . . . . 93
6.1 Camera Model Used in Experiments . . . . . . . . . . . . . . . . . . 112
6.2 Performance of proposed detector . . . . . . . . . . . . . . . . . . . . 112
6.3 Performance of SVM-based detector (the symbol * represents values
smaller than 2%) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.4 Performance of PRNU-based detector . . . . . . . . . . . . . . . . . 113
7.1 Camera Model Used in Experiments . . . . . . . . . . . . . . . . . . 129
7.2 Detection performance of proposed detector δe?
dct (the symbol * represents
values smaller than 2%) . . . . . . . . . . . . . . . . . . . . . 130
7.3 Detection performance of SVM-based detector . . . . . . . . . . . . 130
7.4 Detection performance of PRNU-based detector . . . . . . . . . . . 131
7.5 Detection performance of proposed detector δ
?
dct . . . . . . . . . . . 131
7.6 Detection performance of proposed detector δe?
dct on 4 camera models
of BOSS database . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
10.1 List of proposed statistical tests. . . . . . . . . . . . . . . . . . . . . 177List of Abbreviations
Acronym What (it) Stands For
AC Alternating Current.
AUMP Asymptotically Uniformly Most Powerful.
AWGN Additive White Gaussian Noise.
cdf cumulative distribution function.
CCD Charge-Coupled Device.
CFA Color Filter Array.
CLT Central Limit Theorem.
CMOS Complementary Metal-Oxide Semiconductor.
CRF Camera Response Function.
DC Direct Current.
DCT Discrete Cosine Transform.
DSC Digital Still Camera.
DSLR Digital Single Lens Reflex.
EXIF Exchangeable Image File.
GG Generalized Gaussian.
GLR Generalized Likelihood Ratio.
GLRT Generalized Likelihood Ratio Test.
GOF goodness-of-fit.
GΓ Generalized Gamma.
IDCT Inverse Discrete Cosine Transform.
i.i.d independent and identically distributed.
JPEG Join Photographic Expert Group.
KS Kolmogorov-Smirnov.
LSB Least Significant Bit.
LR Likelihood Ratio.
LRT Likelihood Ratio Test.
LS Least Squares.
mAE Median Absolute Error.
MAE Mean Absolute Error.
MGF Moment-Generating Function
ML Maximum Likelihood.
MM Method of Moments.
MP Most Powerful.
MSE Mean Squared Error.
NP Neyman-Pearson.
PCE Peak to Correlation Energy.
pdf probability density function.
PRNU Photo-Response Non-Uniformity.
RLE Run-Length Encoding.xx List of Tables
ROC Receiver Operating Characteristic.
R/T Rounding and Truncation.
SPA Sample Pair Analysis.
SPN Sensor Pattern Noise.
SVM Support Vector Machine.
TIFF Tagged Image File Format.
UMP Uniformly Most Powerful.
WLS Weighted Least Squares.
WS Weighted Stego-image.
ZMH Zero Message Hypothesis.
ZP Zhang and Ping.Glossary of Notations
Notation Definition
α0 False alarm probability.
β(δ) Power of the test δ.
χ
2
K Chi square distribution with K degree of freedom.
γ Gamma factor.
δ Statistical test.
η Noise.
κ Quantization step in the spatial domain.
µ Expectation.
ν Bit-depth.
σ Standard deviation.
τ Decision threshold.
ξ Number of collected electrons, which is modeled by Poisson distribution.
ϕ 2-D normalized wavelet scaling function.
φ Probability density function of a standard Gaussian random variable.
∆ Quantization step in the DCT domain.
Λ Likelihood Ratio.
Φ Cumulative distribution function of a standard Gaussian random variable.
Θ Parameter space.
Cov Covariance.
E Mathematical expectation.
P[E] Probability that an event E occurs.
R Set of real numbers.
Var Variance.
Z Set of integer numbers.
B(n, p) Binomial distribution where n is the number of experiments and p is
the success probability of each experiment.
D Denoising filter.
G(α, β) Gamma distribution with shape parameter α and scale parameter β.
H0, H1 Null hypothesis and alternative hypothesis.
I Set of pixel indices.
Kα0 Class of tests whose false alarm probability is upper-bounded by α0.
L Log-likelihood function.
N (µ, σ2
) Gaussian distribution with mean µ and variance σ
2
.xxii List of Tables
P(λ) Poisson distribution with mean λ and variance λ.
Q∆ Quantization with step ∆.
S Source of digital images.
U[a, b] Uniform distribution on the interval [a, b].
Z Set of possible pixel values.
Z
N Image space.
C Cover-image that is used for data hiding.
D Quantized DCT coefficients.
F Fisher information.
HDM Linear filter for demosaicing.
I Unquantized DCT coefficients.
Idn Identity matrix of size n × n.
K PRNU.
M Secret message to be embedded.
PCFA CFA pattern.
S Stego-image that contains hidden data.
Z Natural image.
(a, b) Parameters of heteroscedastic noise model.
(˜a, ˜b) Parameters of generalized noise model.
c Color channel.
(˜c, ˜d) Parameters characterizing the relation between α and β, which are
the parameters of DCT coefficient model.
fCRF Camera response function.
fX(x) Probability density function of a random variable X.
gWB Gain for white-balancing.
pX(x) Probability mass function of a random variable X.
r Change rate, r =
R
2
.
B Boundary of the dynamic range, B = 2ν − 1.
L Secret message length.
N Number of pixels in the image Z, N = Nr × Nc if Z is a grayscale
image and N = Nr × Nc × 3 if Z is a full-color image.
Nblk Number of blocks.
Nc Number of columns.
Nr Number of rows.
Ns Number of sources.
Pθ Probability distribution characterized by a parameter vector θ.
QR,θ Probability distribution after embedding at rate R.
R Embedding rate.Chapter 1
General Introduction
1.1 General Context and Problem Description
Traditionally, images are considered as trustworthy since as they are known as being
captured through analog acquisition devices to depict the real-world happenings.
This traditional trustworthiness is built on remarkable difficulties of image content
modification. Indeed, modifying the content of a film-based photo requires special
skills, yet time-consuming and costly, through dark room tricks. Therefore, this
modification is of limited extent.
In the past decades, we have witnessed the evolution of digital imaging technology
with a dramatic improvement of digital images’ quality. This improvement is not
only due to advances in semiconductor fabrication technology that makes it possible
to reduce the pixel size in an image sensor and thus raises the total number of pixels,
but also advances in image processing technology that allows to reduce noise introduced
in a camera and enhance details of the physical scene. The digital revolution
largely replace their analog counterparts to enable ease of digital content creation
and processing at affordable cost and in mass scale. Nowadays, digital still cameras
(DSCs) are taking over a major segment of the consumer photography marketplace.
Only at the very high end (large format, professional cameras with interchangeable
and highly adjustable lenses) and very low end (inexpensive automated snapshot
cameras) are traditional film cameras holding their own. Besides, the development
of communication and networking infrastructure allows digital content to be more
accessible. One of the greatest advantage of digital images acquired by DSCs is the
ease of transmission over communication networks, which film cameras are difficult
to enable.
Unfortunately, this path of technological evolution may provide means for malicious
purposes. Digital images can be easily edited, altered or falsified because
of a large availability of low-cost image editing tools. Consequently, falsified photographs
are appearing with a growing frequency and sophistication. The credibility
and trustworthiness of digital images have been eroded. This is more crucial when
falsified images that were utilized as evidence in a courtroom could mislead the
judgement and lead to either imprisonment for the innocent or freedom for the
guilty. In general, the falsification of digital images may result in important consequences
in terms of political, economic, and social issues.
One example of falsification that causes political issues is given in Figure 1.1.
In the left corner image, President G.W. Bush and a young child are both reading
from America: A Patriotic Primer by Lynne Cheney. But if we look closely, it2 Chapter 1. General Introduction
(a) Forged image. (b) Original image.
Figure 1.1: Example of falsification.
appears that President Bush is holding his book upside down. An unknown hoaxer
has horizontally and vertically flipped the image on the back of the book in Bush’s
hands. This photo of George Bush holding a picture book the wrong way up during
a visit to a school delighted some opponents of the Republican president, and helped
foster his buffoonish image. But press photos from the event in 2002 revealed that
Mr Bush had been holding the book correctly, i.e. hoaxers had simply used photo
editing software to rotate the cover. The original version of the photo (right corner)
was taken in the Summer of 2002 while Bush was visiting George Sanchez Charter
School in Houston. It was distributed by the Associated Press. By comparing the
forged photo and original photo, it can be noted that a dark blue spot is close to the
spine of Bush’s book, but this same spot in the girl’s copy is near the left-hand edge
of the book. This forensic clue can be considered as evidence of forgery. However in
most of the cases, the forgery is not as easy to detect. The human eyes can hardly
differentiate a genuine scene from a deliberately forged scene. Overall, the digital
revolution has raised a number of information security challenges.
To restore the trust to digital images, the field of digital image forensics was
born. Because of importance of information security in many domains, digital image
forensics has attracted a great attention from academic researchers, law enforcement,
security, and intelligence agencies. Conducting forensic analysis is a difficult mission
since forensic analysts need to answer several questions before stating that digital
content is authentic:
1. What is the true origin of this content? How was it generated? By whom was
it taken?
2. Is the image still depicting the captured original scene? Has its content been
altered in some way? How has it been processed?
The first question involves the problem of image origin identification. Source
information of digital images represents useful forensic clues because knowing the1.2. Outline of the Thesis 3
source device that captures the inspected image can facilitate verification or tracing
of device owner as well as the camera taker. This situation is as identical as bullet
scratches allowing forensic analysts to match a bullet to a particular barrel or gun
and trace the gun owner.1 Besides, knowing device model or brand information can
help forensic analysts know more about characteristics of acquisition devices, which
leads to a potential improvement of detecting the underlying forgeries that could
be performed in the inspected image. Another issue is to determine what imaging
mechanism has been used to generate the inspected image (e.g. scanners, cell-phone
cameras, or computer graphics) before assuming that the inspected image is taken
by a digital camera, which can significantly narrow down the search range for the
next step of the investigation.
The second problem is image content integrity. An image has to be proven
authentic and its content has not be forged before it can be used as forensic clues
or as evidence in a legal context. Determining whether an image is forged, which
manipulation has been performed on the image, or which region of the image has
been altered are fundamental tasks.
Beside some basic manipulations such as adding, splicing, and removal, the
image can be also manipulated by embedding a message into image content directly.
The message remains secret such that it is only known by the sender and receiver
and an adversary does not recognize its existence visually. This concept is called
steganography, which is a discipline of the field of information hiding. However, the
concept of steganography has been misused for illegal activities. Detecting existence
of secret messages and revealing their content are also the tasks of forensic analysts.
This task is called steganalysis.
The field of digital image forensics, including steganalysis, is part of an effort to
counter cyber-attacks, which is nowadays one of strategy priorities for defence and
national security in most countries.
1.2 Outline of the Thesis
The main goal of this thesis is to address information security challenges in the field
of digital image forensics. In particular, the problems of image origin identification
and hidden data detection are studied. The thesis is structured in four main parts.
Apart from the first part providing an overview on the field of digital image forensics
and statistical image modeling, the rest of the thesis involves many contributions.
All the work presented in this thesis is illustrated in Figure 1.2.
Part II establishes a profound statistical modeling of natural images by analyzing
the image processing pipeline of a digital camera, as well as proposes efficient
algorithms for estimation of model parameters from a single image. Typically, the
image processing pipeline is composed of three main stages: RAW image acquisition,
1Evidently, tracing an imaging device owner is more difficult as average users have rights to buy
a camera easily in a market with millions of cameras while the use of guns is banned or controlled
in many countries and a gun user has to register his identities.4 Chapter 1. General Introduction
Figure 1.2: Structure of the work presented in this thesis.
post-acquisition enhancement, and JPEG compression that employs Discrete Cosine
Transform (DCT). Therefore, the statistical image modeling in Part II is performed
both in the spatial domain and the DCT domain. By modeling the photo-counting
and read-out processes, a RAW image can be accurately characterized by the heteroscedastic
noise model in which the RAW pixel is normally distributed and its
variance is linearly dependent on its expectation. This model is more relevant than
the Additive White Gaussian Noise (AWGN) model widely used in image processing
since the latter ignores the contribution of Poisson noise in the RAW image
acquisition stage. The RAW image then undergoes post-acquisition processes in
order to provide a high-quality full-color image, referred to as TIFF image. Therefore,
to study image statistics in a TIFF image, it is proposed to start from the
heteroscedastic noise model and take into account non-linear effect of gamma correction,
resulting in a generalized noise model. This latter involves a non-linear
relation between pixel’s expectation and variance. This generalized noise model has
not been proposed yet in the literature. Overall, the study of noise statistics in the
spatial domain indicates the non-stationarity of noise in a natural image, i.e. pixel’s
variance is dependent on the expectation rather than being constant in the whole
image. Besides, pixels’ expectations, namely the image content, are also heterogeneous.
Apart from studying image statistics in the spatial domain, it is proposed to
study DCT coefficient statistics. Modeling the distribution of DCT coefficients is
not a trivial task due to heterogeneity in the natural image and complexity of image
statistics. It is worth noting that most of existing models of DCT coefficients, which
are only verified by conducting the goodness-of-fit test with empirical data, are given
without a mathematical justification. Instead, this thesis provides a mathematical
framework of modeling the statistical distribution of DCT coefficients by relying on
the double stochastic model that combines the statistics of DCT coefficients in a
block whose variance is constant with the variability of block variance in a natural
image. The proposed model of DCT coefficients outperforms the others including
the Laplacian, Generalized Gaussian, and Generalized Gamma model. Numerical1.2. Outline of the Thesis 5
results on simulated database and real image database highlight the relevance of the
proposed models and the accuracy of the proposed estimation algorithms.
The solid foundation established in Part II emphasizes several aspects of interest
for application in digital image forensics. Relying on a more relevant image
model and an accurate estimation of model parameters, the detector is expected
to achieve better detection performance. Part III addresses the problem of image
origin identification within the framework of hypothesis testing theory. More particularly,
it involves designing a statistical test for camera model identification based
on a parametric image model to meet the optimality bi-criteria: the warranting of
a prescribed false alarm probability and the maximization of the correct detection
probability. Camera model identification based on the heteroscedastic noise model,
generalized noise model, and DCT coefficients is respectively presented in Chapter
5, Chapter 6, and Chapter 7. The model parameters are proposed to be exploited
as unique fingerprint for camera model identification. In general, the procedure in
those chapters is similar. The procedure starts from formally stating the problem
of camera model identification into hypothesis testing framework. According to
Neyman-Pearson lemma, the most powerful test for the decision problem is given
by the Likelihood Ratio Test (LRT). The statistical performance of the LRT can be
analytically established. Moreover, the LRT can meet the two required criteria of
optimality. However, this test is only of theoretical interest because it is based on
an assumption that all model parameters are known in advance. This assumption
is hardly met in practice. To deal with the difficulty of unknown parameters, a
Generalized Likelihood Ratio Test (GLRT) is proposed. The GLRT is designed by
replacing unknown parameters by their Maximum Likelihood (ML) estimates in the
Likelihood Ratio. Consequently, the detection performance of the GLRT strongly
depends on the accuracy of employed image model and parameter estimation. It is
shown in Chapter 5, 6, and 7 that the proposed GLRTs can warrant a prescribed
false alarm probability while ensuring a high detection performance. Moreover, the
efficiency of the proposed GLRTs is highlighted when applying on a large image
database.
The problem of hidden data detection is addressed in Part IV. This problem
is also formulated into hypothesis testing framework. The main idea is to rely
on an accurate image model to detect small changes in statistical properties of a
cover image due to message embedding. The formulation in the hypothesis testing
framework allows us to design a test that can meet two above criteria of optimality.
Chapter 8 addresses the steganalysis of Least Significant Bit (LSB) replacement
technique in RAW images. More especially, the phenomenon of clipping is studied
and taken into account in the design of the statistical test. This phenomenon is
due to to limited dynamic range of the imaging system. The impact of the clipping
phenomenon on the detection performance of steganalysis methods has not been
studied yet in the literature. The approach proposed in Chapter 8 is based on the
heteroscedastic noise model instead of the AWGN model. Besides, the approach
proposes to exploit the state-of-the-art denoising method to improve the estimation
of pixels’ expectation and variance. The detection performance of the proposed6 Chapter 1. General Introduction
GLRTs on non-clipped images and clipped images is studied. It is shown that
the proposed GLRTs can warrant a prescribed false alarm probability and achieve
a high detection performance while other detectors fail in practice, especially the
Asymptotically Uniformly Most Powerful (AUMP) test. Next, Chapter 9 addresses
the steganalysis of Jsteg algorithm. It should be noted that Jsteg algorithm is a
variant of LSB replacement technique. Instead of embedding message bits in the
spatial domain, Jsteg algorithm utilizes the LSB of quantized DCT coefficients and
embeds message bits in the DCT domain. The goal of Chapter 9 is to exploit the
state-of-the-art model of quantized DCT coefficients in Chapter 4 to design a LRT
for the steganalysis of Jsteg algorithm. For the practical use, unknown parameters
of the DCT coefficient model are replaced by their ML estimates in the Likelihood
Ratio. Experiments on simulated database and real image database show a very
small loss of power of the proposed test. Furthermore, the proposed test outperforms
other existing detectors. Another contributions in Chapter 9 are that a Maximum
Likelihood estimator for embedding rate is proposed using the proposed model of
DCT coefficients as well as the improvement of the existing Weighted Stego-image
estimator by modifying the technique of calculation of weights.
1.3 Publications and Authors’ Contribution
Most of the material presented in this thesis appears in the following publications
that represent original work, of which the author has been the main contributor.
Patents
1. T. H. Thai, R. Cogranne, and F. Retraint, "Système d’identification d’un
modèle d’appareil photographique associé à une image compressée au format
JPEG, procédé, utilisations and applications associés", PS/B52545/FR, 2014.
2. T. H. Thai, R. Cogranne, and F. Retraint, "Système d’identification d’un
modèle d’appareil photographique associé à une image compressée au format
JPEG, procédé, utilisations and applications associés", PS/B52546/FR, 2014.
Journal articles
1. T. H. Thai, R. Cogranne, and F. Retraint, "Camera model identification
based on the heteroscedastic noise model", IEEE Transactions on Image Processing,
vol. 23, no. 1, pp. 250-263, Jan. 2014.
2. T. H. Thai, F. Retraint, and R. Cogranne, "Statistical detection of data
hidden in least significant bits of clipped images", Elsevier Signal Processing,
vol. 98, pp. 263-274, May 2014.
3. T. H. Thai, R. Cogranne, and F. Retraint, "Statistical model of quantized
DCT coefficients: application in the steganalysis of Jsteg algorithm", IEEE
Transactions on Image Processing, vol. 23, no. 5, pp. 1980-1993, May 2014.1.3. Publications and Authors’ Contribution 7
Journal articles under review
1. T. H. Thai, F. Retraint, and R. Cogranne, "Generalized signal-dependent
noise model and parameter estimation for natural images", 2014.
2. T. H. Thai, F. Retraint, and R. Cogranne, "Camera model identification
based on the generalized noise model in natural images", 2014.
3. T. H. Thai, R. Cogranne, and F. Retraint, "Camera model identification
based on DCT coefficient statistics", 2014.
Conference papers
1. T. H. Thai, F. Retraint, and R. Cogranne, "Statistical model of natural
images", in IEEE International Conference on Image Processing, pp. 2525-
2528, Sep. 2012.
2. T. H. Thai, R. Cogranne, and F. Retraint, "Camera model identification
based on hypothesis testing theory", in European Signal Processing Conference,
pp. 1747-1751, Aug. 2012.
3. T. H. Thai, R. Cogranne, and F. Retraint, "Steganalysis of Jsteg algorithm
based on a novel statistical model of quantized DCT coefficients", in IEEE
International Conference on Image Processing, pp. 4427-4431, Sep. 2013.
4. R. Cogranne, T. H. Thai, and F. Retraint, "Asymptotically optimal detection
of LSB matching data hiding", in IEEE International Conference on Image
Processing, pp. 4437-4441, Sep. 2013.
5. T. H. Thai, R. Cogranne, and F. Retraint, "Optimal detector for camera
model identification based on an accurate model of DCT coefficient", in IEEE
International Workshop on Multimedia Signal Processing (in press), Sep. 2014.
6. T. H. Thai, R. Cogranne, and F. Retraint, "Optimal detection of OutGuess
using an accurate model of DCT coefficients", in IEEE International Workshop
on Information Forensics and Security (in press), Dec. 2014.Part I
Overview on Digital Image
Forensics and Statistical Image
ModelingChapter 2
Overview on Digital Image
Forensics
Contents
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Image Processing Pipeline of a Digital Camera . . . . . . . 12
2.2.1 RAW Image Formation . . . . . . . . . . . . . . . . . . . . . 13
2.2.2 Post-Acquisition Processing . . . . . . . . . . . . . . . . . . . 15
2.2.3 Image Compression . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 Passive Image Origin Identification . . . . . . . . . . . . . . . 19
2.3.1 Lens Aberration . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3.2 Sensor Imperfections . . . . . . . . . . . . . . . . . . . . . . . 23
2.3.3 CFA Pattern and Interpolation . . . . . . . . . . . . . . . . . 25
2.3.4 Image Compression . . . . . . . . . . . . . . . . . . . . . . . . 26
2.4 Passive Image Forgery Detection . . . . . . . . . . . . . . . . 27
2.5 Steganography and Steganalysis in Digital Images . . . . . 29
2.5.1 LSB Replacement Paradigm and Jsteg Algorithm . . . . . . . 32
2.5.2 Steganalysis of LSB Replacement in Spatial Domain . . . . . 33
2.5.2.1 Structural Detectors . . . . . . . . . . . . . . . . . . 33
2.5.2.2 WS Detectors . . . . . . . . . . . . . . . . . . . . . 35
2.5.2.3 Statistical Detectors . . . . . . . . . . . . . . . . . . 36
2.5.2.4 Universal Classifiers . . . . . . . . . . . . . . . . . . 37
2.5.3 Steganalysis of Jsteg Algorithm . . . . . . . . . . . . . . . . . 38
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.1 Introduction
The goal of this chapter is to provide an overview on the field of digital image
forensics. As described in Section 1.1, digital image forensics involve two key problems:
image origin identification and image forgery detection. In general, there are
two approaches to address these problems. Active forensics aims to authenticate
image content by generating extrinsically security measures such as digital watermarks
[1–6] and digital signatures [7–10] and adding them to the image file. These12 Chapter 2. Overview on Digital Image Forensics
security measures are referred to as extrinsic fingerprints. Although active forensics
can provide powerful tools to secure a digital camera and restore the credibility of
digital images, it is of limited extent due to many strict constraints in its protocols.
In order to solve these problems in their entirety, passive forensics has been
quickly evolved. In contrast to active forensics, passive forensics does not impose
any constraint and do not require any prior information including the original reference
image. Forensic analysts have only the suspect image at their disposal and
must explore useful information from the image to gather forensic evidence, trace
the acquisition device and detect any act of manipulation. Passive forensics works
on an assumption that the image contains some internal traces left from the camera.
Every stage from real-world scene acquisition to image storage can provide
clues for forensic analysis. These internal traces are called intrinsic fingerprints.
Extrinsic and intrinsic fingerprints are two forms of digital fingerprints in digital
forensics, which are analogous to human fingerprints in criminal domain. Since passive
forensics does not require neither any external security measures generated in
the digital camera, nor any prior information, it can authenticate an image in a
blind manner and can widely be applied to millions of images that circulate daily
on communication networks.
This thesis mainly addresses the problem of origin identification and integrity
based on passive approach. The chapter is organized as follows. Before discussing
active and passive forensics, it is vital to understand deeply the creation and characteristics
of digital images. Section 2.2 briefly introduces the typical image processing
pipeline of a digital camera, highlighting several aspects of potential interest for applications
in digital image forensics. Section 2.3 analyzes passive methods proposed
for image origin identification. Section 2.4 briefly discusses passive methods for image
forgery detection. Next, Section 2.5 introduces the concept of steganography,
which is a type of image content manipulation, and presents prior-art methods for
detecting secret data embedded in digital images. Finally, Section 2.6 concludes the
chapter.
2.2 Image Processing Pipeline of a Digital Camera
This thesis only deals with DSCs and digital images acquired by them. By terminology,
a natural image means a digital image acquired by a DSC. Other sources
of digitized images such as scanners are not addressed in this thesis but a similar
methodology can be easily derived.
Image processing pipeline involves several steps from light capturing to image
storage performed in a digital camera [11]. After measuring light intensity at each
pixel, RAW image that contains exactly information recorded by the image sensor
goes through some typical post-acquisition processes, e.g. demosaicing, whitebalancing
and gamma correction, to render a full-color high-quality image, referred
to as TIFF image. Image compression can be also performed for ease of storage
and transmission. The image processing pipeline of a digital camera is shown in2.2. Image Processing Pipeline of a Digital Camera 13
Figure 2.1: Image processing pipeline of a digital camera.
Figure 2.1. It should be noted that the sequence of operations differs from manufacturer
to manufacturer but basic operations remain similar. In general, the image
processing pipeline designed in a digital camera is complex, with trade-offs in the
use of buffer memory, computing operations, image quality and flexibility [12]. This
section only discusses some common image processing operations such as demosaicing,
white balancing, gamma correction and image compression. Other processing
operations, e.g. camera noise reduction and edge enhancement, are not included in
this discussion.
A full-color digital image consists of three primary color components: red, green,
and blue. These three color components are sufficient to represent millions of colors.
Formally, the full-color image of a DSC can be represented as a three-dimensional
matrix of size Nr × Nc × 3 where Nr and Nc are respectively the number of rows
and columns. Let c ∈ {R, G, B} denote a color channel where R, G and B stand
for respectively the red, green and blue color. Typically, the output image is coded
with ν bits and each pixel value is a natural integer. The set of possible pixel values
is denoted by Z = {0, 1, . . . , B} with B = 2ν − 1. Therefore, an arbitrary image
belongs to the finite image space Z
N with N = Nr × Nc × 3. In general, the image
space Z
N is high dimensional because of a large number of pixels. To facilitate
discussions, let Z denote an image in RAW format and Ze denote an image in TIFF
or JPEG format. Each color component of the image Z is denoted by Z
c and a pixel
of the color channel c at the location (m, n) is denoted by z
c
(m, n), 1 ≤ m ≤ Nr,
1 ≤ n ≤ Nc.
2.2.1 RAW Image Formation
Typically, a digital camera includes an optical sub-system (e.g. lenses), an image
sensor and an electronic sub-system, which can be regarded as the eye, retina, and
brain in the human visual system. The optical sub-system allows to attenuate
effects of infrared rays and to provide an initial optic image. The image sensor
consists of a two-dimensional arrays of photodiodes (or pixels) fabricated on a silicon14 Chapter 2. Overview on Digital Image Forensics
Figure 2.2: Sample color filter arrays.
wafer. Two common types of an image sensor are Charge-Coupled Device (CCD)
and Complementary Metal-Oxide Semiconductor (CMOS). Each pixel enables to
convert light energy to electrical energy. The output signals of the image sensor are
analog. These signals are then converted to digital signals by an analog-to-digital
(A/D) converter inside the camera. The RAW image is obtained at this stage.
Depending on the analog-to-digital circuit of the camera, the RAW image is recorded
with 12, 14 or even 16 bits. One key advantage is that the RAW image exactly
contains information recorded by the image sensor and it has not yet undergone
post-acquisition operations. This offers more flexibility for further adjustments.
Although the image sensor is sensitive to light intensity, it does not differentiate
light wavelength. Therefore, to record a color image, a Color Filter Array (CFA)
is overlaid on the image sensor. Each pixel records a limited range of wavelength,
corresponding to either red, green or blue. Some examples of CFA patterns are
shown in Figure 2.2. Among available CFA patterns, the Bayer pattern is the most
popular. It contains twice as many green as red or blue samples because the human
eye is more sensitive to green light than both red or blue light. The higher rate of
sampling for the green component enables to better capture the luminance component
of light and, thus, provides better image quality. There are few digital cameras
that allow to acquire a full-resolution information for all three color components
(e.g. Sigma SD9 or Polaroid x530 ). This is not only due to high production cost
but also due to the requirement of a perfect alignment of three color planes together.
Let Z represent the RAW image recorded by the image sensor. Because of
the CFA sampling, the RAW image Z is a single-channel image, namely that it is
represented as a two-dimensional matrix of size Nr × Nc. Each pixel value of the
RAW image Z corresponds to only one color channel. For subsequent processing
operations, each color component is extracted from the RAW image Z. A pixel of
each color component is given by
z
c
(m, n) = (
z(m, n) if PCFA(m, n) = c
0 otherwise,
(2.1)
where PCFA is the CFA pattern.
The RAW image acquisition stage is not ideal due to the degradation introduced
by several noise sources. This stage involves two predominant random noise sources.
The first is the Poisson-distributed noise associated with the stochastic nature of
the photo-counting process (namely shot noise) and dark current generated by the
thermal energy in the absence of light. Dark current is also referred to as Fixed
Pattern Noise (FPN). While shot noise results from the quantum nature of light
and it can not be eliminated, dark current can be subtracted from the image [13].2.2. Image Processing Pipeline of a Digital Camera 15
The second random noise sources account for all remaining electronic noises involved
in the acquisition chain, e.g. read-out noise, which can be modeled by a Gaussian
distribution with zero-mean. Apart from random noises, there is also a multiplicative
noise associated with the sensor pattern. This noise accounts for differences of pixels
response to the incident light due to imperfections during the manufacturing process
and inhomogeneity of silicon wafers. Therefore, this noise is referred to as PhotoResponse
Non-Uniformity (PRNU). The PRNU, which is typically small compared
with the signal, is a deterministic component that is present in every image. FPN
and PRNU are two main components of Sensor Pattern Noise (SPN). The PRNU
is unique for each sensor, thus it can be further used for forensic analysis.
2.2.2 Post-Acquisition Processing
Although the use of the CFA allows to reduce the cost of the camera, this requires to
estimate the missing color values at each pixel location in order to render a full-color
image. It means that all the zero values in the sub-images need to be interpolated.
This estimation process is commonly referred to as CFA demosaicing or CFA interpolation
[14]. Technically, demosaicing algorithms estimate a missing pixel value by
using its neighborhood information. The performance of CFA demosaicing affects
greatly the image quality. Demosaicing algorithms can be generally classified into
two categories: non-adaptive and adaptive algorithms. Non-adaptive algorithms
apply the same interpolation technique for all pixels. The nearest neighborhood, bilinear,
bicubic, and smooth hue interpolations are typical examples in this category.
For example, the bilinear interpolation can be written as a linear filtering
Z
c
DM = Hc
DM ~ Z
c
, (2.2)
where ~ denotes the two-dimensional convolution, Z
c
DM stands for the demosaiced
image of the color channel c, and Hc
DM is the linear filter for the color channel c
HG
DM =
1
4
0 1 0
1 4 1
0 1 0
, HR
DM = HB
DM =
1
4
1 2 1
2 4 2
1 2 1
. (2.3)
Although non-adaptive algorithms can provide satisfactory results in smooth regions
of an image, they usually fail in textured regions and edges. Therefore, adaptive
algorithms, which are more computationally intensive, employ edge information or
inter-channel correlation to find an appropriate set of coefficients to minimize the
overall interpolation error. Because the CFA interpolation commonly estimates a
missing pixel value using its neighbors, it thus creates a correlation between adjacent
pixels. This spatial correlation may be amplified during subsequent processing
stages.
Furthermore, to improve the visual quality, the RAW image needs to go through
another processing step, e.g. white balancing [11]. In fact, an object may appear
different in color when it is illuminated under different light sources. This is due to
the color temperature difference of the light sources, which causes the shift of the16 Chapter 2. Overview on Digital Image Forensics
reflection spectrum of the object from the true color. In other words, when a white
object is illuminated under a light source with low color temperature, the reflection
become reddish. On the other hand, a light source with high color temperature can
cause the white object to become bluish. The human visual system can recognize
the white color of the white object under different light sources. This phenomenon
is called color constancy. However, the digital camera does not have such luxury of
millions of year of evolution as human visual system. Therefore, the white balance
adjustment is implemented in the digital camera to compensate this illumination
imbalance so that a captured white object is rendered white in the image. Basically,
white balance adjustment is performed by multiplying pixels in each color channel
by a different gain factor. For instance, one classical white balancing algorithm is
the Gray World assuming that the average value of three color channels will average
to a common gray value
z
R
DM = z
G
DM = z
B
DM, (2.4)
where z
c
DM denotes the average intensity of the demosaiced image Z
c
DM
z
c
DM =
1
Nr · Nc
X
Nr
m=1
X
Nc
n=1
z
c
DM(m, n). (2.5)
In this algorithm, the green channel is fixed because human eye is more sensitive to
this channel (i.e. g
G
WB = 1). The gain factor for other color channels is given by
g
R
WB =
z
G
DM
z
R
DM
, and g
B
WB =
z
G
DM
z
B
DM
, (2.6)
where g
c
WB denotes the gain factor of the color channel c for white balance adjustment.
Therefore, the white-balanced image Z
c
WB is simply given by
Z
c
WB = g
c
WB · Z
c
DM. (2.7)
Other white-balancing algorithms may be also designed using different gain factors.
Actually, the white balance adjustment is a difficult task due to estimation or selection
of appropriate gain factors to correct for illumination imbalance. In this task,
the prior knowledge of light sources is critical so that the camera knows to select
appropriate gain factors. Therefore, some typical light sources such as daylight, incandescent
or fluorescent are stored in the camera. The white balance can be done
automatically in the camera. Some expensive cameras employ preprogrammed or
manual white balance for adapting to illumination conditions correctly.
Generally, the pixel intensity is still linear with respect to scene intensity before
gamma correction [11, 12]. However, most displays have non-linear characteristics.
The transfer function of these devices can be fairly approximated by a simple power
function that relates the luminance L to voltage V
L = V
γ
. (2.8)2.2. Image Processing Pipeline of a Digital Camera 17
Figure 2.3: JPEG compression chain.
Typically, γ = 2.2. To compensate this effect and render the luminance into a
perceptually uniform domain, the gamma correction is done in the image processing
pipeline. Gamma correction is roughly the inverse of Equation (2.8), applying to
each input pixel value
z
c
GM(m, n) =
z
c
WB(m, n)
1
γ
. (2.9)
After going through all post-acquisition processes, a full-color high-quality image,
referred to as TIFF image, is rendered. For the sake of simplicity, let ZeTIFF denote
the final full-color TIFF image.
2.2.3 Image Compression
The TIFF format does not make ease of storage or transmission. Therefore, most
digital cameras commonly apply lossy compression algorithms to reduce the image
data size. Lossy compression algorithms allow to discard information that is not
visually significant. Therefore, lossy compression algorithms are irreversible when
the image reconstructed from the compressed image data is not as identical as the
original image. Moreover, the use of a lossy compression algorithm is a balancing act
between storage size and image quality. An image which is compressed with a high
compression factor requires little storage space, but it will probably be reconstructed
with a poor quality.
Although many lossy compression algorithms have been proposed, most manufacturers
predominately utilize JPEG compression. The JPEG compression scheme
consists of three fundamental settings: color space, subsampling technique, and
quantization table. Even though JPEG was already proposed by the standard Independent
JPEG Group [15], manufacturers typically design their own compression
scheme for optimal trade-off of image quality versus file size. Fundamental steps of
the typical JPEG compression chain are shown in Figure 2.3.
The JPEG compression scheme works in the different color space, typically
YCbCr color space, rather than the RGB color space. The transformation to the
YCbCr color space is to reduce correlations among red, green and blue components.
It allows for more efficient compression. The channel Y represents the luminance of18 Chapter 2. Overview on Digital Image Forensics
a pixel, and the channels Cb and Cr represent the chrominance. Each channel Y, Cb
and Cr is processed separately. In addition, the channels Cb and Cr are commonly
supsampled by a factor of 2 horizontally and vertically. The transformation from
the RGB color space to the YCbCr color space is linear
Y
Cb
Cr
=
0.299 0.587 0.114
−0.169 −0.331 0.5
0.5 −0.419 0.081
R
G
B
+
0
128
128
. (2.10)
To avoid introducing too many symbols, let ZeTIFF denote also the image obtained
after this transformation.
The JPEG compression algorithm consists of two key steps: Discrete Cosine
Transform (DCT), and quantization. It works separately on each 8 × 8 block of a
color component. The DCT operation converts pixel values from the spatial domain
into transform coefficients
I(u, v) = 1
4
TuTv
X
7
m=0
X
7
n=0
z˜TIFF(m, n)
× cos
(2m + 1)uπ
16
cos
(2n + 1)vπ
16
, (2.11)
where z˜TIFF(m, n) is a pixel in a 8 × 8 block, 0 ≤ m, n ≤ 7, I(u, v) denotes the
two-dimensional DCT coefficient, 0 ≤ u, v ≤ 7, and Tu is the normalized weight
Tu =
(
√
1
2
for u = 0
1 for u > 0
. (2.12)
The index of color channel Y, Cb, and Cr is omitted for simplicity as each color
channel is processed separately. The coefficient at location (0, 0), called the Direct
Current (DC) coefficient, represents the mean value of pixels in the 8 × 8 block.
The remaining 63 coefficients are called the Alternating Current (AC) coefficients.
The DCT is known as sub-optimal transform with two important properties: energy
compaction and decorrelation. In a natural image, the majority of the energy tends
to be more located in low frequencies (i.e. the upper left corner of the 8 × 8 grid)
while high frequencies contains information that is not visually significant.
Then, the DCT coefficients go through the quantization process. The quantization
is carried out by simply dividing each coefficient by the corresponding quantization
step, and then rounding to the nearest integer
D(u, v) = round
I(u, v)
∆(u, v)
, (2.13)
where D(u, v) is the quantized DCT coefficient and ∆(u, v) is the corresponding
element in the 8 × 8 quantization table ∆. The quantization table is designed
differently for each color channel. The quantization is irreversible, which results
in an impossibility of recovering the original image exactly. The final processing2.3. Passive Image Origin Identification 19
step is entropy coding that is a form of lossless process. It arranges quantized DCT
coefficients into the zig-zag sequence and then employs the Run-Length Encoding
(RLE) algorithm and Huffman coding. This step is perfectly reversible.
The JPEG decompression works in the reverse order: entropy decoding, dequantization,
and Inverse DCT (IDCT). When the image is decompressed, the entropy is
decoded, we obtain the two-dimensional quantized DCT coefficients. The dequantization
is performed by multiplying the quantized DCT coefficient D(u, v) by the
corresponding quantization step ∆(u, v)
I(u, v) = ∆(u, v) · D(u, v), (2.14)
where I(u, v) stands for the dequantized DCT coefficient. The IDCT operation is
applied to dequantized DCT coefficients to return to the spatial domain
z˜IDCT(m, n) = X
7
uh=0
X
7
uv=0
1
4
TuTvI(u, v)
× cos
(2m + 1)uπ
16
cos
(2n + 1)vπ
16
. (2.15)
After upsampling color components and transforming into the RGB color space, the
values are rounded to the nearest integers and truncated to a finite dynamic range
(typically [0, 255])
z˜JPEG(m, n) = trunc
roundh
z˜IDCT(m, n)
i, (2.16)
where z˜JPEG(m, n) is the final decompressed JPEG pixel. In general, the JPEG pixel
z˜JPEG(m, n) differs from the original TIFF pixel z˜TIFF(m, n) due to the quantization,
rounding and truncation (R/T) errors in the process. Note that in this image
processing pipeline, R/T errors are only take into account one time for the sake of
simplification.
The way that JPEG compression works separately on each 8×8 block generates
discontinuities across the boundaries of the blocks, which are also known as block
artifacts [16]. The blocking artifacts are more severe when the quantization steps
are coarser. Moreover, because of the quantization in the DCT domain, the DCT
coefficients obtained by applying the DCT operation on the decompressed JPEG
image will cluster around integer multiples of ∆(u, v), even though those DCT
coefficients are perturbed by R/T errors. These two artifacts provide a rich source
of information for forensic analysis of digital images.
2.3 Passive Image Origin Identification
Basically, when an image is captured by a camera, it is stored with the metadata
headers in a memory storage device. The metadata, e.g. Exchangeable Image File
(EXIF) and JPEG headers, contain all recording and compression history. Therefore,
a simplest way to determine the image’s source is to read out directly from the20 Chapter 2. Overview on Digital Image Forensics
metadata. However, such metadata headers are not always available in practice if
the image is resaved in a different format or recompressed. Another problem is that
the metadata headers are not reliable as they can be easily removed or modified
using low-cost editing tools. Therefore, the metadata should not be considered in
forensic analysis.
The common philosophy of passive approach for image origin identification is
to rely on inherent intrinsic fingerprints that the digital camera leaves in a given
image. The fingerprint can discriminate different camera brands, camera models,
and even camera units. Any method proposed for image origin identification must
respond to following questions:
1. Which fingerprints are utilized for origin identification?
2. How to extract these fingerprints accurately from a given image?
3. Under which frameworks is the method designed to exploit the discriminability
of fingerprints extracted from images captured by different sources1 and to
calculate the similarity of fingerprints extracted from images captured by the
same source?
Every stage from real-world scene acquisition to image storage can provide intrinsic
fingerprints for forensic analysis (see Figure 2.1). Although the image processing
pipeline is common for most cameras, each processing step is performed according
to manufacturers’ own design. Thus the information left by each processing step is
useful to trace down to the device source. A fingerprint must satisfy three following
important requirements:
• Generality: the fingerprint should be present in every image.
• Invariant: the fingerprint does not vary for different image contents.
• Robustness: the fingerprint survives non-linear operations such as lossy compression
or gamma correction.
The second question involves a challenge for any forensic method since the fingerprint
extraction may be severely contaminated by non-linear operations (e.g.
gamma correction and lossy compression).
Generally, the image origin identification problem can be formulated into two
frameworks: supervised classification [17–19] and hypothesis testing [20]. Compared
with hypothesis testing framework, supervised classification framework is utilized by
most of existing methods in the literature. The construction of a classifier typically
consists of two stages: training stage and testing stage. It is assumed that the entire
image space Z
N that includes all images from all the sources in the real world can be
1The term source means an individual camera instance, a camera model, or a camera brand.
Other sources such as cell-phone cameras, scanners, computer graphic are not addressed in this
thesis.2.3. Passive Image Origin Identification 21
divided into disjoint subsets in which images with same characteristics from the same
source are grouped together. Let {S1, S2, . . . , SNs} be Ns different sources that are
required to be classified. Typically, each source Sn, 1 ≤ n ≤ Ns, is a subset of Z
N .
In the training stage, suppose that Nim images are collected to be representative for
each source. Each image in the source Sn is denoted by Zn,i. Then a feature vector
is extracted from each image. Formally, a feature vector is a mapping f : Z
N → F
where each image Z is mapped to a Nf-dimensional vector v = f(Z). Here, F is called
feature space and Nf
is the number of selected features, which is also the dimension
of the feature space F. The number of features Nf
is very small compared with the
number of pixels N. Working in a low-dimensional feature space F that represent
the input images is much simpler than working on high-dimensional noisy image
space Z
N . The choice of an appropriate feature vector is primordial in supervised
classification framework since the accuracy of a classifier highly depends on it. Thus
we obtain a set of feature vectors {vn,i} that is representative for each source. In
this training stage feature refinement can be also performed such as dimensionality
reduction or feature selection to avoid overtraining and redundant features. The
knowledge learnt from the set of refined feature vectors helps build a classifier using
supervised machine learning algorithms. A classifier typically is a learned function
that can map an input feature vector to a corresponding source. Therefore, in the
testing stage, the same steps such as feature selection and feature refinement are
performed on the testing images. The output of the trained classifier is the result
predicted for input testing images. Among many existing powerful machine learning
algorithms, Support Vector Machines (SVM) [18, 19] seem to be the most popular
choice in passive forensics. SVM are established in a solid mathematical foundation,
namely statistical learning theory [18]. Moreover, their implementation is available
for download and is easy to use [21].
Supervised classification framework involves two main drawbacks. To achieve
high accuracy, supervised classification framework requires an expensive training
stage that involves many images with different characteristics (e.g. image content
or camera settings) from various sources for representing a real-world situation,
which might be unrealistic in practice. Another drawback of this framework is that
the trained classifier can not establish the statistical performances analytically since
it does not rely on knowledge of a priori statistical distribution of images. In the
operational context, such as for law enforcement and intelligent agencies, the design
of an efficient method might not be sufficient. Forensic analysts also require that the
probability of false alarm should be guaranteed and below a prescribed rate. The
analytic establishment of statistical performances still remains an open problem in
machine learning framework [22].
On the other hand, the problem of image origin identification problem lends
itself to a binary hypothesis testing formulation.
Definition 2.1. (Origin identification problem). Given an arbitrary image Z under
investigation, to identify the source of the image Z, forensic analysts decide between22 Chapter 2. Overview on Digital Image Forensics
two following hypotheses
(
H0 : Z is acquired by the source of interest S0
H1 : Z is acquired by a certain source S1 that differs from the source S0.
(2.17)
Suppose that the source S0 is available, so forensic analysts can have access to its
characteristics, or its fingerprints. Therefore, they can make a decision by checking
whether the image in question Z contains the fingerprints of the source. Relying on
a priori statistical distribution of the image Z under each source, forensic analysts
can establish a test statistic that can give a decision rule according to some criteria
of optimality.
Statistical hypothesis testing theory has been considerably studied and applied
in many fields. Several statistical tests as well as criteria of optimality have been proposed.
While supervised learning framework only requires to find an appropriate set
of forensic features, the most challenging part in hypothesis testing framework is to
establish a statistical distribution to accurately characterize a high-dimensional real
image. In doing so, hypothesis testing framework allows us to establish analytically
the performance of the detector and warrant a prescribed false alarm probability,
which are two crucial criteria in the operational context that supervised classification
framework can not enable. However, hypothesis testing framework is of limited
exploitation in forensic analysis. For the sake of clarity, hypothesis testing theory
will be more detailed in Chapter A.
There are many passive forensic methods proposed in the literature for image
origin identification. In this thesis, we limit the scope of our review to methods for
identification of the source of a digital camera (e.g. camera brand, camera model,
or individual camera instance). The methods to identify other imaging mechanisms
such as cell-phone cameras, scanners, and computer graphics will not be addressed.
It is important to distinguish the problem of camera instance identification and the
problem of camera model/brand identification. More specifically, fingerprints used
for camera instance identification should capture individuality, especially cameras
coming from the same brand and model. For camera model/brand identification,
it is necessary to exploit fingerprints that are shared between cameras of the same
model/brand but discriminative for different camera models/brands.
Existing methods in the literature can be broadly divided into two categories.
Methods in the first category exploit differences in image processing techniques
and component technologies among camera models and manufacturers such as lens
aberration [23], CFA patterns and interpolation [24–26] and JPEG compression
[27,28]. The main challenge in this category is that the image processing techniques
remain identical or similar, and the components produced by a few manufacturers
are shared among camera models. Methods in the second category aim to identify
unique characteristics or fingerprints of the acquisition device such as PRNU [29–36].
The ability to reliably extract this fingerprint from an image is the main challenge
in the second category since different image contents and non-linear operations may2.3. Passive Image Origin Identification 23
severely affect this extraction. Below we will present the methods according to
the position of exploited fingerprints in the image acquisition pipeline of a digital
camera.
2.3.1 Lens Aberration
Digital cameras use lenses to capture incident light. Due to the imperfection of the
design and manufacturing process, lenses cause undesired effects in output images
such as spherical aberration, chromatic aberration, or radial distorsion. Spherical
aberration occurs when all incident light rays end up focusing at different points
after passing through a spherical surface, especially light rays passing through the
periphery of the spherical lens. Chromatic aberration is a failure of lens to converge
different wavelengths at the same position on the image sensor. Radial distorsion
causes straight lines rendered as curved lines on the image sensor and it occurs when
the transverse magnification (ratio of the image distance to the object distance) is
not a constant but a function of the off-axis image distance. Among these effects,
radial distorsion may be the most severe part that lens produces in output images.
Different manufacturers design different lens systems to compensate the effect of
radial distorsion. Moreover, focal length also affects the degree of radial distorsion.
As a result, each camera brand or model may leave an unique degree of radial
distorsion on the output images. Therefore, radial distorsion of lens is exploited
in [23] to identify the source of the image.
The authors in [23] take the center of an image as the center of distorsion and
model the undistorted radius ru as a non-linear function of distorted radius rd
ru = rd + k1r
3
d + k2r
5
d
. (2.18)
Distorsion parameters (k1, k2) are estimated using the straight line method [37,38].
Then the distorsion parameters (k1, k2) are exploited as forensic features to train a
SVM classifier. Although experiments provided a promising result, experiments were
only conducted on three different camera brands. Experiments on large database
including different devices per camera model and different camera models are more
desirable. However, this lens aberration-based classifier would fail for a camera with
possibly interchangeable lenses, e.g. Digital Single Lens Reflex (DSLR) camera.
2.3.2 Sensor Imperfections
As discussed in Section 2.2, imperfections during the manufacturing process and
inhomogeneity of silicon wafers leads to slight variations in the response of each
pixel to incident light. These slight variations are referred as to PRNU, which is
unique for each sensor pattern. Thus PRNU can be exploited to trace down to
individual camera instance. The FPN was also used in [39] for camera instance
identification. However, the FPN can be easily compensated, thus it is not a robust
fingerprint and no longer used in later works.24 Chapter 2. Overview on Digital Image Forensics
Generally, PRNU is modeled as a multiplicative noise-like signal [30, 32]
Z = µ + µK + Ξ, (2.19)
where Z is the output noisy image, µ is the ideal image in the absence of noise, K
represents the PRNU, and Ξ accounts for the combination of other noise sources.
All operations in (2.19) are pixel-wise.
Like supervised classification, the PRNU-based method also consists two stages.
The training stage involves collecting Nim images that are acquired by the camera
of interest S0 and extracting the PRNU K0 characterizing this camera. This is
accomplished by applying a denoising filter on each image to suppress the image
content, then performing Maximum Likelihood (ML) estimation of K0
K0 =
PNim
i=1 Z
res
i Zi
PNim
i=1
Zi
2
, (2.20)
where Z
res
i = Zi −D
Z
is the noise residual corresponding to the image Zi
, 1 ≤ i ≤
Nim, and D stands for the denoising filter. Note that when the PRNU is extracted
from JPEG images, it may contain artifacts introduced by CFA interpolation and
JPEG compression. These artifacts are not unique to each camera instance and
shared among different camera units of the same model. To render the PRNU
unique to the camera and improve the accuracy of the method, a preprocessing
step is performed to suppress these artifacts by subtracting the averages from each
row and column, and applying the Wiener filter in the Fourier domain [30]. In the
testing stage, given an image under investigation Z, the problem of camera source
identification (2.17) is rewritten as follows
(
H0 : Z
res = µK0 + Ξe
H1 : Z
res = µK1 + Ξe,
(2.21)
where the noise term Ξe includes the noise Ξ and additional terms introduced by
the denoising filter. This formulation must be understood as follows: hypothesis
H0 means that the noise residual Z
res contains the PRNU K0 characterizing the
camera of interest S0 while hypothesis H1 means the opposite. It should be noted
that the PRNU detection problem in [30, 32] is formulated in the reverse direction.
The sub-optimal detector for the problem (2.21) is the normalized cross correlation
between the PRNU term µK and the noise residual Z
res [30]. In fact, the normalized
cross correlation is derived from the Generalized Likelihood Ratio Test (GLRT)
by modeling the noise term Ξe as white noise with known variance [40]. A more
stable statistic derived in [32] is the Peak to Correlation Energy (PCE) as it is
independent of the image size and has other advantages such as its response to
the presence of weak periodic signals. Theoretically, the decision threshold for the
problem (2.21) is given by τ =
Φ
−1
(1 − α0)
2
where α0 is the prescribed false
alarm probability, Φ(·) and Φ
−1
(·) denotes respectively the cumulative distribution
function (cdf) of the standard Gaussian random variable and its inverse. If the2.3. Passive Image Origin Identification 25
PCE is smaller than a threshold τ , the image Z is claimed taken by the camera in
question. The detection performance can be improved by selecting an appropriate
denoising filter [33], attenuating scene details in the test image [34,35], or recognizing
the PRNU term with respect to each sub-sample of the CFA pattern [36].
Beside individual camera instance identification, the fingerprint PRNU can be
also used for camera model identification [31]. This is based on an assumption
that the fingerprint obtained from TIFF or JPEG images contains traces of postacquisition
processes (e.g. CFA interpolation) that carry information about the
camera model. In this case, the above preprocessing step that removes the linear
pattern from the PRNU will not be performed. The features extracted from the
PRNU term including statistical moments, cross correlation, block covariance, and
linear pattern, are used to train a SVM classifier.
2.3.3 CFA Pattern and Interpolation
Based on the assumption that different CFA patterns and CFA interpolation algorithms
are employed by different manufacturers, even in different camera models,
thus they can be used to discriminate camera brands and camera models. Typically,
both CFA pattern and interpolation coefficients are unknown in advance. They must
be estimated together from a single image. An algorithm has been developed in [24]
to jointly estimate CFA pattern and interpolation coefficients, which has shown the
robustness to JPEG compression with low quality factors. Firstly, a search space
including 36 possible CFA patterns is established based on the observation that
most cameras use a RGB type of CFA with a fixed periodicity of 2 × 2. Since a
camera may employ different interpolation algorithms for different types of regions,
it is desirable to classify the given image into three types of regions based on gradient
information in a local neighborhood of a pixel: region contains parts of the
image with a significant horizontal gradient, region contains parts of the image with
a significant vertical gradient, and region includes the remaining smooth parts of
the image.
For every CFA pattern PCFA in the search space, the interpolation coefficients
are computed separately in each region by fitting linear models. Using the final
output image Z and the assumed CFA pattern PCFA, we can identify the set of
pixels that acquired directly from the image sensor and those obtained by interpolation.
The interpolated pixels are assumed to be a weighted average of the
pixels acquired directly. The interpolation coefficients are then obtained by solving
these equations. To overcome the difficulty of noisy pixel values and interference of
non-linear post-acquisition processes, singular value decomposition is employed to
estimate the interpolation coefficients. These coefficients are then use to re-estimate
the output image Zb, and find the interpolation error Zb − Z. The CFA pattern that
gives the lowest interpolation error and its corresponding coefficients are chosen as
final results [24].
As soon as the interpolation coefficients are estimated from the given image,
they are used as forensic features to train a SVM classifier for classification of cam-26 Chapter 2. Overview on Digital Image Forensics
era brands and models [24]. The detection performance can be further enhanced by
taking into account intra-channel and inter-channel correlations and more sophisticated
interpolation algorithms in the estimation methodology [26]. Other features
can be used together with interpolation coefficients such as the peak location and
magnitudes of the frequency spectrum of the probability map [41].
2.3.4 Image Compression
Image compression is the final step in the image processing pipeline. As discussed
in Section 2.2, manufacturers have their own compression scheme for optimal tradeoff
of image quality versus file size. Different component technologies (e.g. lenses,
sensors), different in-camera processing operations (e.g. CFA interpolation, whitebalancing),
together with different quantization matrices will jointly result in statistical
difference of quantized DCT coefficient. Capturing this statistical difference
and extracting useful features from it may enable to discriminate different camera
brands or camera models.
To this end, instead of extracting statistical features directly from quantized
DCT coefficients, features are extracted from the difference JPEG 2-D array [28].
The JPEG 2-D array consists of the magnitudes (i.e. absolute values) of quantized
DCT coefficients. Three reasons behind taking absolute values are the followings:
1. The magnitudes of DCT coefficients decrease along the zig-zag order.
2. Taking absolute values can reduce the dynamic range of the resulting array.
3. The signs of DCT coefficients mainly carry information of the outlines and
edges of the original spatial-domain image, which does not involve information
about camera models. Thus by taking absolute values, all the information
regarding camera models remains.
Then to reduce the influence of image content and enhance statistical difference
introduced in image processing pipeline, the difference JPEG 2-D array, which is
defined by taking the difference between an element and one of its neighbors in
the JPEG 2-D array, is introduced. The difference can be calculated along four
directions: horizontal, vertical, main diagonal, and minor diagonal. To model the
statistical difference of quantized DCT coefficients and take into account the correlation
between coefficients, the Markovian transition probability matrix is exploited.
Each difference JPEG 2-D array from a direction generates its own transition probability
matrix. Each probability value in the transition matrix is given by
P
h
X(uh + 1, uv) = k
X(uh, uv) = l
i
=
PNh
uh=1
PNv
uv=1 1X(uh,uv)=l,X(uh+1,uv)=k
PNh
uh=1
PNv
uv=1 1X(uh,uv)=l
,
(2.22)
where X(uh, uv) denotes an element in the difference JPEG 2-D array and 1E is an
indicator function
1E =
(
1 if E is true
0 otherwise.
(2.23)2.4. Passive Image Forgery Detection 27
These steps are performed for the Y and Cb components of the compressed JPEG
image. Totally, we can collect 324 transition probabilities for Y component and 162
transition probabilities for Cb component. The transition probabilities are then used
as forensic features for SVM classification. Experiments are then conducted on a
large database including 40000 images of 8 different camera models, providing a good
classification performance [28]. In this method it is more desirable to perform feature
refinement to reduce the number of features and the complexity of the algorithm.
2.4 Passive Image Forgery Detection
Image forgery detection is another fundamental task of forensic analysts, which aims
to detect any act of manipulation on image content. The main assumption is that
even though a forger with skills and powerful tools does not leave any perceptible
trace of manipulation, the manipulation creates itself inconsistencies in image content.
Depending on which type of inconsistencies is investigated and how passive
forensic methods operate, they can broadly be divided into five categories. A single
method can hardly detect all types of forgery, so forensic analysts should use these
methods together to reliably detect a wide variety of tampering.
1. Universal Classifiers: Any act of manipulation may lead to statistical changes
in the underlying image. Instead of capturing these changes directly in a
high-dimensional and non-stationary image, which is extremely difficult, one
approach is to detect changes in a set of features that represent an image.
Based on these features, supervised classification is employed to provide universal
classifiers to discriminate between unaltered images and manipulated
images. Some typical forensic features are higher-order wavelet statistics [42],
image quality and binary similarity measures [43, 44]. These universal classifiers
are not only able to detect some basic manipulations such as resizing,
splicing, contrast enhancement, but also reveal the existence of hidden messages
[45].
2. Camera Fingerprints-Based: A typical scenario of forgery is to cut a portion
of an image and paste it into a different image, then create the so-called
forged image. The forged region may not be taken by the same camera as
remaining regions of the image, which results in inconsistencies in camera
fingerprints between those regions. Therefore, if these inconsistencies exist in
an image, we could assume that the image is not authentic. For authentication,
existing methods have exploited many camera fingerprints such as chromatic
aberration [46], PRNU [30,32], CFA interpolation and correlation [25, 47–49],
gamma correction [50, 51], Camera Response Function (CRF) [52–54].
3. Compression and Coding Fingerprints-Based: Nowadays most commercial
cameras export images in JPEG format for ease of storage and transmission.
As discussed in Section 2.2, JPEG compression introduces two important artifacts:
clustering of DCT coefficients around integer multiples of the quan-28 Chapter 2. Overview on Digital Image Forensics
tization step, and blocking artifacts. Checking inconsistencies in these two
artifacts can trace the processing history of an image and determine its origin
and authenticity. A possible scenario is that while the original image is saved
in JPEG format, a forger could save it in a lossless format after manipulation.
Existence of these artifacts in an image in a lossless format can show that it has
been previously compressed [55–57]. Another scenario is that the forger could
save the manipulated image in JPEG format, which means that the image
has undergone JPEG compression twice. Detection of double JPEG compression
can be performed by checking periodic patterns (e.g. double peaks and
missing centroids) in the histogram of DCT coefficients due to different quantization
steps [51, 58, 59], which are not present in singly compressed images,
or using the distribution of the first digit of DCT coefficients [60, 61]. The
detection of double JPEG compression is of greater interest since it can reveal
splicing or cut-and-paste forgeries due to the fact that the the forged region
and remaining regions of the image may not have the same processing history.
Inconsistencies can be identified either in DCT domain [62–65] or in spatial
domain via blocking artifacts [66, 67]. Furthermore, the detection of double
JPEG compression can be applied for detecting hidden messages [58, 59].
4. Manipulation-Specific Fingerprints-Based: Each manipulation may leave specific
fingerprints itself within an image, which can be used as evidence of
tampering. For example, resampling causes specific periodic correlations between
neighboring pixels. These correlations can be estimated based on the
Expectation Maximization (EM) algorithm [68], and then used to detect the
resampling [68, 69]. Furthermore, resampling can be also detected by identifying
periodicities in the average of an image’s second derivative along its row
and columns [70], or periodicities in the variance of an image’s derivative [71].
Contrast enhancement creates impulsive peaks and gaps in the histogram of
the image’s pixel value. These fingerprints can be detected by measuring the
amount of high frequency energy introduced into the Fourier transform of an
image’s pixel value histogram [72]. Median filtering introduces streaking into
the signals [73]. Streaks correspond to a sequence of adjacent signal observations
all taking the same value. Therefore, median filtering can be detected
by analyzing statistical properties of the first difference of an image’s pixel
values [74–77]. Splicing disrupts higher-order Fourier statistics, which leaves
traces to detect splicing [78].
5. Physical Inconsistencies-Based: Methods in this category do not make use
of any form of fingerprints but exploit properties of lighting environment for
forgery detection. The main assumption is that all the objects within an image
are typically illuminated under the same light sources, so the same properties
of lighting environments. Therefore, difference in lighting across an image can
be used as evidence of tampering, e.g. splicing. To this end, it is necessary
to estimate the direction of the light source illuminating an object. This can
be accomplished by considering two-dimensional [79] or three-dimensional [80]2.5. Steganography and Steganalysis in Digital Images 29
Figure 2.4: Typical steganographic system.
surface normals, and illumination under a single light source [79] or even under
multiple light sources [81]. The lighting environment coefficients of all objects
in an image are then used for checking inconsistencies.
2.5 Steganography and Steganalysis in Digital Images
Steganography is the art and science of hiding communication. The concept of
steganography is used for invisible communication between only two parties, the
sender and the receiver, such that the message exchanged between them can not
be detected by an adversary. This communication can be illustrated by prisoners’
problem [82]. Two prisoners, Alice and Bob, want to develop an escape plan but
all communications between them are unfortunately monitored by a warden named
Wendy. The escape plan must be kept secret and exchanged without raising Wendy’s
suspicion. It means that the communication does not only involve the confidentiality
of the escape plan but also its undetectability. For this purpose, a practical way is
to hide the the escape plan, or the secret message in a certain ordinary object and
send it to the intended receiver. By terminology, the original object that is used
for message hiding is called cover-object and the object that contains the hidden
message is called stego-object. The hiding technique does not destroy the object
content perceptibly to not raise Wendy’s suspicion, nor modify the message content
so the receiver could totally understand the message.
The advances in information technologies make digital media (e.g. audio, image,
or video) ubiquitous. This ubiquity facilitates the choice of a harmless object in
which the sender can hide a secret message, so sending such media is inconspicuous.
Furthermore, the size of digital media is typically large compared to the size of
secret message. Thus the secret message can be easily hidden in digital media
without visually destroying digital content. Most of researches focus on digital
images, which are also the type of media addressed in this thesis.
A typical steganographic system is shown in Figure 2.4. It consists of two stages:30 Chapter 2. Overview on Digital Image Forensics
embedding stage and extraction stage. When Alice wants to send a secret message
M, she hides it into a cover-image C using a key and an embedding algorithm.
The secret message M is a binary sequence of L bits, M = (m1, m2, . . . , mL)
T with
mi ∈ {0, 1}, 1 ≤ i ≤ L. The resulting stego-image S is then transmitted to Bob via
an insecure channel. Bob can retrieve the message M since he knows the embedding
algorithm used by Alice and has access to the key used in embedding process.
Bob does not absolutely require the original cover-image C for message extraction.
From the Kerckhoffs’ principle [83], it is assumed that in digital steganography,
steganographic algorithms are public so that all parties including the warden Wendy
have access to them. The security of the steganographic system relies solely on the
key. The key could be secret key exchanged between Alice and Bob through a secure
channel, or public key.
In general, steganographic systems can be evaluated by three basic criteria: capacity,
security, and robustness. Capacity is defined as the maximum length of a
secret message. The capacity depends on the embedding algorithm and properties
of cover-images. The security of a steganographic system is evaluated by the undetectability
rather than the difficulty of reading the message content in case of
cryptographic system. However, we can see that steganographic systems also exploit
the idea of exchange of keys (secret and public) from cryptographic system to
reinforce the security. Robustness means the difficulty of removing a hidden message
from a stego-image, so the secret message survives some accidental channel
distortions or systematic interference of the warden that aims to prevent the use
of steganography. It can be noted that longer messages will lead to more changes
in the cover image, thus less security. In brief, these three criteria are mutually
dependent and are balanced when designing a steganographic system.
The purpose of steganography is to secretly communicate through a public channel.
However, this concept has been misused by anti-social elements, criminals, or
terrorists. It could lead to important consequences to homeland security or national
defence when, for example, two terrorists exchange a terrorist plan. Therefore, it
is urgent for law enforcement and intelligence agencies to build up a methodology
in order to detect the mere existence of a secret message and break the security of
steganographic systems. Embedding a secret message into a cover-image is also an
act of manipulating image content, so steganalysis is one of important tasks of forensic
analysts, or steganalysts in this case. Unlike in cryptanalysis, the steganalyst
Wendy does not require to retrieve the actual message content. As soon as she have
detected its existence in an image, she can cut off the communication channel by
putting two prisoners in separate cells. This is the failure of steganography. Besides,
the task of steganalysis must be accomplished blindly without knowledge of original
cover image.
Generally, the steganalyst Wendy can play either active or passive role. While
the active steganalyst is allowed to modify exchanged objects through the public
channel in order to prevent the use of steganography, the passive steganalyst is not.
The only goal of passive steganalyst is to detect the presence of a hidden message in
a given image, which is also the typical scenario on which most of researches mainly2.5. Steganography and Steganalysis in Digital Images 31
Figure 2.5: Operations of LSB replacement (top) and Jsteg (bottom).
focus. It can be noted that the steganalysis is like the coin-tossing game since the
decision of steganalysts is made by telling that the given image is either a coverimage
or a stego-image. Hence in any case, steganalysts can get a correct detection
probability of 50%. However, steganalysts should establish the problem of hidden
message detection in a more formal manner and design a powerful steganalysis tool
with higher correct detection probability, rather than a random guess. Apart from
detecting the presence of a hidden message, it may be desirable for steganalysts to
estimate the message length or brute-force the secret key and retrieve the message
content. The estimation of the message length is called quantitative steganalysis.
Brute-forcing the secret key and extraction of the message content are referred to
as forensic steganalysis.
As stated above, designing a steganographic system is a trade-off between three
basic criteria. Thus many steganographic algorithms have been proposed for different
purposes such as mimic natural processing [84–86], preserve a model of coverimages
[87, 88], or minimize the distorsion function [89, 90]. Among available algorithms,
Least Significant Bit (LSB) replacement might be the oldest embedding
technique in digital steganography. This algorithm is simple and easy to implement,
thus it is available in numerous low-cost steganographic softwares on the Internet
despite its relative insecurity. In addition, LSB replacement inspires a majority
of other steganographic algorithms (e.g. LSB matching [91], Jsteg [92]). Jsteg
algorithm is simply the implementation of LSB replacement in the DCT domain.
Therefore, understanding LSB replacement paradigm is a good starting point before
addressing more complex embedding paradigms. In this thesis, we only review LSB
replacement and Jsteg algorithm, and their powerful steganalysis detectors proposed
in the literature. The readers can be referred to [93–95] for other steganographic
and steganalysis methods.32 Chapter 2. Overview on Digital Image Forensics
2.5.1 LSB Replacement Paradigm and Jsteg Algorithm
Considering the cover-image C as a column vector, the LSB replacement technique
involves choosing a subset of L cover-pixels {c1, c2, . . . , cL}, and replacing the LSB
of each cover pixel by a message bit. The LSB of a cover-pixel ci
is defined as follows
LSB(ci) = ci − 2
j
ci
2
k
, (2.24)
where b·c is the floor function. The LSB of the cover-pixel ci takes values in {0, 1}.
Therefore, by embedding a message bit mi
into the cover-pixel ci
, the stego-pixel si
is given by
si = 2j
ci
2
k
+ mi
. (2.25)
We see that when LSB(ci) = mi
, the pixel value does not change after embedding,
si = ci
. By contrast, when LSB(ci) 6= mi
, the stego-pixel si can be defined as a
function of the cover-pixel ci
in the following manner
si = ci + 1 − 2 · LSB(ci) = ci + (−1)ci , ci
, (2.26)
where ci
is the pixel with flipped LSB. In other words, even values are never decremented
whereas odd values are never incremented. The absolute difference between
a cover-pixel ci and a stego-pixel si
is smaller than 1, |ci − si
| ≤ 1, thus the artifact
caused by the insertion of secret message M could be imperceptible under human
vision. The operation of LSB replacement technique is illustrated in Figure 2.5.
One problem that remains to be solved is the choice of the subset of cover-pixels or
the sequence of pixel indices used in embedding process. To increase the complexity
of the algorithm, the sender could create a pseudorandom path generated from the
secret key shared between the sender and the receiver so that the secret message
bits are spread randomly over the cover-image. Therefore, the distance between
two embedded bits is also determined pseudorandomly, which would not raise the
suspicion of the warden. We can see that the number of message bits that can be
embedded does not exceed beyond the number of pixels of the image Z: L ≤ N,
which leads us to define an embedding rate R
R =
L
N
. (2.27)
This embedding rate R is a measure of the capacity of the steganographic system
based on LSB replacement technique.
Jsteg algorithm is a variant of LSB replacement technique in spatial domain.
Jsteg algorithm embeds the secret message into the DCT domain by replacing LSBs
of quantized DCT coefficients by message bits. The difference from the LSB replacement
technique in spatial domain is that Jsteg algorithm does not embed message
bits in the coefficients that are equal to 0 and 1 since artifacts caused by such embedding
can be perceptibly and easily detected. The DC coefficient is not used as
well for the same reason. The AC coefficients that differ from 0 et 1 are usable2.5. Steganography and Steganalysis in Digital Images 33
coefficients. Consequently, the embedding rate R in Jsteg algorithm is defied as the
ratio of the length L and the number of usable coefficients in the cover-image C
R =
L
P64
k=2 nk
. (2.28)
where nk is the number of usable coefficients at the frequency k, 2 ≤ k ≤ 64.
2.5.2 Steganalysis of LSB Replacement in Spatial Domain
Like the origin identification problem (2.17), the steganalysis problem can be also
formulated as a binary hypothesis testing.
Definition 2.2. (Steganalysis problem). Given a suspect image Z, to verify whether
the image Z contains a secret message or not, the steganalyst decides between two
following hypotheses
(
H0 : Z = C, no hidden message.
H1 : Z = S, with hidden message.
(2.29)
To solve the steganalysis problem (2.29), several methods have been proposed
in the literature. Even though the secret message is imperceptible to human eye,
the act of embedding a secret message modifies the cover content and leaves itself
artifacts that can be detected. Steganalysis methods of LSB replacement can be
roughly divided into four categories: structural detectors, Weighted Stego-image
(WS) detectors, statistical detectors, and universal classifiers. Typically, structural
detectors and WS detectors are quantitative detectors that provide an estimation of
secret message length while statistical detectors and universal classifiers attempt to
separate stego-images from cover-images based on changes in statistical properties
of cover-images due to message embedding. Below we briefly discuss each category
of detectors.
2.5.2.1 Structural Detectors
Structural detectors exploit all combinatorial measures of the artificial dependence
between sample differences and the parity structure of the LSB replacement in
order to estimate the secret message length. Some representatives in this category
are the Regular-Singular (RS) analysis [96], the Sample Pair Analysis (SPA) [97–
99], and the Triple/Quadruple analysis [100, 101]. The common framework is to
model effects of LSB replacement as a function of embedding rate R, invert these
effects to approximate cover-image properties from the stego-image, and find the
best candidate Rb to match cover assumptions.
Both RS and SPA methods rely on evaluating groups of spatially adjacent pixels.
The observations made in RS analysis were formally justified in SPA. For pedagogical
reasons, we discuss the SPA method. For the representation of the SPA method, we34 Chapter 2. Overview on Digital Image Forensics
E2k+1 O2k
E2k O2k−1
R
2
(1−
R
2
)
R
2
(1−
R
2
)
R
2
(1−
R
2
)
R
2
(1−
R
2
)
R
2
4
R
2
4
(1−
R
2
)
2
(1−
R
2
)
2
(1−
R
2
)
2
(1−
R
2
)
2
Figure 2.6: Diagram of transition probabilities between trace subsets under LSB
replacement.
use the extensible alternative notations in [95, 101]. Given an image Z, we define a
trace set Ck that collect all pairs of adjacent pixels (z2i
, z2i+1) as follows
Ck =
n
(2i, 2i + 1) ∈ I2
j
z2i
2
k
=
j
z2i+1
2
k
+ k
o
, (2.30)
where I is the set of pixel indices. Each trace set Ck is then partitioned into four
trace subsets, Ck = E2k ∪ E2k+1 ∪ O2k ∪ O2k−1, where Ek and Ck are defined by
Ek =
n
(2i, 2i + 1) ∈ I2
z2i = z2i+1 + k, z2i+1 is eveno
Ok =
n
(2i, 2i + 1) ∈ I2
z2i = z2i+1 + k, z2i+1 is oddo
.
(2.31)
We can observe that the LSB replacement technique never changes the trace set
Ck of a sample pair but can move sample pairs between trace subsets. Therefore,
we establish transition probabilities as functions of the embedding rate R, which is
shown in Figure 2.6. Thus we can derive the relation between trace subsets of a
stego-image and those of a cover-image
|Es
2k+1|
|Es
2k
|
|Os
2k
|
|Os
2k−1
|
=
1 −
R
2
2 R
2
1 −
R
2
R
2
1 −
R
2
R2
4
R
2
1 −
R
2
1
−
R
2
2 R2
4
R
2
1 −
R
2
R
2
1 −
R
2
R2
4
1 −
R
2
2 R
2
1 −
R
2
R2
4
R
2
1 −
R
2
R
2
1 −
R
2
1
−
R
2
2
|Ec
2k+1|
|Ec
2k
|
|Oc
2k
|
|Oc
2k−1
|
,
(2.32)
where E
c
k
and Oc
k
are trace subsets of the cover-image, and E
s
k
and Os
k
are trace
subsets of the stego-image. Here |S| denotes the cardinality of the set S. After
inverting the transition matrix and assuming that |Ec
2k+1| = |Oc
2k+1|, we obtain a
quadratic equation
0 = R
2
|Ck| − |Ck+1|
+ 4
|Es
2k+1| − |Os
2k+1|
+ 2R
|Es
2k+2| + |Os
2k+2| − 2|Es
2k+1| + 2|Os
2k+1| − |Es
2k
| − |Os
2k
|
. (2.33)2.5. Steganography and Steganalysis in Digital Images 35
The solution of Equation (2.33) is an estimator of the embedding rate R. The SPA
method was further improved by combining with Least Squares (LS) method [98]
and Maximum Likelihood [99], or generalizing from analysis of pairs to analysis of
k-tuples [100, 101].
2.5.2.2 WS Detectors
WS detectors were originally proposed by J. Fridrich in [102] and then improved
in [103, 104]. The key idea of WS is that the embedding rate can be estimated via
the weight that minimizes the distance between the weighted stego image and the
cover image [95]. The weighted stego-image with scalar parameter λ of the image
Z is defined by
∀i ∈ I, z
(λ)
i = (1 − λ)zi + λzi
, with zi = zi + (−1)zi
. (2.34)
The estimator Rb can be provided by minimizing the Euclidian distance between the
weighed stego-image and the cover image
Rb = 2 arg min
λ
X
N
i=1
wi
z
(λ)
i − ci
2
, (2.35)
where the normalized weight vector w with PN
i=1 wi = 1 is taken into account in
the minimization problem (2.35) to reflect the heterogeneity in a natural image. By
solving the root of the first derivative in (2.35), a simplified estimator is given as
Rb = 2X
N
i=1
wi(zi − zi)(zi − ci). (2.36)
Since the cover-pixels ci are unknown in advance, a local estimator for each pixel
from its spatial neighborhood can be employed, or more generally, a linear filter D,
to provide an estimate of cover-image: Cb = D(Z). The estimator Rb in (2.36) follows
immediately. From above observations, the choices of an appropriate linear filter
D and weight vector w are crucial for improvement of WS detectors’ performance
[95, 103, 104].
Both structural detectors and WS detectors are established into quantitative
steganalysis framework, which means that instead of indicating a suspect image Z
is either a cover-image or stego-image, the output of those detectors is a real-value
estimate of the secret message length. In other words, even no secret message is
embedded in the image, i.e. R = 0, we could still obtain a negative or positive value.
Nevertheless, quantitative detectors offer an additional advantage over statistical
detectors, namely that the detection performance can be measured by evaluating
the deviation of the estimator Rb from the true embedding rate R. Some criteria can
be used as measures of performance such as
• Mean Absolute Error (MAE):
1
Nim
X
Nim
n=1
|Rbn − R|, (2.37)36 Chapter 2. Overview on Digital Image Forensics
where Nim is number of images.
• Median Absolute Error (mAE):
mediann|Rbn − R|. (2.38)
2.5.2.3 Statistical Detectors
In contrast to structural detectors and WS detectors, statistical detectors rely on
changes in statistical properties due to message embedding to detect the presence
of the secret message. The output of statistical detectors is a binary decision. Some
representatives are χ
2 detector [105] and Bayesian approach-based detector [106].
Another interesting approach is the one proposed in [107] that is based on the
statistical hypothesis testing theory. To this end, two preliminary assumptions are
given in the following proposition:
Proposition 2.1. In the LSB replacement embedding technique, we assume that
1. The secret message bits are uniformly distributed over the cover-image, namely
that the probability of embedding a message bit into every cover-pixel is identique.
Moreover, message bits and cover pixels are statistically uncorrelated
[107].
2. Secret message bits are independent and identically distributed (i.i.d), and each
message bit mi is drawn from the Binomial distribution B(1,
1
2
)
P[mi = 0] = P[mi = 1] = 1
2
, (2.39)
where P[E] denotes the probability that an event E occurs.
Therefore, from the mechanism of LSB replacement, we can see that the probability
that the pixel does not change after embedding is 1 −
R
2
while the probability that its
LSB is flipped is R
2
P[si = ci
] = 1 −
R
2
and P[si = ci
] = R
2
. (2.40)
Let P0 be the probability distribution of cover-images. Due to message embedding
at rate R whose properties are given in Proposition 2.1, the cover image moves
from the probability distribution P0 to a different probability distribution, denoted
PR. Thus the steganalysis problem (2.29) can be rewritten as follows
(
H0 : Z ∼ P0
H1 : Z ∼ PR.
(2.41)
Based on the assumption that all pixels are independent and identically distributed,
the authors in [107] have developed two schemes depending on the knowledge of
the probability distribution P0. When the probability distribution P0 is not known,2.5. Steganography and Steganalysis in Digital Images 37
the authors study the asymptotically optimal detector (as the number of pixels
N → ∞) according to Hoeffding’s test [108]. When the probability distribution
P0 is known in advance, an optimal detector is given in the sense of NeymanPearson
[20, Theorem 3.2.1]. Although the statistical detector proposed in [107]
is interesting from theoretical point of view, its performance in practice is quite
moderate due to the fact that the cover model used in [107] is not sufficiently
accurate to describe a natural image. The assumption of independence between
pixels does not hold since the image structure and the non-stationarity of noises
during image acquisition process are not taken into account.
Some later works [109–114] rely on a simplistic local polynomial model in which
pixel’s expectations are different in order to design a statistical detector, providing
high detection performance compared with structural and WS ones. Far from assuming
that all the pixels are i.i.d as in [107], those works propose to model each
cover-pixel by the Gaussian distribution, ci ∼ N (µi
, σ2
i
), in order to design the
Likelihood Ratio Test (LRT) in which the Likelihood Ratio (LR) Λ can be given by
Λ(Z) ∝
X
i
1
σ
2
i
(zi − zi)(zi − µi). (2.42)
The LRT is the most powerful test in the sense of Neyman-Pearson approach [20,
Theorem 3.2.1] that can meet simultaneously two criteria of optimality: warranting a
prescribed false alarm probability and maximizing the correct detection probability.
Moreover, the specificity in this approach is to show that the WS detector [102–104]
is indeed a variant of the LRT, which justifies the good detection performance of
such ad hoc detector. Besides, hypothesis testing theory has been also extended to
other complex embedding algorithm, e.g. LSB matching [115, 116].
2.5.2.4 Universal Classifiers
Three previous families of detectors are targeted to a specific steganographic algorithm,
namely LSB replacement. In other words, these three families work on an
assumption that steganalysts know in advance the embedding algorithm used by the
steganographer. Such scenario may not be realistic in the practical context. Universal
classifiers are employed by steganalysts to work in a blind manner in order to
discriminate stego-images and cover-images. Even though universal classifiers have
lower performance than specific embedding-targeted detectors, they are still important
because of their flexibility and ability to be adjusted to completely unknown
steganographic methods.
Typically, universal classifiers can be divided into two types: supervised and
unsupervised. Supervised classification [45, 76, 117–120] has been already discussed
in Section 2.3. While supervised classification requires to know in advance the
label of each image (i.e. cover-image or stego-image) and then build a classifier
based on labeled images, unsupervised classification works in a scenario of unlabeled
images and classifies them automatically without user interference. The accuracy of
supervised classifiers is limited if the training data is not perfectly representative of38 Chapter 2. Overview on Digital Image Forensics
cover source, which may result in mismatch problem [121]. Unsupervised classifiers
try to overcome this problem of model mismatch by postponing building a cover
model until the classification stage. However, to the best of our knowledge, there
has not been yet a reliable method dealing with this scenario in steganalysis.
In universal steganalysis, the design of features is of crucial importance. Features
used for classification should be sensitive to changes caused by embedding, yet
insensitive to variations between covers including also some non-steganographic processing
techniques. In general, the choice of suitable features and machine learning
tools remains open problems [121].
2.5.3 Steganalysis of Jsteg Algorithm
Like steganalysis of LSB replacement in spatial domain, existing methods for steganalysis
of Jsteg algorithm can be also divided into four categories. Structural
detectors detect the presence of secret message by employing the symmetry of the
histogram of DCT coefficients in natural images, which is disturbed by the operation
of Jsteg embedding. Some representative structural detectors are Zhang
and Ping (ZP) detector [122], DCT coefficient-based detector [123], and category
attack [124, 125]. Furthermore, the power of structural detectors can be combined
with theoretically well-founded ML principle [99] or the concept of Zero Message Hypothesis
(ZMH) [96]. These two approaches have been formally analyzed in [126].
Similar to structural detectors for steganalysis of LSB replacement technique, the
ZHM framework starts by choosing a feature vector x of the cover-image (e.g. trace
subsets in case of SPA method), establishes the change in the feature vector x due to
embedding algorithm Emb, then inverts embedding effects to provide a hypothetical
feature vector ˆx
ˆx = Emb−1
(x
r
, r), (2.43)
where x
r
is the stego vector and r is the change rate defined as the ratio between
the number of modified DCT coefficients and the maximum number of usable coefficients,
thus r =
R
2
. Using cover assumptions and zero message properties (e.g.
natural symmetry of the histogram of DCT coefficients), an appropriate penalty
function zmh(x) ≥ 0 is defined so that it returns zero on cover features and nonzero
otherwise. Therefore, the change rate estimator rˆ is defined as the solution of
a minimization problem
rˆ = arg min
r≥0
zmh(ˆx) = arg min
r≥0
zmh(Emb−1
(x
r
, r)). (2.44)
The minimization in (2.44) can be performed either analytically or numerically by
implementing a one-dimensional gradient-descent search over r. The main interest
in [126] is that all features proposed in [104,122,124,125] have been revisited within
ZHM framework. The detector proposed in [123] has been also improved in [126]
within ML framework using a more accurate model of DCT coefficients, namely
Generalized Cauchy distribution. It can be noted that although ZMH is only a2.6. Conclusion 39
heuristic framework and less statistically rigorous than ML framework, it has some
important advantages in terms of low computational complexity and flexibility.
Although Jsteg algorithm replaces LSBs by secret message bits in DCT domain,
the mathematical foundation of WS detectors can be also applied for steganalysis
of Jsteg [127, 128]. Given a vector of AC coefficients D = {D1, D2, . . . , DN }, the
WS-like detector is given by
Rb ∝
X
i
wi(Di − Di)Di
. (2.45)
The difference between the WS detector in (2.36) and the one in (2.45) is that
the local predictor for cover AC coefficients is omitted since the expected value of
AC coefficients is zero in natural images. The weigh wi for each coefficient Di
is
estimated by taking the coefficients at the same location as Di but in four adjacent
blocks. More details were provided in [128].
The hypothesis testing theory was also applied to the steganalysis of Jsteg algorithm.
By relying the Laplacian model of DCT coefficients, a statistical test was
designed in [129]. However, a considerable loss of power was revealed due to the fact
that the Laplacian model is not accurate enough to characterize DCT coefficients.
2.6 Conclusion
This chapter discusses the emerging field of digital image forensics consisting of two
main problems: image origin identification and image forgery detection. To address
these problems, active forensic approach has been proposed by generating extrinsically
fingerprints and adding them into the digital image in the image formation
process, thus creates a trustworthy digital camera. However, active approach is of
limited application due to many strict contraints in its protocols. Therefore, passive
forensic approach has been considerably evolved to help solve these problems in their
entirety. This approach relies on intrinsic traces left by the digital cameras in the
image processing pipeline and by the manipulations themselves to gather forensic
evidence of image origin or forgery. Some intrinsic fingerprints for identification of
image source such as lens aberration, PRNU, CFA pattern and interpolation, and
JPEG compression are reviewed. The task of steganalysis that aims to detect the
mere presence of a secret message in a digital image is also discussed in this chapter.
The state of the art has shown that most of existing methods have been designed
within classification framework. Hypothesis testing framework is of limited
exploitation although this framework offers many advantages, namely that the statistical
performance of detectors can be analytically established and a prescribed
false alarm probability can be guaranteed. Besides, existing methods are designed
using simplistic image models, which results in overall poor detection performance.
This thesis focuses on applying the hypothesis testing theory in digital image forensics
based on an accurate image model, which is established by modeling the main
steps in the image processing pipeline. These aspects will be discussed in the rest
of the thesis.Chapter 3
Overview on Statistical Modeling
of Natural Images
Contents
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2 Spatial-Domain Image Model . . . . . . . . . . . . . . . . . . 41
3.2.1 Poisson-Gaussian and Heteroscedastic Noise Model . . . . . . 42
3.2.2 Non-Linear Signal-Dependent Noise Model . . . . . . . . . . 44
3.3 DCT Coefficient Model . . . . . . . . . . . . . . . . . . . . . . 45
3.3.1 First-Order Statistics of DCT Coefficients . . . . . . . . . . . 45
3.3.2 Higher-Order Statistics of DCT Coefficients . . . . . . . . . . 46
3.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.1 Introduction
The application of hypothesis testing theory in digital image forensics requires an accurate
statistical image model to achieve high detection performance. For instance,
the PRNU-based image origin identification [30,32] takes into account various noise
sources during image acquisition inside a digital camera, which provides an image
model allowing to accurately extract the fingerprint for source identification. An
inaccurate image model will result in a poor detection performance, e.g. in case
of statistical detectors [107, 129]. Therefore in this chapter, the state of the art on
statistical modeling of natural images is reviewed. The statistical image modeling
can be performed either in spatial domain or DCT domain.
The chapter is organized as follows. Section 3.2 analyzes noise statistics in
spatial domain and presents some dominant image models widely used in image
processing. Section 3.3 discusses empirical statistical models of DCT coefficients.
Finally, Section 3.4 concludes the chapter.
3.2 Spatial-Domain Image Model
In this section, we adopt the representation of an arbitrary image Z as a column
vector of length N = Nr × Nc. The representation as a two-dimensional matrix is of42 Chapter 3. Overview on Statistical Modeling of Natural Images
no interest in the study of statistical noise properties. The index of color channel is
omitted for simplicity. Due to the stochastic nature of noise, a pixel is regarded as
a random variable. Generally, the random variable zi
, i ∈ I, can be decomposed as
zi = µzi + ηzi
, (3.1)
where I = {1, . . . , N} denotes the set of pixel indices, µzi denotes the expectation
of the pixel zi
in the absence of noise, and ηzi
accounts for all noise sources that
interfere with the original signal. By convention, µX and σ
2
X denote respectively
the expectation and variance of a random variable X. Here, the expectation µzi
is
considered deterministic and will not be modeled. However, the expectations differ
from each other due to heterogeneity in a natural image. From (3.1), it is easily
seen that the variance of noise ηzi
is equal to the variance of pixel zi
, i.e. σ
2
zi = σ
2
ηzi
.
Some models have been proposed in the literature for the noise ηzi
in an uncompressed
image. They can be classified into two groups: signal-independent
and signal-dependent noise models. While signal-independent noise models assume
the stationarity of noise in the whole image, regardless original pixel intensity,
signal-dependent noise models take into account the proportional dependence of
noise variance on the original pixel intensity. A typical example for the group of
signal-independent noise is the Additive White Gaussian Noise (AWGN). Besides,
signal-dependent noise includes Poisson noise or film-grain noise [130], PoissonGaussian
noise [131, 132], heteroscedastic noise model [133, 134], and non-linear
noise model [135]. Although the AWGN model is widely adopted in image processing
because of its simplicity, it ignores the contribution of Poisson noise to the
image acquisition chain, which is the case of an image acquired by a digital camera.
Noise sources in a natural image are inherently signal-dependent. Therefore,
a signal-dependent noise model is more expected to be employed in further applications.
Since our works mainly focus on signal-dependent noise, only the group of
signal-dependent noise models are discussed in this section.
3.2.1 Poisson-Gaussian and Heteroscedastic Noise Model
The study of noise statistics requires to take into account the impact of Poisson
noise related to the stochastic nature of photon-counting process and dark current
[131–134, 136]. Let ξi denote the number of collected electrons with respect to the
pixel zi
. The number of collected electrons ξi follows the Poisson distribution with
mean λi and variance λi
ξi ∼ P(λi). (3.2)
This Poisson noise results in the dependence of noise variance on original pixel
intensity. The number of collected electrons is further degraded by the AWGN
read-out noise ηr with variance ω
2
. Therefore, the RAW image pixel recorded by
the image sensor can be defined as [136]
zi = a ·
ξi + ηr
, (3.3)3.2. Spatial-Domain Image Model 43
where a is the analog gain controlled by the ISO sensitivity. This leads to the
statistical distribution of the RAW pixel zi
zi ∼ a ·
h
P(λi) + N (0, ω2
)
i
. (3.4)
This model is referred to as Poisson-Gaussian noise model [131,132]. One interesting
property of this model is the linear relation of pixel’s expectation and variance.
Taking mathematical expectation and variance from (3.4), we obtain
µzi = E[zi
] = a · λi
, (3.5)
σ
2
zi = Var[zi
] = a
2
· (λi + ω
2
), (3.6)
where E[X] and Var[X] denote respectively the mathematical expectation and variance
with respect to a random variable X. Consequently, the heteroscedastic relation
is derived as
σ
2
zi = a · µzi + b, (3.7)
where b = a
2ω
2
.
In some image sensors, the collected electrons ξi may be added by a base pedestal
parameter p0 to constitute an offset-from-zero of the output pixel [133]
zi ∼ a ·
h
p0 + P(λi − p0) + N (0, ω2
)
i
. (3.8)
Hence, the parameter b is now given by b = a
2ω
2 − a
2p0. Therefore, the parameter
b can be negative when p0 > ω2
.
To facilitate the application of this signal-dependent noise model, some works
[133, 134] have attempted to approximate the Poisson distribution by the Gaussian
distribution in virtue of a large number of collected electrons
P(λi) ≈ N (λi
, λi). (3.9)
In fact, for λi ≥ 50, the Gaussian approximation is already very accurate [133]
while full-well capacity is largely above 100000 electrons. Finally, the statistical
distribution of the RAW pixel zi can be approximated as
zi ∼ N
µzi
, a · µzi + b
. (3.10)
This model is referred to as heteroscedastic noise model in [134]. The term "heteroscedasticity"
means that each pixel exposes a different variability with the other.
Both Poisson-Gaussian and heteroscedastic noise models are more accurate to
characterize a RAW image than the conventional AWGN, but they do not take
into account yet non-linear post-acquisition operations. Therefore, they are not
appropriate for modeling a TIFF or JPEG image. Besides, it should be noted
that the Poisson-Gaussian and heteroscedastic noise model assume that the effect
of PRNU is negligible, namely that all the pixels respond to the incident light
uniformly. The very small variation in pixel’s response does not strongly affect its
statistical distribution [136].44 Chapter 3. Overview on Statistical Modeling of Natural Images
3.2.2 Non-Linear Signal-Dependent Noise Model
To establish a statistical model of a natural image in TIFF or JPEG format, it is
necessary to take into account effects of post-acquisition operations in the image
processing pipeline. However, as discussed in Section 2.2, the whole image processing
pipeline is not as simple. Some processing steps that are implemented in
a digital camera are difficult to model parametrically. One approach is to consider
the digital camera as a black box in which we attempt to establish a relation
between input irradiance and output intensity. This relation is called Camera Response
Function (CRF), which is described by a sophisticated non-linear function
fCRF(·) [137]. Gamma correction might be the simplest model for the CRF with
only one parameter. Other parametric models have been proposed for CRF such as
polynomial model [137] or generalized gamma curve model [138].
Therefore, the pixel zi can be formally defined as [135, 139]
zi = fCRF
Ei + ηEi
, (3.11)
where Ei denotes the image irradiance and ηEi
accounts for all signal-independent
and signal-dependent noise sources. We can note that although some methodologies
have been proposed for estimation of CRF [50, 137, 140], it is also difficult to study
noise statistics with those sophisticated models.
To facilitate the study of noise statistics, the authors in [135] exploit the first
order of Taylor’s series expansion
zi = fCRF
Ei + ηEi
≈ fCRF
Ei
+ f
0
CRF
Ei
ηEi
, (3.12)
where f
0
CRF denotes the first derivative of the CRF fCRF. Therefore, a relation
between noises before and after transformation by the CRF is obtained
ηzi = f
0
CRF
Ei
ηEi
. (3.13)
It can be noted that even when noise before transformation is independent of the
signal, the non-linear transformation fCRF generates a dependence between pixel’s
expectation and variance.
Based on experimental observations, the authors in [135] obtain a non-linear
parametric model
zi = µzi + µ
γ˜
zi
· ηu, (3.14)
where ηu is zero-mean stationary Gaussian noise, ηu ∼ N (0, σ2
ηu
), and γ˜ is an
exponential parameter to account for the non-linearity of the camera response. Here,
taking variance on the both sides of (3.14), we obtain
σ
2
zi = µ
2˜γ
zi
· Var[ηu] = µ
2˜γ
zi
· σ
2
ηu
. (3.15)
In this model, the pixel zi still follows the Gaussian distribution and the noise
variance σ
2
ηzi
is non-linearly dependent on the original pixel intensity µzi
zi ∼ N
µzi
, µ2˜γ
zi
· σ
2
ηu
. (3.16)
This model allows to represent several kinds of noise such as film-grain, Poisson
noise by changing the parameters γ˜ and σ
2
ηu
(e.g γ˜ = 0.5).3.3. DCT Coefficient Model 45
3.3 DCT Coefficient Model
3.3.1 First-Order Statistics of DCT Coefficients
Apart from modeling an image in the spatial domain, many researches attempt to
model it in the DCT domain since the DCT is a fundamental operation in JPEG
compression. The model of DCT coefficients has been considerably studied in the
literature. However, a majority of DCT coefficient models has just been proposed
without giving any mathematical foundation and analysis. Many researches focus
on comparing the empirical data with a variety of popular statistical models by
conducting the goodness-of-fit (GOF) test, e.g. the Kolmogorov-Smirnov (KS) or χ
2
test. Firstly, the Gaussian model for the DCT coefficients was conjectured in [141].
The Laplacian model was verified in [142] by performing the KS test. This Laplacian
model remains a dominant choice in image processing because of its simplicity and
relative accuracy. Other possible models such as Gaussian mixture [143] and Cauchy
[144] were also proposed. In order to model the DCT coefficients more accurately, the
previous models were extended to the generalized versions including the Generalized
Gaussian (GG) [145] and the Generalized Gamma (GΓ) [146] models. It has been
recently reported in [146] that the GΓ model outperforms the Laplacian and GG
model. Far from giving a mathematical foundation of DCT coefficient model, these
empirical models were only verified using GOF test on a few standard images. Thus,
they can not guarantee the accuracy of the chosen model to a wide range of images,
which leads to a lack of robustness.
The first mathematical analysis for DCT coefficients is given in [147]. It relies
on a doubly stochastic model combining DCT coefficient statistics in a block
whose variance is constant with the variability of block variance in a natural image.
However, this analysis is incomplete due to the lack of mathematical justification
for the block variance model. Nevertheless, it has shown an interest for further
improvements. Therefore, here we provide a discussion about this mathematical
foundation.
Let I denote AC coefficient and σ
2
blk denote block variance. The DC coefficient
is not addressed in this work [147]. The index of frequency is omitted for the sake
of clarity. Using the conditional probability, the doubly stochastic model is given
by
fI (x) = Z ∞
0
fI|σ
2
blk
(x|t)fσ
2
blk
(t)dt x ∈ R, (3.17)
where fX(x) denotes the probability density function (pdf) of a random variable
X. This doubly stochastic model can be considered as infinite mixture of Gaussian
distributions [148, 149]. From the establishment of DCT coefficients in (2.11), it is
noted that each DCT coefficient is a weighted sum of random variables. If the block
variance σ
2
blk is constant, the AC coefficient I can be approximated as a zero-mean
Gaussian random variable based on the Central Limit Theorem (CLT)
fI|σ
2
blk
(x|t) = 1
√
2πt
exp
−
x
2
2t
. (3.18)46 Chapter 3. Overview on Statistical Modeling of Natural Images
Even though the pixels are spatially correlated in a 8 × 8 block due to demosaicing
algorithms implemented in a digital camera, the CLT can still be used for Gaussian
approximation of a sum of correlated random variables [150]. It remains to find the
pdf of σ
2
blk to derive the final pdf of the AC coefficient I. To this end, it was reported
in [147] that from experimental observations, the block variance σ
2
blk can be modeled
by exponential or half-Gaussian distribution. These two distributions can lead to
the Laplacian distribution for the DCT coefficient I [147]. However, as stated above,
due to the fact that the pdf of block variance σ
2
blk is not mathematically justified,
this mathematical framework is incomplete.
3.3.2 Higher-Order Statistics of DCT Coefficients
The above discussion only considers the first-order statistics (i.e. histogram) of
DCT coefficients. The DCT coefficients at the same frequency are collected and
treated separately. An implicite assumption adopted in this procedure is that the
DCT coefficients at the same frequency are i.i.d realizations of a random variable.
However, this is not always true in a natural image because DCT coefficients exhibit
dependencies (or correlation) between them. There are two fundamental kinds of
correlation between DCT coefficients [151], which have been successfully exploited
in some applications [126, 151, 152]
1. intra-block correlation: A well-known feature of DCT coefficients in a natural
image is that the magnitudes of AC coefficients decrease as the frequency
increases along the zig-zag order. This correlation reflects the dependence
between DCT coefficients within a same 8×8 block. Typically, this correlation
is weak since coefficients at different frequencies correspond to different basis
functions.
2. inter-block correlation: Although the DCT base can provide a good decorrelation,
resulting coefficients are still correlated slightly with their neighbors at
the same frequency. We refer this kind of correlation as inter-block correlation.
In general, the correlation between DCT coefficients could be captured by adjacency
matrix [126].
3.4 Conclusion
This chapter reviews some statistical image models in spatial domain and DCT domain.
In spatial domain, two groups of signal-independent and signal-dependent
noise models are discussed. From above statistical analysis, we can draw an important
insight: noise in natural images is inherently signal-dependent. In DCT
domain, some empirical models of DCT coefficient are presented. However, most
of DCT coefficient models are given without mathematical justification. It is still
necessary to establish an accurate image model that can be exploited in further
applications.Part II
Statistical Modeling and
Estimation for Natural Images
from RAW Format to JPEG
FormatChapter 4
Statistical Image Modeling and
Estimation of Model Parameters
Contents
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.2 Statistical Modeling of RAW Images . . . . . . . . . . . . . . 50
4.2.1 Heteroscedastic Noise Model . . . . . . . . . . . . . . . . . . 50
4.2.2 Estimation of Parameters (a, b) in the Heteroscedastic Noise
Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.2.2.1 WLS Estimation . . . . . . . . . . . . . . . . . . . . 53
4.2.2.2 Statistical Properties of WLS Estimates . . . . . . . 54
4.3 Statistical Modeling of TIFF Images . . . . . . . . . . . . . . 57
4.3.1 Generalized Noise Model . . . . . . . . . . . . . . . . . . . . . 57
4.3.2 Estimation of Parameters (˜a, ˜b) in the Generalized Noise Model 59
4.3.2.1 Edge Detection and Image Segmentation . . . . . . 59
4.3.2.2 Maximum Likelihood Estimation . . . . . . . . . . . 60
4.3.3 Application to Image Denoising . . . . . . . . . . . . . . . . . 61
4.3.4 Numerical Experiments . . . . . . . . . . . . . . . . . . . . . 62
4.4 Statistical Modeling in DCT Domain . . . . . . . . . . . . . 65
4.4.1 Statistical Model of Quantized DCT Coefficients . . . . . . . 65
4.4.1.1 Statistical Model of Block Variance and Unquantized
DCT Coefficients . . . . . . . . . . . . . . . . . . . . 65
4.4.1.2 Impact of Quantization . . . . . . . . . . . . . . . . 68
4.4.2 Estimation of Parameters (α, β) from Unquantized DCT Coefficients
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.4.3 Estimation of Parameters (α, β) from Quantized DCT Coeffi-
cients . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.4.4 Numerical Experiments . . . . . . . . . . . . . . . . . . . . . 71
4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7350
Chapter 4. Statistical Image Modeling and Estimation of Model
Parameters
4.1 Introduction
Chapter 3 has presented an overview on statistical modeling of natural images in
spatial domain and DCT domain. Most of existing models in the literature were
provided empirically. The goal of this chapter is to establish a mathematical framework
of studying statistical properties of natural images along image processing
pipeline of a digital camera. The study is performed in spatial domain and DCT
domain. In the spatial domain, the heteroscedastic noise model is firstly recalled,
and a method for estimating the parameters of the heteroscedastic noise model following
the Weighted Least Square (WLS) approach is proposed in Section 4.2. The
analytic establishment of WLS estimates allows us to study their statistical properties,
which is of importance for designing statistical tests. The WLS estimation of
parameters (a, b) has been presented in [134].
Next, Section 4.3 presents the study of noise statistics in a TIFF image by
starting from the heteroscedastic noise model and take into account the effect of
gamma correction, resulting in the generalized signal-dependent noise model. It is
shown that the generalized noise model is also relevent to characterize JPEG images
with moderate-to-high quality factors (Q ≥ 70). This section also proposes a method
that can estimate the parameters of the generalized noise model accurately from a
single image. Numerical results on a large image database show the relevance of the
proposed method. The generalized noise model could be useful in many applications.
A direct application for image denoising is proposed in this section. The foundation
of generalized noise model and estimation of model parameters have been presented
in [153].
Section 4.4 describes the mathematical framework of modeling the statistical
distribution of DCT coefficients. To simplify the study, the approach is based on
the main assumption that the pixels are identically distributed (not necessarily independent)
within a 8 × 8 block. Consequently, the statistical distribution of block
variance can be approximated, thus the model of unquantized DCT coefficients is
provided. Moreover, it is proposed to take into account the quantization operation
to provide a final model of quantized DCT coefficients. The parameters of DCT
coefficient model can be estimated following the ML approach. Numerical results
show that the proposed model outperforms other existing models including Laplacian,
GG, and GΓ model. Section 4.5 concludes the chapter. The foundation of
DCT coefficient model has been presented in [154].
4.2 Statistical Modeling of RAW Images
4.2.1 Heteroscedastic Noise Model
The RAW image acquisition has been discussed in Section 2.2.1. Let Z = (zi)i∈I
denote a RAW image acquired by the image sensor. Typically, the model of RAW
pixel consists of a Poissonian part that addresses the photon shot noise and dark
current and a Gaussian part for the remaining stationary disturbances, e.g. read-4.2. Statistical Modeling of RAW Images 51
estimated expectation: µˆk
estimated variance: ˆσ
2
k
0 0.05 0.1 0.15 0.2 0.25 0
0.4
0.8
1.2
1.6
2
×10−5
Nikon D70: Estimated data
Nikon D70: Fitted data
Nikon D200: Estimated data
Nikon D200: Fitted data
Figure 4.1: Scatter-plot of pixels’ expectation and variance from a natural RAW
image with ISO 200 captured by Nikon D70 and Nikon D200 cameras. The image
is segmented into homogeneous segments. In each segment, the expectation and
variance are calculated and the parameters (a, b) are estimated as proposed in Section
4.2.2. The dash line is drawn using the estimated parameters (a, b). Only the
red channel is used in this experiment.
out noise. For the sake of simplification, the Gaussian approximation of the Poisson
distribution can be exploited because of a large number of collected electrons, which
leads to the heteroscedastic noise model [133, 134]
zi ∼ N
µi
, aµi + b
, (4.1)
where µi denotes the expectation of the pixel zi
. The heteroscedastic noise model,
which gives the noise variance as a linear function of pixel’s expectation, characterizes
a RAW image more accurately than the conventional AWGN model. The
heteroscedastic noise model (4.1) is illustrated in Figure 4.1. It is assumed that the
noise corrupting each RAW pixel is statistically independent of those of neighbor
pixels [133, 136]. In this section it is assumed that the phenomenon of clipping is
absent from a natural RAW image for the sake of simplification, i.e. the probability
that one observation zi exceeds over the boundary 0 or B = 2ν−1 is negligible. More
details about the phenomenon of clipping are given in [133, 155] and in Chapter 8.
In practice, the PRNU weakly affects the parameter a in the heteroscedastic
noise model (4.1). Nevertheless, in the problem of camera model identification, the
PRNU is assumed to be negligible, i.e. the parameter a remains constant for every
pixel.52
Chapter 4. Statistical Image Modeling and Estimation of Model
Parameters
4.2.2 Estimation of Parameters (a, b) in the Heteroscedastic Noise
Model
Estimation of noise model parameters can be performed from a single image or
multiple images. From a practical point of view, we mainly focus on noise model
parameter estimation from a single image. Several methods have been proposed
in the literature for estimation of signal-dependent noise model parameters, see
[133–135, 139, 156]. They rely on similar basic steps but differ in details. The
common methodology starts from obtaining local estimates of noise variance and
image content, then performing the curve fitting to the scatter-plot based on the
prior knowledge of noise model. The existing methods involve two main difficulties:
influence of image content and spatial correlation of noise in a natural image. In
fact, homogeneous regions where local expectations and variances are estimated
are obtained by performing edge detection and image segmentation. However, the
accuracy of those local estimates may be contaminated due to the presence of outliers
(textures, details and edges) in the homogeneous regions. Moreover, because of
the spatial correlation between pixels, the local estimates of noise variance can be
overestimated. Overall, the two difficulties may result in inaccurate estimation of
noise parameters.
For the design of subsequent tests, the parameters (a, b) should be estimated
following the ML approach and statistical properties of ML estimates should be
analytically established. One interesting method is proposed in [133] for ML estimation
of parameters (a, b). However, that method can not provide an analytic
expression of ML estimates due to the difficulty of resolving the complicated system
of partial derivatives. Therefore, ML estimates are only numerically solved by
using the Nelder-Mead optimization method [157]. Although ML estimates given
by that method are relatively accurate, they involve three main drawbacks. First,
the convergence of the maximization process and the sensitivity of the solution to
initial conditions have not been analyzed yet. Second, the Bayesian approach used
in [133] with a fixed uniform distribution might be doubtful in practice. Finally, it
seems impossible to establish statistical properties of the estimates.
This section proposes a method for estimation of parameters (a, b) from a single
image. The proposed method relies on the same technique of image segmentation
used in [133] in order to obtain local estimates in homogeneous regions. Subsequently,
the proposed method is based on the WLS approach to take into account
heteroscedasticity and statistical properties of local estimates. One important advantage
is that WLS estimates can be analytically provided, which allows us to
study statistical properties of WLS estimates. Moreover, the WLS estimates are
asymptotically equivalent to the ML estimates in large samples when the weights
are consistently estimated, as explained in [158, 159].4.2. Statistical Modeling of RAW Images 53
4.2.2.1 WLS Estimation
The RAW image Z is first transformed into the wavelet domain and then segmented
into K non-overlapping homogeneous segments, denoted Sk, of size nk,
k ∈ {1, . . . , K}. The readers are referred to [133] for more details of segmentation
technique. In each segment Sk, pixels are assumed to be i.i.d, thus they
have the same expectation and variance. Let z
wapp
k = (z
wapp
k,i )i∈{1,...,nk} and
z
wdet
k = (z
wdet
k,i )i∈{1,...,nk} be respectively the vector of wavelet approximation coefficients
and wavelet detail coefficients representing the segment Sk. Because the
transformation is linear, the coefficients z
wapp
k,i and z
wdet
k,i also follow the Gaussian
distribution
z
wapp
k,i ∼ N
µk, kϕk
2
2 σ
2
k
, (4.2)
z
wdet
k,i ∼ N
0, σ2
k
, (4.3)
where µk denotes expectation of all pixels in the segment Sk, σ
2
k = aµk + b, and ϕ
is the 2-D normalized wavelet scaling function. Hence, the ML estimates of local
expectation µk and local variance σ
2
k
are given by
µˆk =
1
nk
Xnk
i=1
z
wapp
k,i , (4.4)
σˆ
2
k =
1
nk − 1
Xnk
i=1
z
wdet
k,i − z
wdet
k
2
, with z
wdet
k =
1
nk
Xnk
i=1
z
wdet
k,i . (4.5)
The estimate µˆk is unbiased and follows the Gaussian distribution
µˆk ∼ N
µk,
kϕk
2
2
nk
σ
2
k
, (4.6)
while the estimate σˆ
2
k
follows a scaled chi-square distribution with nk − 1 degrees
of freedom. This distribution can also be accurately approximated as the Gaussian
distribution for large nk [160]:
σˆ
2
k ∼ N
σ
2
k
,
2
nk − 1
σ
4
k
, (4.7)
Figure 4.1 illustrates a scatter-plot of all the pairs {(ˆµk, σˆ
2
k
)} extracted from real
natural RAW images of Nikon D70 and Nikon D200 cameras.
The parameters (a, b) are estimated by considering all the pairs {(ˆµk, σˆ
2
k
)}
K
k=1
where the local variance σˆ
2
k
is treated as a heteroscedastic model of the local expectation
µˆk. This model is formulated as follows
σˆ
2
k = aµˆk + b + skk, (4.8)
where k are independent and identically distributed as standard Gaussian variable
and sk is a function of local mean µk. A direct calculation from (4.8) shows that
s
2
k = Var
σˆ
2
k
− Var
aµˆk + b
=
2
nk − 1
σ
4
k − a
2
kϕk
2
2
nk
σ
2
k =
2
nk − 1
(aµk + b)
2 − a
2
kϕk
2
2
nk
(aµk + b). (4.9)
Inférence d’invariants pour le model checking de
systèmes paramétrés
Alain Mebsout
To cite this version:
Alain Mebsout. Inf´erence d’invariants pour le model checking de syst`emes param´etr´es. Other.
Universit´e Paris Sud - Paris XI, 2014. French. .
HAL Id: tel-01073980
https://tel.archives-ouvertes.fr/tel-01073980
Submitted on 11 Oct 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific
research documents, whether they are published
or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.Université Paris-Sud
École Doctorale d’Informatiqe
Laboratoire de Recherche en Informatiqe
Discipline : Informatiqe
Thèse de doctorat
soutenue le 29 septembre 2014
par
Alain Mebsout
Inférence d’Invariants pour le Model
Checking de Systèmes Paramétrés
Directeur de thèse : M. Sylvain Conchon Professeur (Université Paris-Sud)
Co-encadrante : Mme Fatiha Zaïdi Maître de conférences (Université Paris-Sud)
Composition du jury :
Président du jury : M. Philippe Dague Professeur (Université Paris-Sud)
Rapporteurs : M. Ahmed Bouajjani Professeur (Université Paris Diderot)
M. Silvio Ranise Chercheur (Fondazione Bruno Kessler)
Examinateurs : M. Rémi Delmas Ingénieur de recherche (ONERA)
M. Alan Schmitt Chargé de recherche (Inria Rennes)À Magali.Résumé
Cette thèse aborde le problème de la vérication automatique de systèmes paramétrés
complexes. Cette approche est importante car elle permet de garantir certaines propriétés
sans connaître a priori le nombre de composants du système. On s’intéresse en particulier
à la sûreté de ces systèmes et on traite le côté paramétré du problème avec des méthodes
symboliques. Ces travaux s’inscrivent dans le cadre théorique du model checking modulo
théories et ont donné lieu à un nouveau model checker : Cubicle.
Une des contributions principale de cette thèse est une nouvelle technique pour inférer
des invariants de manière automatique. Le processus de génération d’invariants est intégré
à l’algorithme de model checking et permet de vérier en pratique des systèmes hors de
portée des approches symboliques traditionnelles. Une des applications principales de cet
algorithme est l’analyse de sûreté paramétrée de protocoles de cohérence de cache de taille
industrielle.
Enn, pour répondre au problème de la conance placée dans le model checker, on
présente deux techniques de certication de notre outil Cubicle utilisant la plate-forme
Why3. La première consiste à générer des certicats dont la validité est évaluée de manière
indépendante tandis que la seconde est une approche par vérication déductive du cœur
de Cubicle.
Abstract
This thesis tackles the problem of automatically verifying complex parameterized systems.
This approach is important because it can guarantee that some properties hold
without knowing a priori the number of components in the system. We focus in particular
on the safety of such systems and we handle the parameterized aspect with symbolic
methods. This work is set in the theoretical framework of the model checking modulo
theories and resulted in a new model checker: Cubicle.
One of the main contribution of this thesis is a novel technique for automatically inferring
invariants. The process of invariant generation is integrated with the model checking
algorithm and allows the verication in practice of systems which are out of reach for
traditional symbolic approaches. One successful application of this algorithm is the safety
analysis of industrial size parameterized cache coherence protocols.
Finally, to address the problem of trusting the answer given by the model checker, we
present two techniques for certifying our tool Cubicle based on the framework Why3. The
rst consists in producing certicates whose validity can be assessed independently while
the second is an approach by deductive verication of the heart of Cubicle.
vRemerciements
Mes remerciements vont en tout premier lieu à mes encadrants de thèse, qui m’ont accompagné
tout au long de ces années. Ils ont su orienter mes recherches tout en m’accordant
une liberté et une autonomie très appréciables. Les discussions aussi bien professionnelles
que personnelles ont été très enrichissantes et leur bonne humeur a contribué à faire de ces
trois (et cinq) années un plaisir. Merci à Fatiha pour sa disponibilité et son soutien. Je tiens
particulièrement à remercier Sylvain d’avoir cru en moi et pour son optimisme constant. Il
m’apparaît aujourd’hui que cette dernière qualité est essentielle à tout bon chercheur et
j’espère en avoir tiré les enseignements.
Merci également à mes rapporteurs, Ahmed Bouajjani et Silvio Ranise, d’avoir accepté
de relire une version préliminaire de ce document et pour leurs corrections et remarques
pertinentes. Je remercie aussi les autres examinateurs, Philippe Dague, Rémi Delmas et
Alan Schmitt, d’avoir accepté de faire partie de mon jury.
Le bon déroulement de cette thèse doit aussi beaucoup aux membres de l’équipe VALS
(anciennement Proval puis Toccata). Ils ont su maintenir une ambiance chaleureuse et
amicale tout au long des divers changements de noms, déménagements et remaniements
politiques. Les galettes des rois, les gâteaux, les paris footballistiques, et les discussions
du coin café resteront sans aucun doute gravés dans ma mémoire. Pour tout cela je les en
remercie.
Je tiens à remercier tout particulièrement Mohamed pour avoir partagé un bureau avec
moi pendant près de cinq années. J’espère avoir été un aussi bon co-bureau qu’il l’a été, en
tout cas les collaborations et les discussions autour d’Alt-Ergo furent très fructueuses. Merci
également à Régine pour son aide dans la vie de doctorant d’un laboratoire de recherche et
pour sa capacité à transformer la plus intimidante des procédures administratives en une
simple tâche.
Merci à Jean-Christophe, Guillaume, François, Andrei, Évelyne et Romain pour leurs
nombreux conseils et aides techniques. Merci aussi à Sava Krstic et Amit Goel d’Intel pour `
leur coopération scientique autour de Cubicle.
Enn un grand merci à toute ma famille pour leur soutien moral tout au long de ma
thèse. Je souhaite remercier en particulier mes parents qui ont cru en moi et m’ont soutenu
dans mes choix. Merci également à mes sœurs pour leurs nombreux encouragements. Pour
nir je tiens à remercier ma moitié, Magali, pour son soutien sans faille et pour son aide.
Rien de ceci n’aurait été possible dans elle.
viiTable des matières
Table des matières 1
Table des figures 5
Liste des Algorithmes 7
1 Introduction 9
1.1 Model checking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.1.1 Systèmes nis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.2 Systèmes innis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2 Model checking de systèmes paramétrés . . . . . . . . . . . . . . . . . . . 14
1.2.1 Méthodes incomplètes . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.2 Fragments décidables . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3 Contributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4 Plan de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2 Le model checker Cubicle 19
2.1 Langage d’entrée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1 Algorithme d’exclusion mutuelle . . . . . . . . . . . . . . . . . . . 23
2.2.2 Généralisation de l’algorithme de Dekker . . . . . . . . . . . . . . 25
2.2.3 Boulangerie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.4 Cohérence de Cache . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 Non-atomicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4 Logique multi-sortée et systèmes à tableaux . . . . . . . . . . . . . . . . . 36
2.4.1 Syntaxe des formules logiques . . . . . . . . . . . . . . . . . . . . . 37
2.4.2 Sémantique de la logique . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4.3 Systèmes de transition à tableaux . . . . . . . . . . . . . . . . . . . 41
2.5 Sémantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.5.1 Sémantique opérationnelle . . . . . . . . . . . . . . . . . . . . . . . 44
2.5.2 Atteignabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.5.3 Un interpréteur de systèmes à tableaux . . . . . . . . . . . . . . . . 47
1TABLE DES MATIÈRES
3 Cadre théorique : model checking modulo théories 49
3.1 Analyse de sûreté des systèmes à tableaux . . . . . . . . . . . . . . . . . . 50
3.1.1 Atteignabilité par chaînage arrière . . . . . . . . . . . . . . . . . . 50
3.1.2 Correction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.1.3 Eectivité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.2 Terminaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2.1 Indécidabilité de l’atteignabilité . . . . . . . . . . . . . . . . . . . . 57
3.2.2 Conditions pour la terminaison . . . . . . . . . . . . . . . . . . . . 59
3.2.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.3 Gardes universelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.3.1 Travaux connexes . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.3.2 Calcul de pré-image approximé . . . . . . . . . . . . . . . . . . . . 69
3.3.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3.4 Relation avec le modèle de panne franche et la relativisation des
quanticateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.4.1 Exemples sans existence d’un bel ordre . . . . . . . . . . . . . . . . 74
3.4.2 Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.4.3 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4 Optimisations et implémentation 79
4.1 Architecture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.2 Optimisations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.2.1 Appels au solveur SMT . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.2.2 Tests ensemblistes . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.2.3 Instantiation ecace . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.3 Suppressions a posteriori . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.4 Sous-typage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.5 Exploration parallèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.6 Résultats et conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5 Inférence d’invariants 105
5.1 Atteignabilité approximée avec retour en arrière . . . . . . . . . . . . . . . 107
5.1.1 Illustration sur un exemple . . . . . . . . . . . . . . . . . . . . . . 107
5.1.2 Algorithme abstrait . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
5.1.3 Algorithme complet pour les systèmes à tableaux . . . . . . . . . . 113
5.2 Heuristiques et détails d’implémentation . . . . . . . . . . . . . . . . . . . 117
5.2.1 Oracle : exploration avant bornée . . . . . . . . . . . . . . . . . . . 117
5.2.2 Extraction des candidats invariants . . . . . . . . . . . . . . . . . . 119
5.2.3 Retour en arrière . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
2TABLE DES MATIÈRES
5.2.4 Invariants numériques . . . . . . . . . . . . . . . . . . . . . . . . . 123
5.2.5 Implémentation dans Cubicle . . . . . . . . . . . . . . . . . . . . . 124
5.3 Évaluation expérimentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.4 Étude de cas : Le protocole FLASH . . . . . . . . . . . . . . . . . . . . . . . 130
5.4.1 Description du protocole FLASH . . . . . . . . . . . . . . . . . . . 131
5.4.2 Vérication du FLASH : État de l’art . . . . . . . . . . . . . . . . . 133
5.4.3 Modélisation dans Cubicle . . . . . . . . . . . . . . . . . . . . . . . 135
5.4.4 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
5.5 Travaux connexes sur les invariants . . . . . . . . . . . . . . . . . . . . . . 139
5.5.1 Génération d’invariants . . . . . . . . . . . . . . . . . . . . . . . . 139
5.5.2 Cutos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
5.5.3 Abstraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
6 Certification 145
6.1 Techniques de certication d’outils de vérication . . . . . . . . . . . . . . 145
6.2 La plateforme de vérication déductive Why3 . . . . . . . . . . . . . . . . 147
6.3 Production de certicats . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
6.3.1 Invariants inductifs pour l’atteignabilité arrière . . . . . . . . . . . 147
6.3.2 Invariants inductifs et BRAB . . . . . . . . . . . . . . . . . . . . . . 152
6.4 Preuve dans Why3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
6.5 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
7 Conclusion et perspectives 161
7.1 Résumé des contributions et conclusion . . . . . . . . . . . . . . . . . . . . 161
7.2 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
A Syntaxe et typage des programmes Cubicle 165
A.1 Syntaxe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
A.2 Typage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
Bibliographie 173
Index 187
3Table des figures
2.1 Algorithme d’exclusion mutuelle . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2 Code Cubicle du mutex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 Graphe de Dekker pour le processus i . . . . . . . . . . . . . . . . . . . . . 26
2.4 Code Cubicle de l’algorithme de Dekker . . . . . . . . . . . . . . . . . . . . 27
2.5 Code Cubicle de l’algorithme de la boulangerie de Lamport . . . . . . . . . 29
2.6 Diagramme d’état du protocole German-esque . . . . . . . . . . . . . . . . 31
2.7 Code Cubicle du protocole de cohérence de cache German-esque . . . . . . 32
2.8 Évaluation non atomique des conditions globales par un processus i . . . . 34
2.9 Encodage de l’évaluation non atomique de la condition globale ∀j , i. c(j) 35
2.10 Grammaire de la logique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.1 Machine de Minsky à deux compteurs . . . . . . . . . . . . . . . . . . . . 58
3.2 Traduction d’un programme et d’une machine de Minsky dans un système
à tableaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3 Dénition des congurations M et N . . . . . . . . . . . . . . . . . . . . . 61
3.4 Plongement de M vers N . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.5 Séquence nie d’idéaux inclus calculée par l’algorithme 4 . . . . . . . . . . 64
3.6 Trace fallacieuse pour un système avec gardes universelles . . . . . . . . . 71
3.7 Transformation avec modèle de panne franche . . . . . . . . . . . . . . . . 72
3.8 Trace fallacieuse pour la transformation avec modèle de panne franche . . 73
3.9 Relations entre les diérentes approches pour les gardes universelles . . . 74
3.10 Séquence innie de congurations non comparables pour l’encodage des
machines de Minksy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.11 Séquence innie de congurations non comparables pour une relation
binaire quelconque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.12 Diérences de restrictions entre la théorie du model checking modulo
théories et Cubicle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.1 Architecture de Cubicle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.2 Benchmarks et statistiques pour une implémentation naïve . . . . . . . . . 83
4.3 Arbre préxe représentant V . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.4 Benchmarks pour tests ensemblistes . . . . . . . . . . . . . . . . . . . . . . 87
5TABLE DES FIGURES
4.5 Benchmarks pour l’instantiation ecace . . . . . . . . . . . . . . . . . . . 91
4.6 Graphes d’atteignabilité arrière pour diérentes stratégies d’exploration
sur l’exemple Dijkstra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.7 Suppression a posteriori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4.8 Préservation de l’invariant après suppression d’un nœud . . . . . . . . . . 95
4.9 Benchmarks pour la suppression a posteriori . . . . . . . . . . . . . . . . . 95
4.10 Système Cubicle annoté avec les contraintes de sous-typage . . . . . . . . 97
4.11 Benchmarks pour l’analyse de sous-typage . . . . . . . . . . . . . . . . . . 98
4.12 Une mauvaise synchronisation des tests de subsomption eectués en parallèle 100
4.13 Utilisation CPU pour les versions séquentielle et parallèle de Cubicle . . . 101
4.14 Benchmarks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.1 Système de transition à tabeaux du protocole German-esque . . . . . . . . 108
5.2 Exécution partielle de BRAB sur le protocole German-esque . . . . . . . . 110
5.3 Transition sur un état avec variable non-initialisée . . . . . . . . . . . . . . 119
5.4 Apprentissage à partir d’une exploration supplémentaire avant redémarrage 122
5.5 Architecture de Cubicle avec BRAB . . . . . . . . . . . . . . . . . . . . . . 125
5.6 Résultats de BRAB sur un ensemble de benchmarks . . . . . . . . . . . . . 128
5.7 Architecture FLASH d’une machine et d’un nœud . . . . . . . . . . . . . . 130
5.8 Structure d’un message dans le protocole FLASH . . . . . . . . . . . . . . . 132
5.9 Description des transitions du protocole FLASH . . . . . . . . . . . . . . . 134
5.10 Résultats pour la vérication du protocole FLASH avec Cubicle . . . . . . 138
5.11 Protocoles de cohérence de cache hiérarchiques . . . . . . . . . . . . . . . 143
6.1 Invariants inductifs calculés par des analyses d’atteignabilité avant et arrière 148
6.2 Vérication du certicat Why3 de German-esque par diérents prouveurs
automatiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
6.3 Invariant inductif calculé par BRAB . . . . . . . . . . . . . . . . . . . . . . 154
6.4 Vérication par diérents prouveurs automatiques du certicat (Why3) de
German-esque généré par BRAB . . . . . . . . . . . . . . . . . . . . . . . . 154
6.5 Vérication de certicats sur un ensemble de benchmarks . . . . . . . . . 155
6.6 Informations sur le développent Why3 . . . . . . . . . . . . . . . . . . . . 158
6.7 Aperçu d’une technique d’extraction . . . . . . . . . . . . . . . . . . . . . 159
A.1 Grammaire des chiers Cubicle . . . . . . . . . . . . . . . . . . . . . . . . 167
A.2 Règles de typage des termes . . . . . . . . . . . . . . . . . . . . . . . . . . 169
A.3 Règles de typage des formules . . . . . . . . . . . . . . . . . . . . . . . . . 170
A.4 Règles de typage des actions des transitions . . . . . . . . . . . . . . . . . 170
A.5 Vérication de la bonne formation des types . . . . . . . . . . . . . . . . . 171
A.6 Règles de typage des déclarations . . . . . . . . . . . . . . . . . . . . . . . 171
6Liste des Algorithmes
1 Code de Dekker pour le processus i . . . . . . . . . . . . . . . . . . . . . . . 26
2 Pseudo-code de la boulangerie de Lamport pour le processus i . . . . . . . . 29
3 Interpréteur d’un système à tableaux . . . . . . . . . . . . . . . . . . . . . . 47
4 Analyse d’atteignabilité par chaînage arrière . . . . . . . . . . . . . . . . . . 53
5 Test de satisabilité naïf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6 Analyse d’atteignabilité abstraite avec approximations et retour en arrière
(BRAB) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
7 Analyse d’atteignabilité avec approximations et retour en arrière (BRAB) . . 115
8 Oracle : Exploration avant limitée en profondeur . . . . . . . . . . . . . . . 116
71
Introduction
Sommaire
1.1 Model checking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.1.1 Systèmes nis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.2 Systèmes innis . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2 Model checking de systèmes paramétrés . . . . . . . . . . . . . . . 14
1.2.1 Méthodes incomplètes . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.2 Fragments décidables . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3 Contributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4 Plan de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Les systèmes informatiques sont aujourd’hui omniprésents, aussi bien dans les objets
anodins de la vie courante que dans les systèmes critiques comme les contrôleurs automatiques
utilisés par l’industrie aéronautique. Tous ces systèmes sont généralement très
complexes, il est donc particulièrement dicile d’en construire qui ne comportent pas
d’erreurs. On peut notamment constater le succès récent des architectures multi-cœurs,
multi-processeurs et distribuées pour les serveurs haut de gamme mais aussi pour les
terminaux mobiles personnels. Un des composants les plus complexes de telles machines
est leur protocole de cohérence de cache. En vaut pour preuve le célèbre dicton :
« Il y a seulement deux choses compliquées en informatique : l’invalidation des
caches et nommer les choses. »
— Phil Karlton
En eet pour fonctionner de manière optimale chaque composant qui partage la mémoire
(processeur, cœur, etc.) possède son propre cache (une zone mémoire temporaire) lui
permettant de conserver les données auxquelles il a récemment accédé. Le protocole en
question assure que tous les caches du système se trouvent dans un état cohérent, ce qui en
9Chapitre 1 Introduction
fait un élément vital. Les méthodes les plus courantes pour garantir la qualité des systèmes
informatiques sont le test et la simulation. Cependant, ces techniques sont très peu adaptées
aux programmes concurrents comme les protocoles de cohérence de cache.
Pour garantir une ecacité optimale, ces protocoles sont souvent implantés au niveau
matériel et fonctionnent par échanges de messages, de manière entièrement asynchrone.
Le moment auquel un message arrivera ou un processeur accédera à la mémoire centrale
est donc totalement imprévisible [36]. Pour concevoir de tels systèmes on doit alors
considérer de nombreuses « courses critiques » (ou race conditions en anglais), c’est-à-dire
des comportements qui dépendent de l’ordre d’exécution ou d’arrivée des messages. Ces
scénarios sont par ailleurs très compliqués, faisant intervenir plusieurs dizaines d’échanges
de messages. Ainsi, la rareté de leurs apparitions fait qu’il est très dicile de reproduire
ces comportements par des méthodes de test et de simulation.
Une réponse à ce problème est l’utilisation de méthodes formelles pouvant garantir
certaines propriétés d’un système par des arguments mathématiques. De nombreuses
techniques revendiquent leur appartenance à cette catégorie, comme le model checking,
qui s’attache à considérer tous les comportements possibles d’un système an d’en vérier
diérentes propriétés.
1.1 Model checking
La technique du model checking a été inventée pour résoudre le problème dicile de la
vérication de programmes concurrents. Avant 1982, les recherches sur ce sujet intégraient
systématiquement l’emploi de la preuve manuelle [131]. Pnueli [137], Owicki et Lamport
[132] proposèrent, vers la n des années 70, l’usage de la logique temporelle pour spécier
des propriétés parmi lesquelles :
— la sûreté : un mauvais comportement ne se produit jamais, ou
— la vivacité : un comportement attendu nira par arriver.
Le terme model dans l’expression « model checking » peut faire référence à deux choses.
Le premier sens du terme renvoie à l’idée qu’on va représenter un programme par un
modèle abstrait. Appelons ce modèle M. Le deuxième sens du terme fait référence au fait
qu’on va ensuite essayer de vérier des propriétés de M, autrement dit que M est un modèle
de ces propriétés. Le model checking implique donc de dénir « simplement » ce qu’est (1)
un modèle, et (2) une propriété d’un modèle.
1. Un modèle doit répondre aux trois questions suivantes :
a) À tout instant, qu’est-ce qui caractérise l’état d’un programme ?
b) Quel est l’état initial du système ?
c) Comment passe-t-on d’un état à un autre ?
101.1 Model checking
2. Les propriétés qu’on cherche à vérier sont diverses : Est-ce qu’un mauvais état peut
être atteint (à partir de l’état inital) ? Est-ce qu’un certain état sera atteint quoiqu’il
advienne ? Plus généralement, on souhaite vérier des propriétés qui dépendent de
la manière dont le programme (ou le modèle) évolue. On exprime alors ces formules
dans des logiques temporelles.
1.1.1 Systèmes finis
Les travaux fondateurs de Clarke et Emerson [38] et de Queille et Sifakis [140] intègrent
cette notion de logique temporelle à l’exploration de l’ensemble des états du système
(espace d’état). Dans leur article de 1981 [38], Clarke et Emerson montrent comment
synthétiser des programmes à partir de spécications dans une logique temporelle (appelée
CTL, pour Computational Tree Logic). Mais c’est surtout la seconde partie de l’article qui
a retenu l’attention de la communauté. Dans celle-ci, ils construisent une procédure de
décision fondée sur des calculs de points-xes pour vérier des propriétés temporelles de
programmes nis.
L’avantage principal du model checking par rapport aux autres techniques de preuve
est double. C’est d’abord un processus automatique et rapide, de sorte qu’il est souvent
considéré comme une technique « presse-bouton ». C’est aussi une méthode qui fonctionne
déjà avec des spécications partielles. De cette façon, l’eort de vérication peut être commencé
tôt dans le processus de conception d’un système complexe. Un de ses désavantages,
qui est aussi inhérent à toutes les autres techniques de vérication, est que la rédaction des
spécications est une tâche dicile qui requiert de l’expertise. Mais l’inconvénient majeur
du model checking est apparu dans les années 80, et est connu sous le nom du phénomène
d’explosion combinatoire de l’espace d’états. Seuls les systèmes avec un nombre petit d’états
(de l’ordre du million) pouvaient être analysés à cette époque, alors que les systèmes réels
en possèdent beaucoup plus. Par conséquent, un important corpus de recherche sur le
model checking aborde le problème du passage à l’échelle.
Une avancée notoire pour le model checking a été l’introduction de techniques symboliques
pour résoudre ce problème d’explosion. Alors que la plupart des approches avant
1990 utilisaient des représentations explicites, où chaque état individuel est stocké en
mémoire, Burch et al. ont montré qu’il était possible de représenter de manière symbolique
et compacte des ensembles d’états [29]. McMillan reporte dans sa thèse [116] une représentation
de la relation des états de transition avec BDD [27] (diagrammes de décision binaire)
puis donne un nombre d’algorithmes basés sur des graphes dans le langage du µ-calcul.
L’utilisation de structures de données compactes pour représenter de larges ensembles
d’états permet de saisir certaines des régularités qui apparaissent naturellement dans les
circuits ou autres systèmes. La complexité en espace du model checking symbolique a
été grandement diminuée et, pour la première fois, des systèmes avec 1020 états ont été
vériés. Cette limite a encore été repoussée avec divers ranements du model checking
11Chapitre 1 Introduction
symbolique.
Le point faible des techniques symboliques utilisant des BDD est que la quantité d’espace
mémoire requise pour stocker ces structures peut augmenter de façon exponentielle. Biere
et al. décrivent une technique appelée le model checking borné (ou BMC pour Bounded Model
Checking) qui sacrie la correction au prot d’une recherche d’anomalies ecace [19].
L’idée du BMC est de chercher les contre-exemples parmi les exécutions du programme
dont la taille est limitée à un certain nombre d’étapes k. Ce problème peut être encodé
ecacement en une formule propositionnelle dont la statisabilité mène directement à
un contre-exemple. Si aucune erreur n’est trouvée pour des traces de longueur inférieure
à k, alors la valeur de la borne k est augmentée jusqu’à ce qu’une erreur soit trouvée,
ou que le problème devienne trop dicile à résoudre 1
. La force de cette technique vient
principalement de la mise à prot des progrès fait par les solveurs SAT (pour la satisabilité
booléenne) modernes. Elle a rencontré un succès majeur dans la vérication d’implémentations
de circuits matériels et fait aujourd’hui partie de l’attirail standard des concepteurs
de tels circuits. Comme l’encodage vers des contraintes propositionnelles capture la sé-
mantique des circuits de manière précise, ces model checkers ont permis de découvrir
des erreurs subtiles d’implémentation, dues par exemple à la présence de débordements
arithmétiques.
Une extension de cette technique pour la preuve de propriétés, plutôt que la seule
recherche de bogues, consiste à ajouter une étape d’induction. Cette extension de BMC
s’appelle la k-induction et dière d’un schéma d’induction classique par le point suivant :
lorsqu’on demande à vérier que la propriété d’induction est préservée, on suppose qu’elle
est vraie dans les k étapes précédentes plutôt que seulement dans l’étape précédente [52,
151].
Une autre vision du model checking est centrée sur la théorie des automates. Dans
ces approches, spécications et implémentations sont toutes deux construites avec des
automates. Vardi et Wolper notent une correspondance entre la logique temporelle et les
automates de Büchi [164] : chaque formule de logique temporelle peut être considérée
comme un automate à états ni (sur des mots innis) qui accepte précisément les séquences
satisfaites par la formule. Grâce à cette connexion, ils réduisent le problème du model
checking à un test de vacuité de l’automate AM ∩A¬φ (où AM est l’automate du programme
M et A¬φ est l’automate acceptant les séquences qui violent la propriété φ) [161].
1.1.2 Systèmes infinis
Le problème d’explosion combinatoire est encore plus frappant pour des systèmes
avec un nombre inni d’états. C’est le cas par exemple lorsque les types des variables du
1. Dans certains cas un majorant sur la borne k est connu (le seuil de complétion) qui permet d’armer
que le système vérie la propriété donnée.
121.1 Model checking
programme sont innis (e.g. entiers mathématiques) ou les structures de données sont
innies (e.g. buers, les d’attente, mémoires non bornés). Pour traiter de tels systèmes,
deux possibilités s’orent alors : manipuler des représentations d’ensembles d’états innis
directement, ou construire une abstraction nie du système.
Dans la première approche, des représentations symboliques adaptées reposent par
exemple sur l’utilisation des formules logiques du premier ordre. Pour cela, les techniques
utilisant précédemment les solveurs SAT (traitant exclusivement de domaines nis encodés
par de la logique propositionnelle) ont été peu à peu migrées vers les solveurs SMT
(Satisabilité Modulo Théories). Ces derniers possèdent un moteur propositionnel (un
solveur SAT) couplé à des méthodes de combinaison de théories. La puissance de ces
solveurs vient du grand nombre de théories qu’ils supportent en interne, comme la théorie
de l’arithmétique linéaire (sur entiers mathématiques), la théorie de l’égalité et des fonctions
non interprétées, la théorie des tableaux, la théorie des vecteurs de bits, la théorie des types
énumérés, etc. Certains solveurs SMT supportent même les quanticateurs. Par exemple,
une application récente de la technique de k-induction aux programmes Lustre (un langage
synchrone utilisé notamment dans l’aéronautique) utilisant des solveurs SMT est disponible
dans le model checker Kind [85, 86].
La seconde approche pour les systèmes innis – qui peut parfois être utilisée en complément
de la technique précédente – consiste à sacrier la précision de l’analyse en
simpliant le problème an de se ramener à l’analyse d’un système ni. La plupart de ces
idées émergent d’une certaine manière du cadre de l’interprétation abstraite dans lequel un
programme est interprété sur un domaine abstrait [46,47]. Une forme d’abstraction particulière
est celle de l’abstraction par prédicats. Dans cette approche, la fonction d’abstraction
associe chaque état du système à un ensemble prédéni de prédicats. L’utilisateur fournit
des prédicats booléens en nombre ni pour décrire les propriétés possibles d’un système
d’états innis. Ensuite une analyse d’accessibilité est eectuée sur le modèle d’états nis
pour fournir l’invariant le plus fort possible exprimable à l’aide de ces prédicats [81].
Généralement, les abstractions accélèrent la procédure de model checking lorsqu’elles
sont les plus générales possibles. Parfois trop grossières, ces abstractions peuvent empêcher
l’analyse d’un système pourtant sûr en exposant des contre-exemples qui n’en sont pas dans
le système réel. Il devient alors intéressant de raner le domaine abstrait utilisé précédemment
de manière automatique an d’éliminer ces mauvais contre-exemples. Cette idée a
donné naissance à la stratégie itérative appelée CEGAR (pour Counter-Example Guided Abstraction
Renement, i.e. ranement d’abstraction guidé par contre-exemples) [13, 35, 147].
Elle est utilisée par de nombreux outils et plusieurs améliorations ont été proposées au
l des années. On peut mentionner par exemple les travaux de Jahla et al. [89, 94] sur
l’abstraction paresseuse implémentés dans le model checker Blast [18] ainsi que ceux de
McMillan [119] qui combine cette technique avec un ranement par interpolation de
Craig [48] permettant ainsi de capturer les relations entre variables utiles à la preuve de la
propriété souhaitée.
13Chapitre 1 Introduction
Un système peut aussi être inni, non pas parce que ses variables sont dans des domaines
innis, mais parce qu’il est formé d’un nombre non borné de composants. Par exemple, un
protocole de communication peut être conçu pour fonctionner quelque soit le nombre de
machines qui y participent. Ces systèmes sont dits paramétrés, et c’est le problème de leur
vérication qui nous intéresse plus particulièrement dans cette thèse.
1.2 Model checking de systèmes paramétrés
Un grand nombre de systèmes réels concurrents comme le matériel informatique ou
les circuits électroniques ont en fait un nombre ni d’états possibles (déterminés par la
taille des registres, le nombre de bascules, etc.). Toutefois, ces circuits et protocoles (e.g.
les protocoles de bus ou les protocoles de cohérence de cache) sont souvent conçus de
façon paramétrée, dénissant ainsi une innité de systèmes. Un pour chaque nombre de
composants.
Souvent le nombre de composants de tels systèmes n’est pas connu à l’avance car ils
sont conçus pour fonctionner quelque soit le nombre de machines du réseau, quelque soit
le nombre de processus ou encore quelque soit la taille des buers (mémoires tampons).
En vérier les propriétés d’une manière paramétrée est donc indispensable pour s’assurer
de leur qualité. Dans d’autres cas ce nombre de composants est connu mais il est tellement
grand (plusieurs milliers) que les techniques traditionnelles sont tout bonnement incapables
de raisonner avec de telles quantités. Il est alors préférable dans ces circonstances de vérier
une version paramétrée du problème.
Apt et Kozen montrent en 1986 que, de manière générale, savoir si un programme P
paramétré par n, P (n) satisfait une propriété φ(n), est un problème indécidable [10]. Pour
mettre en lumière ce fait, ils ont simplement créé un programme qui simule n étapes d’une
machine de Turing et change la valeur d’une variable booléenne à la n de l’exécution si
la machine simulée ne s’est pas encore arrêtée 2
. Ce travail expose clairement les limites
intrinsèques des systèmes paramétrés. Même si le résultat est négatif, la vérication automatique
reste possible dans certains cas. Face à un problème indécidable, il est coutume
de restreindre son champ d’application en imposant certaines conditions jusqu’à tomber
dans un fragment décidable. Une alternative consiste à traiter le problème dans sa globalité,
mais avec des méthodes non complètes.
1.2.1 Méthodes incomplètes
Le premier groupe à aborder le problème de la vérication paramétrée fut Clarke et
Grumberg [39] avec une méthode fondée sur un résultat de correspondance entre des
2. Ce programme est bien paramétré par n. Bien qu’il ne fasse pas intervenir de concurrence, le résultat
qui suit peut être aussi bien obtenu en mettant n processus identiques P (n) en parallèle.
141.2 Model checking de systèmes paramétrés
systèmes de diérentes tailles. Notamment, ils ont pu vérier avec cette technique un
algorithme d’exclusion mutuelle en mettant en évidence une bisimulation entre ce système
de taille n et un système de taille 2.
Toujours dans l’esprit de se ramener à une abstraction nie, de nombreuses techniques
suivant ce modèle ont été développées pour traiter les systèmes paramétrés. Par exemple
Kurshan et McMillan utilisent un unique processus Q qui agrège les comportements de n
processus P concurrents [105]. En montrant que Q est invariant par composition parallèle
asynchrone avec P, on déduit que Q représente bien une abstraction du système paramétré.
Bien souvent l’enjeu des techniques utilisées pour vérier des systèmes paramétrés est
de trouver une représentation à même de caractériser des familles innies d’états. Par
exemple si la topologie du système (i.e. l’organisation des processus) n’a pas d’importance,
il est parfois susant de « compter » le nombre de processus se trouvant dans un état
particulier. C’est la méthode employée par Emerson et al. dans l’approche dite d’abstraction
par compteurs [64]. Si l’ordre des processus importe (e.g. un processus est situé « à gauche »
d’un autre) une représentation adaptée consiste à associer à chaque état un mot d’un
langage régulier. Les ensembles d’états sont alors représentés par les expressions régulières
de ce langage et certaines relations de transition peuvent être exprimées par des transducteurs
nis [1, 99]. Une généralisation de cette idée a donné naissance au cadre du model
checking régulier [24] qui propose des techniques d’accélération pour calculer les clôtures
transitives [96, 128]. Des extensions de ces approches ont aussi été adaptées à l’analyse de
systèmes de topologies plus complexes [22].
Plutôt que de chercher à construire une abstraction nie du système paramétré dans son
intégralité, l’approche dite de cuto (coupure) cherche à découvrir une borne supérieure
dépendant à la fois du système et de la propriété à vérier. Cette borne k, appelée la valeur
de cuto, est telle que si la propriété est vraie pour les système plus petits que k alors
elle est aussi vraie pour les systèmes de taille supérieure à k [62]. Parfois cette valeur
peut-être calculée statiquement à partir des caractéristiques du système. C’est l’approche
employée dans la technique des invariants invisibles de Pnueli et al. alliée à une génération
d’invariants inductifs [12, 138]. L’avantage de la technique de cuto est qu’elle s’applique
à plusieurs formalismes et qu’elle permet simplement d’évacuer le côté paramétré d’un
problème. En revanche le calcul de cette borne k donne souvent des valeurs rédhibitoires
pour les systèmes de taille réelle. Pour compenser ce désavantage, certaines techniques
ont été mises au point pour découvrir les bornes de cuto de manière dynamique [4, 98].
1.2.2 Fragments décidables
Il est généralement dicile d’identier un fragment qui soit à la fois décidable et utile en
pratique. Certaines familles de problèmes admettent cependant des propriétés qui en font
des cadres théoriques intéressants. Partant du constat que les systèmes synchrones sont
souvent plus simples à analyser, Emerson et Namjoshi montrent que certaines propriétés
15Chapitre 1 Introduction
temporelles sont en fait decidables pour ces systèmes [63]. Leur modèle fonctionne pour
les systèmes composés d’un processus de contrôle et d’un nombre arbitraire de processus
homogènes. Il ne s’applique donc pas, par exemple, aux algorithmes d’exclusion mutuelle.
L’écart de méthodologie qui existe entre les méthodes non complètes et celles qui identient
un fragment décidable du model checking paramétré n’est en réalité pas si grand.
Dans bien des cas, les chercheurs qui mettent au point ces premières mettent aussi en
évidence des restrictions susantes sur les systèmes considérés pour rendre l’approche
complète et terminante. C’est par exemple le cas des techniques d’accélération du model
checking régulier ou encore celui du model checking modulo théories proposé par Ghilardi
et Ranise [77, 79].
À la diérence des techniques pour systèmes paramétrés mentionnées précédemment,
cette dernière approche ne construit pas d’abstraction nie mais repose sur l’utilisation
de quanticateurs pour représenter les ensembles innis d’états de manière symbolique.
En eet lorsqu’on parle de systèmes paramétrés, on exprime naturellement les propriétés
en quantiant sur l’ensemble des éléments du domaine paramétré. Par exemple, dans un
système où le nombre de processus n’est pas connu à l’avance, on peut avoir envie de
garantir que quelque soit le processus, sa variable locale x n’est jamais nulle. Le cadre
du model checking modulo théories dénit une classe de systèmes paramétrés appelée
systèmes à tableaux permettant de maîtriser l’introduction des quanticateurs. La sûreté
de tels systèmes n’est pas décidable en général mais il existe des restrictions sur le problème
d’entrée qui permettent de construire un algorithme complet et terminant. Un autre
avantage de cette approche est de tirer parti de la puissance des solveurs SMT et de leur
grande versatilité.
Toutes ces techniques attaquent un problème intéressant et important. Celles qui sont
automatiques (model checking) ne passent pourtant pas à l’échelle sur des problèmes
réalistes. Et celles qui sont applicables en pratique demandent quant à elles une expertise
humaine considérable, ce qui rend le processus de vérication très long [33,49,118,134,135].
Le problème principal auquel répond cette thèse est le suivant.
Comment vérier automatiquement des propriétés de sûreté de systèmes
paramétrés complexes ?
Pour répondre à cette question, on utilise le cadre théorique du model checking modulo
théories pour concevoir de nouveaux algorithmes qui infèrent des invariants de manière
automatique. Nos techniques s’appliquent avec succès à l’analyse de sûreté paramétrée de
protocoles de cohérence de cache conséquents, entre autres.
1.3 Contributions
Nos contributions sont les suivantes :
161.4 Plan de la thèse
— Un model checker open source pour systèmes paramétrés : Cubicle. Cubicle implémente
les techniques présentées dans cette thèse et est librement disponible à
l’adresse suivante : http://cubicle.lri.fr.
— Un ensemble de techniques pour l’implémentation d’un model checker reposant sur
un solveur SMT.
— Un nouvel algorithme pour inférer des invariants de qualité de manière automatique :
BRAB. L’idée de cet algorithme est d’utiliser les informations extraites d’un modèle
ni du système an d’inférer des invariants pour le cas paramétré. Le modèle ni
est en fait mis à contribution en tant qu’oracle dont le rôle se limite à émettre un
jugement de valeur sur les candidats invariants qui lui sont présentés. Cet algorithme
fonctionne bien en pratique car dans beaucoup de cas les instances nies, même
petites, exhibent déjà la plupart des comportements intéressants du système.
— Une implémentation de BRAB dans le model checker Cubicle.
— L’application de ces techniques à la vérication du protocole de cohérence de cache
de l’architecture multi-processeurs FLASH. À l’aide des invariants découverts par
BRAB, la sûreté de ce protocole a pu être vériée entièrement automatiquement pour
la première fois.
— Deux approches pour la certication de Cubicle à l’aide de la plate-forme Why3.
La première est une approche qui fonctionne par certicats (ou traces) et vérie le
résultat produit par le model checker. Ce certicat prend la forme d’un invariant
inductif. La seconde approche est par vérication déductive du cœur de Cubicle. Ces
deux approches mettent en avant une autre qualité de BRAB : faciliter ce processus
de certication, par réduction de la taille des certicats pour l’une, et grâce à son
ecacité pour l’autre.
1.4 Plan de la thèse
Ce document de thèse est organisé de la façon suivante : Le chapitre 2 introduit le
langage d’entrée du model checker Cubicle à travers diérents exemples d’algorithmes et
de protocoles concurrents. Une seconde partie de ce chapitre présente la représentation
formelle des systèmes de transitions utilisés par Cubicle ainsi que leur sémantique. Le
chapitre 3 présente le cadre théorique du model checking modulo théories conçu par
Ghilardi et Ranise. Les résultats et théorèmes associés sont également donnés et illustrés
dans ce chapitre, qui constitue le contexte dans lequel s’inscrivent nos travaux. Le chapitre 4
donne un ensemble d’optimisations nécessaires à l’implémentation d’un model checker
reposant sur un solveur SMT comme Cubicle. Nos travaux autour de l’inférence d’invariants
sont exposés dans le chapitre 5. On y présente et illustre l’algorithme BRAB. Les détails
pratiques de son fonctionnement sont également expliqués et son intérêt est appuyé par une
17Chapitre 1 Introduction
évaluation expérimentale sur des problèmes diciles pour la vérication paramétrée. En
particulier on détaille le résultat de la preuve du protocole de cohérence de cache FLASH.
Le chapitre 6 présente deux techniques de certication que nous avons mis en œuvre
pour certier le model checker Cubicle. Ces deux techniques reposent sur la plate-forme
de vérication déductive Why3. Enn le chapitre 7 donne des pistes d’amélioration et
d’extension de nos travaux et conclut ce document.
182
Le model checker Cubicle
Sommaire
2.1 Langage d’entrée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1 Algorithme d’exclusion mutuelle . . . . . . . . . . . . . . . . . 23
2.2.2 Généralisation de l’algorithme de Dekker . . . . . . . . . . . . 25
2.2.3 Boulangerie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.4 Cohérence de Cache . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 Non-atomicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4 Logique multi-sortée et systèmes à tableaux . . . . . . . . . . . . . 36
2.4.1 Syntaxe des formules logiques . . . . . . . . . . . . . . . . . . . 37
2.4.2 Sémantique de la logique . . . . . . . . . . . . . . . . . . . . . . 39
2.4.3 Systèmes de transition à tableaux . . . . . . . . . . . . . . . . . 41
2.5 Sémantique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.5.1 Sémantique opérationnelle . . . . . . . . . . . . . . . . . . . . . 44
2.5.2 Atteignabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.5.3 Un interpréteur de systèmes à tableaux . . . . . . . . . . . . . . 47
L’outil issu des travaux présentés dans ce document est un model checker pour systèmes
paramétrés, dénommé Cubicle. Le but de ce chapitre est de familiariser le lecteur avec l’outil,
tout particulièrement son langage d’entrée et sa syntaxe concrète. Quelques exemples
variés de tels systèmes sont formulés dans ce langage an d’orir un premier aperçu des
possibilités du model checker. On donne également une description plus formelle de la
sémantique des systèmes décrits dans le langage de Cubicle.
19Chapitre 2 Le model checker Cubicle
2.1 Langage d’entrée
Cubicle est un model checker pour systèmes paramétrés. C’est-à-dire qu’il permet de
vérier statiquement des propriétés de sûreté d’un programme concurrent pour un nombre
quelconque de processus 1
. Pour représenter ces programmes, on utilise des systèmes de
transition car ils permettent facilement de modéliser des comportements asynchrones ou
non déterministes. Ces systèmes décrivent les transitions possibles d’un état du programme
à un autre. Ils peuvent être considérés comme un langage bas niveau pour la vérication.
Étant donné que les systèmes manipulés par Cubicle sont paramétrés, les transitions qui
le composent le sont également. Dans cette section, on présente de manière très informelle
le langage d’entrée de Cubicle 2
.
La description d’un système commence par des déclarations de types, de variables
globales et de tableaux. Cubicle connaît quatre types en interne : le type des entiers (int),
le type des réels (real), le type des booléens (bool) et le type des identicateurs de
processus (proc). Ce dernier est particulièrement important car c’est par les éléments de
ce type que le système est paramétré. Le paramètre du système est la cardinalité du type
proc. L’utilisateur a aussi la liberté de déclarer ses propres types abstraits ou ses propres
types énumérés. L’exemple suivant dénit un type énuméré state à trois constructeurs
Idle, Want et Crit ainsi qu’un type abstrait data.
type state = Idle | Want | Crit
type data
Les tableaux et variables représentent l’état du système ou du programme. Tous les
tableaux ont la particularité d’être uniquement indexés par des éléments du type proc, leur
taille est par conséquent inconnue. C’est une limitation de l’implémentation actuelle du
langage de Cubicle qui existe pour des raisons pratiques et rien n’empêcherait d’ajouter la
possibilité de déclarer des tableaux indexés par des entiers. Dans ce qui suit on déclare une
variable globale Timer de type real et trois tableaux indexés par le type proc.
var Timer : real
array State[proc] : state
array Chan[proc] : data
array Flag[proc] : bool
Les tableaux peuvent par exemple être utilisés pour représenter des variables locales ou
des canaux de communication.
1. Un programme concurrent est souvent paramétré par son nombre de processsus ou threads mais ce
paramètre peut aussi être la taille de certains buers ou le nombre de canaux de communication par exemple.
2. Une description plus précise de la syntaxe et de ce langage est faite en annexe A de ce document.
202.1 Langage d’entrée
Les états initiaux du système sont dénis à l’aide du mot clef init. Cette déclaration qui
vient en début de chier précise quelles sont les valeurs initiales des variables et tableaux
pour tous leurs indices. Notons que certaines variables peuvent ne pas être initialisées et on
a le droit de mentionner seulement les relations entres elles. Dans ce cas tout état dont les
valeurs des variables et tableaux respectent les contraintes xées dans la ligne init sera
un état initial correct du système. Par exemple, la ligne suivante dénit les états initiaux
comme ceux ayant leurs tableaux Flag à false et State à Idle pour tout processus z, ainsi
que leur variable globale Timer valant 0.0. Le paramètre z de init représente tous les
processus du système.
init (z) { Flag[z] = False && State[z] = Idle && Timer = 0.0 }
Remarque. On ne précise pas le type des paramètres car seuls ceux du type proc sont
autorisés
Le reste du système est donné comme un ensemble de transitions de la forme garde/action.
Chaque transition peut être paramétrée (ou non) par un ou plusieurs identicateurs de
processus comme dans l’exemple suivant.
transition t (i j)
requires { i < j && State[i] = Idle && Flag[i] = False &&
forall_other k. (Flag[k] = Flag[j] || State[k] <> Want) }
{
Timer := Timer + 1.0;
Flag[i] := True;
State[k] := case
| k = i : Want
| State[k] = Crit && k < i : Idle
| _ : State[k];
}
Dans cet exemple, la transition t est déclenchable s’il existe deux processus distincts
d’identicateurs i et j tels que i est inférieur à j. Les tableaux State et Flag doivent
contenir respectivement la valeur Idle et la valeur false à l’indice i. En plus de cette garde
locale (aux processus i et j), on peut mentionner l’état des autres processus du système.
La partie globale de la garde est précédée du mot clef forall_other. Ici, on dit que tous
les autres processus (sous-entendu diérents de i et j) doivent soit avoir la même valeur
de Flag que j, soit contenir une valeur diérente de Want dans le tableau State.
Remarque. Dans Cubicle, les processus sont diérenciés par leur identicateurs. Ici, les
paramètres i et j de la transition sont implicitement quantiés existentiellement et doivent
21Chapitre 2 Le model checker Cubicle
être des identicateurs de processus deux à deux distincts. L’ensemble des identicateurs
de processus est seulement muni d’un ordre total. La présence de cet ordre induit une
topologie linéaire sur les processus. La comparaison entre identicateurs est donc autorisée
et on peut par exemple écrire i < j dans une garde.
La garde de la transition est donnée par le mot clef requires. Si elle est satisfaite, les
actions de la transition sont exécutées. Chaque action est une mise à jour d’une variable
globale ou d’un tableau. La sémantique des transitions veut que l’ensemble des mises
à jour soit réalisé de manière atomique et chaque variable qui apparaît à droite d’un
signe := dénote la valeur de cette variable avant la transition. L’ordre des aectations
n’a donc pas d’importance. La première action Timer := Timer + 1.0 incrémente la
variable globale de 1 lorsque la transition est prise. Les mises à jour de tableaux peuvent être
codées comme de simples aectations si une seule case est modiée. L’action Flag[i] :=
True modie le tableau Flag à l’indice i en y mettant la valeur true. Le reste du tableau
n’est pas modié. Si la transition modie plusieurs cases d’un même tableau, on utilise une
construction case qui précise les nouvelles valeurs contenues dans le tableau à l’aide d’un
ltrage. State[k] := case ... mentionne ici les valeurs du tableau State pour tous
les indices k (k doit être une variable fraîche) selon les conditions suivantes. Pour chaque
indice k, le premier cas possible du ltrage est exécuté. Le cas
| k = i : Want
nous demande de vérier tout d’abord si k vaut i, c’est-à-dire de mettre de la valeur Want
à l’indice i du tableau State. Le deuxième cas
| State[k] = Crit && k < i : Idle
est plus compliqué : si le premier cas n’est pas vérié (i.e. k est diérent de i), que State
contenait Crit à l’indice k, et que k est inférieur à i alors la nouvelle valeur de State[k]
est Idle. Plus simplement, cette ligne change les valeurs Crit du tableau State se trouvant
à gauche de i (k < i) en Idle. Enn tous les ltrages doivent se terminer par un cas par
défaut noté _. Dans notre exemple, le cas par défaut du ltrage
| _ : State[k]
dit que toutes les autres valeurs du tableau restent inchangées (on remet l’ancienne valeur
de State[k]).
La relation de transition, décrite par l’ensemble des transitions, dénit l’exécution du
système comme une boucle innie qui à chaque itération :
1. choisit de manière non déterministe une instance de transition dont la garde est vraie
dans l’état courant du système ;
2. met à jour les variables et tableaux d’état conformément aux actions de la transition
choisie.
222.2 Exemples
Les propriétés de sûreté à vérier sont exprimées sous forme négative, c’est-à-dire qu’on
caractérise les états dangereux du système. On les exprime dans Cubicle à l’aide du mot
clef unsafe, éventuellement suivi d’un ensemble de variables de processus distinctes. La
formule dangereuse suivante exprime que les mauvais états du système sont ceux où il
existe au moins deux processus distincts x et y tels que le tableau State contienne la valeur
Crit à ces deux indices.
unsafe (x y) { State[x] = Crit && State[y] = Crit }
On dira qu’un système est sûr si aucun des états dangereux ne peut être atteint à partir
d’un des états initiaux.
Remarque. Bien que Cubicle soit conçu pour vérier des systèmes paramétrés, il est tout
de même possible de l’utiliser pour vérier des systèmes dont le nombre de processus est
xé à l’avance. Pour cela, il sut d’inclure la ligne “number_procs n” dans le chier, où n
est le nombre de processus. Dans ce cas, on pourra mentionner explicitement les processus
1 à n en utilisant les constantes #1 à #n.
Remarque. Le langage d’entrée de Cubicle est une version moins riche mais paramétrée du
langage de Murφ [57] et similaire à Uclid [28]. Bien que limité pour l’instant, il est assez
expressif pour permettre de décrire aisément des systèmes paramétrés conséquents (75
transitions, 40 variables et tableaux pour le protocole FLASH [106] par exemple).
2.2 Exemples
Dans cette section, on montre comment utiliser Cubicle et son expressivité pour modéliser
diérents algorithmes et protocoles de la littérature. Ces exemples sont donnés à titre
didactique et sont choisis de manière à illustrer les caractéristiques fondamentales du
langage. Le but de cette section est de donner au lecteur une bonne intuition des possibilités
oertes par l’outil de manière à pouvoir modéliser et expérimenter le model checker sur
ses propres exemples.
2.2.1 Algorithme d’exclusion mutuelle
L’exclusion mutuelle est un problème récurrent de la programmation concurrente. L’algorithme
décrit ci-dessous résout ce problème, i.e. il permet à plusieurs processus de
partager une ressource commune à accès unique sans conit, en communiquant seulement
au travers de variables partagées. C’est une version simpliée de l’algorithme de Dekker
(présenté en 2.2.2) qui fonctionne pour un nombre arbitraire de processus identiques.
Sur la gure 2.1, on matérialise n processus concurrents qui exécutent tous le même
protocole. Chaque processus est représenté par le graphe de transition entre ses états : Idle,
23Chapitre 2 Le model checker Cubicle
Process 1
Idle
Want
Crit
Turn = 1
Turn := ?
Process 2
Idle
Want
Crit
Turn = 2
Turn := ?
Process n
Idle
Want
Crit
Turn = n
Turn := ?
. . .
Process 3
Idle
Want
Crit
Turn = 3
Turn := ?
Figure 2.1 – Algorithme d’exclusion mutuelle
Want, et Crit, l’état initial étant Idle. Un processus peut demander l’accès à la section critique
à tout moment en passant dans l’état Want. La synchronisation est eectuée au travers
de la seule variable partagée Turn. La priorité est donnée au processus dont l’identiant
i est contenu dans la variable Turn, qui peut dans ce cas passer en section critique. Un
processus en section critique peut en sortir sans contrainte si ce n’est celle de « donner la
main » à un de ses voisins en changeant la valeur de Turn. Cette dernière est modiée de
façon non-déterministe (Turn := ? dans le schéma), donc rien n’interdit à un processus
de se redonner la main lui-même. La propriété qui nous intéresse ici est de vérier la sûreté
du système, c’est-à-dire qu’à tout moment, au plus un processus est en section critique.
Le code Cubicle correspondant à ce problème est donné ci-dessous en gure 2.2. Pour
modéliser l’algorithme on a choisi de représenter l’état des processus par un tableau
State contenant les valeur Idle, Want, ou Crit. On peut aussi voir State[i] comme la
valeur d’une variable locale au processus d’identicateur i. La variable partagée Turn est
simplement une variable globale au système. On dénit les états initiaux comme ceux où
tous les processus sont dans l’état Idle, quelque soit la valeur initiale de la variable Turn.
Prenons l’exemple de la transition req. Elle correspond au moment où un processus
demande l’accès à la section critique, passant de l’état Want à Idle. Elle se lit : la transition
req est possible s’il existe un processus d’identiant i tel que State[i] a pour valeur
Idle. Dans ce cas, la case State[i] prend pour valeur Want.
La formule unsafe décrit les mauvais états du système comme ceux dans lesquels il
existe (au moins) deux processus distincts en section critique (i.e. pour lesquels la valeur de
State est Crit). Autrement dit, on veut s’assurer que la formule suivante est un invariant
du système :
∀i,j. (i , j ∧ State[i] = Crit) =⇒ State[j] , Crit
242.2 Exemples
mutex.cub
type state = Idle | Want | Crit
array State[proc] : state
var Turn : proc
init (z) { State[z] = Idle }
unsafe (z1 z2) { State[z1] = Crit &&
State[z2] = Crit }
transition req (i)
requires { State[i] = Idle }
{ State[i] := Want }
transition enter (i)
requires { State[i] = Want &&
Turn = i }
{ State[i] := Crit; }
transition exit (i)
requires { State[i] = Crit }
{ Turn := ? ;
State[i] := Idle; }
Figure 2.2 – Code Cubicle du mutex
Pour vérier que le système décrit dans le chier mutex.cub précédent est sûr, la manière
la plus simple d’invoquer Cubicle est de lui passer seulement le nom de chier en argument :
cubicle mutex.cub
On peut voir ci-après la trace émise par le model checker sur la sortie standard. Lorsque
ce dernier ache sur la dernière ligne “The system is SAFE”, cela signie qu’il a été en
mesure de vérier que l’état unsafe n’est jamais atteignable dans le système.
node 1: unsafe[1] 5 (2+3) remaining
node 2: enter(#2) -> unsafe[1] 7 (2+5) remaining
node 3: req(#2) -> enter(#2) -> unsafe[1] 8 (1+7) remaining
The system is SAFE
2.2.2 Généralisation de l’algorithme de Dekker
L’algorithme de Dekker est en réalité la première solution au problème d’exclusion mutuelle.
Cette solution est attribuée au mathématicien Th. J. Dekker par Edsger W. Dijkstra
qui en donnera une version fonctionnant pour un nombre arbitraire de processus [54]. En
1985, Alain J. Martin présente une version simple de l’algorithme généralisé à n processus
[115]. C’est cette version qui est donnée ici sous forme d’algorithme (Algorithme 1) et
sous forme de graphe de ot de contrôle (Figure 2.3).
La variable booléenne x (i) est utilisée par un processus pour signaler son intérêt à entrer
en section critique. La principale diérence avec l’algorithme original est l’utilisation d’une
valeur spéciale pour réinitialiser t. Dans Cubicle, les constantes de processus ne sont pas
explicites donc on ne peut pas matérialiser l’identiant spécial 0 dans le type proc. Pour
25Chapitre 2 Le model checker Cubicle
Algorithme 1 : Code de Dekker pour
le processus i [115]
Variables :
x (i) : variable booléenne,
initialisée à false
t : variable partagée,
initialisée à 0
p(i) :
NCS while true do
x (i) := true;
WANT while ∃j , i. x (j) do
AWAIT x (i) := false;
await [ t = 0 ∨ t = i ];
TURN t := i;
x (i) := true;
CS // Section critique;
x (i) := false;
t := 0;
NCS
CS
WANT
∃j , i. x (j)
AWAIT
t = 0 t = i
TURN
x (i):= true
x (i):= false
x (i):= false
t:= 0
t:= i
x (i):= true
Figure 2.3 – Graphe de Dekker pour le
processus i
modéliser t, on a choisit d’utiliser deux variables globales : T représente t lorsque celle-ci
est non nulle et la variable booléenne T_set vaut False lorsque t a été réinitialisée (à 0).
Le tableau P est utilisé pour représenter le compteur de programme et peut prendre les
valeurs des étiquettes de l’algorithme 1. On peut remarquer que dans notre modélisation,
la condition de la boucle while est évaluée de manière atomique. Les transitions wait et
enter testent en une seule étape l’existence (ou non) d’un processus j dont la variable x (j)
est vraie. De la même manière que précédemment, on veut s’assurer qu’il y ait au plus un
processus au point de programme correspondant à l’étiquette CS, i.e. en section critique.
Cubicle est capable de prouver la sûreté de ce système. À vue d’œil, la correction de
l’algorithme n’est pas triviale lorsqu’un nombre arbitraire de processus s’exécutent de
manière concurrente. Pour illustrer ce propos, admettons que le concepteur ait fait une
erreur et qu’un processus i puisse omettre de passer sa variable x (i) à true lorsqu’il arrive à
l’étiquette TURN. Il sut alors de rajouter la transition suivante au système pour modéliser
les nouveaux comportements introduits :
262.2 Exemples
dekker_n.cub
type location =
NCS | WANT | AWAIT | TURN | CS
array P[proc] : location
array X[proc] : bool
var T : proc
var T_set : bool
init (i) {
T_set = False &&
X[i] = False && P[i] = NCS
}
unsafe (i j) { P[i] = CS && P[j] = CS }
transition start (i)
requires { P[i] = NCS }
{ P[i] := WANT;
X[i] := True; }
transition wait (i j)
requires { P[i] = WANT && X[j] = True }
{ P[i] := AWAIT;
X[i] := False; }
transition enter (i)
requires { P[i] = WANT &&
forall_other j. X[j] = False }
{ P[i] := CS }
transition awaited_1 (i)
requires { P[i] = AWAIT &&
T_set = False }
{ P[i] := TURN }
transition awaited_2 (i)
requires { P[i] = AWAIT &&
T_set = True && T = i }
{ P[i] := TURN }
transition turn (i)
requires { P[i] = TURN }
{ P[i] := WANT;
X[i] := True;
T := i; T_set := True; }
transition loop (i)
requires { P[i] = CS }
{ P[i] := NCS;
X[i] := False;
T_set := False; }
Figure 2.4 – Code Cubicle de l’algorithme de Dekker
transition turn_buggy (i)
requires { P[i] = TURN }
{ P[i] := WANT;
T := i; T_set := True; }
Si on exécute Cubicle sur le chier maintenant obtenu, il nous fait savoir que la propriété
n’est plus vériée en exposant une trace d’erreur. On peut voir sur la trace suivante qu’un
mauvais état est atteignable en dix étapes avec deux processus.
Error trace: start(#2) -> enter(#2) -> start(#1) -> wait(#1, #2) ->
loop(#2) -> awaited_1(#1) -> turn_buggy(#1) -> enter(#1) ->
start(#2) -> enter(#2) -> unsafe[1]
27Chapitre 2 Le model checker Cubicle
UNSAFE !
Des constantes sont introduites pour chaque processus entrant en jeu dans la trace
et sont notées #1, #2, #3, . . . . La notation “. . . wait(#1, #2) -> . . . ” signie que pour
reproduire la trace, il faut prendre la transition wait instanciée avec les processus #1 et #2.
Remarque. Un état dangereux de ce système est en réalité atteignable en seulement huit
étapes mais il faut pour cela qu’au moins trois processus soient impliqués. On peut s’en
rendre compte en forçant Cubicle à eectuer une exploration purement en largeur grâce
à l’option -postpone 0. De cette façon, on est assuré d’obtenir la trace d’erreur la plus
courte possible :
Error trace: start(#1) -> start(#3) -> wait(#1, #3) -> awaited_1(#1) ->
turn_buggy(#1) -> enter(#1) -> start(#2) -> enter(#2) ->
unsafe[1]
2.2.3 Boulangerie
L’algorithme de la boulangerie a été proposé par Leslie Lamport en réponse au problème
d’exclusion mutuelle [110]. Contrairement aux approches précédentes, la particularité
de cet algorithme est qu’il est résistant aux pannes et qu’il fonctionne même lorsque les
opérations de lecture et d’écriture ne sont pas atomiques. Son pseudo-code est donné dans
l’algorithme 2 (voir page suivante).
On peut faire le parallèle entre le principe de base de l’algorithme et celui d’une boulangerie
aux heures de pointe, d’où son nom. Dans cette boulangerie, chaque client (matérialisant
un processus) choisi un numéro en entrant dans la boutique. Le client qui souhaite acheter
du pain ayant le numéro le plus faible s’avance au comptoir pour être servi. La propriété
d’exclusion mutuelle de cette boulangerie se manifeste par le fait que son fonctionnement
garantit qu’un seul client est servi à la fois. Il est possible que deux clients choisissent le
même numéro, celui dont le nom (unique) est avant l’autre a alors la priorité.
La modélisation faite dans Cubicle est reprise de la version modélisée dans PFS par
Abdulla et al. [3] et est donnée ci-dessous. C’est une version simpliée de l’algorithme
original de Lamport dans laquelle le calcul du maximum à l’étiquette Choose et l’ensemble
des tests de la boucle for à l’étiquette Wait sont atomiques. Les lectures et écritures sont
aussi considérées comme étant instantanées.
Cet algorithme est tolérant aux pannes, c’est à dire qu’il continue de fonctionner même
si un processus s’arrête. Un processus i a le droit de tomber en panne et de redémarrer en
section non critique tout en réinitialisant ses variables locales. Ce comportement peut être
modélisé dans Cubicle en rajoutant un point de programme spécial Crash représentant
le fait qu’un processus est en panne. On ajoute une transition sans garde qui dit qu’un
processus peut tomber en panne à tout moment, ainsi qu’une transition lui permettant de
redémarrer (voir page 30).
282.2 Exemples
Algorithme 2 : Pseudo-code de la boulangerie de Lamport pour le
processus i [110]
Variables :
choosing[i] : variable booléenne, initialisée à false
number[i] : variable entière initialisée à 0
p(i) :
NCS begin
choosing[i] := true;
Choose number[i] := 1 + max(number[1], . . . , number[N]);
choosing[i] := false;
for j = 1 to N do
Wait await [ ¬ choosing[j] ];
await [ number[j] = 0 ∨ (number[i], i) < (number[j], j) ];
CS // Section critique;
number[i] := 0;
goto NCS;
bakery_lamport.cub
type location = NCS | Choose | Wait | CS
array PC[proc] : location
array Ticket[proc] : int
array Num[proc] : int
var Max : int
init (x) { PC[x] = NCS && Num[x] = 0 &&
Max = 1 && Ticket[x] = 0 }
invariant () { Max < 0 }
unsafe (x y) { PC[x] = CS && PC[y] = CS }
transition next_ticket ()
{
Ticket[j] := case | _ : Max;
Max := Max + 1;
}
transition take_ticket (x)
requires { PC[x] = NCS &&
forall_other j. Num[j] < Max }
{
PC[x] := Choose;
Ticket[x] := Max;
}
transition wait (x)
requires { PC[x] = Choose }
{
PC[x] := Wait;
Num[x] := Ticket[x];
}
transition turn (x)
requires { PC[x] = Wait &&
forall_other j.
(PC[j] <> Choose && Num[j] = 0 ||
PC[j] <> Choose && Num[x] < Num[j] ||
PC[j] <> Choose &&
Num[x] = Num[j] && x < j) }
{
PC[x] := CS;
}
transition exit (x)
requires { PC[x] = CS }
{
PC[x] := NCS;
Num[x] := 0;
}
Figure 2.5 – Code Cubicle de l’algorithme de la boulangerie de Lamport
29Chapitre 2 Le model checker Cubicle
type location =
NCS | Choose | Wait | CS | Crash
...
transition fail (x)
{ PC[x] := Crash }
transition recover (x)
requires { PC[x] = Crash }
{
PC[x] := NCS;
Num[x] := 0;
}
2.2.4 Cohérence de Cache
Dans une architecture multiprocesseurs à mémoire partagée, l’utilisation de caches
est requise pour réduire les eets de la latence des accès mémoire et pour permettre la
coopération. Les architectures modernes possèdent de nombreux caches ayant des fonctions
particulières, mais aussi plusieurs niveaux de cache. Les caches qui sont les plus près des
unités de calcul des processeurs orent les meilleures performances. Par exemple un accès
en lecture au cache (succès de cache ou cache hit) L1 consomme seulement 4 cycles du
processeur sur une architecture Intel Core i7, alors qu’un accès mémoire (défaut de cache
ou cache miss) consomme en moyenne 120 cycles [113]. Cependant l’utilisation de caches
introduit le problème de cohérence de cache : toutes les copies d’un même emplacement
mémoire doivent être dans des états compatibles. Un protocole de cohérence de cache fait en
sorte, entre autres, que les écritures eectuées à un emplacement mémoire partagé soient
visibles de tous les autres processeurs tout en garantissant une absence de conits lors des
opérations.
Il existe plusieurs types de protocoles de cohérence de cache :
— cohérence par espionnage 3
: la communication se fait au travers d’un bus central sur
lequel les diérentes transactions sont visibles par tous les processeurs.
— cohérence par répertoire 4
: chaque processeur est responsable d’une partie de la
mémoire et garde trace des processeurs ayant une copie locale dans leur cache. Ces
protocoles fonctionnent par envoi de messages sur un réseau de communication.
Bien que plus dicile à mettre en œuvre, cette dernière catégorie de protocoles est
aujourd’hui la plus employée, pour des raisons de performance et de passage à l’échelle. Les
architectures réelles sont souvent très complexes, elles implémentent plusieurs protocoles
de cohérence de manière hiérarchique, et utilisent plusieurs dizaines voire centaines de
variables. Néanmoins leur fonctionnement repose sur le même principe fondamental. Un
protocole simple mais représentatif de cette famille à été donné par Steven German à
3. Ces protocoles sont aussi parfois qualiés de snoopy.
4. On qualie parfois ces protocoles par le terme anglais directory based.
302.2 Exemples
la communauté académique [138]. L’exemple suivant dénommé German-esque est une
version simpliée de ce protocole.
E
S
I
Shr[i] := true
Exg := true
Exg := true
Shr[i] := true
Shr[i] := false
Exg := false
Exg := false
Shr[i] := false
Figure 2.6 – Diagramme d’état du protocole German-esque
L’état d’un processeuri est donné par la variable Cache[i] qui peut prendre trois valeurs :
(E)xclusive (accès en lecture et écriture), (S)hared (accès en lecture seulement) ou (I)nvalid
(pas d’accès à la mémoire). Les clients envoient des requêtes au responsable lorsqu’un défaut
de cache survient : RS pour un accès partagé (défaut de lecture), RE pour un accès exclusif
(défaut d’écriture). Le répertoire contient quatre informations : une variable booléene
Exg signale par la valeur true qu’un des clients possède un accès exclusif à la mémoire
principale, un tableau de booléens Shr, tel que Shr[i] est vrai si le client i possède une
copie (avec un accès en lecture ou écriture) de la mémoire dans son cache, Cmd contient la
requête courante (ϵ marque l’absence de requête) dont l’émetteur est enregistré dans Ptr.
Les états initiaux du système sont représentés par la formule logique suivante :
∀i. Cache[i] = I ∧ ¬Shr[i] ∧ ¬Exg ∧ Cmd = ϵ
signiant que les caches de tous les processeurs sont invalides, aucun accès n’a encore été
donné et il n’y a pas de requête à traiter.
La Figure 2.6 donne une vue assez haut niveau de l’évolution d’un seul processeur. Les
èches pleines montrent l’évolution du cache du processeur selon ses propres requêtes, alors
que les èches pointillées représentent les transitions résultant d’une requête d’un autre
client. Par exemple, un cache va de l’état I à S lors d’un défaut de lecture : le répertoire lui
accorde un accès partagé tout en enregistrant cette action dans le tableau Shr[i] := true. De
31Chapitre 2 Le model checker Cubicle
germanesque.cub
type msg = Epsilon | RS | RE
type state = I | S | E
(* Client *)
array Cache[proc] : state
(* Directory *)
var Exg : bool
var Cmd : msg
var Ptr : proc
array Shr[proc] : bool
init (z) {
Cache[z] = I && Shr[z] = False &&
Exg = False && Cmd = Epsilon
}
unsafe (z1 z2) {
Cache[z1] = E && Cache[z2] <> I
}
transition request_shared (n)
requires { Cmd = Epsilon &&
Cache[n] = I }
{
Cmd := RS;
Ptr := n ;
}
transition request_exclusive (n)
requires { Cmd = Epsilon &&
Cache[n] <> E }
{
Cmd := RE;
Ptr := n;
}
transition invalidate_1 (n)
requires { Shr[n]=True && Cmd = RE }
{
Exg := False;
Cache[n] := I;
Shr[n] := False;
}
transition invalidate_2 (n)
requires { Shr[n]=True &&
Cmd = RS && Exg=True }
{
Exg := False;
Cache[n] := S;
Shr[n] := True;
}
transition grant_shared (n)
requires { Ptr = n &&
Cmd = RS && Exg = False }
{
Cmd := Epsilon;
Shr[n] := True;
Cache[n] := S;
}
transition grant_exclusive (n)
requires {
Cmd = RE && Exg = False &&
Ptr = n && Shr[n] = False &&
forall_other l. Shr[l] = False }
{
Cmd := Epsilon;
Exg := True;
Shr[n] := True;
Cache[n] := E;
}
Figure 2.7 – Code Cubicle du protocole de cohérence de cache German-esque
322.3 Non-atomicité
façon similaire, si un défaut en écriture survient dans un autre cache, le répertoire invalide
tous les clients enregistrés dans Shr avant de donner l’accès exclusif. Cette invalidation
générale a pour eet de passer les caches dans les états E et S à l’état I.
La modélisation qui est faite de ce protocole est assez immédiate et est donnée ci-dessous.
On peut toutefois remarquer qu’on s’intéresse ici seulement à la partie contrôle du protocole
et on oublie les actions d’écriture et lecture réelles de la mémoire. La seule propriété qu’on
souhaite garantir dans ce cas est que si un processeur a son cache avec accès exclusif alors
tous les autres sont invalides :
∀i,j. (i , j ∧ Cache[i] = E) =⇒ Cache[j] = I
Le responsable du répertoire est abstrait et on ne s’intéresse qu’à une seule ligne de
mémoire donc l’état du répertoire est représenté avec des variables globales.
2.3 Non-atomicité
Dans la plupart des travaux existants sur les systèmes paramétrés, on fait la supposition
que l’évaluation des conditions globales est atomique. La totalité de la garde est évaluée en
une seule étape. Cette hypothèse est raisonnable lorsque les conditions globales masquent
des détails d’implémentation qui permettent de faire cette évaluation de manière atomique.
En revanche, beaucoup d’implémentations réelles d’algorithmes concurrents et de protocoles
n’évaluent pas ces conditions instantanément mais plutôt par une itération sur
une structure de donnée (tableau, liste chaînée, etc.). Par exemple, l’algorithme de Dekker
(voir Section 2.2.2) implémente le test ∃j , i.x (j) de l’étiquette WANT par une boucle
qui recherche un j tel que x (j) soit vrai. De même, on a modélisé la boucle d’attente de
l’algorithme de la boulangerie (Section 2.2.3, algorithme 2, étiquette Choose) par une garde
universelle dans la transition turn.
En supposant que des conditions sont atomiques, on simplie le problème mais cette
approximation n’est pas conservatrice. En eet, l’évaluation d’une condition peut être
entrelacée avec les actions des autres processus. Il est possible par exemple, qu’un processus
change la valeur de sa variable locale alors que celle-ci à déjà été comptabilisée pour une
condition globale avec son ancienne valeur. Il peut dans ce cas exister dans l’implémentation
des congurations qui ne sont représentées par aucun état du modèle atomique. Si on veut
prendre en compte ces éventualités dans notre modélisation, on se doit de reéter tous les
comportements possibles dans le système de transition.
La vérication de propriétés d’exclusion mutuelle dans des protocoles paramétrés comme
l’algorithme de la boulangerie à déjà été traitée par le passé [32, 114]. Ces preuves ne sont
souvent que partiellement automatisées et font usage d’abstractions ad-hoc. La première
approche permettant une vérication automatique de protocoles avec gardes non atomiques
a été développée en 2008 [5]. Les auteurs utilisent ici un protocole annexe de ranement
33Chapitre 2 Le model checker Cubicle
pour modéliser l’évaluation non atomique des conditions globales. L’approche qu’on
présente dans la suite de cette section est identique en substance à celle de [5]. On montre
cependant qu’on peut rester dans le cadre déni par Cubicle pour modéliser ces conditions
non atomiques.
Comme les tests non atomiques sont implémentés par des boucles, on choisit de modéliser
les implémentations de la gure 2.8. La valeur N représente ici le paramètre du système,
∀j , i. c(j) ∃j , i. c(j)
j := 1 ;
while (j ≤ N) do
if j , i ∧ ¬c(j) then return false ;
j := j + 1
end ;
return true
j := 1 ;
while (j ≤ N) do
if j , i ∧ c(j) then return true ;
j := j + 1
end ;
return false
Figure 2.8 – Évaluation non atomique des conditions globales par un processus i
c’est-à-dire la cardinalité du type proc. Pour une condition universelle, on parcourt tous
les éléments (de 1 à N) et on s’assurent qu’ils vérient la condition c. Si on trouve un
processus qui ne respecte pas cette condition on sort de la boucle et on renvoie false.
Malheureusement dans Cubicle, on ne peut pas mentionner ce paramètre N explicitement
(car le solveur SMT ne peut pas raisonner sur la valeur de la cardinalité des modèles). On
ne peut dès lors pas utiliser de compteur entier. Pour s’en sortir, on construit une boucle
avec un compteur abstrait pour lequel on peut seulement tester si sa valeur est 0 ou N
5
.
On peut également incrémenter, décrémenter, et aecter ce compteur à ces mêmes valeurs.
Dans Cubicle on modélise ce compteur par un tableau de booléens représentant un
encodage unaire de sa valeur entière. Le nombre de cellules contenant la valeur true
correspond à la valeur du compteur. Incrémenter ce compteur revient donc à passer une
case de la valeur false à la valeur true. Pour modéliser l’évaluation non atomique de la
condition ∀j , i. c(j)
6
, on utilise un compteur Cpt. Comme on veut qu’il soit local à un
processus, on a besoin d’un tableau bi-dimensionnel. Le tableau en Cpt[i] matérialise le
compteur local au processusi. Le résultat de l’évaluation de cette condition sera stocké dans
la variable Res[i] à valeurs dans le type énuméré {E,T,F}. Res[i] contient E initialement
ce qui signie que la condition n’est pas nie d’être évaluée. Lorsqu’elle contient T alors la
condition globale a été évalué à vrai, et si elle contient F la condition globale est fausse.
Les transitions correspondantes sont données gure 2.9.
Avec cette modélisation, on spécie juste que la condition locale c(j) doit être vériée
5. On peut généraliser à tester si sa valeur est k ou N − k où k est une constante positive entière.
6. L’encodage de l’évaluation de la condition duale ∃j , i. c(j) est symétrique.
342.3 Non-atomicité
Transition Commentaire
type result = E | T | F
array Cpt[proc,proc] : bool
array Res[proc] : result
transition start (i)
requires { ... }
{ Res[i] := E
Cpt[x,y] := case
| x=i : False
| _ : Cpt[x,y] }
On initialise le compteur à 0 et on signale
que la condition est en cours
d’évaluation avec la variable locale
Res.
transition iter (i j)
requires { Cpt[i,j] = False && c(j) }
{ Cpt[i,j] := True }
La condition c(j) n’a pas encore été
vériée. Comme elle est vraie on incrémente
le compteur.
transition abort (i j)
requires { Cpt[i,j] = False && ¬c(j) }
{ Res[i] := F }
La condition c(j) n’a pas encore été
vériée mais elle est fausse. On sort
de la boucle, la condition globale est
fausse.
transition exit (i)
requires { forall_other j.
Cpt[i,j] = True }
{ Res[i] := T }
Toutes les conditionsc(j) ont étés véri-
ées. On sort de la boucle, la condition
globale est vraie.
Figure 2.9 – Encodage de l’évaluation non atomique de la condition globale ∀j , i. c(j)
35Chapitre 2 Le model checker Cubicle
pour tous les processus, indépendamment de l’ordre. Cette sous-spécication reste conservatrice.
Il est toutefois possible d’ajouter des contraintes d’ordre sur la variable j si c’est
important pour la propriété de sûreté.
On peut remarquer qu’on se sert d’une garde universelle dans la transition exit. Ceci
n’inue en rien la « non-atomicité » de l’évaluation de la condition car le quanticateur
est seulement présent pour encoder le test Cpt[i] = N.
Remarque. Avec cette garde universelle, on risque de tomber dans le cas d’une fausse alarme
à cause du traitement détaillé en section 3.3 du chapitre suivant. L’intuition apportée par
le modèle de panne franche, nous permet d’identier ces cas problématiques. Si la sûreté
dépend du fait qu’un processus puisse disparaître du système pendant l’évaluation d’une
condition globale, alors on risque de tomber dans ce cas défavorable.
Les versions non atomiques des algorithmes sont bien plus compliquées que leurs
homologues atomiques. Les raisonnements à mettre en œuvre pour dérouler la relation
de transition (aussi bien en avant qu’en arrière) sont plus longs. C’est ce qui en fait des
candidats particulièrement coriaces pour les procédures de model checking.
2.4 Logique multi-sortée et systèmes à tableaux
On a montré dans la section précédente que le langage de Cubicle permet de représenter
des algorithmes d’exclusion mutuelle ou des protocoles de cohérence de cache à l’aide
de systèmes de transitions paramétrés. Le lecteur intéressé par la dénition précise de
la syntaxe concrète et des règles de typage de ce langage trouvera leur description en
annexe A.
Dans cette section, on dénit formellement la sémantique des programmes Cubicle. Pour
ce faire, on utilise le formalisme des systèmes à tableaux conçu par Ghilardi et Ranise [77].
Ainsi, on montre dans un premier temps que chaque transition d’un système paramétré peut
simplement être interprétée comme une formule dans un fragment de la logique du premier
ordre multi-sortée. Ce fragment est déni par l’ensemble des types et variables déclarés au
début du programme (ainsi que ceux prédénis dans Cubicle). Dans un deuxième temps, on
donne une sémantique opérationnelle à ces formules à l’aide d’une relation de transition
entre les modèles logiques de ces formules.
On rappelle ici brièvement les notions usuelles de la logique du premier ordre multisortée
et de la théorie des modèles qui sont utilisées pour dénir les systèmes à tableaux
de Cubicle. Des explications plus amples peuvent être trouvées dans des manuels traitant
du sujet [92, 152]. Le lecteur familier avec ces concepts peut ne lire que la section 2.4.3 qui
présente plus en détail la construction des ces systèmes.
362.4 Logique multi-sortée et systèmes à tableaux
2.4.1 Syntaxe des formules logiques
La logique du premier ordre multi-sortée est une extension classique qui possède essentiellement
les mêmes propriétés que la logique du premier ordre sans sortes [149]. Son
intérêt est qu’elle permet de partitionner les éléments qu’on manipule selon leur type.
Dénition 2.4.1. Une signature Σ est un tuple (S,F ,R) où :
— S est un ensemble non vide de symboles de sorte
— F est un ensemble de symboles de fonction, chacun étant associé à un type de la
forme
— s pour les symboles d’arité 0 (zéro) avec s ∈ S. On appelle ces symboles des
constantes.
— s1 × . . . × sn → s pour les symboles d’arité n, avec s1,. . . ,sn,s ∈ S
— R est un ensemble de symboles de relation (aussi appelé prédicats). On associe à
chaque prédicat d’arité n un type de la forme s1 × . . . × sn avec s1,. . . ,sn ∈ S.
Dans la suite on supposera que le symbole d’égalité = est inclus dans toutes les signatures
qui seront considérées et qu’il a les types s × s quelque soit la sorte s ∈ S
7
. On notera
par exemple par f : s1 × . . . × sn → s un symbole de fonction f dans F dont le type est
s1 × . . . × sn → s.
L’en-tête du chier Cubicle est en fait une façon de donner cette signature. Par exemple
l’en-tête du code de l’exemple du mutex de la section 2.2.1 correspond à la dénition de la
signature Σ suivante :
en-tête Cubicle signature Σ = (S,F ,R)
type state = Idle | Want | Crit
array State[proc] : state
var Turn : proc
S = {state,proc}
F = {Idle : state,Want : state,
Crit : state,
State : proc → state,
Turn : proc}
R = {= : state × state
: proc × proc}
Remarque. Le mot-clef var ne permet pas d’introduire une variable dans la logique mais
permet de déclarer une constante logique avec son type. Le choix des mots-clefs var et
array reète une vision plus intuitive des systèmes Cubicle comme des programmes.
7. On pourrait éviter cette formulation avec un symbole d’égalité polymorphe mais cela demande
d’introduire des variables de type.
37Chapitre 2 Le model checker Cubicle
Remarque. Cubicle connaît en interne les symboles de sorte proc, bool, int et real ainsi
que les symboles de fonction +, −, les constantes 0,1,2,. . . ,0.0,1.0,. . . et les relations < et
≤. Par convention, ils apparaîtront dans la signature Σ seulement s’ils sont utilisés dans le
système.
On distinguera parmi ces signatures celles qui ne permettent pas d’introduire de nouveaux
termes car il est important pour Cubicle de maîtriser la création des processus.
Dénition 2.4.2. Une signature est dite relationnelle si elle ne contient pas de symboles
de fonction.
Dénition 2.4.3. Une signature est dite quasi-relationnelle si les symboles de fonction
qu’elle contient sont tous des constantes.
On dénit les Σ-termes, Σ-atomes (ou Σ-formules atomiques), Σ-littéraux et Σ-formules
comme les expressions du langage déni par la grammaire décrite en gure 2.10. Les types
des variables quantiées ne sont pas indiqués par commodité.
Σ-terme : hti ::= c où c est une constante de Σ
| f (hti, . . . , hti) où f est un symbole de fonction de Σ d’arité
> 0
| ite (hφi, hti, hti)
Σ-atome : hai ::= false | true
| p(hti, . . . , hti) où p est un symbole de relation de Σ
Σ-littéral : hli ::= hai | ¬hai
Σ-formule : hφi ::= hli | hφi ∧ hφi | hφi ∨ hφi | ∀i. hφi | ∃i. hφi
Figure 2.10 – Grammaire de la logique
En plus de cette restriction syntaxique, on impose que les Σ-termes et Σ-atomes soient
bien typés en associant des sortes aux termes :
1. Chaque constante c de sorte s ∈ S est un terme de sorte s.
2. Soient f un symbole de fonction de type s1 × . . . × sn → s, t1 un terme de sorte s1,
. . . , et tn un terme de sorte sn alors f (t1,. . . tn) est un terme de sorte s.
3. Soit p un symbole de relation de type s1 × . . . ×sn. L’atome p(t1,. . . ,tn) est bien typé
ssi t1 est un terme de sorte s1, . . . , et tn est un terme de sorte sn.
382.4 Logique multi-sortée et systèmes à tableaux
On appelle une Σ-clause une disjonction de Σ-littéraux. On dénote par, Σ-CNF (resp.
Σ-DNF) une conjonction de disjonction de littéraux (resp. une disjonction de conjonction
de littéraux).
Conventions et notations
Pour éviter la lourdeur de la terminologie on dénotera par termes, atomes (ou formules
atomiques), littéraux, formules, clauses, CNF et DNF respectivement les Σ-termes, Σ-atomes
(ou Σ-formules atomiques), Σ-littéraux, Σ-formules, Σ-clauses, Σ-CNF et Σ-DNF lorsque le
contexte ne permet pas d’ambiguïté.
Les termes de la forme ite (φcond ,tthen,telse ) correspondent à la construction conditionnelle
classique if φcond then tthen else telse . On suppose l’existence d’une fonction elim_ite
qui prend en entrée une formule sans quanticateurs dont les termes peuvent contenir le
symbole ite et renvoie une formule équivalente sansite. De plus on suppose que elim_ite
renvoie une formule en forme normale disjonctive (Σ-DNF). Par exemple,
elim_ite(x = ite (φ,t1,t2)) = (φ ∧ x = t1) ∨ (¬φ ∧ x = t2)
On notera par i¯ une séquence i1,i2,. . . ,in. Pour les formules quantiées, on écrira
∃x,y. φ (resp. ∀x,y. φ) pour ∃x∃y. φ (resp. ∀x∀y. φ). En particulier, on écrira ∃i¯. φ pour
∃i1∃i2 . . . ∃in. φ.
2.4.2 Sémantique de la logique
Dénition 2.4.4. Une Σ-structure A est une paire (D,I) où D est un ensemble appelé le
domaine de A (ou l’univers de A) et dénoté par dom(A). Les éléments de D sont appelés
les éléments de la structure A. On notera |dom(A)| le cardinal du domaine de A et on dira
qu’une structure A est nie si |dom(A)| est ni. I est l’interprétation qui :
1. associe à chaque sorte s ∈ S de Σ un sous ensemble non vide de D.
2. associe à chaque constante de Σ de type s un élément du sous-domaine I(s).
3. associe à chaque symbole de fonction f ∈ F d’arité n > 0 et de type s1 × . . . × sn → s
une fonction totale I(f ) : I(s1) × . . . × I(sn) → I(s).
4. associe à chaque symbole de relation p ∈ R d’arité n > 0 et de type s1 × . . . × sn une
fonction totale I(p) : I(s1) × . . . × I(sn) → {true,false}.
Cette interprétation peut être étendue de manière homomorphique aux Σ-termes et Σ-
formules – elle associe à chaque terme t de sorte s un élément I(t) ∈ I(s) et à chaque
formule φ une valeur I(φ) ∈ {true,false}.
Dénition 2.4.5. On appelle une Σ-théorie T un ensemble (potentiellement inni) de
Σ-structures. Ces structures sont aussi appelées les modèles de T .
39Chapitre 2 Le model checker Cubicle
Dénition 2.4.6. On dit qu’un Σ-modèle M = (A,I) satisfait une formule φ ssi I(φ) =
true, dénoté par M |= φ.
Dénition 2.4.7. Une formule φ est dite satisable dans une théorie T (ou T -satisable)
ssi il existe un modèle M ∈ T qui satisfait φ.
Une formule φ est dite conséquence logique d’un ensemble Γ de formules dans une théorie
T (et noté par Γ |=T φ) ssi tous les modèles de T qui satisfont Γ satisfont aussi φ.
Dénition 2.4.8. Une formule φ est dite valide dans une théorie T (ou T -valide) ssi sa
négation est T -insatisable, dénoté par T |= φ ou ∅ |=T φ.
Dénition 2.4.9. Soient A et B deux Σ-structures. A est une sous-structure de B, noté
A ⊆ B si dom(A) ⊆ dom(B).
Dénition 2.4.10. Soient A une Σ-structure et X ⊆ dom(A), alors il existe une unique
plus petite sous-structure B de A tel que dom(B) ⊆ X. On dit que B est la sous-structure de
A générée par X et on note B = hXiA.
Les deux dénitions suivantes seront importantes pour caractériser la théorie des processus
supportée par Cubicle.
Dénition 2.4.11. Une Σ-théorie T est localement nie ssi Σ est nie, chaque sous ensemble
ni d’un modèle de T génère une sous-structure nie.
Remarque. Si Σ est relationnelle ou quasi-relationnelle alors toute Σ-théorie est localement
nie.
Dénition 2.4.12. Une Σ-théorie T est close par sous-structure ssi chaque sous-structure
d’un modèle de T est aussi un modèle de T .
Exemple. La théorie ayant pour modèle la structure de domaine N et signature ({int},
{0,1}, {=,≤}) où ces symboles sont interprétés de manière usuelle (comme dans la théorie
de l’arithmétique de Presburger) est localement nie et close par sous-structure. Si on étend
cette signature avec le symbole de fonction + alors elle n’est plus localement nie mais
reste close par sous-structure. Une théorie ayant pour modèle une structure nie, avec une
signature (_,∅,{=,R}) où R est interprétée comme une relation binaire qui caractériserait
un anneau est localement nie mais n’est pas close par sous-structure.
Le problème de la satisabilité modulo une Σ-théorie T (SMT) consiste à établir la
satisabilité de formules closes sur une extension arbitraire de Σ (avec des constantes).
Une extension de ce problème, beaucoup plus utile en pratique, est d’établir la satisabilité
modulo la combinaison de deux (ou plus) théories.
402.4 Logique multi-sortée et systèmes à tableaux
Exemples de théories. La théorie de l’égalité (aussi appelée théorie vide, ou EUF) est
la théorie qui a comme modèles tous les modèles possibles pour une signature donnée.
Elle n’impose aucune restriction sur l’interprétation faite de ses symboles (ses symboles
sont dits non-interprétés). Les fonctions non-interprétées sont souvent utilisées comme
technique d’abstraction pour s’aranchir d’une complexité ou de détails inutiles.
La théorie de l’arithmétique est une autre théorie omniprésente en pratique. Elle est
utilisée pour modéliser l’arithmétique des programmes, la manipulation de pointeurs et de
la mémoire, les contraintes de temps réels, les propriétés physiques de certains systèmes,
etc. Sa signature est {0,1,...,+,−,∗,/,≤} étendue à un nombre arbitraire de constantes, et
ses symboles sont interprétés de manière usuelle sur les entiers et les réels.
Une théorie de types énumérés est une théorie ayant une signature Σ quasi-relationnelle
contenant un nombre ni de constantes (constructeurs). L’ensemble de ses modèles consiste
en une unique Σ-structure dont chaque symbole est interprété comme un des constructeurs
de Σ. Dans ce qui va suivre on verra que ces théories seront utiles pour modéliser les points
de programme de processus et les messages échangés par ces processus dans les systèmes
paramétrés.
2.4.3 Systèmes de transition à tableaux
Cette section introduit le formalisme des systèmes à tableaux conçu par Ghilardi et
Ranise [77]. Il permet de représenter une classe de systèmes de transition paramétrés dans
un fragment restreint de la logique du premier ordre multi-sortée. Pour ceci on aura besoin
des théories suivantes :
— une théorie des processus TP sur signature ΣP localement nie dont le seul symbole
de type est proc, et telle que la TP -satisabilité est décidable sur le fragment sans
quanticateurs
— une théorie d’éléments TE sur signature ΣE localement nie dont le seul symbole
de type est elem, et telle que la TE-satisabilité est décidable sur le fragment sans
quanticateurs. TE peut aussi être l’union de plusieurs théories TE = TE1 ∪ . . . ∪ TEk
,
dans ce cas TE a plusieurs symboles de types elem1, . . ., elemk .
— la théorie d’accès TA sur signature ΣA, obtenue en combinant la théorie TP et la
théorie TE de la manière suivante. ΣA = ΣP ∪ ΣE ∪ Q où Q est un ensemble de
symboles de fonction de type proc × . . . × proc → elemi
(ou constantes de type
elemi
). Étant donnée une structure S, on note par S|ty la structure S dont le domaine
est restreint aux éléments de type ty. Les modèles de TA sont les structures S où
S|proc est un modèle de TP et S|elem est un modèle de TE et S|proc×...×proc→elem est
l’ensemble des fonctions totales de proc × . . . × proc → elem.
41Chapitre 2 Le model checker Cubicle
On suppose dans la suite que les théories TE et TP ne partagent pas de symboles, i.e.
ΣE ∩ ΣP = {=} (seule l’égalité apparaît dans toutes les signatures).
Dénition 2.4.13. Un système (de transition) à tableaux est un triplet S = (Q,I,τ ) avec Q
partitionné en Q0,. . . ,Qm où
— Qi est un ensemble de symboles de fonction d’arité i. Chaque f ∈ Qi a comme
type proc × . . . × proc
| {z }
i fois
→ elemf
. Les fonctions d’arité 0 représentent les variables
globales du système. Les fonctions d’arité non nulle représentent quand à elles les
tableaux (indicés par des processus) du système.
— I est une formule qui caractérise les états initiaux du système (où les variables de Q
peuvent apparaître libres).
— τ est une relation de transition.
La relation τ peut être exprimée sous la forme d’une disjonction de formules quantiées
existentiellement par zéro, une, ou plusieurs variables de type proc. Chaque composante de
cette disjonction est appelée une transition et est paramétrée par ses variables existentielles.
Elle met en relation les variables globales et tableaux d’états avant et après exécution
de la transition. Si x ∈ Q est un tableau (ou une variable globale), on notera par x
′
la
valeur de x après exécution de la transition et par Q
′
l’ensemble des variables et tableaux
après exécution de la transition. La forme générale des transitions qu’on considère est la
suivante :
t(Q,Q
′
) = ∃i¯. γ (i¯,Q)
| {z }
garde
∧
^
x∈Q
∀j¯.x
′
(j¯) = δx (i¯,j¯,Q)
| {z }
action
où
— γ est une formule sans quanticateurs 8
appelée la garde de t
— δx est une formule sans quanticateurs appelée la mise à jour de x
Les variables de Q peuvent apparaître libres dans γ et les δx . Cette formule est équivalente
à la variante suivante où les fonctions x
′
sont écrites sous forme fonctionnelle avec un
lambda-terme :
t(Q,Q
′
) = ∃i¯. γ (i¯,Q) ∧
^
x∈Q
x
′ = λj¯. δx (i¯,j¯,Q)
8. On autorise une certaine forme de quantication universelle dans γ en section 3.3.
422.4 Logique multi-sortée et systèmes à tableaux
Intuitivement, une transition t met en jeu un ou plusieurs processus (les variables
quantiées existentiellement i¯, ses paramètres) qui peuvent modier l’état du système
(cf. Section 2.5). Ici γ représente la garde de la transition et les δx sont les mises à jour
des variables et tableaux d’état. Un tel système S = (Q,I,τ ) est bien décrit par la syntaxe
concrète de Cubicle et de manière analogue, sa sémantique est une boucle innie qui, à
chaque tour, exécute une transition choisie arbitrairement dont la garde γ est vraie, et met
à jour les valeurs des variables de Q en conséquence.
Soit un système S = (Q,I,τ ) et une formule Θ (dans laquelle les variables de Q peuvent
apparaître libres), le problème de la sûreté (ou de l’atteignabilité) est de déterminer s’il
existe une séquence de transitions t1,. . . ,tn dans τ telle que
I (Q
0
) ∧ t1 (Q
0
,Q
1
) ∧ . . . ∧ tn (Q
n−1
,Q
n
) ∧ Θ(Q
n
)
est satisable modulo les théories mises en jeu. S’il n’existe pas de telle séquence, alors S
est dit sûr par rapport à Θ. Autrement dit, ¬Θ est une propriété de sûreté ou un invariant
du système.
Exemple (Mutex). On prend ici l’exemple d’un mutex simple paramétré par son nombre
de processus (dans type proc) dont un aperçu plus détaillé a été donnée en section 2.2.1.
Pour cet exemple, on prendra TP la théorie de l’égalité de signature ΣP = ({proc},∅,{=})
ayant pour symbole de type proc. On considère comme théorie des éléments, l’union
d’une théorie des types énumérés TE de signature ΣE = ({state},{Idle,Want,Crit},{=}) où
Idle, Want, et Crit en sont les constructeurs de type state et de la théorie TP . La théorie
d’accès TA est dénie comme la combinaison de TP et TE. Elle a pour signature ΣA =
ΣP ∪ ΣE ∪ (_,{State,Turn},∅) où State est un symbole de fonction de type proc →
state, et Turn est une constante de type proc.
Avec le formalisme décrit précédemment, le système S = (Q,I,τ ) représentant le problème
du mutex s’exprime de la façon suivante. L’ensemble Q contient les symboles State
et Turn. Les états initiaux du système sont décris par la formule
I ≡ ∀i. State(i) = Idle
La relation de transition τ est la disjonction treq ∨ tenter ∨ texit avec :
treq ≡ ∃i. State(i) = Idle ∧
∀j. State′
(j) = ite (i = j, Want, State(j)) ∧ Turn′ = Turn
tenter ≡ ∃i. State(i) = Want ∧ Turn = i ∧
∀j. State′
(j) = ite (i = j, Crit, State(j)) ∧ Turn′ = Turn
texit ≡ ∃i. State(i) = Crit ∧
∀j. State′
(j) = ite (i = j, Idle, State(j))
43Chapitre 2 Le model checker Cubicle
Enn la formule caractérisant les mauvais états du système est :
Θ ≡ ∃i,j. i , j ∧ State(i) = Crit ∧ State(j) = Crit
La description de ce système faite dans la syntaxe concrète de Cubicle donnée en section
2.2.1 est l’expression directe de cette représentation. Pour plus de simplicité, on notera les
transitions avec le sucre syntaxique (de Cubicle)
transition t (i¯) requires { д } { a }
dans la section suivante. Par exemple, la première transition treq sera notée par
transition treq (i)
requires {State[i] = Idle}
{ State[j]:= case i = j : Want | _ : State′
[j] } .
2.5 Sémantique
La sémantique d’un programme décrit par un système de transition à tableaux dans
Cubicle est dénie pour un nombre de processus donné. On xe n la cardinalité du domaine
proc. C’est-à-dire que tous les modèles qu’on considère dans cette section interprètent le
type proc vers un ensemble à n éléments.
Remarque. On peut aussi voir un Σ-modèle M comme un dictionnaire qui associe les
éléments de Σ aux éléments du domaine de M.
Soit S = (Q,I,τ ) un système à tableaux, et TA la combinaison des théories comme dénie
en section 2.4.3. Dans la suite de cette section, on verra les modèles de TA comme des
dictionnaires associant tous les symboles de ΣA à des éléments de leur domaine respectif.
La première partie de ce chapitre donne au lecteur tous les éléments nécessaires pour
réaliser un interprète du langage d’entrée de Cubicle et s’assurer qu’il soit correct.
2.5.1 Sémantique opérationnelle
On dénit la sémantique opérationnelle du système à tableaux S pour n processus sous
forme d’un triplet K
n = (Sn,In,−→) où :
— Sn est l’ensemble potentiellement inni des modèles de TA où la cardinalité de l’ensemble
des éléments de proc est n.
— In = {M ∈ Sn | M |= I} est le sous ensemble de Sn dont les modèles satisfont la
formule initiale I du système à tableaux S.
442.5 Sémantique
— −→ ⊆ Sn × Sn est la relation de transition d’états dénie par la règle suivante :
transition t (i¯) requires { д } { a }
σ : i¯7→ proc M |= дσ A = all(a,i¯)
M −→ update(Aσ,M)
oùA = all(a,proc) est l’ensemble des actions de a instanciées avec tous les éléments
de proc et σ est une substitution des paramètres i¯ de la transition vers éléments
de proc. L’application de substitution de variables sur les actions s’eectue sur les
termes de droite. On note Aσ l’ensemble des actions de A auxquelles on a appliqué
la substitution σ :
x := t ∈ A ⇐⇒ x := tσ ∈ Aσ
A[i¯] := case c1 : t1
| . . .
| cm : tm
| _ : tm+1
∈ A ⇐⇒
A[i¯] := case c1σ : t1σ
| . . .
| cmσ : tmσ
| _ : tm+1σ
∈ Aσ
update(Aσ,M) est le modèle obtenu après application des actions de Aσ. On dénit
une fonction d’évaluation ⊢I telle que :
M ⊢I e : v ssi l’interprétation de e dans M est v
L’union des dictionnaires M1 ∪ M2 est dénie comme l’union des ensembles des
liaisons lorsque ceux-ci sont disjoints. Lorsque certaines liaisons apparaissent à la
fois dans M1 et M2, on garde seulement celles de M2. On note la fonction update
par le symbole ⊢up dans les règles qui suivent.
M ⊢up a1 : M1 M ⊢up a2 : M2
M ⊢up a1; a2 : M1 ∪ M2
M ⊢I t : v
M ⊢up x := t : M ∪ {x 7→ v}
M 6|= c1 M ⊢up A[i¯]:= case c2:t2 | . . . | _ : tn+1 : M′
M ⊢up A[i¯]:= case c1:t1 | c2:t2 | . . . | _ : tn+1 : M′
M |= c1 M ⊢I t1 : v1 M ⊢I A : fA M ⊢I i¯: vi
M ⊢up A[i¯]:= case c1:t1 | c2:t2 | . . . | _ : tn+1 : M ∪ {A 7→ fA ∪ {vi
7→ v1}}
M ⊢up M ⊢I t : v M ⊢I A : fA M ⊢I i¯: vi
M ⊢up A[i¯]:= case _ : t : M ∪ {A 7→ fA ∪ {vi
7→ v}}
45Chapitre 2 Le model checker Cubicle
Exécuter l’action x := t revient à changer la liaison de x dans le modèle M par la
valeur de t, comme montré par la deuxième règle. L’avant dernière règle dénit quant à
elle l’exécution d’une mise à jour du tableau A en position i¯. Si la première condition c1 de
la construction case est satisable dans le modèle courant, l’interprétation de la fonction
correspondant à A est changée pour qu’elle associe maintenant la valeur de t aux valeurs
de i¯.
Remarque. La construction case du langage de Cubicle est similaire aux constructions
traditionnelles de certains langages de programmation comme le branchement conditionnel
switch . . .case . . .break de C, ou match de ML. En eet les instructions d’un cas sont
exécutées seulement si toutes les conditions précédentes sont fausses. Le dernier cas _
permet de s’assurer qu’au moins une instruction est exécutée. En utilisant la forme logique
de la section 2.4.3, une mise à jour avec case s’exprime sous la forme de termes ite (ifthen-else)
imbriqués. Une fois les ite éliminés, l’ensemble des conditions obtenues forme
une partition (i.e. elles sont mutuellement insatisables et leur disjonction est valide).
Ces règles montrent notamment qu’on évalue les termes des aectations dans le modèle
précédent et non celui qu’on est en train de construire. Le caractère ; dans les actions ne
représente pas une séquence car les actions d’une transition sont exécutées simultanément
et de manière atomique.
Un système paramétré a alors toutes les sémantiques {K
n
| n ∈ N}. On peut aussi voir la
sémantique d’un système à tableaux paramétré comme une fonction qui à chaque n associe
K
n 9
.
2.5.2 Atteignabilité
Ici on ne s’intéresse qu’aux propriétés de sûreté des systèmes à tableaux, ce qui revient
au problème de l’atteignabilité d’un ensemble d’états.
Soit K
n = (Sn,In,−→) un triplet exprimant la sémantique d’un système à tableaux S =
(Q,I,τ ) comme déni précédemment. On note par −→∗
la clôture transitive de la relation
−→ sur Sn. On dit qu’un état s ∈ Sn est atteignable dans K
n
et on note Reachable(s,K
n
) ssi
il existe un état s0 ∈ In tel que
s0 −→∗
s
Soit une propriété dangereuse caractérisée par la formule Θ. On dira qu’un système à
tableaux S est non sûr par rapport à Θ ssi
∃n ∈ N. ∃s ∈ Sn. s |= Θ ∧ Reachable (s,K
n
)
9. On peut remarquer que K
n
est en réalité une structure de Kripke innie pour laquelle on omet la
fonction de labellisation L des états de la structure de Kripke car elle correspond exactement aux modèles, i.e.
L(M) = M.
462.5 Sémantique
Au contraire, on dira que S est sûr par rapport à Θ ssi
∀n ∈ N. ∀s ∈ Sn. s |= Θ =⇒ ¬Reachable (s,K
n
)
2.5.3 Un interpréteur de systèmes à tableaux
À l’aide de la sémantique précédente, on peut dénir diérentes analyses sur un système
à tableaux. Par exemple, un interpréteur de systèmes à tableaux est un programme dont les
états sont des états de K
n = (Sn,In,−→), qui démarre en un état initial de In et qui « suit »
une séquence de transitions de −→.
Comme dans la section précédente, l’interpréteur pour un système à tableaux S =
(Q,I,τ ) représente l’état du programme par un dictionnaire sur Q (i.e. un modèle de TA).
On suppose ici que In est non vide, c’est-à-dire qu’il existe au moins un modèle de I où
proc est de cardinalité n. Dans ce cas, on note Init la fonction qui prend n en argument et
qui retourne un état de In au hasard.
L’interpréteur consiste en une procédure run (Algorithme 3) prenant en argument
le paramètre n et la relation de transition τ . Elle maintient l’état du système dans le
dictionnaire M et exécute une boucle innie qui modie M en fonction des transitions
choisies.
Algorithme 3 : Interpréteur d’un système à tableaux
Variables :
M : l’état courant du programme (un modèle de TA)
procedure run(n,τ ) : begin
M := Init(n);
while true do
let L = enabled(n,τ ,M) in
if L = ∅ then deadlock ();
let a,σ = select(L) in
M := update(all(a,proc)σ,M);
La fonction enabled(n,τ ,M) renvoie l’ensemble des transitions de τ dont la garde est
vraie pour M. Autrement dit,
(transition t (i¯) requires { д } { a }) ∈ enabled(n,τ ,M) =⇒ M |= ∃i¯. д(i¯)
où д est la garde de la transition t et i¯ en sont les paramètres. Si aucune des transitions
n’est possible alors on sort de la boucle d’exécution avec la fonction deadlock. Si M
47Chapitre 2 Le model checker Cubicle
correspond à un état nal du système, le programme s’arrête. Sinon on est dans une
situation d’interblocage (ou deadlock).
La fonction select choisit de manière aléatoire une des transitions de L et retourne les
actions a correspondantes ainsi qu’une substitution σ des arguments vers les éléments du
domaine de proc telle que M |= д(i¯)σ.
Ensuite la fonction update(all(a,proc)σ,M) retourne un nouveau dictionnaire où les
valeurs des variables et tableaux sont mises à jour en fonction des actions de l’instance de
la transition choisie, comme déni précédemment.
Remarque. On peut aussi ajouter une instruction assert(¬M |= Θ) à l’algorithme 3 qui
lève une erreur dès qu’on passe par un état mauvais, i.e. lorsque M |= Θ.
Exemple (Mutex). Prenons l’exemple du mutex de la section précédente avec deux processus
#1 et #2. Une conguration de départ satisfaisant la formule initiale I possible est le
modèle M ci-dessous. En exécutant la transition treq pour le processus #1, on change la
valeur de State(#1) et obtient le nouveau modèle M′
.
M =
F dom(M)
Turn 7→ #2
State 7→
(
#1 7→ Idle
#2 7→ Idle
.
.
.
tr eq [i\#1]
−−−−−−−−−−−−→ M′ =
F dom(M′
)
Turn 7→ #2
State 7→
(
#1 7→ Want
#2 7→ Idle
.
.
.
Maintenant qu’il est aisé de se faire une idée du langage de description et de sa sémantique
qu’on utilise pour les systèmes de transition paramétrés, on montre dans la suite de ce
document comment construire un model checker capable de prouver la sûreté des exemples
de la section 2.2. Les algorithmes présentés dans ce chapitre sont des systèmes jouets, dans
le sens où ils représentent des problèmes de vérication formelle de taille assez réduite.
Cependant les preuves manuelles de ses systèmes paramétrés ne sont pas pour autant
triviales et les outils automatiques sont souvent mis au point sur ce genre d’exemples. On
s’eorcera bien sûr d’expliquer comment développer des algorithmes qui passent à l’échelle
sur des problèmes plus conséquents.
483
Cadre théorique : model checking modulo
théories
Sommaire
3.1 Analyse de sûreté des systèmes à tableaux . . . . . . . . . . . . . . 50
3.1.1 Atteignabilité par chaînage arrière . . . . . . . . . . . . . . . . 50
3.1.2 Correction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.1.3 Eectivité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.2 Terminaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2.1 Indécidabilité de l’atteignabilité . . . . . . . . . . . . . . . . . . 57
3.2.2 Conditions pour la terminaison . . . . . . . . . . . . . . . . . . 59
3.2.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.3 Gardes universelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.3.1 Travaux connexes . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.3.2 Calcul de pré-image approximé . . . . . . . . . . . . . . . . . . 69
3.3.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3.4 Relation avec le modèle de panne franche et la relativisation des
quanticateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.4.1 Exemples sans existence d’un bel ordre . . . . . . . . . . . . . . 74
3.4.2 Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.4.3 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Le cadre théorique sur lequel repose Cubicle est celui du model checking modulo théories
proposé par Ghilardi et Ranise [77]. C’est un cadre déclaratif dans lequel les systèmes
manipulent un ensemble de tableaux innis d’où le nom de systèmes à tableaux. Un système
est décrit par des formules logiques du premier ordre et des transitions gardées (voir
49Chapitre 3 Cadre théorique : model checking modulo théories
Section 2.4.3). Une des forces de cette approche réside dans l’utilisation des capacités de
raisonnement des solveurs SMT et de leur support interne pour de nombreuses théories. On
rappelle dans ce chapitre les fondements de cette théorie et certains résultats et théorèmes
associés.
Dans la suite de ce chapitre on se donne un système à tableaux S = (Q,I,τ ) et une
formule Θ représentant des états dangereux. Rappelons que la relation τ peut s’exprimer
sous la forme d’une disjonction de transitions paramétrées de la forme :
t(Q,Q
′
) = ∃i¯. γ (i¯,Q)
| {z }
garde
∧
^
x∈Q
∀j¯.x
′
(j¯) = δx (i¯,j¯,Q)
| {z }
action
avecγ et δx des formulessans quanticateurs. Ces restrictions sont très importantes car elles
permettent à la théorie exposée dans ce chapitre de caractériser des conditions susantes
pour lesquelles l’atteignabilité (ou la sûreté) est décidable.
Cubicle implémente le cadre du model checking modulo théories mais va au-delà en
relâchant certaines contraintes, au prix de la complétude et de la terminaison, mais reste
correct.
3.1 Analyse de sûreté des systèmes à tableaux
Cette section présente les conditions sous lesquelles l’analyse de sûreté d’un système à
tableau peut être mise en œuvre de façon eective. En particulier on caractérise un fragment
de la logique qui est clos par les opérations de l’algorithme d’atteignabilité arrière et on
montre que cette approche est correcte.
3.1.1 Atteignabilité par chaînage arrière
Plusieurs approches sont possibles pour résoudre les instances du problème de sûreté
(ou d’atteignabilité). Une première approche consiste à construire l’ensemble des états
atteignables (par chaînage avant) à partir des états initiaux, une autre approche, celle qui
sera adoptée dans la suite, consiste à construire l’ensemble des états qui peuvent atteindre
les mauvais états du système (atteignabilité par chaînage arrière).
Dénition 3.1.1. La post-image d’une formule φ(X) par la relation de transition τ est
dénie par
Postτ (φ)(X
′
) = ∃X. φ(X) ∧ τ (X,X
′
)
Elle représente les états atteignables à partir de φ en une étape de τ .
503.1 Analyse de sûreté des systèmes à tableaux
Dénition 3.1.2. La pré-image d’une formule φ(X
′
) par la relation de transition τ est
dénie par
Preτ (φ)(X) = ∃X
′
. τ (X,X
′
) ∧ φ(X
′
)
De manière analogue la pré-image d’une formule φ(X
′
) par une transition t est dénie par
Pret
(φ)(X) = ∃X
′
. t(X,X
′
) ∧ φ(X
′
)
et donc Preτ (φ)(X) =
W
t∈τ Pret
(φ)(X).
La pré-image Preτ (φ) est donc une formule qui représente les états qui peuvent atteindre
φ en une étape de transition de τ .
La clôture de la pré-image Pre∗
τ
(φ) est dénie par :
Pre0
τ
(φ) = φ
Pren
τ
(φ) = Preτ (Pren−1
τ
(φ))
Pre∗
τ
(φ) =
W
k∈N Prek
τ
(φ)
La clôture de Θ par Preτ caractérise alors l’ensemble des états qui peuvent atteindre
Θ. Une approche générale pour résoudre le problème d’atteignabilité consiste alors à
calculer cette clôture et vérier si elle contient un état de la formule initiale. L’algorithme
d’atteignabilité par chainage arrière présenté ci-après, fait exactement ceci de manière
incrémentale. Si, pendant sa construction de Pre∗
τ
(Θ), on découvre qu’un état initital (un
modèle de I) est aussi un modèle d’un des Pren
τ
(Θ), alors le système n’est pas sûr vis-à-
vis de Θ. Le système est sûr si, a contrario, aucune des pré-images ne s’intersecte avec
I. L’algorithme peut décider une telle propriété seulement si cette clôture est aussi un
point-xe.
Plusieurs briques de base sont nécessaires pour construire un tel algorithme. La première
est d’être capable de calculer les pré-images successives. Pour une recherche en avant, il
faut pouvoir calculer Postn
(I) ce qui est souvent impossible pour les systèmes paramétrés à
cause de la présence de quanticateurs universels dans la formule initiale I. En revanche, le
calcul du Pre est eectif dans les systèmes à tableaux si on restreint la forme des formules
exprimant les états dangereux.
Dénition 3.1.3. On appelle cube une formule de la forme ∃i¯.(∆ ∧ F ), où les i¯sont des
variables de la théorie TP , ∆ est une conjonction de diséquations entre les variables de i¯, et
F est une conjonction de littéraux.
Proposition 3.1.1. Si φ est un cube, la formule Preτ (φ) est équivalente à une disjonction de
cubes.
51Chapitre 3 Cadre théorique : model checking modulo théories
Démonstration. Soit φ = ∃p.(∆ ∧ F ) un cube, Preτ (φ) est la disjonction des Pret
(φ) pour
chaque transition de t de τ .
Prenons une transition t de τ , Pret
(φ)(Q) = ∃Q
′
. t(Q,Q
′
) ∧ ∃p.(∆ ∧ F (Q
′
)) se réécrit en
∃Q
′
. ∃i¯. γ (i¯,Q) ∧
^
x∈Q
x
′ = λj¯. δx (i¯,j¯,Q) ∧ ∃p.(∆ ∧ F (Q
′
)) (3.1)
Par la suite, on utilisera la notation traditionnellement employée en combinatoire
A
k
pour l’ensemble des combinaisons de A de taille k.
Soit j¯ = j1,. . . jk . Étant donné x ∈ Q et x
′ = λj¯. δx (i¯,j¯,Q) une des mises à jour de la
transition t, on notera σx
′ la substitution x
′
(pσ )\δx (i¯,pσ ,Q) pour tout pσ ∈
p
k
. Maintenant,
la formule ∃p.(∆ ∧ F (Q
′
))[σx
′] correspond en essence à la réduction de l’application d’une
lambda expression apparaissant dans l’équation (3.1). La réduction de toutes les lambda
expressions conduit à la formule suivante :
∃Q
′
. ∃i¯. γ (i¯,Q) ∧ ∃p.(∆ ∧ F (Q
′
)[σx
′,x
′
∈ Q
′
])
F (Q
′
)[σx ,x ∈ Q] n’est pas tout à fait sous forme de cube car les σx peuvent contenir des
termes ite. Notons Fd1
(i¯,Q) ∨ . . . ∨ Fdh
(i¯,Q) = elim_ite(F (Q
′
)[σx ,x ∈ Q]) la disjonction
résultant de l’élimination des ite des mises à jour. Les Fd (i¯,Q) sont des conjonctions de
littéraux. En sortant les disjonctions, on obtient :
∃Q
′
.
_
Fd (i¯,Q) ∈elim_ite(F (Q′
)[σx ,x∈Q])
∃i¯. γ (i¯,Q) ∧ ∃p.(∆ ∧ Fd (i¯,Q))
et donc :
Pret
(φ)(Q) =
_
Fd (i¯,Q) ∈ elim_ite(F (Q′
)[σx ,x∈Q])
∃i¯.∃p. (∆ ∧γ (i¯,Q) ∧ Fd (i¯,Q))
Dans ce qui suit on supposera que la formule caractérisant les états dangereux Θ est un
cube. La clôture construite par l’algorithme sera donc une disjonction de cubes et pourra
être vue comme un ensemble de cubes V.
On donne une analyse d’atteignabilité par chaînage arrière classique dans l’algorithme 4.
Cet algorithme maintient une le à priorité Q de cubes à traiter et la clôture partielle ou
l’ensemble des cubes visités V dont la disjonction des éléments caractérise les états pouvant
atteindre Θ. On démarre avec en ensemble V vide matérialisant la formule false et une le
Q où seule la formule Θ est présente.
La fonction BWD calcule itérativement la clôture Pre∗
τ
(Θ) et si elle termine, renvoie un
des deux résultats possibles :
52
Segmentation supervisée d’actions à partir de primitives
haut niveau dans des flux vid´eos
Adrien Chan-Hon-Tong
To cite this version:
Adrien Chan-Hon-Tong. Segmentation supervis´ee d’actions `a partir de primitives haut niveau
dans des flux vid´eos. Signal and Image Processing. Universit´e Pierre et Marie Curie - Paris
VI, 2014. French. .
HAL Id: tel-01084604
https://tel.archives-ouvertes.fr/tel-01084604
Submitted on 19 Nov 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific
research documents, whether they are published
or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.Université Pierre et Marie Curie
École doctorale des Sciences mécaniques,
acoustique, électronique et robotique de Paris
Laboratoire de Vision et Ingénierie des Contenus (CEA, LIST, DIASI)
Segmentation supervisée d’actions à partir de primitives
haut niveau dans des flux vidéos
Par Adrien CHAN-HON-TONG
Thèse de doctorat de Génie informatique, automatique et traitement du signal
Dirigée par Catherine ACHARD
et encadrée par Laurent LUCAT
Présentée et soutenue publiquement le 29/09/2014
Devant un jury composé de :
CAPLIER Alice, Professeur, Rapporteur
CANU Stéphane, Professeur, Rapporteur
CORD Matthieu, Professeur, Examinateur
EL YACOUBI Mounim A., Maitre de conférences, Examinateur
ACHARD Catherine, Maitre de conférences, Directeur de thèse
LUCAT Laurent, Ingénieur – Chercheur, Encadrant de thèseA mes parents.
A ma femme et mes enfants.
Factorisation matricielle, application `a la
recommandation personnalis´ee de pr´ef´erences
Julien Delporte
To cite this version:
Julien Delporte. Factorisation matricielle, application `a la recommandation personnalis´ee de
pr´ef´erences. Other. INSA de Rouen, 2014. French. .
HAL Id: tel-01005223
https://tel.archives-ouvertes.fr/tel-01005223
Submitted on 12 Jun 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific
research documents, whether they are published
or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.THÈSE
Présentée à :
L’Institut National des Sciences Appliquées de Rouen
En vue de l’obtention du titre de :
Docteur en Informatique
Par :
Julien DELPORTE
Intitulée :
Factorisation Matricielle,
Application à la Recommandation
Personnalisée de Préférences
soutenue le 3 février 2013
Devant le jury composé de :
Rapporteurs : Younès BENNANI - Université Paris-Nord
Gérard GOVAERT - Université de Technologie de Compiègne
Examinateurs : Anne BOYER - Université de Lorraine
Michèle SEBAG - Université Paris-Sud
Dominique FOURDRINIER - Université de Rouen
Directeur : Stéphane CANU - INSA de Rouen
Lh*rs p2p : une nouvelle structure de donn´ees distribu´ee
et scalable pour les environnements Pair `a Pair
Hanafi Yakouben
To cite this version:
Hanafi Yakouben. Lh*rs p2p : une nouvelle structure de donn´ees distribu´ee et scalable pour
les environnements Pair `a Pair. Other. Universit´e Paris Dauphine - Paris IX, 2013. French.
.
HAL Id: tel-00872124
https://tel.archives-ouvertes.fr/tel-00872124
Submitted on 11 Oct 2013
Services de r´epartition de charge pour le Cloud :
application au traitement de donn´ees multim´edia.
Sylvain Lefebvre
To cite this version:
Sylvain Lefebvre. Services de r´epartition de charge pour le Cloud : application au traitement
de donn´ees multim´edia.. Computers and Society. Conservatoire national des arts et metiers -
CNAM, 2013. French. .
HAL Id: tel-01062823
https://tel.archives-ouvertes.fr/tel-01062823
Submitted on 10 Sep 2014
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of scientific
research documents, whether they are published
or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destin´ee au d´epˆot et `a la diffusion de documents
scientifiques de niveau recherche, publi´es ou non,
´emanant des ´etablissements d’enseignement et de
recherche fran¸cais ou ´etrangers, des laboratoires
publics ou priv´es.CONSERVATOIRE NATIONAL DES
ARTS ET MÉTIERS
École Doctorale Informatique, Télécommunications et Électronique (Paris)
CEDRIC
THÈSE DE DOCTORAT
présentée par : Sylvain LEFEBVRE
soutenue le : 10 Décembre 2013
pour obtenir le grade de : Docteur du Conservatoire National des Arts et Métiers
Spécialité : INFORMATIQUE
Services de répartition de charge pour le Cloud :
Application au traitement de données multimédia
THÈSE dirigée par
M. GRESSIER-SOUDAN Eric Professeur, CEDRIC-CNAM, Paris
Encadrée par
Mme. CHIKY Raja Enseignant-Chercheur, LISITE-ISEP, Paris
RAPPORTEURS
Mme. MORIN Christine Chercheur Titulaire, INRIA-IRISA, Rennes
M. PIERSON Jean-Marc Professeur, IRIT, Université Paul Sabatier, Toulouse
EXAMINATEURS
M. ROOSE Philippe Directeur de recherche, LIUPPA, Pau
M. SENS Pierre Directeur de recherche, LIP6, UPMC, Paris
M. PAWLAK Renaud Directeur technique, IDCapture, Paris
Mme. SAILHAN Françoise Maitre de conférence, CEDRIC-CNAM, Paris"When they first built the University of California at Irvine they just put the buildings in.
They did not put any sidewalks, they just planted grass. The next year, they came back
and put the sidewalks where the trails were in the grass."
Larry WallRemerciements
Les travaux menés durant ces trois ans ont été possible grâce à la confiance et aux
encouragements que mes encadrants Eric Gressier-Soudan, Renaud Pawlak puis Raja Chiky
m’ont accordé, à la fois lors du recrutement et tout au long de ces 36 derniers mois. Je
tiens à remercier particulièrement Raja Chiky, pour son optimisme, ses conseils et ses
encouragements en toutes circonstances.
Je tiens aussi à remercier tous les membres de l’équipe de Recherche et Développement
Informatique du LISITE : Yousra pour les filtres de Bloom, Zakia, Bernard et Matthieu
pour leurs conseils et commentaires avisés, et Olivier pour les probabilités. En restant à
l’ISEP je remercie aussi mes collègues de bureaux : Giang, Sathya, Adam, Ahmad, Fatima,
Maria et Ujjwal.
Mes sincères remerciements vont aux membres du jury qui ont accepté de juger mon travail
: MM. Pierson et Roose, Mme Morin ainsi que le professeur P. Sens pour ses conseils lors
de ma soutenance de mi-parcours et pour m’avoir donné accès à la plateforme GRID5000.
Je dois aussi adresser des remerciements à ceux qui m’ont encouragé dans ma poursuite
d’études : Professeurs B. Marchal, F. Pommereau, M. Bernichi de l’ESIAG et A. Ung
d’Essilor sans lesquels je ne me serais pas lancé dans cette aventure.
Enfin, ce travail n’aurait pu être mené sans les encouragements de ma famille, de mes
amis, et de Clara.
iiiREMERCIEMENTS
ivRésumé
Les progrès conjugués de l’algorithmique et des infrastructures informatiques permettent
aujourd’hui d’extraire de plus en plus d’informations pertinentes et utiles des données issues
de réseaux de capteurs ou de services web. Ces plateformes de traitement de données
"massives" sont confrontées à plusieurs problèmes. Un problème de répartition des données
: le stockage de ces grandes quantités de données impose l’agrégation de la capacité de
stockage de plusieurs machines. De là découle une seconde problématique : les traitements
à effectuer sur ces données doivent être à leur tour répartis efficacement de manière à ne
surcharger ni les réseaux, ni les machines.
Le travail de recherche mené dans cette thèse consiste à développer de nouveaux algorithmes
de répartition de charge pour les systèmes logiciels de traitement de données
massives. Le premier algorithme mis au point, nommé "WACA" (Workload and Cache
Aware Algorithm) améliore le temps d’exécution des traitements en se basant sur des ré-
sumés des contenus stockés sur les machines. Le second algorithme appelé "CAWA" (Cost
Aware Algorithm) tire partie de l’information de coût disponible dans les plateformes de
type "Cloud Computing" en étudiant l’historique d’exécution des services.
L’évaluation de ces algorithmes a nécessité le développement d’un simulateur d’infrastructures
de "Cloud" nommé Simizer, afin de permettre leur test avant le déploiement en
conditions réelles. Ce déploiement peut se faire de manière transparente grâce au système
de distribution et de surveillance de service web nommé "Cloudizer", développé aussi dans
le cadre de cette thèse, qui a servi à l’évaluation des algorithmes sur l’Elastic Compute
Cloud d’Amazon.
Ces travaux s’inscrivent dans le cadre du projet de plateforme de traitement de données
Multimédia for Machine to Machine (MCube). Ce projet requiert une infrastructure
logicielle adaptée au stockage et au traitement d’une grande quantité de photos et de sons,
issus de divers réseaux de capteurs. La spécificité des traitements utilisés dans ce projet a
nécessité le développement d’un service d’adaptation automatisé des programmes vers leur
environnement d’exécution.
Mots clés : Répartition de charge, Cloud, Données Massives
vAbstract
Nowadays, progresses in algorithmics and computing infrastructures allow to extract
more and more adequate and useful information from sensor networks or web services data.
These big data computing platforms have to face several challenges. A data partitioning
issue ; storage of large volumes imposes aggregating several machines capacity. From this
problem arises a second issue : to compute these data, tasks must be distributed efficiently
in order to avoid overloading networks and machines capacities. The research work carried
in this thesis consists in developping new load balancing algorithms for big data computing
software. The first designed algorithm, named WACA (Workload And Cache Aware algorithm)
enhances computing latency by using summaries for locating data in the system.
The second algorithm, named CAWA for "Cost AWare Algorithm", takes advantage of
cost information available on so-called "Cloud Computing" platforms by studying services
execution history. Performance evaluation of these algorithms required designing a Cloud
Infrastructure simulator named "Simizer", to allow testing prior to real setting deployment.
This deployement can be carried out transparently thanks to a web service monitoring and
distribution framework called "Cloudizer", also developped during this thesis work and was
used to assess these algorithms on the Amazon Elastic Compute Cloud platform.
These works are set in the context of data computing platform project called "Multimedia
for Machine to Machine" (MCube). This project requires a software infrastructure
fit to store and compute a large volume of pictures and sounds, collected from sensors. The
specifics of the data computing programs used in this project required the development of
an automated execution environement adaptation service.
Keywords : Load balancing, Cloud Computing, Big Data
viiAvant propos
Cette thèse se déroule dans l’équipe Recherche et Développement en Informatique (RDI)
du laboratoire Laboratoire d’Informatique, Signal et Image, Électronique et Télécommunication
(LISITE) de l’Institut Supérieur d’Électronique de Paris. L’équipe RDI se focalise
principalement sur la thématique des systèmes complexes avec deux axes forts. Le premier
axe vise la fouille de données et l’optimisation dans ces systèmes. L’optimisation est en
effet pour la plupart du temps liée à la traçabilité et à l’analyse des données, en particulier
les données liées aux profils d’utilisation. Le deuxième axe concerne l’étude de langages, de
modèles, et de méthodes formelles pour la simulation et la validation des systèmes complexes,
en particulier les systèmes biologiques et les systèmes embarqués autonomes sous
contraintes fortes.
Les travaux de cette thèse s’inscrivent dans le cadre d’un projet européen de mise au
point de plateforme de services Machine à Machine permettant d’acquérir et d’assurer
l’extraction et l’analyse de données multimédia issues de réseaux de capteurs. Ce projet,
baptisé Mcube pour Multimedia for machine to machine (Multimédia pour le machine à
machine) est développé en partenariat avec le fond Européen de Développement Régional
et deux entreprises de la région Parisienne : CAP 2020 et Webdyn. Il permet de réunir les
différentes problématiques de recherches de l’équipe RDI au sein d’un projet commun, en
partenariat avec les membres de l’équipe de recherche en traitement du signal du LISITE.
La particularité de ce projet est qu’il se concentre sur la collecte de données multimédias.
Les difficultés liées au traitement de ces données nécessitent de faire appel à des
technologies spécifiques pour leur stockage. Cette plateforme ne se limite pas au stockage
des données, et doit fournir aux utilisateurs la possibilité d’analyser les données récupérées
en ligne. Or, ces traitements peuvent s’exécuter dans un environnement dynamique soumis
à plusieurs contraintes comme le coût financier, ou la consommation énergétique. La répartition
des traitements joue donc un rôle prépondérant dans la garantie de ces contraintes. La
répartition des données sur les machines joue aussi un rôle important dans la performance
des traitements, en permettant de limiter la quantité de données à transférer.
Ces travaux ont été encadrés par Dr. Renaud Pawlak puis suite à son départ de
l’ISEP en septembre 2011, par Dr. Raja Chiky, sous la responsabilité du professeur Eric
Gressier-Soudan de l’équipe Systèmes Embarqués et Mobiles pour l’Intelligence Ambiante
du CEDRIC-CNAM.RÉSUMÉ
xTable des matières
1 Introduction 1
2 MCube : Une plateforme de stockage et de traitement de données multimédia
9
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1.1 Architecture du projet MCube . . . . . . . . . . . . . . . . . . . . . 9
2.1.2 Problématiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Composants des plateformes de stockage de données multimédia . . . . . . . 12
2.2.1 Stockage de données multimédia . . . . . . . . . . . . . . . . . . . . 13
2.2.2 Distribution des traitements . . . . . . . . . . . . . . . . . . . . . . . 17
2.2.3 Plateformes génériques de traitements de données multimédias . . . 20
2.3 Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4 Architecture de la plateforme MCube . . . . . . . . . . . . . . . . . . . . . . 23
2.4.1 Architecture matérielle . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.2 Architecture logicielle . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.3 Architecture de la plateforme MCube . . . . . . . . . . . . . . . . . . 24
2.4.4 Description des algorithmes de traitement de données multimédia . . 26
2.5 Développement du projet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
xiTABLE DES MATIÈRES
3 Le framework Cloudizer : Distribution de services REST 31
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Architecture du canevas Cloudizer . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.1 Les nœuds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.2 Le répartiteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.3 Déploiement de services . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3 Intégration au projet MCube . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.4 Considérations sur l’implémentation . . . . . . . . . . . . . . . . . . . . . . 38
3.5 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4 Simizer : un simulateur d’application en environnement cloud 41
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.1.1 Simulateurs de Cloud existants . . . . . . . . . . . . . . . . . . . . . 42
4.2 Architecture de Simizer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.2.1 Couche Evénements . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.2.2 Couche architecture . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.2.3 Fonctionnement du processeur . . . . . . . . . . . . . . . . . . . . . 48
4.2.4 Exécution d’une requête . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.3 Utilisation du simulateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.4 Validation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.4.1 Génération de nombres aléatoires . . . . . . . . . . . . . . . . . . . . 53
4.4.2 Fonctionnement des processeurs . . . . . . . . . . . . . . . . . . . . . 55
4.5 Discussion et travaux futurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5 Algorithmes de répartition de charge 59
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
xiiTABLE DES MATIÈRES
5.2 Classification et composition des algorithmes de répartition de charge . . . . 61
5.2.1 Familles d’algorithmes de répartition de charge . . . . . . . . . . . . 61
5.2.2 Composition d’algorithmes de répartition de charge . . . . . . . . . . 63
5.3 Algorithmes de répartition par évaluation de la charge . . . . . . . . . . . . 65
5.4 Algorithmes de répartition fondés sur la localité . . . . . . . . . . . . . . . . 66
5.4.1 Techniques exhaustives . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.4.2 Techniques de hachage . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.4.3 Techniques de résumé de contenus . . . . . . . . . . . . . . . . . . . 69
5.5 Stratégies basées sur le coût . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6 WACA : Un Algorithme Renseigné sur la Charge et le Cache 77
6.1 Contexte et Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.1.1 Localité des données pour les traitements distribués . . . . . . . . . 77
6.2 Filtres de Bloom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
6.2.1 Filtres de Bloom Standards (FBS) . . . . . . . . . . . . . . . . . . . 80
6.2.2 Filtres de Bloom avec compteurs (FBC) . . . . . . . . . . . . . . . . 82
6.2.3 Filtres de Bloom en Blocs (FBB) . . . . . . . . . . . . . . . . . . . . 82
6.3 Principe Général de l’algorithme WACA . . . . . . . . . . . . . . . . . . . . 83
6.3.1 Dimensionnement des filtres . . . . . . . . . . . . . . . . . . . . . . . 84
6.3.2 Choix de la fonction de hachage . . . . . . . . . . . . . . . . . . . . . 85
6.4 Algorithme sans historique (WACA 1) . . . . . . . . . . . . . . . . . . . . . 87
6.4.1 Tests de WACA 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
6.5 Algorithme avec historique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.5.1 Compléxité de l’algorithme et gain apporté . . . . . . . . . . . . . . 92
6.5.2 Experimentation de WACA avec historique . . . . . . . . . . . . . . 93
xiiiTABLE DES MATIÈRES
6.6 Block Based WACA (BB-WACA) . . . . . . . . . . . . . . . . . . . . . . . . 95
6.6.1 Description de l’algorithme . . . . . . . . . . . . . . . . . . . . . . . 95
6.6.2 Analyse de l’algorithme . . . . . . . . . . . . . . . . . . . . . . . . . 98
6.7 Evaluation de la politique BB WACA . . . . . . . . . . . . . . . . . . . . . 102
6.7.1 Évaluation par simulation . . . . . . . . . . . . . . . . . . . . . . . . 102
6.7.2 Évaluation pratique sur l’Elastic Compute Cloud . . . . . . . . . . . 107
6.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7 CAWA : Un algorithme de répartition basé sur les les coûts 113
7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7.2 Approche proposée : Cost AWare Algorithm . . . . . . . . . . . . . . . . . . 115
7.2.1 Modélisation du problème . . . . . . . . . . . . . . . . . . . . . . . . 116
7.2.2 Avantages de l’approche . . . . . . . . . . . . . . . . . . . . . . . . . 117
7.3 Phase de classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
7.3.1 Représentation et pré-traitement des requêtes . . . . . . . . . . . . . 118
7.3.2 Algorithmes de classification . . . . . . . . . . . . . . . . . . . . . . . 120
7.4 Phase d’optimisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.4.1 Matrice des coûts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.4.2 Résolution par la méthode Hongroise . . . . . . . . . . . . . . . . . . 122
7.4.3 Répartition vers les machines . . . . . . . . . . . . . . . . . . . . . . 123
7.5 Évaluation par simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
7.5.1 Preuve de concept : exemple avec deux machines . . . . . . . . . . . 124
7.5.2 Robustesse de l’algorithme . . . . . . . . . . . . . . . . . . . . . . . . 125
7.6 Vers une approche hybride : Localisation et optimisation des coûts . . . . . 127
7.7 Conclusion et travaux futurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
8 Conclusion 131
xivTABLE DES MATIÈRES
A Cloud Computing : Services et offres 139
A.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
A.2 Modèles de services . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
A.2.1 L’Infrastructure à la Demande (Infrastructure as a Service) . . . . . 140
A.2.2 La Plateforme à la demande (Platform as a Service) . . . . . . . . . 140
A.2.3 Le logiciel à la demande (Software As a Service) . . . . . . . . . . . 141
A.3 Amazon Web Services . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
B Code des politiques de répartition 143
B.1 Implémentation de WACA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
B.2 Implémentation de l’algorithme CAWA . . . . . . . . . . . . . . . . . . . . . 145
C CV 147
Bibliographie 149
Glossaire 161
Index 163
xvTABLE DES MATIÈRES
xviListe des tableaux
2.1 Propriétés des systèmes de traitements de données multimédias . . . . . . . 23
3.1 Protocole HTTP : exécution de services de traitement de données . . . . . . 37
4.1 Lois de probabilité disponibles dans Simizer . . . . . . . . . . . . . . . . . . 44
4.2 Résultats des tests du Chi-2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.3 Comparaison de Simizer et CloudSim, temps d’exécution de tâches . . . . . 56
6.1 Configurations des tests de la stratégie WACA . . . . . . . . . . . . . . . . 103
A.1 Caractéristiques des instances EC2 . . . . . . . . . . . . . . . . . . . . . . . 141
xviiLISTE DES TABLEAUX
xviiiTable des figures
2.1 Architecture du projet MCube . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Architecture pour la fouille de données multimédia . . . . . . . . . . . . . . 12
2.3 Architecture de la plateforme MCube . . . . . . . . . . . . . . . . . . . . . . 25
2.4 Modèle de description d’algorithme . . . . . . . . . . . . . . . . . . . . . . . 27
3.1 Architecture de la plateforme Cloudizer . . . . . . . . . . . . . . . . . . . . 33
3.2 Modèle des stratégies de répartition de charge . . . . . . . . . . . . . . . . . 35
4.1 Architecture de Simizer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.2 Entités de gestion des événements . . . . . . . . . . . . . . . . . . . . . . . . 46
4.3 Entités de simulation système . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.4 Comparaison des distributions aléatoires de Simizer . . . . . . . . . . . . . . 54
5.1 Stratégies de sélection possibles [GPS11, GJTP12] . . . . . . . . . . . . . . 64
5.2 Graphique d’ordonnancement, d’après Assunçao et al. [AaC09] . . . . . . . 72
6.1 Relation entre nombre d’entrées/sorties et temps d’éxécution . . . . . . . . 78
6.2 Exemples de Filtres de Bloom . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.3 Description de l’algorithme . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
6.4 Comparaison des fonctions MD5, SHA-1 et MumurHash . . . . . . . . . . . 86
6.5 Mesures du temps d’exécution des requêtes, WACA version 1 . . . . . . . . 90
xixTABLE DES FIGURES
6.6 Mesures du temps d’exécution des requêtes, WACA version 2 . . . . . . . . 93
6.7 Comparaisons de WACA 1 et 2 . . . . . . . . . . . . . . . . . . . . . . . . . 94
6.8 Flot d’exécution de l’algorithme BB WACA . . . . . . . . . . . . . . . . . . 96
6.9 Schéma du tableau d’index . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
6.10 Complexité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
6.11 Distribution des temps de réponses simulés, 1000 requêtes, distribution Uniforme
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.12 Distribution des temps de réponses simulés, 1000 requêtes, distribution Gaussienne
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.13 Distribution des temps de réponses simulés, 1000 requêtes, distribution Zip-
fienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.14 Répartition des requêtes sur 20 machines, (Zipf) . . . . . . . . . . . . . . . 107
6.15 Résultats de simulation : temps de sélection des machines . . . . . . . . . . 108
6.16 Résultats d’exécutions sur le cloud d’Amazon . . . . . . . . . . . . . . . . . 110
7.1 Description de la phase de classification / optimisation . . . . . . . . . . . . 116
7.2 Distribution cumulative des temps de réponses, 2 machines . . . . . . . . . 124
7.3 CAWA : Distribution cumulative des temps de réponse, 10 machines . . . . 126
xxChapitre 1
Introduction
Ces dernières années, le besoin de traiter des quantités de données de plus en plus grandes
s’est fortement développé. Les applications possibles de ces analyses à grande échelle vont
de l’indexation de pages web à l’analyse de données physiques, biologiques ou environnementales.
Le développement de nouvelles plateformes de services informatiques comme les
réseaux de capteurs et les "nuages", ces plateformes de services de calcul à la demande,
accentuent ce besoin tout en facilitant la mise en œuvre de ces outils. Les réseaux de capteurs
ne sont pas une technologie récente, mais la capacité de traiter des grandes quantités
de données issues de ces réseaux est aujourd’hui facilement accessible à un grand nombre
d’organisations, en raison du développement de l’informatique en "nuage" : le Cloud Computing.
Ce nouveau modèle de service informatique est, d’après la définition du National
Institute of Standards and Technologies (NIST), un service mutualisé, accessible par le ré-
seau, qui permet aux organisations de déployer rapidement et à la demande des ressources
informatiques [MG11]. Dans ce contexte, les applications combinant plateformes d’acquisition
de données autonomes et les "nuages" pour traiter les données acquises, se développent
de plus en plus et permettent de fournir de nouveaux services en matière d’analyse de données,
dans le domaine commercial [Xiv13], ou académique [BMHS13, LMHJ10].
1Cadre applicatif
Les travaux de cette thèse s’inscrivent dans le cadre d’un projet de recherche financé
par le Fond Européen de DEveloppement Régional (FEDER) d’Ile de France 1, nommé
Multimedia pour le Machine à Machine (MCube) 2. Ce projet consiste à mettre au point
un ensemble de technologies permettant de collecter, transférer, stocker et traiter des données
multimédias collectées à partir de passerelles autonomes déployées géographiquement.
L’objectif est d’en extraire des informations utiles pour les utilisateurs du service. Par
exemple, il peut s’agir de détecter la présence d’une certaine espèce d’insecte nuisible dans
un enregistrement sonore, afin de permettre à l’agriculteur d’optimiser le traitement insecticide
de ses cultures, en épandant que lorsque cela est nécessaire.
Ce projet pose plusieurs difficultés de réalisation : en premier lieu, l’intégration et le
stockage de volumes de données importants, pouvant venir de différentes sources comme un
réseau de capteurs ou de multiples services WEB, implique de sélectionner les technologies
appropriées pour traiter et stocker ces données[Lan01]. À titre d’exemple, les cas d’études
utilisés pour le projet MCube consistent en un suivi photographique du développement de
plans de tomates et des écoutes sonores pour la détection de nuisibles. Ces deux cas d’études
effectués sur un seul champ durant les trois campagnes d’acquisition du projet (2011,2012
et 2013) ont nécessité la collecte d’un téraoctet et demi de données, soit environ 466,6
gigaoctets par utilisateur et par an. Le service définitif devant s’adresser à un nombre plus
important de clients, l’espace requis pour ces deux applications représentera donc un volume
non négligeable, en utilisation réelle. Le deuxième aspect de ces travaux consiste à mettre
au point un système pouvant adapter ces applications à un environnement dynamique
tel que les plateformes de cloud computing, de manière à pouvoir bénéficier de ressources
importantes à la demande lorsqu’un traitement le requiert.
La troisième difficulté concerne les traitements d’images eux mêmes, qui sont réalisés
par des scientifique ayant peu ou pas d’expériences de la programmation exceptés dans
des langages spécifiques comme MATLAB 3, dont l’utilisation sur les plateforme de type
1. http://www.europeidf.fr/index.php, consulté le 5 octobre 2013
2. http://mcube.isep.fr/mcube, consulté le 5 octobre 2013
3. http://www.mathworks.fr/products/matlab/, consulté le 5 octobre 2013
2"nuage" n’est pas facile. En effet, ces programmes ne sont pas écrits par des experts de la
programmation parallèle ou des calculs massifs, mais sont écrits pour traiter directement
un ou deux fichiers à la fois. Or, le contexte du projet MCube impose de traiter de grandes
quantités de fichiers avec ces mêmes programmes, ce qui requiert un système permettant
de les intégrer le plus simplement possible dans un environnement parallèle.
Ces trois verrous s’inscrivent dans des problématiques scientifiques plus larges liées aux
"nuages" et aux services distribués en général.
Problématiques scientifiques
Les problématiques scientifiques abordées dans ce document sont au nombre de trois.
La première d’entre elle consiste à assurer la répartition de requêtes dans un système
distribué déployé sur un "Cloud", en tenant compte des aspects particuliers de ce type
de plateformes. La deuxième problématique, plus spécifique au projet MCube, concerne
l’adaptation automatique de traitements à leur environnement d’exécution. Troisièmement,
Le développement de nouvelles stratégies de répartition a nécessité de nombreux tests en
amont du déploiement sur une infrastructure réelle, or il n’existe pas, à notre connaissance,
de simulateur d’applications distribuées sur le "cloud" approprié pour tester ce type de
développements.
Distribution de requêtes dans le "Cloud" Les stratégies de répartition fournies par
les services de "Cloud Computing" sont limitées dans leurs fonctionnalités ou leur capacité.
Par exemple, le répartiteur élastique de la plateforme Amazon Web Services (ELB : Elastic
Load Balancer), distribue les requêtes selon une stratégie en tourniquet (Round Robin)
sur les machines les moins chargées du système 4. Seule cette stratégie de répartition est
disponible pour les utilisateurs. Or, les applications déployées sur les plateformes d’informatique
en nuage sont diverses, par conséquent une stratégie générique n’est pas toujours
adaptée pour obtenir la meilleure performance du système. De plus, Liu et Wee [LW09]
ont démontré que déployer son propre répartiteur d’applications web sur une machine vir-
4. https://forums.aws.amazon.com/message.jspa?messageID=129199#129199, consulté le 5 octobre
2013
3tuelle dédiée était plus économique et permettait de répondre à un plus grand nombre de
requêtes concurrentes que le service de répartition de charge élastique fournit par Amazon.
Les fournisseurs de plateformes Cloud imposent souvent à leurs utilisateurs des stratégies
de répartition génériques pour pouvoir répondre à un grand nombre de cas d’utilisation,
mais ces stratégies ne sont pas toujours les plus efficaces : Un exemple notable est celui de
la plateforme Heroku 5, qui utilisait une stratégie de répartition aléatoire pour attribuer
les requêtes à différents processeurs. Or, cette répartition aléatoire se faisait sans que les
multiples répartiteurs du système ne communiquent entre eux pour surveiller la charge
des machines. Par conséquent, certains répartiteurs envoyaient des requêtes vers des machines
déjà occupées, ce qui créait des files d’attentes inattendues 6. Utiliser des stratégies
de répartition de charge appropriées, tenant compte des spécificités des plateformes de
type "Cloud Computing" est donc indispensable. Les spécificités de ces plateformes sont
notamment :
Des performances difficilement prévisibles : L’infrastructure physique de ces plateformes
est partagée par un grand nombre d’utilisateurs (cf. annexe A). La consé-
quence de ce partage est qu’en fonction de l’utilisation des ressources faite par les multiples
utilisateurs, il peut arriver que deux machines virtuelles identiques sur le papier
ne fournissent pas obligatoirement le même niveau de performance [BS10, IOY+11].
Des latences réseaux plus élevées : La taille des centres de données utilisés dans les
plateformes de Cloud Computing, ainsi que leur répartition géographique a pour
conséquence une latence plus importante dans les communications réseaux, qu’il
convient de masquer le plus possible à l’utilisateur final.
Une plateforme d’informatique à la demande doit donc permettre aux utilisateurs de choisir
la stratégie de distribution la plus adaptée à leur cas d’utilisation. De plus, il est nécessaire
de prendre en compte les spécificités de ces environnements pour développer de nouvelles
stratégies de répartition adaptées.
5. https://www.heroku.com/, consulté le 5 octobre 2013
6. https://blog.heroku.com/archives/2013/2/16/routing_performance_update, consulté le 5 octobre
2013
4Adaptation d’applications de traitements de données multimédia Ces nouvelles
plateformes sont par définition simples d’utilisation, flexibles et économiques. Cependant,
pour tirer parti des avantages de ces services, il est nécessaire de mettre en place des processus
automatisés de déploiement, de distribution et de configuration des applications
[AFG+09, ZCB10, MG11]. Les plateformes de cloud computing promettent à leurs utilisateurs
l’accès à une infinité de ressources à la demande, mais toutes les applications ne
sont pas nécessairement conçues pour être distribuées dans un environnement dynamique.
Quelles sont donc les caractéristiques des applications pouvant être déployées dans les environnements
de type "Cloud Computing" ? Quels mécanismes peuvent être mis en œuvre
pour assurer le déploiement de ces applications de manière plus ou moins transparente ?
Comment amener ces traitements à s’exécuter de manière distribuée ou parallèle pour
pouvoir tirer parti des avantages fournis par les plateformes de "Cloud Computing" ?
Test et performance A ces questions s’ajoute la problématique du test de l’application.
Il n’existe à ce jour pas de simulateur fiable permettant d’évaluer le comportement
d’applications déployées dans le Cloud, car les efforts actuels, tels que les simulateurs
CloudSim[RNCB11] et SimGrid[CLQ08], se concentrent sur la simulation des infrastructures
physiques supportant ces services plutôt que sur les applications utilisant ces services
[SL13]. Or, le développement de protocoles et d’algorithmes distribués nécessite des tests
sur un nombre important de machines. L’ajustement de certains paramètres peut requé-
rir de multiples tests sur diverses configurations (nombre de machines, puissance, type de
charge de travail), mais il n’est pas toujours aisé de devoir déployer des tests grandeur
nature pour ce type d’ajustements. Il faut donc développer ou adapter les outils existants
pour faciliter ces tests, en fournissant une interface de programmation de haut niveau pour
développer les protocoles à tester, sans que l’utilisateur n’ait à programmer à la fois la
simulation et le protocole qu’il souhaite étudier.
Approche développée
L’approche développée pour répondre à ces problématiques a consisté à mettre au
point une plateforme de distribution de services web destinée aux environnements de type
5Service d’Infrastructure à la Demande (Infrastructure As A Service, IaaS, cf. annexe A),
permettant de déployer et de distribuer des services web ou des applications en ligne de
commande en les transformant en services Web. Cette application, nommée Cloudizer, a
permis l’étude de différentes stratégies de distribution et de leur impact sur les différentes
applications déployées à travers plusieurs publications [PLCKA11, SL12, LKC13].
Cette plateforme a été utilisée dans le projet MCUBE, pour distribuer les programmes
de traitements des images collectées. Les volumes de données concernés par ce projet sont
tels que l’utilisation d’une stratégie de distribution des requêtes fondée sur la localité
des données [DG04, PLCKA11] permet de réduire efficacement les temps de traitement.
Dans ce domaine, les algorithmes de distribution les plus utilisés sont ceux fondés sur la
technique du hachage cohérent [KLL+97, KR04], qui est mise en œuvre dans plusieurs
systèmes de stockage de données massives. Le but de ces travaux est de montrer à travers
différentes simulations que les filtres de Bloom [Blo70, FCAB98, DSSASLP08] peuvent
être facilement combinés à d’autres algorithmes de répartition de charge, pour fournir une
alternative performante au hachage cohérent, dans certaines conditions. Ce travail a permis
la mise au point d’une stratégie de répartition de charge fondée sur des filtres de Bloom
indexés appelée WACA (Workload And Cache Aware Algorithm, Algorithme Renseigné
sur la Charge et le Cache).
Les Clouds de type Infrastructure à la Demande constituent l’environnement de déploiement
cible de ces services. La propriété de ces plateformes est de facturer leurs services
à l’utilisation. Afin de prendre ce facteur en compte, nous avons développé une stratégie
fondée sur le coût comme indicateur de performance, et nommée CAWA (Cost-AWare Algorithm,
Algorithme Renseigné sur le Coût) dont le fonctionnement a été testé à travers
des simulations. Tel que montré en section 1 de cette introduction, il n’existe pas encore
de simulateur adéquat pour les utilisateurs de plateformes de Cloud Computing. Le logiciel
Simizer a donc été développé pour permettre la simulation d’applications orientées services
déployées sur des infrastructures Cloud. Ce simulateur a permis de simuler et tester
les stratégies de distribution développées pour la plateforme Cloudizer, et d’étudier leur
comportement à large échelle.
6Organisation du présent document
Le reste de ce document est organisé en deux parties principales. La première partie,
composée des chapitres 2 à 4, décrit les développements des différentes plateformes logicielles
évoquées dans la section précédente. Le chapitre 2 présente les particularités du
projet MCube et ce qui le différencie des plateformes de traitement de données multimédia
existantes. Le chapitre 3 décrit le fonctionnement de la plateforme Cloudizer et son utilisation
dans le cadre du projet MCUBE, puis le chapitre 4 décrit les particularités et le
fonctionnement du simulateur Simizer.
La seconde partie de ce document se concentre sur les stratégies de distribution de
requêtes mises au point au cours de cette thèse. L’état de l’art en matière de répartition
de charge est présenté dans le chapitre 5. les chapitres suivants décrivent respectivement
la stratégie WACA, (chapitre 6), qui utilise des résumés compacts pour assurer une distribution
des tâches en fonction de la localisation des données dans le système, et la stratégie
CAWA (chapitre 7) qui se fonde sur une estimation du coût d’exécution des tâches pour effectuer
la répartition. Le chapitre 8 présentera les conclusions et perspectives de l’ensemble
de ces travaux.
78Chapitre 2
MCube : Une plateforme de stockage
et de traitement de données
multimédia
2.1 Introduction
L’objectif technique du projet MCube (Multimedia 4 Machine 2 Machine) est de développer
une technologie Machine à Machine pour la capture et l’analyse de données multimédia
par des réseaux de capteurs avec des problématiques de faible consommation et de
transmission GPRS/EDGE. Le projet couvre la chaîne complète : l’acquisition des données,
la transmission, l’analyse, le stockage, et le service d’accès par le WEB. Il s’appuie sur les
infrastructures M2M actuellement offertes par les opérateurs du secteur comme les réseaux
3G/GPRS pour la communication des données. Le but de cette plateforme est de fournir
des services d’analyse de données multimédia à faible coût permettant diverses applications
telles que la surveillance de cultures et de sites industriels (détections d’intrusions ou
d’insectes nuisibles).
2.1.1 Architecture du projet MCube
L’architecture globale de la technologie MCube correspond à l’état de l’art en matière
d’architecture M2M et est résumée en figure 2.1. Les "passerelles" sont des systèmes embarqués
permettant de piloter des périphériques d’acquisition de données multimédia comme
des appareils photos ou des microphones USB. Les passerelles assurent la transmission des
92.1. INTRODUCTION
Figure 2.1 – Architecture du projet MCube
données collectées vers la plateforme MCube, via une connexion 3G si un accès Ethernet
n’est pas disponible. La communication s’effectue via le protocole HTTP. La plateforme
est un serveur accessible via le web, dont le rôle consiste à :
Stocker les données collectées La plateforme assure le stockage des données multimé-
dia capturées et remontées par les passerelles. Ceci nécessite un large espace de stockage
redondant et distribué afin de limiter les risques de pertes de données, ainsi
que des méthodes efficaces pour retrouver les données stockées.
Configurer les passerelles Le système offre la possibilité de communiquer avec les passerelles
afin de les mettre à jour dynamiquement et de changer différents paramètres
tels que le type de capture à effectuer (sons, images ou vidéos) ou la fréquence de ces
captures. Cette communication se fait via une interface de programmation prenant
la forme d’un service web REST[Fie00], déployée sur les serveurs de la plateforme.
Traiter et analyser les données multimédia Les utilisateurs du système MCube peuvent
développer leurs propres programmes d’analyse de données, et les stocker sur la plateforme
pour former leur propre bibliothèque de traitements. Ces traitements doivent
pouvoir être exécutés par lots, en parallèle sur un grand nombre de fichiers, mais aussi
en temps réel au fur et à mesure de la collecte des données.
Par conséquent, mis à part le rôle de communication avec les passerelles, la plateforme
MCube devrait reposer sur une base de données multimédia. Ces systèmes stockent et
102.1. INTRODUCTION
traitent des données en volumes importants (plusieurs giga/téraoctets). Les données concernées
peuvent être de types différents (sons, images, vidéos,...) et sont séparées en un nombre
important de petits fichiers pouvant provenir de différents périphériques d’acquisition. De
plus, ces données sont généralement peu ou pas structurées. Afin d’assurer l’efficacité des
traitements sur les données multimédia, il est nécessaire de les exécuter de façon parallèle.
À nouveau, le résultat de ces traitements doit être stocké dans le système, ce qui permet
la réutilisation des données pour des analyses supplémentaires. La somme de toutes ces
données exige une capacité de stockage importante.
2.1.2 Problématiques
Une contrainte primordiale du projet MCube est d’aboutir à un service suffisamment
flexible pour pouvoir être personnalisé à chaque scénario d’utilisation, dans le but d’optimiser
le modèle économique du client en fonction de nombreux critères. Ainsi, les traitements
des données multimédia pourront être faits aussi bien côté passerelle que côté plateforme
suivant les critères à optimiser. La plateforme fournira des services d’aide à la décision
permettant d’optimiser au mieux la solution. Les choix d’architecture logicielle décrits en
section 2.4 reflètent ces besoins.
La plateforme MCube permet d’exécuter des analyses poussées sur les données reçues
des passerelles. Les algorithmes utilisés pour ces analyses sont souvent soit expérimentaux,
soit développés spécifiquement pour certains clients, et ne sont pas disponibles dans les librairies
de traitements de données multimédias existantes telles que Image Terrier[HSD11]
ou OpenCV[Bra00]. La conséquence est que ces algorithmes ne sont pas toujours directement
parallélisables. Or, la collecte d’un nombre important de fichiers dans les passerelles
MCube impose de pouvoir être en mesure d’exécuter les traitements sur une grande quantité
de données en parallèle.
Cet état de fait a des conséquences sur les choix d’architecture à effectuer car il est
nécessaire de fournir un accès aux données à la fois au niveau fichier pour que les données
soient accessibles aux différents programmes de traitements et un accès automatisé, via une
interface de programmation, pour permettre aux utilisateurs d’interroger leurs données en
temps réel.
112.2. COMPOSANTS DES PLATEFORMES DE STOCKAGE DE DONNÉES
MULTIMÉDIA
Ce chapitre expose donc dans un premier temps les composants des systèmes de stockage
et de traitement de données multimédias en section 2.2, et analyse les différentes
plateformes existantes de ce domaine par rapport aux besoins de la plateforme MCube en
section 2.3. La section 2.4 décrit la solution adoptée pour la mise au point de l’architecture
de la plateforme MCube et les problématiques qui découlent de ces choix sont discutées en
section 2.6.
2.2 Composants des plateformes de stockage de données multimédia
Il est possible de définir une plateforme de traitement de données multimédias comme
un système logiciel distribué permettant de stocker des fichiers contenant des données
photographiques, vidéos ou sonores, et de fournir les services nécessaires à l’extraction et
au stockage d’informations structurées issues de ces fichiers.
Les systèmes d’analyse de données multimédia possèdent un ensemble hiérarchisé de
composants permettant de transformer les données brutes en informations précises [CSC09,
HSD11]. Le schéma 2.2 montre l’articulation de ces différents composants, que l’on retrouvera
dans la plupart des systèmes décrits dans ce chapitre.
Données
multimédias
Extraction
descripteurs
Stockage
descripteurs
Indexation
Detection
Index
informations
Figure 2.2 – Architecture pour la fouille de données multimédia
Le premier composant de ces systèmes correspond à la couche de stockage des données.
Ce composant doit assurer le stockage et la disponibilité des données brutes, c’est à dire
les documents audiovisuels dans leur format d’origine (RAW, MPEG, AVI, WAV), mais
aussi des données intermédiaires nécessaires pour les traitements (les descripteurs) et les
résultats des algorithmes d’indexation et d’analyse.
Les descripteurs permettent de décrire le contenu des documents audiovisuels stockés
122.2. COMPOSANTS DES PLATEFORMES DE STOCKAGE DE DONNÉES
MULTIMÉDIA
dans le système. Il s’agit de représentations intermédiaires des données multimédias, comme
par exemple les valeurs obtenues après l’application d’une transformée de Fourrier à un enregistrement
sonore. Il existe un nombre important de représentations différentes, chacune
dépendant du type d’information que l’utilisateur souhaite extraire des données collectées.
Les systèmes de stockage multimédia fournissent une bibliothèque d’algorithmes divers
permettant de procéder à l’extraction de plusieurs types de représentations.
À partir de ces descripteurs, l’information obtenue peut être traitée de plusieurs manières
: elle peut être utilisée pour construire un index des données afin de faciliter la
recherche de contenu dans la banque de données multimédia (indexation), ou bien les données
peuvent être traitées pour en extraire des informations précises, à travers l’utilisation
d’algorithmes de détection d’objets, d’artefacts ou de mouvements (détection).
Les composants génériques décrits dans cette section sont présents dans la plupart des
systèmes évoqués dans la suite de ce chapitre. Chaque système doit cependant relever un
certain nombre de défis pour parvenir à indexer ou extraire des informations des contenus.
2.2.1 Stockage de données multimédia
Les données multimédia sont dans la plupart des cas des données extrêmement riches en
informations et donc très volumineuses. Les données ainsi stockées doivent aussi faire l’objet
de traitements et pré-traitements, dont il faut stocker les résultats pour pouvoir les analyser
à l’aide d’outils appropriés. Les volumes de stockage atteints deviennent très vite handicapant
pour les systèmes de gestion de base de données traditionnels. Différentes stratégies de
stockage distribué peuvent être utilisées pour résoudre ce problème. Les données multimé-
dias recouvrent généralement des espaces disque importants et sont difficilement compressibles
sans perte d’information. Par conséquent, la distribution des données sur plusieurs
machines à la fois apparaît comme la solution simple et économique. Plusieurs stratégies
coexistent dans le domaine pour parvenir à ce but : les données peuvent être stockées dans
un système de fichiers distribué [SKRC10], dans une base de données distribuée [Kos05] ou
encore dans une base de données distribuée non relationnelle [Cor07, CDG+06].
132.2. COMPOSANTS DES PLATEFORMES DE STOCKAGE DE DONNÉES
MULTIMÉDIA
Système de fichiers distribués Un système de fichiers distribué est un système dans
lequel l’espace disque de plusieurs machines est mis en commun et vu par toutes les machines
du système comme une seule entité de manière transparente. Cela permet d’augmenter
l’espace disponible en partageant la capacité des disques de chaque machine du système,
ou d’augmenter la fiabilité du système en autorisant la réplication des données. Des
exemples de systèmes de fichiers distribués sont le Network File System (NFS) [SCR+00],
XTreemFS[HCK+07] ou encore le Hadoop Distributed File System [SKRC10].
Cette approche est utilisée dans de nombreux projets de stockage et de traitement de
données multimédia. Par exemple, les projets RanKloud [Can11] et ImageTerrier [HSD11]
reposent sur le système de fichiers distribué issu du projet Hadoop, le Hadoop Distributed
File System [SKRC10]. Ce système de fichiers a la particularité de ne permettre que l’ajout
et la suppression de fichiers. La modification des données n’est pas possible. Cette limitation
ne pose pas de problème dans les systèmes de stockage et traitement de données multimédia,
car les fichiers bruts ne font pas l’objet de modifications internes, mais sont copiés puis lus
plusieurs fois de suite.
Ce type de système est particulièrement adapté lorsque les données doivent être traitées
en parallèle sur plusieurs machines par divers programmes, comme dans le système de
traitement de données parallèle Hadoop [Whi09].
Stockage en base de données La solution la plus directe pour fournir l’accès à des
données dans une plateforme de services est la mise au point d’une base de données relationnelle.
D’après [Kos05] l’arrivée dans les années 90 des systèmes de bases de données
orientés objets tels qu’Informix 1 ou Oracle 2 a permis l’émergence de systèmes plus efficaces
pour représenter les données multimédia. Les standards MPEG-7 [MPE12b] et MPEG-
21 [Mpe12a], par exemple, ont fourni un cadre de représentation des données multimédia
pouvant servir de référence pour la mise au point de schémas de base de données spéci-
fiques. C’est cette approche qui a été retenue dans le projet de “base de donnée MPEG-7”,
développée par M. Döller et décrite dans [Döl04]. En utilisant un système de gestion de
bases de données objet, M. Döller a créé un nouveau schéma respectant le format de re-
1. http://www.ibm.com/software/data/informix/, consulté le 5 octobre 2013
2. http://www.oracle.com/us/products/database/overview/index.html, consulté le 5 octobre 2013
142.2. COMPOSANTS DES PLATEFORMES DE STOCKAGE DE DONNÉES
MULTIMÉDIA
présentation fourni par le standard MPEG-7. Afin de parvenir à utiliser le langage SQL
pour rechercher les données, les méthodes d’indexation ont aussi été étendues pour pouvoir
indexer des données multi-dimensionnelles. Ceci permet aux utilisateurs de bénéficier de
tous les mécanismes des bases de données traditionnelles et notamment d’utiliser le langage
SQL pour la manipulation et la recherche de données multimédia. Les fichiers sont stockés
soit en tant qu’objets binaires (BLOBs), comme simples champs d’une table, soit dans le
système de fichiers, et seul le chemin vers les données figure dans la base.
La principale limite de cette approche réside dans le fait que le système soit implémenté
comme une extension du système commercial de bases de données Oracle. Il est donc
difficilement envisageable d’ajouter de nouvelles fonctionnalités au système, en raison de
l’interface de programmation de bas niveau nécessaire à ces changements. L’autre limite de
cette approche est que le système n’est pas distribué, or, le volume de données généralement
associé avec les bases de données multimédia peut nécessiter un fonctionnement réparti
afin de multiplier la capacité de stockage et de traitement, ce qui n’est pas le cas dans ces
travaux.
Bases de données distribuées : Les bases de données distribuées permettent d’agréger
la capacité de stockage de plusieurs machines au sein d’un seul système de base
de données. Retenue par K. Chatterjee et al. [CSC09], cette approche consiste à
utiliser les capacités existantes de systèmes de bases de données distribuées, comme
par exemple MySql Cluster 3, et à adapter la base de données en ajoutant un index
réparti permettant de retrouver rapidement les données recherchées sur l’ensemble
des machines.
IrisNet [GBKYKS03] est un réseau de capteurs pair à pair sur lequel les images et données
des différents capteurs sont stockées dans une base de données XML. Les nœuds
sont divisés en deux catégories : les "Sensing Agents" (SA) qui sont des machines
de puissance moyenne reliées aux capteurs (webcam, météo, . . . ) et les "Organizing
Agents" (OA) qui sont des serveurs sur lesquels sont déployés les services du réseau
de capteurs. Les capteurs eux-mêmes sont des machines de puissance moyenne, avec
peu ou pas de contraintes environnementales, et un espace de stockage important.
3. http://www.mysql.com, consulté le 5 octobre 2013
152.2. COMPOSANTS DES PLATEFORMES DE STOCKAGE DE DONNÉES
MULTIMÉDIA
Ces nœuds appelés “Sensing Agents” sont utilisés pour déployer des “Senselets”, qui
filtrent les données issues des capteurs. La base de données est distribuée sur les OA.
Les utilisateurs peuvent requêter la base de données en utilisant le langage XPATH
(langage de requêtage de données XML).
Ces deux approches reposent sur les systèmes de base de données traditionnels fournissant
de fortes garanties de cohérence des données, suivant le principe ACID (Atomicité,
Cohérence, Isolation, Durabilité). Or, il a été démontré que lorsque la taille
d’un système distribué augmente, fournir une garantie sur la cohérence des données
du système ne permet pas d’assurer à la fois disponibilité et la performance de
celui-ci. C’est le théorème de CAP, Consistency, Availability et Partition Tolerance
(Cohérence, Disponibilité et Tolérance aux partitions) démontré par Gilbert et Lynch
dans [GL02]. Les systèmes multimédias distribués ne nécessitent pas de supporter de
fortes garanties de cohérence sur les données : les fichiers à traiter ne sont écrits
qu’une seule fois puis lus à plusieurs reprises pour mener à bien les analyses voulues.
Par conséquent, certains acteurs ont construit leur propre système de gestion de données
multimédia en s’abstrayant de ces garanties, comme Facebook 4 l’a fait avec le
système Haystack [Vaj09]. Les composants de ce système ne reposent pas sur une base
de données relationnelle mais sur un index distribué permettant de stocker les images
dans des fichiers de grandes tailles (100Go), ce qui permet de grouper les requêtes et
de réduire les accès disques nécessaires à l’affichage de ces images. La particularité
de ce système est que les images y sont peu recherchées, mais sont annotées par les
utilisateurs pour y ajouter des informations sur les personnes présentes dans l’image
et la localisation de la prise de vue.
Un autre exemple de base de données distribuée utilisée pour stocker les données
multimédia est celui de Youtube 5, qui utilise la base de données orientée colonnes
BigTable [CDG+06, Cor07], pour stocker et indexer les aperçus de ses vidéos.
Agrégation de bases de données : Le canevas AIR créé par F. Stiegmaier et al. [SDK+11]
se concentre sur l’extensibilité en utilisant un intergiciel pour connecter plusieurs
bases de données entre elles, et utilise des requêtes au format MPEG-7 [MPE12b].
4. http://facebook.com, consulté le 5 octobre 2013
5. http://youtube.com, consulté le 5 octobre 2013
162.2. COMPOSANTS DES PLATEFORMES DE STOCKAGE DE DONNÉES
MULTIMÉDIA
Cependant ces travaux restent dirigés sur la recherche de contenus plutôt que sur
la détection d’éléments précis dans les images. Les données et leurs métadonnées
(descripteurs) sont réparties sur différents systèmes de gestion de bases de données
(SGBD) pouvant fonctionner sur différentes machines. Lorsque le système reçoit une
requête, deux cas se présentent : soit les nœuds sont homogènes et la requête est envoyée
à chaque machine puis les résultats sont fusionnés et / ou concaténés, soit les
nœuds sont des systèmes différents (bases de données différentes) et seule la partie la
plus adaptée de la requête est transmise au noeud le plus approprié. Les intergiciels
LINDO[BCMS11] et WebLab[GBB+08] fournissent des modèles de représentations
de données communs à plusieurs systèmes et permettent les transferts de données
entre des services de traitements adoptant ce modèle. Ces systèmes ne reposent sur
aucun système de stockage particulier mais permettent d’agréger différentes sources
de données et différents services de traitements hétérogènes. La problématique de
cette approche est la nécessité de devoir adapter les services et les traitements au
modèle exposé par les interfaces d’un tel système.
Une grande variété de solutions existent au problème du stockage des données multimédia.
Un critère de choix possible est le type d’utilisation qui sera fait des données : par
exemple un système d’extraction des connaissances fonctionnera mieux avec un système
de fichiers distribué dans lequel les données sont accessibles de manière transparente, au
contraire d’une base de donnée SQL qui requiert une interface particulière pour accéder
aux données stockées. Dans le cadre du projet MCube l’accès aux données doit être possible
de plusieurs manières : il faut pouvoir fournir un accès permettant de traiter les données
en parallèle ainsi qu’une interface permettant de requêter les données générées par les ré-
sultats des analyses effectuées. Le système se rapprochant le plus de ce cas d’utilisation est
donc l’utilitaire HADOOP [Whi09], qui fournit à la fois un système de haut niveau pour
requêter les données et un accès de bas niveau via le système de fichiers distribué.
2.2.2 Distribution des traitements
Un volume important de données à analyser se traduit par la nécessité de paralléliser
le traitement des données, de manière à réduire les temps d’exécution. Cependant, tous
172.2. COMPOSANTS DES PLATEFORMES DE STOCKAGE DE DONNÉES
MULTIMÉDIA
les systèmes de stockage de données multimédia ne permettent pas de traitement parallèle
des données. Dans le domaine des traitements de données multimédia il est possible de
distinguer deux manières de traiter les données[Can11] : les traitements à la chaîne (Multiple
Instruction Multiple Data, MIMD) et les traitements parallèles (Single Instruction
Multiple Data, SIMD).
Traitements à la chaîne : Multiple Instruction Multiple Data Le système est
constitué de plusieurs unités, chacune exécutant une étape particulière d’une chaine de
traitements. Les données passent d’une étape à l’autre en étant transférées d’une entité
à l’autre, de sorte que plusieurs données sont à différents stades de traitement au même
instant.
Le projet WebLab [GBB+08] est une architecture de traitement de données multimé-
dia orientée service qui permet de faciliter le développement d’applications distribuées de
traitement multimédia. Cette plateforme repose sur un modèle de données commun à tous
ses composants représentant une ressource multimédia. Ce modèle ne repose pas sur un
standard mais permet de créer des ressources conformes au standard MPEG-7. La raison
de ce choix est que le standard MPEG-7 a été créé en 2002 et ne permet pas de bénéficier
des dernières avancées en matière de descripteurs de données multimédias. Cette repré-
sentation générique permet d’associer à chaque ressource des “annotations” représentant le
contenu extrait de la ressource (appelés “morceaux de connaissance”). Les services disponibles
se divisent en services d’acquisition, services de traitements, services de diffusion.
Le modèle de données commun permet à ces différents services de pouvoir être composés
pour créer des flux de traitements, de l’acquisition à la diffusion du contenu multimédia.
Cette solution se veut très flexible et générique mais ne propose pas de solution en ce qui
concerne la répartition des traitements.
Le système SAPIR (Search in Audio-visual content using Peer-to-peer Information Retrieval)
[KMGS09] est un moteur de recherche multimédia implémentant la recherche par
l’exemple : il permet de retrouver à partir d’un document multimédia donné les documents
similaires ou correspondant au même objet. SAPIR utilise le Framework apache
UIMA [UIM12] pour extraire les informations nécessaires à l’indexation des données au
182.2. COMPOSANTS DES PLATEFORMES DE STOCKAGE DE DONNÉES
MULTIMÉDIA
format MPEG-7. Les flux ou fichiers reçus sont divisés en plusieurs modalités : par exemple
dans le cas d’une vidéo, un “splitter” va séparer le son des images, puis la suite d’images
va aussi être divisée en plusieurs images fixes, chaque élément ainsi extrait va ensuite être
traité par un composant spécifique pour le son, la vidéo et les images le tout de façon parallèle.
Une fois la phase d’extraction terminée le fichier d’origine est recomposé en intégrant
les métadonnées qui en ont été extraites. UIMA rend la main au système SAPIR, qui va
insérer le fichier dans son index distribué en se basant sur les métadonnées que le fichier
contient désormais. Le système utilise une architecture pair à pair pour stocker et répartir
les données.
Cependant, la dépendance du système SAPIR avec Apache UIMA, destine ce système
uniquement à la recherche de contenus multimédia plutôt qu’à servir de plateforme de
traitement de données multimédia générique.
Traitement en parallèle : Single Instruction Multiple Data (SIMD) Ce type de
système sépare les étapes du traitement dans le temps plutôt que dans l’espace : à chaque
étape du traitement, toutes les machines du système exécutent le même traitement en
parallèle sur l’ensemble des données. C’est le modèle suivi par le framework Hadoop [Whi09]
pour traiter les données. Ce framework générique de traitement de données massives en
parallèle est utilisé dans plusieurs systèmes de traitements de données multimédia. Par
exemple, les travaux menés dans le cadre du projet RanKloud [Can11] utilisent et étendent
le framework HADOOP [Whi09] pour répondre à des requêtes de classement, ainsi que
pour permettre des jointures dans les requêtes portant sur plusieurs ensembles de données.
Pour cela le système échantillonne les données et évalue statistiquement leur répartition
pour optimiser certaines procédures (notamment les opérations de jointures). Un index des
données locales est construit sur chaque machine du système, permettant à chaque nœud
de résoudre les requêtes localement et d’envoyer les résultats à une seconde catégorie de
nœuds qui assureront la finalisation des requêtes. Cependant ce système est conçu pour
analyser une grande quantité de données et non pas pour répondre à des requêtes en temps
réel, et se destine plutôt à des requêtes de recherche de contenus.
Le projet Image Terrier [HSD11] est un système d’indexation et de recherche d’images
192.2. COMPOSANTS DES PLATEFORMES DE STOCKAGE DE DONNÉES
MULTIMÉDIA
et de vidéos fondé sur le système de recherche textuelle Terrier 6. Ce système utilise lui
aussi la technique de distribution des traitements fournie par le canevas HADOOP afin de
construire incrémentalement l’index des images. Ce système présente l’avantage d’être très
ouvert, mais il est uniquement destiné à la recherche de contenus.
Limites des outils existants Ces deux types de répartitions ne sont pas exclusives
et les deux approches peuvent être combinées de manière à augmenter l’efficacité d’un
système. Il est ainsi possible de créer des flux de travaux enchaînant différentes étapes de
traitement ou les exécutant en parallèle. La principale limite des outils existants réside
dans le fait que les traitements répartis font partie d’une bibliothèque logicielle utilisant
un canevas donné, comme ImageTerrier [HSD11] et Hadoop. Or, dans le projet MCube,
les traitements à répartir sont codés et compilés sans suivre d’API ou de canevas logiciel
particulier. Il est aussi parfois nécessaire d’exécuter les traitements à la demande au fur
et à mesure de l’arrivée des données. Dans ce contexte il apparait donc nécessaire de faire
appel à des plateformes de plus haut niveau permettant d’adapter les traitements à leur
contexte d’exécution.
2.2.3 Plateformes génériques de traitements de données multimédias
La recherche en matière de traitement des données multimédia se concentre aussi pour
une large part sur la conception de nouveau algorithmes d’extraction d’informations. Le
système doit fournir un catalogue de services permettant de procéder aux extractions de
données et aux analyses voulues par l’utilisateur. Cette librairie doit être extensible afin de
permettre aux utilisateurs d’y implanter leurs propres analyses. L’ouverture d’un système
se mesure à sa disponibilité, et à sa capacité à s’interfacer avec d’autres systèmes de manière
à pouvoir être utilisé dans différents contextes. Plusieurs systèmes de stockage évoqués dans
ce chapitre sont décrits dans la littérature mais ne sont pas disponibles pour évaluation,
du fait du peu de cas d’utilisations qu’ils permettent de résoudre. Par exemple le système
Haystack développé par Facebook ne fait pas l’objet d’un développement à l’extérieur
de l’entreprise. Le projet RanKloud bien que décrit dans diverses publications, n’est pas
6. http://terrier.org/, consulté le 5 octobre 2013
202.2. COMPOSANTS DES PLATEFORMES DE STOCKAGE DE DONNÉES
MULTIMÉDIA
publiquement disponible. De même, peu de projets sortent du simple cadre du prototype
de recherche, comme par exemple le projet LINDO [BCMS11].
Le projet LINDO [BCMS11] a pour objectif de développer une infrastructure géné-
rique de traitement de données multimédia permettant de distribuer les traitements et
les données, en assurant l’interopérabilité de différents systèmes de traitement de données
multimédias. Il a permis la mise au point d’une infrastructure d’indexation générique et
distribuée. Pour cela, un modèle de données représentatif a été créé pour les données multimédia
et pour les algorithmes d’indexation de ces données. Les données sont donc réparties
sur un système de fichiers distribué et le système sélectionne l’algorithme d’indexation le
plus approprié en fonction des requêtes les plus féquemment envoyées par l’utilisateur. Ce
système a été appliqué à la vidéosurveillance, pour détecter des événements dans les flux vidéo.
C’est une plateforme multi-utilisateurs, qui peut être utilisée dans plusieurs domaines
à la fois, et permet de représenter les données au format MPEG-7 ou MPEG-21. Cependant
les informations ne sont extraites qu’à la demande explicite des utilisateurs (à travers
une requête) et traversent toutes un serveur central qui contrôle les machines indexant
les contenus. Ce système risque donc de limiter l’élasticité de la solution. L’élasticité d’un
système est sa capacité à s’adapter à l’apparition ou la disparition dynamique de nouvelles
ressources. Cette notion est particulièrement importante dans le contexte des plateformes
de Cloud Computing, où les ressources peuvent être allouées et disparaître rapidement.
Le projet WebLab est un projet libre 7, il est construit sur le même principe d’interface
et de modèle d’échange de données que le projet LINDO. Le projet WebLab ne modélise
pas les traitements, mais seulement le format des données à échanger entre différentes
plateformes de traitements hétérogènes. Ce système repose sur le bus de service Petals 8
pour ses communications, or ce composant semble posséder des problèmes de performance
comme le montre les résultats de différents bancs d’essais successifs 9.
Ces deux systèmes servent donc d’intergiciels pour la communication entre différentes
plateformes de traitements et permettent l’agrégation de différents sites ou grilles spécialisés
7. http://weblab-project.org/, consulté le 5 octobre 2013
8. http://petals.ow2.org/, consulté le 5 octobre 2013
9. http://esbperformance.org/display/comparison/ESB+Performance+Testing+-+Round+6,
consulté le 5 octobre 2013
212.3. ANALYSE
dans certaines étapes de traitement.
Le propos du projet MCube est au contraire de concentrer les données des différents
utilisateurs afin de mutualiser la plateforme de traitement et permettre des économies
d’échelles en matière de stockage et de capacité de calcul. Ce projet se situe à un niveau
intermédiaire entre les systèmes de traitements de données de bas niveau (ImageTerrier,
Hadoop, ...) et ces plateformes de fédération que sont les projets LINDO et WebLab.
Il s’agit donc d’un système multi-tenant, car il sert plusieurs clients en mutualisant ses
ressources.
2.3 Analyse
Les systèmes de stockage et de traitements multimédias décrits ici possèdent diverses
architectures. Les architectures fondées sur les bases de données traditionnelles laissent
peu à peu place à des systèmes basés sur les technologies issues des plateformes Web à
large échelle telles que le canevas Hadoop [Whi09]. Bien que l’adoption de ces solutions se
démocratise, il n’existe pas pour le moment d’alternative permettant de tirer parti des différents
services de ces plateformes sans nécessiter de développement supplémentaire pour
être adapté à l’environnement cible. De plus, hormis les initiatives telles que LINDO, Weblab
ou ImageTerrier, peu de projets dépassent le stade du prototype de recherche. Pour
une large part, ces projets servent de plateformes d’évaluation des algorithmes d’extraction
de connaissances et d’indexation, ou sont orientés vers la recherche de contenus. Le
tableau 2.1 résume les propriétés disponibles pour chacun des systèmes listés dans les sections
précédentes, par rapport aux défis décrits dans la section 2.1.2 de ce chapitre.
L’examen des différentes plateformes de stockage et de traitement de données multimé-
dias montre qu’il n’existe pas, actuellement, de projets remplissant le cahier des charges du
projet MCube. Il existe des plateformes de traitements de données génériques, qui ne sont
pas spécialisées dans les données multimédia, comme le canevas Hadoop, et qui peuvent
donc servir de base à la plateforme MCube.
222.4. ARCHITECTURE DE LA PLATEFORME MCUBE
Table 2.1 – Propriétés des systèmes de traitements de données multimédias
Stockage Traitements Mutualisation ouverture Elasticité
Système Données Descripteurs Informations Descripteurs Indexation Informations
Mpeg-7 DB oui oui non oui oui non oui non non
AIR distribué distribué non oui distribué non oui non limitée
Lindo distribué distribué non distribué distribué oui oui limitée limitée
Weblab distribué distribué non non non non oui limitée limitée
SAPIR distribué distribué non oui oui non oui limité oui
IrisNet distribué distribué distribués oui distribué oui oui oui oui
[CSC09] distribué distribué non oui distribué non oui non oui
RanKloud distribué distribué non distribué distribué non oui non oui
Haystack distribué distribué distribués distribué distribué oui non non oui
ImageTerrier distribué distribué non distribué distribué non non oui oui
2.4 Architecture de la plateforme MCube
2.4.1 Architecture matérielle
Passerelles MCube. Les passerelles MCube sont des appareils mis au point par la
société Webdyn 10. Il s’agit d’un système embarqué reposant sur le système Linux et un
processeur ARM. La présence du système d’exploitation complet permet de connecter
divers périphériques d’acquisition de données multimédias comme des appareils photos ou
des micros. Le système de la passerelle exécute un planificateur de tâches pouvant être
configuré à distance en recevant des commandes depuis les serveurs MCube. Le rôle des
passerelles est d’assurer l’exécution à intervalles réguliers (configurés par l’utilisateur) d’un
programme appelé "librairie passerelle" actuellement déployé sur le système. Les passerelles
sont équipées d’un port Ethernet et d’un modem 3G permettant de se connecter à internet
pour dialoguer avec le serveur MCube.
Serveurs MCube. Les serveurs MCube sont trois machines Dell équipées chacune de
deux processeurs intel Xeon embarquant 8 cœurs chacun. L’espace de stockage important
sur les machines (8 téraoctets par serveur) permet d’anticiper sur la quantité de données
à stocker dans le cadre du projet MCube, dont les collectes annuelles peuvent représenter
dans certains cas plusieurs centaines de gigaoctets par mois.
10. http://www.webdyn.com, consulté le 5 octobre 2013
232.4. ARCHITECTURE DE LA PLATEFORME MCUBE
2.4.2 Architecture logicielle
L’architecture logicielle du projet MCube a été conçue de manière à permettre aux
utilisateurs de pouvoir eux-mêmes développer les applications déployées sur les passerelles
et la plateforme. Pour cela, une interface de programmation a été mise au point par le
constructeur de la passerelle, la société WebDyn 11, permettant de séparer les tâches d’acquisition
des données de leur planification. Les composants développés sur cette interface
sont appelés "librairies passerelles". Les librairies de passerelles sont des librairies dynamiques
implantant les fonctions de l’interface de programmation MCube, ce qui permet de
les déployer à la demande depuis la plateforme Web du projet. Ces librairies sont développées
pour remplir deux fonctions principales :
– L’acquisition des données : C’est la fonction essentielle de ces librairies, elle consiste
à piloter les différents périphériques de capture de données multimédia connectés à
la passerelle pour acquérir des données brutes : photos, sons, vidéos.
– Filtrage des données : Dans certains cas, les données capturées peuvent être volumineuses.
Par exemple, un cas d’utilisation possible du service MCube consiste à
détecter la présence d’insectes nuisibles à partir d’enregistrements sonores. Dans ce
cas précis les données enregistrées ne sont envoyées au serveur que lorsqu’un signal
suspect est détecté dans l’enregistrement. Un traitement plus précis exécuté à la
demande sur le serveur permet ensuite de confirmer ou d’infirmer la détection.
La communication entre les passerelles et les serveurs repose sur un protocole HTTP/
REST qui permet aux passerelles :
– d’envoyer des données collectées à la plateforme MCube via le serveur Web,
– de recevoir une nouvelle librairie,
– de recevoir des commandes à transmettre à la librairie déployée sur la passerelle.
2.4.3 Architecture de la plateforme MCube
La plateforme MCube a un rôle de gestion des équipements et d’agrégation d’information.
Elle assure la communication avec les passerelles déployées, en permettant aux
utilisateurs de les configurer à l’aide d’une interface web. La plateforme fournit aux utilisa-
11. http://www.webdyn.com/, consulté le 5 octobre 2013
242.4. ARCHITECTURE DE LA PLATEFORME MCUBE
teurs l’accès aux librairies et programmes d’analyse de données qu’ils ont développés. Les
données transférées par les passerelles sont stockées sur les serveurs de la plateforme, et
une interface web permet aux utilisateurs de lancer ou de programmer les analyses qu’ils
souhaitent exécuter sur les données téléchargées depuis les passerelles. L’architecture finale
de la plateforme MCube repose sur trois composants logiciels :
Demandes de
traitements
mcube.isep.fr Cloudizer
Utilisateurs
Passerelles
Envoi de données
Consultation des données
Configuration
HDFS
HDFS
HDFS
Noeuds de stockage / traitement
Stockage / consultation
données passerelles et traitements
Requêtes de traitements
Service Web
MCube
Figure 2.3 – Architecture de la plateforme MCube
L’interface Web C’est l’interface utilisateur du système. Elle permet aux agriculteurs
de gérer leurs passerelles et d’accéder à leurs données afin de les récupérer dans le
format qu’ils souhaitent ou de lancer / planifier les traitements à effectuer. De plus
l’interface permet aux utilisateurs de charger de nouveaux programmes de traitements
de données.
Le canevas Hadoop Le système Hadoop permet de stocker les données de manière répartie
via le système de fichiers distribué HDFS [SKRC10]. Il permet d’avoir un système
de fichiers redondant pouvant accueillir un grand nombre de machines. De plus, les
données ainsi stockées peuvent être accédées à l’aide de langages de plus haut niveau
tel que le langage de requêtage HQL (Hive Query Language) [TSJ+09]
252.4. ARCHITECTURE DE LA PLATEFORME MCUBE
Le canevas Cloudizer Le framework Cloudizer est un canevas logiciel développé durant
cette thèse qui permet de distribuer des requêtes de services web à un ensemble de
machines. Ce système est utilisé pour traiter les fichiers envoyés par les passerelles
au fur et à mesure de leur arrivée dans le système.
La figure 2.3 montre comment s’articulent les différents composants de la plateforme.
Les données de configuration, les informations utilisateurs, et les coordonnées des passerelles
sont stockées dans une base de données SQL traditionnelle (MySql 12). Les données
remontées par les passerelles, ainsi que les librairies et les programmes d’analyses sont
stockés dans le système HDFS [SKRC10].
Chaque utilisateur possède un répertoire dédié sur le système de fichiers distribué. Ce
répertoire contient les fichiers reçus des passerelles et classés par nom de la librairie d’origine
des données. Les résultats des traitements effectués sur ces données sont stockés dans un
répertoire dédié et classés par noms de traitements et date d’exécution. Ceci permet aux
utilisateurs de pouvoir retrouver leurs données de manière intuitive.
Les utilisateurs peuvent choisir deux modes de traitement des données : un mode évé-
nementiel et un mode planifié. Lorsque le mode événementiel est sélectionné, l’utilisateur
définit le type d’événement déclenchant le traitement voulu : ce peut par exemple être l’arrivée
d’un nouveau fichier ou le dépassement d’un certain volume de stockage. Le traitement
est alors exécuté sur les données désignées par l’utilisateur. Le mode planifié correspond
à une exécution du traitement régulière et à heure fixe. Le déclenchement des traitements
est géré par la plateforme Cloudizer décrite dans le chapitre suivant.
2.4.4 Description des algorithmes de traitement de données multimédia
Les utilisateurs de la plateforme peuvent charger de nouveaux algorithmes de traitement
de données multimédia. Pour que le système puisse utiliser cet algorithme, il est nécessaire
d’en fournir une description afin de le stocker dans la base de données. Le terme "algorithme"
désigne ici par abus de langage l’implantation concrète d’un algorithme donné,
compilée sous la forme d’un programme exécutable. Un modèle type de ces algorithmes
a donc été conçu, il est représenté en figure 2.4. Ce schéma est inspiré des travaux sur
12. www.mysql.com, consulté le 5 octobre 2013
262.4. ARCHITECTURE DE LA PLATEFORME MCUBE
l’adaptation de composants de [AGP+08, BCMS11] et [GBB+08].
Figure 2.4 – Modèle de description d’algorithme
Un programme et l’ensemble de ses fichiers sont décrits par la classe "Algorithm". Cette
classe contient une liste qui permet de spécifier les fichiers exécutables et de configurations
nécessaires à l’exécution du programme. Un programme est généralement exécuté avec des
paramètres fournis sur l’entrée standard, la liste des paramètres (la classe "Parameter")
décrit les paramètres à fournir à l’exécutable ainsi que leurs positions et préfixes respectifs
si besoin. La classe "OutputFormat" permet de décrire le type de donnée en sortie de
l’exécution du programme. Par exemple, la sélection du format ”TextOuput” signifie que
la sortie du programme sur l’entrée standard correspond à des données textes tabulaires,
séparées par un caractère spécifique. D’autres formats sont disponibles et peuvent être
ajoutés à la librairie.
Exemple de modèle d’algorithme : Calcul de tailles de tomates Le listing 2.1
présente un exemple de modèle d’algorithme pour un programme développé dans le cadre
du projet MCube. Dans ce cas d’utilisation, un dispositif expérimental a été mis au point
par les membres de l’équipe de traitement du signal de l’ISEP, afin de prendre en photo un
272.4. ARCHITECTURE DE LA PLATEFORME MCUBE
plant de tomates selon deux angles différents. Grâce à ce décalage et un calibrage précis du
dispositif, il est possible de donner une estimation de la taille des tomates détectées dans
les photos, si leurs positions sont connues. Cet algorithme prend en entrée deux listes de
points correspondants respectivement aux contours droit et gauche d’une tomate du plant
photographié, et fournit une estimation de la taille du fruit.
Listing 2.1 – Exemple d’instance du modèle d’algorithme
tomate_measurement
1. 0
U j jwal Verma au tho r>
Detection de visages
methode de Viola!Jones , l i b r a i r i e OPEN!CV
d e s c r i p t i o n>
t x t
tomate_measurement . j a r
f i l e s>
leftImageContours
parameter>
rightImageContours
parameter>
pa rame te r s>