DESIGN D’INTERFACES DE MOBILES POUR L ...MOBILE INTERFACE DESIGN FOR BROWSING LARGE COLLECTIONS OF IMAGES Soutenue le 17 mai 2010 Directeur de th ese : M. CUBAUD Pierre Professeur

THESEpr�esent�ee pour obtenir le grade de

DOCTEUR DU CONSERVATOIRE NATIONAL DES ARTS ET METIERS

Discipline : Informatique

pr�epar�ee au

Centre d'Etude et De Recherche en Informatique du CNAM

dans le cadre de l'EDITE de Paris

Shuo-Hsiu HSU

Titre :

DESIGN D’INTERFACES DE MOBILES POUR

L’EXPLORATION DE GRAND CORPUS

D’IMAGES

English Title :

MOBILE INTERFACE DESIGN FOR

BROWSING LARGE COLLECTIONS OF IMAGES

Soutenue le 17 mai 2010

Directeur de these :

M. CUBAUD Pierre Professeur au CNAM

President du jury :

M. NATKIN St�ephane Professeur Titulaire de Chaire au CNAM

Rapporteurs :

Mme. CHEN Lin-Lin Professeur au NTUST, Taiwan Tech

M. PIETRIGA Emmanuel Charg�e de recherche INRIA

Examinateurs :

Mme. JUMPERTZ Sylvie Ing�enieur de recherche �a l'Orange Labs

M. GELGON Marc Professeur au PolyTech'Nantes

M. TOPOL Alexandre Ma�tre de conf�erence au CNAM

ii

Resume

La navigation de contenus photos cons�equents et les probl�ematiques qui y sont asso-

ci�ees int�eressent les chercheurs depuis des ann�ees. Les caract�eristiques physiques de

ces contenus font �emerger des probl�ematiques encore plus complexes lorsqu'on les

parcourt sur appareils portables. Les nouvelles sp�eci�cations des appareils portables

et la litt�erale explosion des contenus num�eriques mettent les designers au d�e�. Ils

doivent, d'une part, am�eliorer l'exp�erience de navigation et, d'autre part, donner

corps �a des caract�eristiques produits nouvelles et adapt�ees �a l'usage. La pr�esente

dissertation aborde la navigation de contenus photos cons�equents sur appareils por-

tables selon trois �etapes, techniques de visualisation, techniques d'interaction et,

en�n, design d'interface pour appareils portables. �A travers l'�etude du Casual Info-

vis sur appareils portables, nous cherchons �a proposer un design int�egr�e qui puisse

orienter les futurs d�eveloppements pour la recherche et l'industrie.

Keyword : Personal photo albums, navigation, serendipity, unexpected discovery,

categorization, interface design, interaction, causal infovis, mobile device, gesture,

haptic manipulation.

Version originale : anglais.

Traduction francaise : Melissa Chouikrat-Marcinkowski, 2010

iii

iv

Remerciements

This dissertation would not be made without the support I received from an extended

community of colleagues, friends, families, and people working in various places. I

would like to express my sincere appreciation to many people and organizations that

contributed to my doctoral studies.

First of all, I would like to thank my advisors and committee members for their

sincere care, interest, and thoughtful feedback. To my advisors Professor Pierre

Cubaud and Mrs. Sylvie Jumpertz - thank you both for your vast reserve of pa-

tience, knowledge and long-term support in directing me through the research and

in integrating the knowledge both from the academic and the industry. To Pro-

fessor Lin-Lin Chen and Dr. Emmanuel Pietriga - thank you for providing helpful

suggestions and precious advice on reviewing my dissertation. To Professor St�e-

phane Natkin, Professor Marc Gelgon and Dr. Alexandre Topol - thank you for your

thought provoking questions and suggestions during the defense. In addition to the

committee, members in Cedric Lab at CNAM have been of great importance in this

work : I am grateful to Professor Eric Gressier-Soudan for his encouragement every

time when I come back to Paris. Thanks, C�ecile LePrado for enlarging my vision in

the domain of sound design ; Rodrigo Almeida, as my sincere trouble shooter, I am

extremely grateful to your help either on the programming, on research discussion,

on bouncing random ideas or on sharing daily life experience ; Pedro Alessio, thank

you for bringing lots of joy to relax the pressure during my doctoral life. Thanks also

goes to Vivane Gal, Hassan Labiah, Fatima-Zahra Kaghat, Areti Damala, Shih-Han

Chang, Antoine Gonot, Olivier Veneri, J�erome Dupire and Xiang Qiu Hou, for your

various help during the time in CNAM. I would like to convey my sincere apprecia-

tion to my colleagues in Orange Labs Rennes for their support of all my research

activities and the fellowship for my doctoral studies over the past three years.

This dissertation would never have been completed without the encouragement and

devotion of my family and friends. I would like to thank two families : my parents,

my aunt, my sister and the family of Mrs. Yi-An Pong, her daughters Chia-Chun

Lu, Ke-Chen Pong and her son-in-law Chien-Hung Ku for their wholehearted love

and spiritual support of me studying overseas for the past six years. I would also like

to thank my friends Chen Yan, Kai Yan and Yu-Pu Cao for your warmest help for

moving to Rennes. Special recognition and thanks also goes to James Jeng Weei

Lin for providing me with a model that de�nitely had an e�ect that was needed for

accomplishing the thesis ; to Jonathan Chapman, thank you for having me prepared

v

before beginning my adventure in Europe. To Hannah Levick and Lauren Murphy,

thank you for saving me when receiving my mails titled by cat on a hot brick˝.

To M�elissa, thank you for your persistent support and care during the last period

of time in accomplishing my dissertation.

Finally, I am thankful to my cat GucciOrr, for being with me at every moment,

especially for chasing his toys in front of me when I was working hard.

vi

Table des matieres

1 Introduction 11

1.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.2 L'�ere num�erique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.3 Contexte de la mobilit�e et photos num�eriques . . . . . . . . . . . . 16

1.4 Chronologie du projet de recherche . . . . . . . . . . . . . . . . . . 18

1.5 Plan de th�ese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2 Definitions 23

2.1 Usages li�es �a la photographie traditionnelle . . . . . . . . . . . . . . 24

2.2 Activit�es individuelles et collectives dans la pratique de la navigation

photo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.3 Albums photos personnels et commerciaux . . . . . . . . . . . . . 30

2.4 Casual Infovis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.5 S�erendipit�e et gestion des contenus photos num�eriques . . . . . . . 33

2.6 R�e exion premi�ere sur un design d'interaction inspir�e du Rubik's cube 39

3 Etat de l’art 41

3.1 Normes et standards de m�etadonn�ees pour les photos num�eriques

grand public . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.2 Algorithmes de calcul pour le regroupement des photos num�eriques 44

3.3 Outils de gestion pour les contenus photos num�eriques . . . . . . . 49

3.4 Techniques de visualisation des photos num�eriques . . . . . . . . . 53

3.5 Casual Infovis et techniques d'interaction sur les appareils mobiles . 58

vii

Table des mati�eres

3.6 M�ethodologie d'�evaluation des navigateurs d'images . . . . . . . . . 63

3.7 R�e exion sur le design et conclusion . . . . . . . . . . . . . . . . . 65

4 Design I 67

4.1 Interaction appareils portables/mains . . . . . . . . . . . . . . . . . 68

4.2 Pr�esentation g�en�erale des gestes et mouvements de manipulation de

la main . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

4.3 Gestes d'interaction sur contenus photos num�eriques . . . . . . . . 75

4.4 R�e exion autour du Rubik's cube . . . . . . . . . . . . . . . . . . . 80

4.5 Proposition de design - Phora . . . . . . . . . . . . . . . . . . . . . 83

4.6 �Evaluation du design . . . . . . . . . . . . . . . . . . . . . . . . . 90

4.7 R�esultat de l'�evaluation . . . . . . . . . . . . . . . . . . . . . . . . 94

4.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

5 Meta-categorisation des photos numeriques 101

5.1 Probl�ematique de la gestion des photos num�eriques . . . . . . . . . 102

5.2 Objectif de l'�etude . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

5.3 �El�ements de m�eta-cat�egorisation . . . . . . . . . . . . . . . . . . . 103

5.4 D�e�nition des six cat�egories . . . . . . . . . . . . . . . . . . . . . . 105

5.5 �Evaluation de la m�eta-cat�egorisation . . . . . . . . . . . . . . . . . 107

5.6 R�esultats de l'�evaluation . . . . . . . . . . . . . . . . . . . . . . . 110

5.7 M�eta-interface bas�ee sur la visualisation origami . . . . . . . . . . . 120

5.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

6 Deuxieme proposition de design 129

6.1 R�e exion sur les r�esultats obtenus chapitre 4 . . . . . . . . . . . . . 130

6.2 Pr�esentation de l'interface circulaire . . . . . . . . . . . . . . . . . 131

6.3 Propositions de design et analyse . . . . . . . . . . . . . . . . . . . 134

6.4 Impl�ementation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

6.5 Probl�ematique du prototype . . . . . . . . . . . . . . . . . . . . . . 144

6.6 Proposition de plan de test . . . . . . . . . . . . . . . . . . . . . . 145

6.7 R�e exion sur le design et conclusion . . . . . . . . . . . . . . . . . 150

viii

7 Conclusions et perspectives 153

7.1 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

7.2 Pr�esentation tangible inspir�ee du Rubik's cube pour interaction fu-

ture avec des photos num�eriques . . . . . . . . . . . . . . . . . . . 156

7.3 Notre vision de l'avenir . . . . . . . . . . . . . . . . . . . . . . . . 161

References 163

1

2

Table des figures

1.1 Les trois contextes de cette th�ese . . . . . . . . . . . . . . . . . . . 13

1.2 Nombre de photos publi�ees sur Flickr de 2004 �a 2009 . . . . . . . . 14

1.3 Carte m�emoire SD Panasonic . . . . . . . . . . . . . . . . . . . . . 15

1.4 Carte m�emoire SONY . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.5 Mod�ele GEMS de cycle de vie des contenus personnels . . . . . . . 17

1.6 Les quatre �etapes chronologiques du projet de recherche. . . . . . . 20

1.7 Chapitres suivant l'ordre chronologique d'accomplissement du travail

de recherche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.1 Appareil photo l�eger Kodak . . . . . . . . . . . . . . . . . . . . . . 25

2.2 Exemple d'image ronde Kodak . . . . . . . . . . . . . . . . . . . . 25

2.3 �Ecran circulaire LCD Toshiba Matsushita . . . . . . . . . . . . . . . 27

2.4 Motorola Aura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.5 Spacewars, le premier jeu vid�eo . . . . . . . . . . . . . . . . . . . . 27

2.6 Approche de Frohlich . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.7 Proposition de d�e�nition du Casual InfoVis . . . . . . . . . . . . . . 32

2.8 Planogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2.9 Remplissage de l'espace . . . . . . . . . . . . . . . . . . . . . . . . 36

2.10 Pr�esentation en zigzag . . . . . . . . . . . . . . . . . . . . . . . . 37

2.11 Pr�esentation en pyramide . . . . . . . . . . . . . . . . . . . . . . . 37

2.12 Relations entre utilisateur, interface et contenus num�eriques. . . . . 39

2.13 Caract�eristiques du Rubik's cube et mappage du contexte de la na-

vigation d'images. . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3

3.1 Exemple de cycle de vie des images num�eriques . . . . . . . . . . . 43

3.2 Exemple d'extraction partielle de donn�ees EXIF . . . . . . . . . . . 43

3.3 Pr�esentation de photos num�eriques sur di��erentes �echelles chrono-

logiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.4 PhotoMesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.5 FotoFile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.6 Mediabrowser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.7 PhotoTOC, navigateur d'images avec « vue d'ensemble + d�etail » . 50

3.8 Navigateur d'images EasyAlbum . . . . . . . . . . . . . . . . . . . 50

3.9 Navigateur d'images MyPhotos . . . . . . . . . . . . . . . . . . . . 51

3.10 Navigateur d'images MiAlbum . . . . . . . . . . . . . . . . . . . . 51

3.11 Mylifebit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.12 Agrafo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.13 Photohelix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.14 Miniature Flickr . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.15 PhotoSynth . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.16 Six modes de pr�esentation photos, propositions de Cooper et al. [1] 56

3.17 Perspective wall . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3.18 M�elange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.19 Arbre hyperbolique . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.20 Vue �sheye . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.21 Flutter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3.22 Interface de l'Acer F900(a) et du HTC Touch HD(b) . . . . . . . . 59

3.23 Interface du Nokia N82(a) et du Motorola A3100 Fun Album(b) . . 60

3.24 Interface du LG KM900(a) et du My Photo Egg(b) . . . . . . . . . 61

3.25 Panneau tactile 3D d�evelopp�e par Mitsubishi . . . . . . . . . . . . . 62

3.26 TOSHIBA qosmio . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3.27 Composants de la plateforme de communication et contenus �emo-

tionnels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

4

4.1 Le V de la victoire (�a g.) et le V �a valeur d'insulte (�a dr.) . . . . . . 69

4.2 Synergies simples . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4.3 Synergies r�eciproques 1 . . . . . . . . . . . . . . . . . . . . . . . . 72

4.4 Synergies r�eciproques 2 . . . . . . . . . . . . . . . . . . . . . . . . 72

4.5 Mouvements intrins�eques s�equentiels . . . . . . . . . . . . . . . . . 72

4.6 Processus de mappage conceptuel et perceptuel . . . . . . . . . . . 74

4.7 Mappages et niveaux de limitation de la formeThree mapping . . . . 74

4.8 Cube Browser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

4.9 AudioCubes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4.10 3D story cube . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4.11 Cognitive cubes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4.12 Wooden brains . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

4.13 Search Cube . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

4.14 Communication entre utilisateurs et contenus �emotionnels . . . . . 83

4.15 Description de Phora . . . . . . . . . . . . . . . . . . . . . . . . . 84

4.16 Trois gestes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

4.17 A�chage des photos . . . . . . . . . . . . . . . . . . . . . . . . . 86

4.18 Phora ash . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

4.19 Probl�ematique de couverture de l'�ecran sur Phora . . . . . . . . . . 87

4.20 Interface visuelle simul�ee sous Processing . . . . . . . . . . . . . . . 89

4.21 M�ecanisme de SpaceNavigator . . . . . . . . . . . . . . . . . . . . 89

4.22 Mise en place de l'environnement d'�evaluation . . . . . . . . . . . . 92

4.23 Temps moyen1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

4.24 Temps moyen2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

4.25 Temps moyen3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

4.26 Comportement utilisateur adapt�e au mode PG . . . . . . . . . . . . 98

4.27 Comportement utilisateur adapt�e au mode RG . . . . . . . . . . . . 98

5.1 Interface du cameraphone K800i . . . . . . . . . . . . . . . . . . . 104

5

5.2 Contextes de la prise de vue . . . . . . . . . . . . . . . . . . . . . . 104

5.3 Type A : Vue statique simple (�a g.), Type B : vues multiples (�a dr.). 107

5.4 Type C : Capture de mouvement avec appareil �xe (�a g.), Type D :

Capture de mouvement avec appareil en mouvement (�a dr.). . . . . 107

5.5 Type E : Groupes (�a g.), Type F : Groupes en mouvement (�a dr.) . 107

5.6 R�epartition de la taille des albums photos entre les 20 participants. . 108

5.7 Taches de classement manuel sur photos imprim�ees. . . . . . . . . . 108

5.8 R�epartition des types de photos en E1 et E2. . . . . . . . . . . . . 110

5.9 R�epartition d�etaill�ee des r�esultats en E1. . . . . . . . . . . . . . . . 110

5.10 Vue globale des diagrammes de 10 participants �a E2. . . . . . . . . 111

5.11 Vue globale des diagrammes de 10 participants �a E2 . . . . . . . . 111

5.12 Diagrammes originaux : Zones W, X, Y et Z de coh�erence des r�esultats113

5.13 Diagramme r�eorganis�e pour les zones A (haut) et B (bas) dans l'ordre

1 et 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.14 Diagramme r�eorganis�e a�n de d�egager les zones C (haut) et D (bas)

dans l'ordre 3 et 4. . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.15 Sujets d'une photo ayant conscience (�a g.) ou non (�a dr.) de l'ap-

pareil photo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

5.16 Diagrammes r�eorganis�es a�n de d�egager les zones E (haut) et F

(bas) dans l'ordre 5 et 6. . . . . . . . . . . . . . . . . . . . . . . . 115

5.17 Poses discontinues. . . . . . . . . . . . . . . . . . . . . . . . . . . 115

5.18 Digrammes r�eorganis�es a�n de d�egager les zones G (haut) et H (bas) 117

5.19 Diagrammes r�eorganis�es a�n de d�egager les zones I (haut) et J (bas) 117

5.20 Diagramme r�eorganis�e a�n de d�egager les zones K (�a g.) et L (�a dr.) 117

5.21 Photos d'une cible en mouvement d'un point de vue macro et micro 119

5.22 R�epartition des photos pr�ef�er�ees. . . . . . . . . . . . . . . . . . . . 119

5.23 Contexte original des quatre photos les plus appr�eci�ees . . . . . . . 119

5.24 Types des brochures di��erentes . . . . . . . . . . . . . . . . . . . . 121

5.25 Scentsory-Nokia, concept de t�el�ephone mobile int�egrant des tech-

niques de pliage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

5.26 L'interface du Rovi Liquid media guide lanc�e en 2009. . . . . . . . . 121

6

5.27 Prototypage rapide sur pliage papier. . . . . . . . . . . . . . . . . . 123

5.28 Etat pli�e et d�epli�e de deux mod�eles de pliage papier . . . . . . . . . 123

5.29 Mod�ele de pliage papier libre . . . . . . . . . . . . . . . . . . . . . 123

5.30 Le Zoopraxiscope de Muybridge expos�e au Kingston Museum. . . . 124

5.31 Pr�esentation en accord�eon (en haut), en pile de jetons (au milieu)

et en Rolodex (en bas) : gestes tactiles d'interaction. . . . . . . . . 125

5.32 Visualisation Phorigami de 561 photos . . . . . . . . . . . . . . . . 126

6.1 (a)Fisheye, (b)Arbre hyperbolique . . . . . . . . . . . . . . . . . . 131

6.2 Foto�le . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

6.3 Face Bubble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

6.4 Interface circulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

6.5 MyPhotoEgg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

6.6 Passage d'une vue �a l'autre sur navigateur d'images traditionnel . . 133

6.7 Transition de la vue d�etail �a la vue globale sous Google Picasa . . . 133

6.8 Premier essai avec Phorigami . . . . . . . . . . . . . . . . . . . . . 135

6.9 Analyse par diagramme radar de la s�election d'album . . . . . . . . 136

6.10 Analyse par diagramme radar de la navigation de contenus . . . . . 137

6.11 Scrolling photo sur iPhone . . . . . . . . . . . . . . . . . . . . . . 138

6.12 Mur Cooliris 3D sur Google Nexus supportant le scrolling photo . . 139

6.13 Visualisation de 173 photos rondes sur arbre hyperbolique . . . . . . 139

6.14 Visualisation de photos rondes sur arbre hyperbolique . . . . . . . . 139

6.15 Mode d'a�chage pour la s�election d'album : pr�esentation carrousel . 142

6.16 Mode d'a�chage pour la navigation des contenus et manipulation

simul�ee via une visualisation hyperbolique. . . . . . . . . . . . . . . 142

6.17 M�etaphore du plateau tournant dans la visualization . . . . . . . . . 142

6.18 Flux de taches sur la version retravaill�ee de Phora . . . . . . . . . . 143

6.19 Arbre hyperbolique en Javascript InfoVis Toolkits . . . . . . . . . . 144

6.20 Maintien des �el�ements dans la limite du cercle, lors du calcul de

collision. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

7

6.21 Impl�ementation de l'e�et de zoom lorsqu'un �el�ement est gliss�e vers

le centre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

6.22 Mise en place de l'environnement. . . . . . . . . . . . . . . . . . . 149

6.23 Description des deux m�ecanismes de changement de vue. . . . . . . 151

6.24 Pr�esentation en vue vignettes (�a g.) et en mode contexte + focus

(�a dr.). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

6.25 Trois modes de pr�esentation propos�es par Copper et al. . . . . . . . 151

6.26 Vues vignettes adaptable et gestes de navigation . . . . . . . . . . 151

7.1 Cube obtenu via la pr�esentation Tetris 3D. . . . . . . . . . . . . . . 156

7.2 Pr�esentation Tetris 3D . . . . . . . . . . . . . . . . . . . . . . . . 156

7.3 Prototype de pr�esentation cubique irr�eguli�ere . . . . . . . . . . . . 159

7.4 Six vues di��erentes du prototype du premier type de pr�esentation

cubique irr�eguli�ere . . . . . . . . . . . . . . . . . . . . . . . . . . . 160

7.5 Six vues di��erentes du deuxi�eme type de prototype de visualisation

irr�eguli�ere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160

7.6 Diagramme en entonnoir . . . . . . . . . . . . . . . . . . . . . . . 161

7.7 Siftables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

7.8 Sixthsenses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

8

Liste des tableaux

2.1 Taxonomie propos�ee par Kindberg et al. [2] . . . . . . . . . . . . . 30

2.2 Comparaison InfoVis traditionnel / Casual InfoVis . . . . . . . . . . 31

4.1 Analyse des gestes quotidiens identi��es. . . . . . . . . . . . . . . . 76

4.2 Gestes quotidiens selon la fonction des doigts Points de couleur

rouge :doigt travaillant seul Points de couleur bleue :doigts tra-

vaillant en groupe Points de couleur magenta :doigts travaillant de

fa�con s�equentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4.3 Interface retravaill�ee de Phora : fonctions et gestes de manipulation

associ�es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

4.4 Trois types de taches et r�eactions potentielles des participants . . . 91

4.5 Panorama des �etudes de navigateurs d'images . . . . . . . . . . . . 93

5.1 Comparaison des deux approches. . . . . . . . . . . . . . . . . . . . 105

5.2 Mouvement de l'appareil photo et des cibles. . . . . . . . . . . . . . 105

5.3 Cat�egories, contextes et techniques d'interaction associ�es. . . . . . . 106

5.4 R�esum�e des deux exp�eriences. . . . . . . . . . . . . . . . . . . . . . 108

5.5 Pr�ef�erences photos de 10 participants. . . . . . . . . . . . . . . . . 118

6.1 Propositions de design et taches associ�ees . . . . . . . . . . . . . . 140

7.1 Correspondance entre notre cat�egorisation et les formes repr�esenta-

tives bas�ees sur Tetris. . . . . . . . . . . . . . . . . . . . . . . . . 159

9

10

Chapitre 1

Introduction

Si la pr�esente th�ese s'int�eresse �a la gestion des contenus photos num�eriques, elle

avait initialement pour th�eme la gestion des contenus vid�eo. Les images pouvant

etre consid�er�ees comme les �el�ements �a partir desquels se construit une vid�eo, notre

postulat a �et�e le suivant : adresser la probl�ematique de la gestion des contenus

photos permettra de d�egager des solutions potentiellement adapt�ees aux contenus

vid�eo. Comme dit le proverbe, « l'eau qui porte le navire est celle-l�a meme qui

l'engloutit ». Cette num�erisation qui nous permet de cr�eer librement des conte-

nus audiovisuels pose �egalement le probl�eme de la gestion de ces contenus. Nous

introduirons le sujet de la pr�esente th�ese par une pr�esentation des contextes asso-

ci�es. Nous d�ecrirons ensuite le ph�enom�ene de la num�erisation a�n de souligner les

probl�emes li�es �a la gestion des contenus num�eriques et d'introduire notre point de

vue. Dans un souci de clari�cation des probl�ematiques abord�ees, nous pr�esenterons

la terminologie relative �a la gestion des contenus photos num�eriques. En�n, nous

exposerons notre plan de th�ese ainsi que notre m�ethodologie.

11

1.1 Contexte

Contexte du projet

La pr�esente th�ese s'inscrit dans le cadre d'un projet industriel men�e sur trois an-

n�ees au sein d'Orange Labs (France Telecom R&D Rennes, �a l'initiative du projet)

et du laboratoire CEDRIC (CNAM, Conservatoire National des Arts et M�etiers).

L'�equipe �a laquelle j'ai �et�e rattach�e s'int�eresse tout particuli�erement au design et �a

la relation client. Ce projet b�en�e�cie du dispositif CIFRE (Conventions Industrielles

de Formation par la Recherche) et est �nanc�e conjointement par l'entreprise et le

gouvernement. L'�equipe que j'ai pu int�egrer comprend un responsable d'�equipe, un

post-doc et deux doctorants pour la partie design, ainsi que 13 personnes sp�ecialis�ees

en ergonomie, conception et IHM (Interaction Homme Machine).

Face �a la probl�ematique de la gestion des contenus photos num�eriques, les syst�emes

classiques de visualisation s'int�eressent �a l'e�cacit�e des r�esultats obtenus sur une

recherche donn�ee. Sur cette meme probl�ematique, un domaine nouveau, le Casual

Infovis, s'appuie sur des techniques de visualisation et d'interaction riches, et porte

sur la navigation de contenus num�eriques personnels comme les photos. L'objectif

de notre projet est de proposer, sur des appareils avec �ecran de dimension r�eduite,

une interface bas�ee sur le Casual Infovis et qui adresse cette probl�ematique d'un

point de vue design. Les questions associ�ees concernent l'approche adopt�ee dans

l'organisation des photos, les techniques d'interaction sur appareils mobiles et les

mod�eles de visualisation des photos num�eriques.

Contexte industriel

Ce projet rel�eve des programmes de recherche Orange Labs sur l'interaction avec

des contenus audiovisuels. Son objectif est d'explorer les mod�eles de pr�esentation et

d'interaction avec des contenus multim�edia cons�equents et de faciliter l'utilisation de

ces derniers. Derri�ere ces �etudes se retrouve un objectif strat�egique majeur pour les

entreprises de t�el�ecommunications. La d�e�nition de nouveaux services multim�edia

et l'enrichissement des services de t�el�ecommunication existants. Astrolabe [3], le

pr�ec�edent projet de l'�equipe, est un navigateur d'images qui permet de visualiser les

photos sous la forme d'une spirale. Astrolabe ins�ere des signaux auditifs qui viennent

enrichir l'exp�erience utilisateur lors de la navigation de contenus photos personnels

ou professionnels d'un certain volume. Les utilisateurs sont invit�es �a d�ecouvrir les

contenus photos d'une fa�con plus �emotionnelle, par le biais de signaux auditifs divers

et d'un mode de pr�esentation original.

Les contenus multim�edia v�ehiculent des informations audiovisuelles riches qui sont

susceptibles d'etre �eveill�ees par di��erents signaux. La navigation de contenus audio-

visuels n�ecessite une interface int�egrant des modes avanc�es de pr�esentation visuelle

et des techniques puissantes d'interaction, en d'autres termes, une interface assez

�eloign�ee de la classique WIMP. La pr�esente th�ese s'int�eresse �a la gestion des photos

num�eriques comme premi�ere �etape vers la r�esolution des probl�ematiques li�ees aux

contenus multim�edia. Son th�eme se situe �a la crois�ee de trois domaines : cat�egori-

sation des photos num�eriques, techniques d'interaction associ�ees �a la visualisation

de ces photos et design d'interfaces ayant vocation �a etre int�egr�ees sur appareils

portables. Les trois contextes de cette th�ese sont illustr�es (cf. �g. 1.1).

12

Figure 1.1 � Les trois contextes de cette these

1.2 L� ere numerique

Poussee par les progres technologiques, notre production est passee d’ analogique

a numerique. Au bureau ou a notre domicile, nous produisons des donnees qui

tendent vers le tout numerique. Les documents ou fichiers texte sur lesquels nous

travaillons sont numerises sous differents formats tels que PDF, TXT, DOC ou RTF.

Nos modes de communication se sont numerises : nous envoyons des courriers

électroniques, des SMS, nous chattons sur messagerie instantanee et participons

a des visioconferences. Notre consommation énergetique quotidienne est relevee

et numerisee via des compteurs d’ eau, d’ électricite ou de gaz. Nos deplacements

numerises s’ affichent sur notre navigateur GPS. Nous allons jusqu’ a numeriser notre

propre condition physique lorsque nous mesurons notre rythme cardiaque durant

l’ effort. Impossible de le nier, nous menons desormais une existence numerique.

Nos activites physiques, traduites en format numerique, sont quantifiees. L’ étape

suivante, pour demain a en croire certains, serait la numerisation de nos émotions

quotidiennes !

La croissance rapide des contenus numeriques peut s’ expliquer par le prix relative-

ment faible des appareils électroniques (appareils photo numeriques, camescopes,

scanners, telephones portables, PDA, etc..) et dispositifs de stockage (disques ex-

ternes, cles USB, cartes memoire). De ce fait, les utilisateurs sont incites a creer des

contenus et a les conserver, voire les partager avec leurs amis. Prenons l’ exemple de

la photo numerique : la croissance des ventes d’ appareils photo numeriques indique

que celle-ci fait desormais partie de notre quotidien. IDC prevoit qu’ entre 2008 et

2012, les ventes d’ appareils photo numeriques vont augmenter de 3 pourcent en

moyenne, pour passer de 146 a 160 millions [4]. La photographie numerique im-

pacte tres fortement le marche du tirage photo traditionnel. Elle ne necessite pas de

developpement mais davantage d’ espace de stockage, ce qui a permis l’ émergence

de services Internet tels que Google Picasa et Flickr qui proposent des espaces de

13

Figure 1.2 – Nombre de photos publi�ees sur Flickr de 2004 �a 2009

stockage en ligne gratuits pour les images. Le 12 octobre 2009, Flickr a annonc�e

avoir pass�e le cap symbolique des 4 milliards de photos publi�ees. Ce jalon atteint,

au vu des statistiques, on d�ecouvre que la croissance de Flickr s'est faite au rythme

de 1 milliard de photos par an entre 2007 et 2009 (cf. �g. 1.2). Cette croissance

massive se retrouve �egalement chez Facebook, qui a annonc�e le 15 octobre 2008

[5] avoir franchi la barre des dix milliards de photos h�eberg�ees.

Compar�e �a l'analogique, le num�erique permet de g�en�erer des donn�ees qu'il est facile

de reproduire, transf�erer et stocker. Si les donn�ees num�eriques sont utilis�ees par

un syst�eme informatique, par exemple pour e�ectuer une op�eration math�ematique,

les contenus sont pour leur part des donn�ees qui sont li�ees aux utilisateurs par

di��erents aspects. Ces contenus se rapportent �a des activit�es humaines diverses et

vari�ees et pr�esentent en g�en�eral des informations �a caract�ere personnel. Ils sont

conserv�es �a deux endroits di��erents : aupr�es d'institutions publiques (ex : pr�efecture

de police) ou sur nos appareils �electroniques personnels (ex : ordinateur, portable,

disque dur externe). Si nous pouvons controler l'acc�es �a nos contenus personnels

lorsque nous les h�ebergeons nous-meme, il en va autrement lorsqu'ils sont h�eberg�es

par des institutions publiques, puisque leur acc�es est alors limit�e, meme pour leur

propri�etaire initial.

Les contenus num�eriques ne sont pas une simple version num�eris�ee de contenus

analogiques. Ils remettent en cause nos modes de gestion traditionnels et notre

exp�erience utilisateur. On peut les manipuler de di��erentes fa�cons selon l'usage et

les pr�esenter sur di��erentes plateformes comme un PC de bureau, un ordinateur

portable, un t�el�ephone mobile ou encore un ordinateur port�e (wearable computer),

o�u l'�ecran est remplac�e par des lunettes sur lesquelles sont projet�ees des informations

visuelles. Servis par la facilit�e de l'Internet et le recours toujours plus fr�equent

14

aux appareils portables, les usages se sont multipli�es et diversi��es. Les contenus

num�eriques sont devenus une boule de neige g�eante qui n'en �nit pas de rouler et

de grossir. Leur gestion est une exp�erience totalement nouvelle, et le fait qu'il soit

tr�es facile de les transformer et de les �echanger vient compliquer la tache du designer

dans sa d�e�nition d'une interface capable de s'adapter aux di��erents usages. Les

contenus num�eriques �etant en rapport avec la vie de l'utilisateur, ils sont les vecteurs

d'informations riches susceptibles de d�eclencher des �emotions chez ce dernier. Ils

pourraient, de ce fait, constituer une vaste ressource multim�edia o�u chacun pourrait

cr�eer, archiver et revivre les exp�eriences de sa vie.

La gestion des contenus num�eriques, en particulier de ceux qui, �a l'instar des photos,

sont vecteurs d'�emotions, ne saurait se contenter d'interfaces WIMP ou de syst�emes

d'InfoVis classiques. Elle n�ecessite des interfaces novatrices qui vont venir extraire

des signaux �emotionnels �a partir des contenus num�eriques et susciter l'attachement

et l'�emotion vis-�a-vis des contenus.

Figure 1.3 – Carte m�emoire SD Panasonic(images extraites de www.engadget.com)

Figure 1.4 – Carte m�emoire SONY(images extraites de http ://forum.hardware.fr)

15

1.3 Contexte de la mobilite et photos numeriques

Grace �a la technologie qui nous a ouvert les portes de la mobilit�e, nos activit�es ne

se cantonnent plus �a un environnement �xe. Le premier exemple de succ�es dans

ce domaine est l'invention du t�el�ephone portable qui permet �a tout un chacun de

communiquer lors de ses d�eplacements. Plus tard, le PC a quitt�e le bureau pour

devenir portable, et chacun a pu travailler et manipuler ses donn�ees dans un contexte

de mobilit�e. Avec Internet, la mobilit�e a franchi une nouvelle �etape puisque l'on peut

d�esormais acc�eder �a ses contenus de n'importe o�u, via une connexion r�eseau et un

�equipement �electronique. Cette mobilit�e a transform�e l'usage des appareils et fait

�emerger de nouveaux mod�eles d'usage. Par exemple, dans un contexte de mobilit�e,

les appareils photos num�eriques peuvent revetir di��erents usages. Selon le sc�enario,

l'appareil photo sera un outil de travail, de divertissement, ou encore le moyen

d'enregistrer ses activit�es [6].

En r�egle g�en�erale, la condition de mobilit�e peut etre continue ou nomade [7]. En

mobilit�e continue, l'utilisateur est en mouvement, il peut par exemple etre au t�e-

l�ephone portable pendant la marche. En mobilit�e nomade, il se rend �a un endroit

�xe pour y travailler, comme par exemple dans un caf�e pour surfer sur Internet

en Wi-Fi depuis son ordinateur portable. Selon que l'on est en condition �xe, en

mobilit�e continue ou nomade, les besoins divergent, notamment en ce qui concerne

l'environnement d'ex�ecution des taches. Le mod�ele d'usage varie selon la condition

de travail et les intentions de l'utilisateur. On peut alors se poser la question sui-

vante : quel genre de cocktail obtient-on lorsque condition de mobilit�e et contenus

num�eriques se rencontrent ?

Il est possible de cr�eer des contenus num�eriques �a partir d'un endroit �xe : on

peut prendre une photo et l'envoyer �a ses amis depuis son PC au bureau. Dans

un contexte de mobilit�e, cette meme tache permet de cr�eer des contenus qui sont

davantage li�es �a des �ev�enements en temps r�eel. La technologie de mobilit�e permet

de cr�eer, d'atteindre et de partager des contenus avec une exibilit�e accrue. D�es lors

que l'on a un appareil portable sous la main, nos contenus sont disponibles �a tout

moment, de n'importe o�u. Cette disponibilit�e accrue vient expliquer la rapidit�e de

la croissance des contenus num�eriques. Jusqu'�a pr�esent, si l'on utilise un appareil

portable pour cr�eer des contenus num�eriques, c'est essentiellement pour prendre

des photos et enregistrer des vid�eos. On cr�ee des contenus en temps r�eel, selon les

�ev�enements, contenus que l'on partage avec ses amis et que l'on di�use ensuite �a

l'�echelle plan�etaire via un service Internet. Ces contenus sont bel et bien des contenus

personnels. Salminen et al. [8] proposent quatre phases - Get, Enjoy, Maintain, Share

(litt�eralement : Obtenir, Appr�ecier, Maintenir, Partager) qui permettent de d�e�nir

un mod�ele de cycle de vie des contenus personnels illustr�e en �g. 1.5.

Ce mod�ele GEMS exprime les usages et actions li�es aux contenus personnels, �a dif-

f�erentes �etapes dans le temps (G, E, M, S). Selon le contexte, les utilisateurs suivent

tout ou partie de la proc�edure. Le mod�ele et les usages d�ecrits peuvent varier selon

l'appareil utilis�e. En ce qui concerne certains appareils portables « anciens » tels que

les lecteurs MP3, on peut consid�erer que leur vocation est de distraire l'utilisateur

(G) plus que d'o�rir un service �etendu (G, M, S). Les appareils portables actuels

ont �evolu�e vers une plus grande multifonctionnalit�e, a�n de supporter l'ensemble des

services o�erts par une connexion Internet. De ce point de vue, le design d'interface

est confront�e �a un d�e� �enorme : tout appareil permettant d'e�ectuer une action li�ee

16

�a l'une des phases du mod�ele GEMS doit proposer une interface sp�eci�que. Face �a

la polyvalence accrue des appareils, les interfaces associ�ees doivent int�egrer davan-

tage de m�ecanismes dont la exibilit�e facilite l'usage sur des taches complexes, �a

chacune des �etapes G, E, M, S.

Conscients que l'avenir du contenu mobile est fortement li�e �a la connexion Inter-

net, Google, Yahoo et AmazonGoogle ont annonc�e le concept de cloud computing

(informatique d�emat�erialis�ee) [9][10] pour les futurs appareils portables tels que les

smartbooks et les netbooks. Comme indiqu�e en �g. 1.5, les fonctions en phases G

et S sont davantage li�ees au service Internet, celles en E et M concernant davantage

les fonctionalit�es de l'appareil. Grace au cloud computing, les futurs appareils vont

int�egrer un �eventail toujours plus vaste de services Internet. L'acc�es �a ces services

sera la dominante, l'appareil en lui-meme se cantonnant �a un role de pont physique

vers les contenus virtuels, l'interface ayant pour role de guider les utilisateurs dans

la navigation de leurs contenus.

Figure 1.5 – Mod�ele GEMS de cycle de vie des contenus personnels(image bas�ee sur l'ouvrage Personal content experience[11])

17

1.4 Chronologie du projet de recherche

�Etant donn�e que la pr�esente th�ese aborde le prototypage d'un point de vue de-

sign, nous avons choisi de d�e�nir un processus en boucle sur quatre �etapes qui sont

illustr�ees en �g.1.6. Nous commen�cons par la phase d'analyse au cours de laquelle

nous collectons les connaissances fondamentales n�ecessaires �a la d�e�nition de di��e-

rentes th�eories et au d�eveloppement d'id�ees de design. Sur le r�esultat de l'analyse, la

deuxi�eme phase a pour objectif de construire les th�eories qui guideront le d�eveloppe-

ment des propositions de design. La derni�ere phase de ce processus est l'�evaluation

qui permet de tester le prototypage et de collecter les di��erents r�esultats. La prise

en compte des r�esultats de cette �evaluation vient ensuite am�eliorer la proposition

de design.

Au cours de la phase d'analyse, nous avons consult�e de nombreux articles de re-

cherche traitant des techniques de visualisation et de leur int�egration �a des navi-

gateurs d'images. Dans un contexte de mobilit�e, nous nous sommes interrog�es sur

la relation qui existe entre l'objet et les mains. Notre premi�ere th�eorie s'est alors

inspir�ee du Rubik's cube qui associe une technique de visualisation sp�eci�que �a une

technique de manipulation particuli�ere. Les di��erents modes de r�esolution du Ru-

bik's cube ont par ailleurs retenu notre attention et nous ont amen�e �a r�e �echir �a

la probl�ematique de la d�ecouverte de l'inattendu lors de la navigation de contenus

photos num�eriques cons�equents.

Avec pour point de d�epart la th�eorie du Rubik's cube, nous soumettons un concept

de design permettant d'�etudier les techniques de visualisation propres au cube. Notre

proposition avanc�ee de design se pr�esente comme une r�e exion autour des appareils

mobiles, avec une attention particuli�ere aux gestes de manipulation et techniques

de visualisation inspir�ees du Rubik's cube. Nous avons par ailleurs cherch�e �a prendre

en compte la d�ecouverte de l'inattendu dans le design d'interface.

Notre proposition de design met en lumi�ere deux �el�ements fondamentaux concernant

la navigation de contenus photo : d'une part, la d�ecouverte de l'inattendu lors de la

navigation de contenus cons�equents et, d'autre part, l'organisation de ces memes

contenus. Concernant la d�ecouverte de l'inattendu, nous nous sommes int�eress�es

�a la probl�ematique de la s�erendipit�e. L'observation des modes de pr�esentation des

produits nous am�ene �a consid�erer qu'il est possible de « provoquer » la d�ecouverte

de l'inattendu par des m�ecanismes sp�eci�ques qui viennent in uencer la fa�con dont

les utilisateurs parcourent un contenu. Concernant l'organisation des contenus, nous

nous sommes int�eress�es aux albums photos en ligne et avons d�egag�e di��erentes

cat�egories de photos susceptibles d'etre utilis�ees dans l'organisation des contenus

photo.

L'observation de contenus photo personnels permet d'obtenir certains indices. Nous

proposons une approche de m�eta-cat�egorisation qui se pr�esente comme une r�e exion

sur l'organisation conventionnelle des photos. Cette approche nous am�ene �a d�e�nir

les grandes lignes d'une m�eta-interface. Avant d'impl�ementer celle-ci, nous avons

proc�ed�e �a une �evaluation de notre m�eta-cat�egorisation, que nous avons appliqu�ee

aux contenus photo de « Mr. Tout-le-monde ». L'�etape suivante a �et�e l'impl�emen-

tation de notre design. Au vu de la di�cult�e d'impl�ementation sur �ecran tactile

circulaire, nous avons d�ecid�e d'adapter le m�ecanisme de SpaceNavigator a�n de si-

muler les gestes de manipulation propos�es par notre design. Nous avons �egalement

18

organis�e un plan de test a�n de valider les performances des gestes sur di��erentes

taches de navigation d'images. Les r�esultats de cette �evaluation nous ont ensuite

permis d'a�ner notre design d'interface.

Avant d'a�ner notre design, nous continuons �a travailler sur notre m�eta-interface

et nous int�eressons aux techniques de pliage origami comme modes de pr�esentation

des di��erentes cat�egories de photos. Nous avons choisi d'impl�ementer notre m�eta-

interface sous environnement Processing. Apr�es une derni�ere boucle pour a�ner,

nous soumettons �a nouveau notre design d'interface inspir�ee du Casual InfoVis,

design dont l'impl�ementation et l'�etude utilisateur sont plani��ees pour ex�ecution.

1.5 Plan de these

Sur la base du d�eroulement chronologique de notre travail de recherche, nous avons

d�e�ni sept chapitres (cf. �g.1.7). Le chapitre 3 dresse l'�etat de l'art des techniques

et applications potentielles. Le chapitre 4 adresse pour sa part la probl�ematique du

design d'interaction dans un contexte de mobilit�e. Lors de la phase successive de

d�eveloppement, les r�esultats de l'�evaluation viennent am�eliorer le design propos�e.

Le chapitre 5 d�ecrit notre approche de cat�egorisation des photos. Nous proposons

une approche qui entend faciliter la navigation des photos en liant leur mode de

pr�esentation �a la cat�egorie �a laquelle elles appartiennent. Le chapitre 6 propose

d'a�ner notre design, en int�egrant le Casual InfoVis sur des appareils dot�es d'un

�ecran circulaire.

19

Figure 1.6 – Les quatre �etapes chronologiques du projet de recherche.

20

Figure 1.7 � Chapitres suivant l’ ordre chronologique d’ accomplissement du tra-vail de recherche.

21

22

Chapitre 2

Definitions

Dans le pr�esent chapitre, nous proposons un panorama des pratiques quotidiennes

de la photographie en ce qui concerne la cr�eation, le stockage, l'organisation, la

recherche et l'a�chage des photos. Bien que la photographie soit pass�ee de « phy-

sique » �a num�erique, elle n'en a pas moins conserv�e certains usages acquis sur pho-

tos papier. Nous aborderons les probl�ematiques li�ees �a la gestion des photos papier

et num�eriques, puis d�e�nirons la terminologie utilis�ee dans la pr�esente dissertation.

En�n, nous pr�esenterons notre proposition de design comme solution potentielle aux

probl�ematiques li�ees aux contenus photos num�eriques.

23

2.1 Usages lies a la photographie traditionnelle

Les archives visuelles telles que les textes et les dessins sont des mat�eriaux signi-

�catifs qui permettent de consigner les �ev�enements importants. La photographie

a permis �a tout un chacun d'immortaliser les instants pr�ecieux de son existence.

Avant l'arriv�ee du num�erique, les albums photos papier repr�esentaient des archives

tr�es importantes pour les familles en ce qu'elles permettaient aux plus jeunes de

mieux comprendre l'histoire familiale. Puisque d�evelopp�ees sur papier, les photos

traditionnelles pr�esentent les caract�eristiques suivantes :

1. Elles vieillissent mal, avec une qualit�e photo di�cile �a conserver.

2. L'accumulation des collections n�ecessite davantage d'espace physique de sto-

ckage.

Selon les usages, trois modes de rangement sont possibles : la bo�te �a chaussures,

le livre album et le cadre photo.

{ La bo�te �a chaussures : c'est une fa�con tr�es r�epandue de ranger des a�aires

personnelles (documents, photos). Elle peut contenir davantage que les deux

autres solutions abord�ees. Les contenus peuvent etre des documents dont on n'a

plus usage, sans ordre de rangement particulier. Les photos peuvent y etre tri�ees

(on peut s�eparer les photos « rat�ees » du reste), et on la range dans un endroit

o�u il ne sera par forc�ement �evident de la retrouver, comme par exemple un grenier

[12].

{ Le livre album : c'est un mode de rangement typique des photos. Il permet

de les organiser de fa�con simple, comme par th�eme ou par date. Sur chaque

page, les photos peuvent etre dispos�ees d'une fa�con plus ou moins artistique.

Contrairement �a la bo�te �a chaussures, on le range dans un endroit facile d'acc�es

pour les membres de la famille, comme par exemple sur une �etag�ere.

{ Le cadre photo : c'est un mode d'a�chage tr�es repr�esentatif, qui permet de mettre

en valeur des photos illustrant un �ev�enement important ou certaines p�eriodes de

la vie. Chaque cadre contient une photo unique, qui peut etre une miniature ou

un agrandissement. En g�en�eral, les cadres photos, en tant qu'objets-souvenirs,

sont d�ecor�es de fa�con artistique et accroch�es au mur ou pos�es sur une �etag�ere, �a

port�ee du regard des membres de la famille ou des visiteurs.

Les photographies �xes sont principalement disponibles en format rectangulaire de

dimensions vari�ees. Une exception dans l'histoire de la photo : en 1888, Kodak sort

son premier appareil photo instantan�e (cf. �g. 2.1), �equipement l�eger. Le d�evelop-

pement et le tirage, e�ectu�ees par l'usine Kodak, produisent des images rondes. Le

choix de ce format n'�etait pas du au hasard : les lentilles grand angle dont �etait

�equip�e l'appareil, peu couteuses, produisaient une r�esolution m�ediocre dans les par-

ties ext�erieures de l'image. A�n de pallier ce probl�eme, un cache rond avait �et�e

install�e dans l'appareil. Par la suite, les photos ont syst�ematiquement �et�e d�evelop-

p�ees dans un format rectangulaire. L'avantage des albums photos papier est qu'ils

permettent de conserver les photos �a un endroit sp�eci�que bien identi��e. La gestion

des photos papier est par ailleurs pratique : on peut facilement annoter les photos

au verso, les indexer ou les r�eorganiser selon ses pr�ef�erences. Facile �egalement de

comparer des photos, de les disposer sur la table ou de les faire passer de main en

main.

Les photos num�eriques sont tr�es faciles �a reformater, dupliquer et distribuer. Com-

par�e aux photos papier, leur manipulation physique est limit�ee. La pr�esentation de

24

Figure 2.1 – Appareil photo l�eger Kodak(image extraite de www.photomuse.org)

Figure 2.2 – Exemple d'image ronde Kodak(images extraites de www.photomuse.org)

leur contenu d�epend en fait du m�edia, toutes les op�erations potentielles se trouvant

de ce fait limit�ees par l'interface dudit m�edia. Cependant, si le m�edia int�egre une

interface intelligente, la manipulation des photos num�eriques peut s'e�ectuer d'une

fa�con aussi souple qu'avec des photos papier. Puisque les photos num�eriques d�e-

pendent du m�edia, on peut supposer que les caract�eristiques des di��erents m�edias

vont amener tout autant d'usages. Le premier �el�ement di��erentiateur est la taille

de l'�ecran, qui peut aller de l'�ecran miniature d'une montre au mur vid�eo utilis�e

lors d'�ev�enements. La quantit�e de contenu qui est pr�esent�ee sur l'�ecran r�ev�ele la

condition d'usage de l'appareil. Ainsi, les appareils portables, avec leur �ecran r�eduit,

vont permettre d'a�cher une information minimale, tandis que les PC de bureau,

aux capacit�es plus cons�equentes, permettront l'a�chage de contenus riches.

En r�egle g�en�erale, les appareils �electroniques classiques a�chent les photos num�e-

riques sur sur des �ecrans rectangulaires de dimensions vari�ees. En 2007, Toshiba

Matsushita a pr�esent�e son prototype d'�ecran LCD circulaire 3 pouces (cf. �g. 2.3)

dans le but d'orienter l'industrie automobile et celle du portable vers ce type d'�ecran.

En 2008, Motorola a lanc�e « Arua » , le premier t�el�ephone portable �a �ecran circu-

laire du march�e (cf. �g.2.4). D'un point de vue technologique, l'utilisation d'un

�ecran circulaire est loin d'etre une innovation quand on sait que ce type d'�ecran se

25

retrouve d�es 1950 sur divers syst�emes informatiques, tout particuli�erement dans le

domaine radar. Rappelons que « Spacewars », le premier jeu vid�eo, d�evelopp�e par

Steve Russell au MIT pour le PDP-1 (cf. �g.2.5), �etait lui aussi int�egr�e sur �ecran

circulaire [13]. Par la suite, une fois surmont�ees les di�cult�es li�ees �a la projection

d'images, l'�ecran cathodique est pass�e de circulaire �a rectangulaire. Dans le meme

ordre d'id�ees, comme discut�e plus tot, c'est �a un d�efaut mat�eriel du premier ap-

pareil photo commercialis�e par Kodak que l'on doit le format rond auquel �etaient

initialement d�evelopp�ees les photos [14].

Les nouvelles technologies r�eactualisent ce mode d'a�chage « vintage » et re-

mettent en cause l'exp�erience utilisateur acquise sur �ecrans conventionnels. Ces

nouvelles sp�eci�cations d'�ecran am�enent la possibilit�e d'une exp�erience visuelle re-

nouvel�ee. De fa�con �evidente, les designers vont devoir concevoir une interface no-

vatrice qui soit adapt�ee aux contenus audiovisuels �emergeants que l'on retrouve sur

les appareils portables.

26

Figure 2.3 – �Ecran circulaire LCD Toshiba Matsushita(image extraite de www.gadgettastic.com)

Figure 2.4 – Motorola Aura(image extraite de img.gsmarena.com)

Figure 2.5 – Spacewars, le premier jeu vid�eo(image extraite de sophia.javeriana.edu.co)

27

2.2 Activites individuelles et collectives dans la pra-

tique de la navigation photo

Avec la technologie, la photographie est pass�ee du format papier au num�erique. Les

photos num�eriques, exibles, s'adaptent �a tout type de pr�esentation. Le num�erique

permet davantage d'e�ets visuels dans l'a�chage des photos et nous convie �a une

exp�erience nouvelle de navigation. L'un des avantages du num�erique est sa capacit�e

« magique » de stocker des milliers voire des millions de photos sur un seul dis-

positif de stockage. Avec un p�eriph�erique de sortie, sur t�el�ephone portable comme

sur PC, les utilisateurs peuvent parcourir de nombreux contenus photos, exp�erience

de navigation totalement nouvelle qui n'�etait pas possible sur photos papier. L'aug-

mentation des capacit�es mat�erielles s'accompagne d'une croissance e�r�en�ee des

contenus num�eriques. De ce fait, les interfaces doivent proposer des techniques de

visualisation sp�eci�ques permettant de restituer les nombreuses photos num�eriques

et de les a�cher avec les e�ets visuels adapt�es. Elles doivent par ailleurs prendre

en compte les probl�ematiques d'usabilit�e et d'esth�etique. Cela dit, meme si l'on

int�egre des caract�eristiques nouvelles aux photos num�eriques, les sc�enarii d'usage

n'en restent pas moins inspir�es de l'usage sur photos papier.

Les photos papier et num�eriques induisent des activit�es qui peuvent etre individuelles

ou collectives. L'activit�e individuelle de navigation parmi les photos implique deux

acteurs qui sont le photographe et le lecteur (qui n'est pas �a l'origine des photos mais

qui les conserve). Lorsque le photographe parcourt des clich�es dont il est l'auteur,

la sc�ene captur�ee lui revient �a l'esprit. Le lecteur, qui n'a pas cette connaissance

vis-�a-vis de la sc�ene en question, se contente de parcourir le contenu visuel des

photos et d'en extraire des signaux �emotionnels.

Avec les activit�es collectives, la photo est int�eressante en ce qu'elle devient un

moyen narratif qui permet �a chaque membre de la famille de raconter une his-

toire et d'�evoquer ses souvenirs. On pourra parcourir un album photo en famille

ou disposer les photos sur le sol a�n que chacun en ait un aper�cu. Ce type d'acti-

vit�e collective permet de rassembler la famille non seulement autour d'un moment

d'�emotion mais �egalement autour d'un moment de plaisir, plaisir de partager des

histoires avec ses proches. Concernant les activit�es associ�ees aux photos, l'approche

de Frohlich and Tallyn [15] permet de d�ecrire le role d'une photo vis-�a-vis du pho-

tographe, du public et du sujet (cf. �g.2.6). Six activit�es sont illustr�ees par des

traits pleins et pointill�es. Les pointill�es repr�esentent les di��erentes r�e exions que

la photo peut provoquer chez les lecteurs. Quant aux traits pleins, ils repr�esentent

les di��erents moyens d'interaction entre lecteurs. D'apr�es cette approche, l'activit�e

collective suscite l'interaction entre les lecteurs et enrichit la valeur de la navigation

parmi les photos non seulement dans un cadre collectif mais �egalement dans un

cadre individuel.

L'approche d�ecrite en �g.2.6 peut s'appliquer �a l'activit�e collective de navigation

d'albums photos. Parcourir des photos num�eriques �a plusieurs requiert une interface

sp�eci�que qui permette l'�evocation de souvenirs �a travers la narration ou le partage

du v�ecu de chacun. Selon l'usage, l'�eventail d'activit�es possibles sur un type donn�e

de plateforme varie. Par exemple, si un appareil portable permet �a un utilisateur

unique de parcourir ses propres contenus, pour des utilisateurs multiples, il permet

l'ex�ecution de taches simples de partage de photos, comme par exemple en envoyant

un MMS ou en faisant passer l'appareil �a ses amis.

28

Certaines applications commerciales conventionnelles telles que Microsoft Surface

MicrosoftSurface [16] proposent un grand �ecran tactile multi-touch dont l'interface

permet l'usage collectif de photos num�eriques en environnement multi-utilisateurs

(comparer plusieurs photos, les �etaler, les passer �a son voisin). Ce type d'applica-

tion int�egre une forme d'interaction tangible en ce que les utilisateurs manipulent

directement les contenus ou plutot la repr�esentation physique de ces contenus.

Les photos num�eriques pr�esentent l'avantage de pouvoir etre a�ch�ees sur des sup-

ports multiples, en utilisant des techniques riches de visualisation. On peut imaginer

qu'int�egrer des usages acquis dans d'autres circonstances permettra d'optimiser la

navigation de contenus photos num�eriques et d'enrichir les activit�es collectives qui

y sont li�ees.

Figure 2.6 – Approche de Frohlich and Tallyn [15]

29

2.3 Albums photos personnels et commerciaux

Qu'est-ce qu'un contenu personnel ? Il s'agit d'un contenu li�e dans son int�egralit�e �a

son propri�etaire, quel que soit l'endroit �a partir duquel il serait cr�e�e ou r�ecup�er�e. En

ce qui concerne les photos num�eriques, un album photo personnel contient des cli-

ch�es de sujets qui sont li�es au propri�etaire de l'album. Ce type d'album peut contenir

des clich�es dont le propri�etaire est �a l'origine (captur�es avec son propre appareil),

des clich�es qu'on lui aurait transmis (partag�es par ses amis) ou encore des clich�es

�a vocation commerciale (t�el�echarg�es sur Internet). �A l'oppos�e, les albums photos

commerciaux ne contiennent pas de photos ayant trait �a des activit�es personnelles

mais des photos �a vocation publicitaire. Ils sont souvent commercialis�es sous forme

de CD photo tels que Corel PhotoCD [17] ou via des services Internet comme Getty

Image GettyImages [18]. Les utilisateurs payent pour t�el�echarger des photos r�ealis�ees

par des professionnels, qu'ils pourront ensuite utiliser dans un cadre professionnel

ou personnel. Avec la d�emocratisation des appareils permettant la capture d'image

tels que les appareils photos num�eriques ou les camera phones, la pratique de la

photo est devenue un jeu d'enfant. Les possibilit�es de partage instantan�e o�ertes

par les appareils incitent par ailleurs les utilisateurs �a cr�eer leurs propres photos sur

la base d'�ev�enements temps r�eel. Les contenus photos personnels captur�es �a partir

des appareils varient selon l'usage. A�n de comprendre les m�ecanismes de capture

d'image sur camera phones, Kindberg et al. Kindberg et al. [2] proposent une taxo-

nomie �a deux dimensions (a�ective ou fonctionnelle) et deux contextes (individuel

ou social). L'objectif premier des photos dites a�ectives est la r�e exion personnelle

et l'�evocation du souvenir, tandis que les photos dites fonctionnelles sont captur�ees

en vue d'une tache bien pr�ecise (cf. tableau 2.1).

Tableau 2.1 – Taxonomie propos�ee par Kindberg et al. [2]

Individuel Social

Affectif R�e exion personnelle Exp�erience personnelle Famillepartag�ee et amis distants

Fonctionnel Tache personnelle Tache partag�ee Tache distante(avec quelqu'un (avec quelqu'unde proche) d'�eloign�e)

Les albums photos personnels sont conserv�es en local sur un appareil �electronique

ou en ligne sur les espaces de stockage que proposent certains services Internet.

Transf�erer ses photos num�eriques sur son PC est la fa�con la plus r�epandue de

conserver ses contenus personnels. Bien que les capacit�es de stockage des appareils

mobiles aient �evolu�e, tout le monde n'a pas l'habitude d'y conserver l'int�egralit�e de

ses contenus photos. Pour certains, l'appareil portable est un simple outil de capture

d'image. Une fois le clich�e e�ectu�e, ils transf�erent celui-ci sur PC. Une autre raison

�a cela est que certains craignent de voir leur vie priv�ee leur �echapper si l'appareil

et son contenu venaient �a etre �egar�es. Nous avons men�e une �etude aupr�es de 45

personnes et nous sommes int�eress�es au nombre de photos conserv�ees sur camera

phone. Nous avons obtenu une moyenne de 226 photos par personne. Parmi les

participants, si 11 avaient conserv�e un nombre de photos sup�erieur �a la moyenne,

seulement trois en avaient conserv�e plus de 1000. Les albums personnels en ligne

permettent l'entrecroisement de r�eseaux sociaux complexes, avec la possibilit�e de

faire des d�ecouvertes inattendues. Un exemple typique : alors que vous parcourez

un album mis en ligne par un parfait inconnu, vous y reconnaissez un visage ami.

30

2.4 Casual Infovis

Le Casual Infovis (Casual Information Visualization) Pousman et al. [19] peut etre

consid�er�e comme un domaine compl�ementaire de l'InfoVis classique. Sa pratique

concerne particuli�erement la visualisation, au quotidien, de contenus num�eriques

personnels. D'apr�es la d�e�nition de Pousman, quatre crit�eres (cf. Tableau 2.2) per-

mettent de distinguer InfoVis classique et Casual InfoVis. En r�egle g�en�erale, de par

son mod�ele d'usage di��erent, le Casual InfoVis attire un spectre plus large d'utilisa-

teurs. Les syst�emes classiques d'InfoVis permettent �a leurs utilisateurs (des experts

scienti�ques) de conduire des analyses de donn�ees pour compr�ehension de ces der-

ni�eres dans le cadre de travaux professionnels. Ce type d'usage, souvent motiv�e

professionnellement, comprend des taches qui ne sont pas r�ep�et�ees mais compl�et�ees

sur une p�eriode de temps d�etermin�ee. Le Casual InfoVis n'est quant �a lui pas limit�e

au contexte professionnel puisqu'il s'�etend �egalement �a la vie quotidienne dans le

cadre d'un usage plus personnel et divertissant. De ce fait, les pro�ls des utilisateurs

du Casual InfoVis vont de novice �a expert. Si InfoVis classique et Casual InfoVis

permettent tous deux de visualiser des donn�ees pour analyse avanc�ee, le Casual

InfoVis permet potentiellement d'adresser des donn�ees plus vari�ees et �a vis�ee moins

analytique.

Tableau 2.2 – Comparaison InfoVis traditionnel / Casual InfoVis

Pro�l de syst�eme/ Type InfoVis traditionnel Casual InfoVis

Type d’utilisateur Expert De novice �a expert

Type d’usage Taches compl�et�ees Taches compl�et�eessur une p�eriode �a plusieursd�etermin�ee et reprises.non r�ep�etitives.

Type de donnees Donn�ees Donn�eesprofessionnelles Personnelles

Objectif Visualisation Visualisationanalytique non-analytiquedes donn�ees. des donn�ees.

Categories de Casual InfoVis et principes

Pour mieux introduire les syst�emes de Casual InfoVis, Z. Pousman s'int�eresse �a plu-

sieurs cas « limites » d'InfoVis classique. Il s'agit de l'InfoVis ambiant, de l'InfoVis

social, de l'InfoVis artistique ou encore d'autres InfoVis exp�erimentaux. De par leur

mode de visualisation bas�e sur une repr�esentation abstraite de l'information, ceux-ci

sont consid�er�es comme des syst�emes d'InfoVis au sens large du terme. L'InfoVis

ambiant agit comme un module p�eriph�erique ou un widget qui fournit des informa-

tions ambiantes en lien avec l'environnement de travail : horaires de bus, m�et�eo ou

cours de la Bourse. Ambient Orb Amb [20], InfoCanvas [21] et SideShow [22] (la

Windows Sidebar sous Vista) en sont quelques exemples. L'InfoVis social s'attache

quant �a lui �a transformer certaines donn�ees issues de taches quotidiennes (archives

mails, marque-pages ou r�eseau d'amis) en di��erents mod�eles de visualisation. L'ap-

proche est centr�ee sur l'utilisateur en ce qu'elle permet de d�ecrire et de visualiser

ses relations avec son environnement. Cette vue « �egocentrique » di��ere de la vue

orient�ee donn�ees que l'on retrouve dans les syst�emes d'InfoVis classique [19]. Le

syst�eme Themail de Viega [23], Tag Clouds PopularTagsCloud [24] et PeopleGar-

31

den [25] en sont quelques exemples. Les InfoVis artistiques sont un autre domaine

�emergent, orient�e donn�ees, qui permet de visualiser l'information d'int�eret d'une

fa�con artistique. Ils remettent en cause le point de vue adopt�e par les syst�emes d'In-

foVis classique dans l'analyse et la pr�esentation des donn�ees. Les donn�ees objets

de l'analyse y sont pr�esent�ees d'une fa�con esth�etique et agr�eable, a�n de susciter

la curiosit�e de l'utilisateur. Sorting Wignell [26], Tableau Machine [27] et Presence

Era [28] en sont quelques exemples.

La pr�esente th�ese introduit un Casual InfoVis permettant une repr�esentation de

contenus photos num�eriques, �a l'instar de PhotoMesa [29]. Apr�es une d�e�nition de

l'InfoVis classique et du Casual InfoVis, nous proposons un Casual InfoVis person-

nalis�e que nous int�egrons au design d'interface d�ecrit �a la pr�esente th�ese. En �g.2.7,

nous mettons en vis-�a-vis InfoVis classique, Casual InfoVis et notre proposition de

Casual Infovis. Notre Casual InfoVis permettant la pr�esentation de contenus per-

sonnels tels que des photos num�eriques, ses utilisateurs potentiels ne se limitent

pas �a une population d'experts. Par ailleurs, notre technique de visualisation a pour

objectif de procurer non seulement des e�ets visuellement plaisants mais �egalement

di��erents indices visuels qui guideront l'utilisateur dans sa d�ecouverte des contenus

photos. De plus, dans la mesure o�u notre Casual InfoVis sera appliqu�e �a un contexte

de mobilit�e, il n�ecessitera des techniques riches de manipulation di��erentes de celles

que proposent les interfaces WIMP conventionnelles, a�n de permettre une interac-

tion plus intuitive. En�n, nous supposons que notre proposition de Casual InfoVis

sera int�egr�ee �a un mode d'a�chage non conventionnel, ce qui devrait amener une

exp�erience visuelle di��erente et des modes d'usage nouveaux.

Figure 2.7 – Proposition de d�e�nition du Casual InfoVis

32

2.5 Serendipite et gestion des contenus photos nu-

meriques

En fran�cais, le terme s�erendipit�e est un n�eologisme et n'est de ce fait pas inscrit

au dictionnaire. Le Merriam-Webster d�e�nit la s�erendipit�e comme « la facult�e ou le

ph�enom�ene de d�ecouverte de choses de valeur ou agr�eables que l'on ne cherchait

pas » . La d�e�nition du Collins est « la chance qu'ont certaines personnes de d�ecou-

vrir ou de cr�eer des choses int�eressantes ou de valeur par hasard » . L'encyclop�edie

Wikipedia d�ecrit quant �a elle la s�erendipit�e comme « l'e�et par lequel une personne

fait une d�ecouverte heureuse par accident, notamment quand elle recherchait tout

autre chose » . Le mot s�erendipit�e vient d'un ancien conte persan et fut cr�e�e par

Horace Walpole le 28 janvier 1754 dans une lettre �a son ami Horace Mann qui

r�esidait �a Florence [30].

Cette d�ecouverte, je la dois �a un talisman, que Mr Chute appelle sortes

Walpolianae, grace auquel je trouve tout ce que je veux, �a point nomm�e,

o�u que je le cherche. On pourrait quasiment rattacher cette d�ecouverte

�a ce que j'appelle la S�erendipit�e, un mot tr�es riche de sens que je vais

tenter de t'expliquer, n'ayant rien de mieux �a te raconter. L'�etymologie

de ce terme est plus parlante que sa d�e�nition. J'ai eu l'occasion de lire

un conte stupide appel�e « Les trois Princes de Serendip » . Au cours

de leurs p�eriples, leurs Altesses faisaient toujours des d�ecouvertes, par

accident ou grace �a leur sagacit�e, de choses qu'ils ne recherchaient pas.

Par exemple, l'un des princes avait d�ecouvert qu'un chameau borgne

de l'ıil droit avait emprunt�e la meme route qu'eux, �etant donn�e que

l'herbe n'avait �et�e brout�ee que du cot�e gauche, alors qu'elle �etait plus

belle du cot�e droit. Comprenez-vous maintenant le sens du terme s�e-

rendipit�e ? Une des occasions les plus remarquables de cette sagacit�e

accidentelle (car vous devez reconna�tre qu'aucune des d�ecouvertes que

vous recherchez ne correspond �a cette description) fut celle de mon ami

Lord Chancellier Clarendon, qui d�ecouvrit le mariage du Duc d'York et

de Madame Hyde, en observant le respect que manifestait sa m�ere �a

table �a l'encontre de Madame Hyde.

L'�episode du conte en question d�ecrit la rencontre des princes avec un chamelier qui

a �egar�e un de ses chameaux. Le nıud de l'a�aire est que, �a partir d'indices qu'ils

ont relev�es, les princes sont capables de d�ecrire pr�ecis�ement ce chameau qu'ils n'ont

jamais vu. Un quiproquo s'ensuit, le chamelier ne sachant plus dire si les princes

ont juste vu son chameau ou s'ils l'ont vol�e. Il n'y a en fait aucune co•�ncidence,

mais plutot une bonne dose de sagacit�e et un sens certain de l'observation. Si

on la consid�ere comme une science myst�erieuse, au meme titre qu'un lancer de

d�es divins, la s�erendipit�e r�esulte en fait de deux facteurs : la maturit�e mentale

de la personne et la probabilit�e de d�ecouverte d'indices dans un environnement

donn�e. La fameuse pomme de Newton ou le bain d'Archim�ede sont des exemples

de d�ecouvertes accidentelles dans les sciences. G.Gore a tent�e en 1878 de d�e�nir les

conditions de la d�ecouverte accidentelle : Les d�ecouvertes se font �a di��erents degr�es

d'inattendu, mais on fait rarement une grande d�ecouverte sans le savoir.[31]

Comme Joseph Rossman l'explique, « dans presque tous les cas, il s'av�ere que

la d�ecouverte accidentelle arrive au terme d'une recherche assidue et prudente ,

et qu'un certain e�ort est accompli dans le but d'identi�er l'indice qui permettra

33

cette d�ecouverte. » Dans les domaines scienti�ques, on s'int�eresse davantage au

cheminement permettant d'atteindre l'inattendu (le « comment » et le « quand »)

qu'�a l'inattendu en lui-meme. Plus que la d�ecouverte elle-meme, c'est le processus

de d�ecouverte et son timing qui sont la v�eritable surprise.

Decouverte accidentelle et navigation de contenus numeriques

En ce qui concerne la gestion des contenus num�eriques, la probl�ematique de la d�e-

couverte accidentelle a �et�e abord�ee du point de vue de la recherche de donn�ees.

Leong et al. ont men�e une s�erie d'�etudes empiriques [33][34][35] sur les pratiques

quotidiennes li�ees �a l'�ecoute de musique num�erique. D'apr�es eux, pour davantage

de plaisir musical, les utilisateurs ne devraient pas laisser le mode shu�e (lecture

al�eatoire) choisir les morceaux �a leur place, mais plutot faire eux-memes leurs choix

musicaux. Avec pour objectif d'am�eliorer l'exp�erience utilisateur sur des syst�emes

interactifs, ils observent le comportement des utilisateurs et analysent leurs retours

concernant le mode shu�e. Les avantages et les inconv�enients de ce mode d'�ecoute

sont ensuite abord�es. Il est rapport�e que, dans certaines situations, les utilisateurs

choisissent le mode shu�e parce qu'il permet une certaine d�efamiliarisation vis-�a-vis

du contenu ainsi que la d�ecouverte de la s�erendipit�e. Cette �etude qualitative rapporte

�egalement que certaines approches semi-al�eatoires (limiter le contenu parcouru ou

appliquer des crit�eres dans le shu�ing), permettent d'exercer un choix dans l'ex-

p�erience d'�ecoute musicale. La probabilit�e de faire des d�ecouvertes heureuses est

d'autant plus �elev�ee que les morceaux sont jou�es en mode shu�e. Probabilit�e qui

diminue si le contenu musical est arrang�e manuellement et que sa vari�et�e est r�eduite.

Cette �etude n'a n�eanmoins pas mis en place divers taches ou processus dans le but

d'observer si ceux-ci permettaient ou non de faire des d�ecouvertes accidentelles.

Elle s'est content�ee d'observer le comportement des utilisateurs sur des taches cou-

rantes. En ce qui concerne les photos num�eriques, la notion de navigation bas�ee sur

la s�erendipit�e int�eresse �egalement PhotoMesa [29] et FotoFile [36]. L'id�ee est de

proposer une navigation simple des photos qui soit source de plaisir. N�eanmoins, la

mani�ere dont on aboutit �a des d�ecouvertes accidentelles n'est pas abord�ee dans ces

�etudes.

Les �etudes s'int�eressent rarement �a la d�ecouverte inattendue via l'utilisation d'outils

d'InfoVis. Il y a pour cela deux raisons. La premi�ere est la m�ethode utilis�ee dans

l'�evaluation des outils d'InfoVis. La plupart sont �evalu�es via des �etudes quantitatives

permettant de simuler un sc�enario utilisateur et des cas d'usage sur une p�eriode de

temps tr�es courte. Tellement courte que cela r�eduit fortement, de fait, la proba-

bilit�e de faire des d�ecouvertes inattendues. Par ailleurs, les taches r�ealis�ees durant

l'�evaluation peuvent ne pas re �eter de fa�con r�ealiste l'usage quotidien, s'�eloignant

de ce fait des conditions d'observation de la s�erendipit�e. La deuxi�eme raison est que

les interfaces int�egrent rarement des m�ecanismes sp�eci�ques dont l'objectif serait

une navigation bas�ee sur la s�erendipit�e. En e�et, la plupart des outils syst�eme, qu'il

s'agisse d'InfoVis classique ou de Casual InfoVis, ne mentionnent quasiment jamais

la possibilit�e d'une telle exp�erience.

Les conditions essentielles �a la d�ecouverte accidentelle sont, d'une part, une explo-

ration assidue et, d'autre part, une p�eriode de temps �etendue. La mani�ere la plus

conventionnelle d'encourager une navigation bas�ee sur la s�erendipit�e est d'exposer

les utilisateurs �a un ensemble de contenus qu'ils puissent parcourir �a leur guise.

Certaines �etudes se sont int�eress�ees �a cet aspect, comme par exemple le navigateur

zoomable de PhotoMesa [29] ou le navigateur hyperbolique d'images [37], dont les

m�ecanismes permettent la libre exploration d'un contenu cons�equent. Dans la d�e-

34

couverte de la s�erendipit�e lors de la navigation, le plaisir et la satisfaction tiennent

�egalement aux performances de l'interface. Le probl�eme est que les interfaces �evo-

qu�ees n'int�egrent souvent qu'une seule technique de visualisation. Un tel m�ecanisme

inchang�e de visualisation risque d'amoindrir le plaisir de naviguer et de masquer cer-

tains indices permettant la d�ecouverte de la s�erendipit�e. Comme Leong et al. [35]

l'ont rapport�e, les utilisateurs font le choix du mode shu�e dans le but de d�ecouvrir

une exp�erience nouvelle d'�ecoute musicale, lib�er�ee d'un ordre pr�e-�etabli de lecture

des morceaux. Cette d�efamiliarisation peut contribuer de fa�con essentielle �a la nou-

veaut�e du contenu et stimuler la curiosit�e des utilisateurs, surtout si ces derniers

ont l'habitude de parcourir toujours le meme contenu musical. L'approche conven-

tionnelle de cette d�efamiliarisation vis-�a-vis du contenu est de proposer di��erents

modes de visualisation, comme le fait Microsoft Windows avec sa barre d'outils. Dif-

f�erentes vues sont propos�ees dans la navigation des dossiers (Miniature, Mosa•�que,

Icone, Liste et D�etails). Les outils d'InfoVis proposent eux aussi di��erents modes

de visualisation dans la navigation des albums photos. N�eanmoins, aucune �etude ne

s'est int�eress�ee �a leurs r�esultats en termes de d�efamiliarisation vis-�a-vis du contenu.

Decouverte accidentelle et presentation produits

Comme l'a d�eclar�e Ivring Langmuir , chimiste et physicien am�ericain, « si on ne peut

pas pr�evoir une d�ecouverte, on peut tout de meme pr�evoir le travail qui, potentielle-

ment, permettra d'y aboutir » [38]. Autrement dit, avec une certaine strat�egie, on

peut augmenter la probabilit�e d'atteindre l'inattendu et donc la d�ecouverte. Dans

notre quotidien, le shopping est une activit�e qui o�re l'occasion de faire des d�ecou-

vertes. Lorsque nous anons en ville ou en rayon, il arrive que certains produits nous

interpellent. La fa�con dont ils nous sont pr�esent�es nous am�ene �a penser qu'ils sont

exactement ce que nous recherchions. Les pr�esentoirs sont des modes de pr�esenta-

tion sp�eci�ques qui permettent de promouvoir des produits ou services aupr�es d'un

public d'acheteurs. Tous les pr�esentoirs respectent des principes de base qui ont

pour objectif de pousser �a l'acte d'achat. En r�egle g�en�erale, les pr�esentoirs suivent

l'une des pr�esentations de base suivantes :

{ Les devantures de magasin : Elles donnent typiquement sur la rue ou les all�ees

des centres commerciaux. Leur objectif : attirer le passant et le faire entrer en

magasin.

{ Les vitrines : Elles pr�esentent typiquement des articles (1) jug�es trop couteux

pour etre expos�es en devanture ou (2) des articles de niche qui int�eressent for-

tement la client�ele premi�ere du magasin. On les retrouve dans les zones de forte

fr�equentation.

{ Les pr�esentoirs « opportunistes » : Ce terme fait r�ef�erence aux pr�esentoirs qui

tirent pro�t d'espaces r�eduits mais n�eanmoins exploitables du magasin, comme

par exemple le haut d'une �etag�ere ou l'espace mural disponible.

Ces trois types de pr�esentoirs proposent une hi�erarchie des produits en magasin. Si

on applique ces memes principes �a la visualisation des photos via une interface de

navigation, la devanture de magasin serait l'image miniature qui est utilis�ee comme

icone d'une cat�egorie donn�ee. Les vitrines seraient les di��erentes techniques de

visualisation photo, comme par exemple l'a�chage 2D ou 3D. Quant aux pr�esentoirs

« opportunistes » , il s'agirait de l'espace situ�e autour de l'interface de navigation,

qui peut etre un raccourci ou un indice e�cace permettant d'induire la s�erendipit�e

(pour acc�eder aux objets d'int�eret).

35

Ces pr�esentoirs sont fortement d�ependants du mat�eriel de pr�esentation utilis�e. Un

mat�eriel typique de pr�esentation visuelle des produits est le planogramme (cf. �g.2.8).

Dans un planogramme, chaque produit est rattach�e �a une cat�egorie selon ses pro-

pri�et�es et ses formes. Il est ensuite dispos�e �a un endroit donn�e de la gondole en

fonction de cette cat�egorie. L'objectif est d'optimiser l'achalandage des rayons tout

en joignant l'utile �a l'agr�eable. Cette id�ee se retrouve chez PhotoMesa, qui applique

une m�ethode de remplissage de l'espace (cf. �g.2.9) dans son mode Quantum Tree-

map de visualisation des photos. L'inconv�enient de cette m�ethode est qu'elle induit

une in�evitable surcharge visuelle dans la navigation du contenu.

Figure 2.8 – Planogramme(image extraite de www.unitedmarketinginc.com)

Figure 2.9 – Remplissage de l'espace(image extraite de www.gettyimages.com)

Un bon mat�eriel de pr�esentation doit etre assez souple pour permettre une certaine

vari�et�e dans la pr�esentation des produits, a�n d'o�rir une « shopping experience »divertissante au client. Sur la meme id�ee, une bonne interface doit proposer un

mod�ele souple de visualisation a�n d'augmenter la vari�et�e des modes de pr�esentation

des photos, tout particuli�erement pour la d�efamiliarisation vis-�a-vis du contenu.

Dans la th�eorie, les add-on et la vari�et�e des modes de visualisation vont dans le sens

d'une navigation bas�ee sur la s�erendipit�e qui induirait la d�ecouverte accidentelle. Un

pr�esentoir r�eussi int�egre certains des sept principes de design suivants :

1. Vari�et�e : cr�eation d'un contraste au sein des produits, a�n d'attirer l'attention

du client.

36

2. Dominance : identi�cation claire du centre de l'attention, qui v�ehicule le mes-

sage cl�e du pr�esentoir.

3. Groupage : transmission d'un message e�cace et clair dans la communication

client, en regroupant les produits en ensembles aux formes int�eressantes et

stimulantes.

4. Profondeur : d�e�nition d'une profondeur de mobilier qui permet de placer les

produits �a une distance ad�equate.

5. �Eventail : pr�esentation en �eventail, sorte de pyramide invers�ee, qui permet de

r�epartir les produits du bas vers le haut et vers l'ext�erieur, et de diriger le

regard en cons�equence.

6. Zigzag : pr�esentation en zigzag, sorte de pyramide modi��ee, qui permet de

pr�esenter les produits sans avoir deux niveaux de pr�esentation identiques. Ce

type de pr�esentation est moins monotone que la pyramide (cf. �g.2.10)

7. Pyramide : un des modes de pr�esentation les plus r�epandus, les produits sont

empil�es verticalement a�n de former une pyramide, forme physique qui cr�ee

le centre d'attention (cf. �g.2.11)

Figure 2.10 – Pr�esentation en zigzag(image extraite de www.lenehans.ie)

Figure 2.11 – Pr�esentation en pyramide(image extraite de www.gettyimages.com)

37

Ces principes de design proposent di��erents modes de visualisation et exp�eriences

visuelles selon la fa�con dont les produits sont arrang�es. Une interface de naviga-

tion peut appliquer ces principes dans la pr�esentation des contenus photos, meme

si l'e�cacit�e de la visualisation 3D reste �a prouver. En fait, pr�esentation produits

et visualisation photos di��erent de par leurs caract�eristiques de contenu. Si le pr�e-

sentoir permet de grouper des produits de meme apparence, la visualisation des

photos concerne pour sa part des photos ind�ependantes les unes des autres et tr�es

di��erentes. Chaque photo transporte un e�et visuel qui lui est propre, et transmet

des informations visuelles et �emotionnelles autrement plus complexes que ne le font

de simples produits.

Pour r�esumer, si la s�erendipit�e semble arriver par hasard, scienti�ques et sociologues

consid�erent qu'elle ne se pr�esente qu'au terme d'une recherche assidue. L'�etude d'un

tel ph�enom�ene doit donc se faire sur le long terme, dans l'espoir de stimuler une d�e-

couverte accidentelle et d'observer le comportement utilisateur qui lui est associ�e. Si

on ne peut pas provoquer l'inattendu, on peut n�eanmoins cr�eer un contexte qui o�re

aux utilisateurs une probabilit�e plus �elev�ee de faire des d�ecouvertes accidentelles.

« En recherche scienti�que, le hasard et les d�ecouvertes accidentelles se pr�eparent

avec du labeur et de la r�e exion. » [39] Par cons�equent, le syst�eme de naviga-

tion propos�e doit pr�esenter deux caract�eristiques. La premi�ere : o�rir un aper�cu de

l'ensemble du contenu aux utilisateurs, pour davantage de possibilit�es et de vari�et�e

dans les modes de d�ecouverte des r�esultats. La seconde : proposer un m�ecanisme de

d�efamiliarisation vis-�a-vis du contenu, via di��erentes techniques de visualisation. De

cette fa�con, un meme contenu peut etre a�ch�e de di��erentes mani�eres, pour plus

de vari�et�e et de curiosit�e dans l'approche de l'objet recherch�e. A�n de comprendre

l'incidence de la s�erendipit�e dans la navigation de contenus photos, il faudra mener

davantage d'�etudes qualitatives. L'id�ee est d'observer les conditions mentales et le

comportement de l'utilisateur, a�n d'identi�er quelles taches pourraient induire la

d�ecouverte inattendue d'un tr�esor.

38

2.6 Reflexion premiere sur un design d’interaction

inspire du Rubik’s cube

Apr�es nous etre pench�es sur les caract�eristiques des photos papier et num�eriques,

nous en listons les avantages et les inconv�enients. L'avantage majeur des photos

papier est qu'elles sont associ�ees �a des taches de manipulation physique. Les photos

num�eriques, pour leur part, pr�esentent l'avantage de pouvoir etre transf�er�ees sur

tout type de support. Avec pour objectif de pallier les limitations de la manipulation

physique sur photos num�eriques, nous nous demandons comment transf�erer, sur

photos num�eriques, certaines taches physiques de manipulation ex�ecut�ees sur photos

papier. C'est un fait, nos mains sont l'outil indispensable �a l'ex�ecution de taches

complexes, outil qui nous permet d'interagir avec des dispositifs m�ecaniques ou

num�eriques. La main sait ex�ecuter des mouvements avec di��erents degr�es de libert�e,

mais aussi adapter ses techniques de manipulation dans l'ex�ecution de tout type de

tache complexe au quotidien.

Si l'on suppose que, dans un contexte de mobilit�e, les techniques de manipulation

jouent un role majeur dans l'interaction avec des contenus num�eriques, en quoi cette

exp�erience des techniques de manipulation sur objets physiques pourrait-elle am�e-

liorer la manipulation de contenus num�eriques ? Regardons les contenus num�eriques

de plus pr�es. En d�epit de leur richesse et de leur complexit�e, ils se transforment

et s'adaptent tr�es facilement �a tout type de pr�esentation. Dans leurs modes de

pr�esentation, les contenus num�eriques sont une sorte de kal�eidoscope qu'il est fa-

cile de transformer selon l'usage. Comme illustr�e en �g.2.12, dans la mesure o�u les

techniques de manipulation et les contenus num�eriques sont riches et s'adaptent

facilement �a l'usage, on peut se demander quel role jouera l'interface et quelles

devront etre ses caract�eristiques.

Figure 2.12 – Relations entre utilisateur, interface et contenus num�eriques.

Selon nous, l'�etablissement d'une correspondance entre des gestes et des fonctions

sp�eci�ques doit se faire via la m�etaphore appropri�ee. Lorsque le geste est mapp�e

m�etaphoriquement sur des fonctions nouvelles, on transf�ere non seulement la signi-

�cation mais �egalement l'exp�erience utilisateur acquise.

A�n de d�e�nir les techniques potentielles d'interaction et les mod�eles de pr�esentation

associ�es, nous proposons un design pr�eliminaire inspir�e du Rubik's cube. Ce design

nous permet d'adresser �a la fois les aspects li�es �a la visualisation et ceux li�es au

transfert de l'exp�erience de manipulation physique.Dans la mesure o�u l'exp�erience

intuitive de jeu peut permettre de s'adapter plus rapidement �a une nouvelle interface,

nous avons choisi de placer la m�etaphore du jeu au coeur de la pr�esentation cubique.

Nous ne proposons pas un design concret d'appareil portable mais plutot un mod�ele

adaptatif dans la pr�esentation de contenus audiovisuels sur appareils portables et

39

l'interaction avec ces memes contenus. Comme c'est le cas avec le Casual InfoVis,

la visualisation a pour but de procurer une exp�erience de navigation agr�eable. Nous

consid�erons que le recours �a des m�ecanismes de jeu peut �egayer un usage qui serait

continu, persistant. Parmi les m�ecanismes de jeu envisag�es, nous avons retenu celui

du Rubik's cube.

Le Rubik's Cube[40] est le fameux puzzle tridimensionnel invent�e en 1974 par le

sculpteur et professeur d'architecture hongrois Ern}o Rubik. Le Rubik's cube a sus-

cit�e un vif int�eret pour les domaines scienti�ques tels que les math�ematiques, la

m�ecanique et l'interaction homme-ordinateur. Le Rubik's cube pr�esente �a la fois

des techniques de manipulation riches et un mod�ele de pr�esentation sp�eci�que. Ce

mod�ele de pr�esentation permet une certaine d�efamiliarisation vis-�a-vis du contenu

et peut de ce fait etre rattach�e �a la s�erendipit�e. Le Rubik's cube est tr�es appr�eci�e

des joueurs pour son m�ecanisme de puzzle 3D. Son mode de r�esolution varie selon

la strat�egie de chaque joueur. Autrement dit, chaque joueur suit son propre che-

min jusqu'�a l'objectif �nal. Avec ce type de jeu, les joueurs ont peu de chances de

tomber deux fois sur la meme sc�ene, ce qui am�eliore la jouabilit�e. Consid�erons la

manipulation du cube comme un cheminement, un processus de navigation parmi

les images. On peut �etablir un mappage entre l'objectif du cube (rassembler les

carr�es d'une meme couleur sur chaque face) et une navigation parmi les contenus

photos dont la �nalit�e serait de « d�ecouvrir » l'image d�esir�ee. Chaque face du Ru-

bik's cube peut ainsi etre pens�ee comme une cat�egorie d'images. Dans ce sens, une

face de couleurs m�elang�ees sur le Rubiks's cube peut etre pens�ee comme di��erentes

cat�egories d'images dans un meme album photo. �g.2.13, nous illustrons les carac-

t�eristiques du Rubik's cube, les techniques de manipulation et de pr�esentation ainsi

que le mappage de la navigation photo.

Figure 2.13 – Caract�eristiques du Rubik's cube et mappage du contexte de lanavigation d'images.

40

Chapitre 3

Etat de l’art

Depuis le 18�eme si�ecle et la r�evolution industrielle, les machines ont permis d'all�eger

les charges de travail, en automatisant l'ex�ecution de taches complexes en produc-

tion. De nos jours, l'Homme s'appuie sur le calcul num�erique dans cet all�egement

des taches, �a un niveau autrement plus complexe. La num�erisation de l'information

quotidienne s'�etant rapidement g�en�eralis�ee, il y a eu cr�eation de ressources riches,

vari�ees et en perp�etuelle augmentation.

Les contenus num�eriques personnels tels que les photos num�eriques ont fait �emer-

ger des probl�ematiques nouvelles de gestion. Chercheurs et industriels s'appliquent

�a d�evelopper des mod�eles nouveaux d'interaction et de visualisation a�n d'optimiser

la gestion des contenus photos num�eriques. Le pr�esent chapitre propose un pano-

rama complet qui va de la construction des photos num�eriques aux techniques de

pr�esentation associ�ees, en passant par les syst�emes mis en place et les approches

d'�evaluation suivies.

41

3.1 Normes et standards de metadonnees pour les

photos numeriques grand public

D'apr�es le NISO (National Information Standard Organization) [41], les m�etadon-

n�ees sont des informations structur�ees qui d�ecrivent, expliquent, localisent ou faci-

litent la d�ecouverte, l'utilisation ou la gestion d'une ressource informationnelle. Les

m�etadonn�ees assurent les cinq fonctions suivantes :

1. La d�ecouverte de ressources sur crit�eres pertinents,2. L'identi�cation des ressources,3. Le regroupement des ressources semblables,4. La s�eparation des ressources dissemblables,5. La localisation des ressources via des informations et indices.

Pour regrouper les photographies num�eriques, les algorithmes informatiques s'ap-

puient sur les m�etadonn�ees qui leur sont associ�ees. D'une fa�con g�en�erale, au mo-

ment de la prise, la plupart des appareils photos num�eriques n'enregistrent qu'une

quantit�e limit�ee d'informations. D'o�u l'introduction de m�etadonn�ees qui permettent

d'int�egrer des d�e�nitions g�en�erales, couramment exploitables par l'ensemble des ap-

pareils photos num�eriques. En principe, il existe deux sp�eci�cations de m�etadonn�ees

pour les photos num�eriques : le format EXIF et le standard IPTC. L'EXIF ou ex-

changeable image �le format [42] (cf. �g.3.2), a �et�e d�evelopp�e par le JEIDA (Japan

Electronic Industries Development Association) [43]. Le format EXIF repose sur des

formats existants tels que JPEG, TIFF, Rev.6.0 et RIFF WAV, auxquels il int�egre

des balises de m�etadonn�ees. L'objectif est d'assurer l'interop�erabilit�e entre les p�eri-

ph�eriques d'imagerie (appareil photo, imprimante, t�el�ephone portable, PDA) et le

photoware [44], dans l'ex�ecution de travaux photographiques sur ordinateurs grand

public. Les balises EXIF couvrent un large �eventail de donn�ees, que l'on peut r�epartir

en quatre cat�egories :

1. Les informations temporelles (date et heure du clich�e),2. Les informations relatives aux r�eglages de l'appareil,3. Une miniature de l'image pour pr�evisualisation dans un navigateur,4. Des informations de description et de copyright.

Le deuxi�eme standard est l'IIM (Information Interchange Model), propos�e en 1991

par l'IPTC [45] en association avec la NAA (Newspaper Association of America).

Le mod�ele IIM peut s'appliquer �a tout type de donn�ees multim�edia (audio, vid�eo,

texte) et a pour objectif de faciliter le partage ou l'�echange de celles-ci. Pour les pho-

tographies num�eriques, les informations IIM sont organis�ees en ensembles rattach�es

�a di��erents identi�ants. Commun�ement appel�ees headers IPTC, les m�etadonn�ees

IIM di��erent des m�etadonn�ees EXIF. Certaines d'entre elles ont �et�e adapt�ees par

di��erents logiciels commerciaux, comme par exemple Adobe. L'int�egration de m�eta-

donn�ees IPTC �a di��erents formats d'image s�eduit de plus en plus de photographes

professionnels ou amateurs. Les utilisateurs peuvent ainsi sauvegarder des informa-

tions de m�etadonn�ees d�ecrivant le contenu des photos num�eriques directement dans

ces derni�eres. Ce format va vraisemblablement optimiser la recherche d'images par

le contenu.

Il existe d'autres formats potentiels de m�etadonn�ees, tels que le DCMI (Dublin Core

Metadata Initiative) [46], le DIG35 (Digital Imaging Group Initiative) [47], le MPEG-

7 MPEG-7 [48] et le XMP (eXtensible Metadata Platform) XMP [49], toujours

42

en d�eveloppement. Ces m�etadonn�ees sont en fait des balises qui sont captur�ees

automatiquement lors de la prise de vue. Si leur contenu devait etre jug�e insu�sant,

le balisage manuel est propos�e comme une alternative permettant de customiser les

m�etadonn�ees des photos num�eriques.

Figure 3.1 – Exemple de cycle de vie des images num�eriques

Figure 3.2 – Exemple d'extraction partielle de donn�ees EXIF �a partir d'uneimage num�erique

43

3.2 Algorithmes de calcul pour le regroupement des

photos numeriques

Les scientifiques recherchent des solutions intelligentes de gestion des photos nume-

riques, et s’ interessent donc aux techniques d’ automatisation qui permettent d’ en

faciliter la navigation et/ou la recherche. Dans ses travaux, Rodden considere qu’ une

interface doit posseder deux fonctionnalites essentielles pour faciliter la navigation

des photos [12]. L’ une d’ elles est la technique de gestion automatique, qui per-

met par exemple de regrouper des photos en fonction de leurs metadonnees. Dans

l’ interface de navigation, une technique automatique de calcul permet de regrou-

per les photos dans des categories personnalisees, en analysant les caracteristiques

attendues. La definition du groupe selon le Larousse de la langue francaise est la

suivante : « un ensemble de choses, d’ animaux ou de personnes formant un tout et

definis par une caracteristique commune » . Dans un contexte de photo numerique,

le regroupement consiste a rassembler les photos ayant, d’ apres leurs metadonnees,

des caracteristiques communes. L’ idee principale du regroupement est de calcu-

ler/mesurer la distance entre deux élements, laquelle peut être maximum, minimum

ou moyenne. Une presentation generale des algorithmes qui s’ appliquent est propo-

see ci-apres :

1. Algorithme base sur l’ information chronologique : le regroupement s’ effectue

sur la date et l’ heure du cliche.

Le regroupement chronologique est considere comme le principe fondamental

de navigation et de recherche des cliches [50]. L’ une de ses principales applica-

tions est l’ organisation de photos sous forme de frise chronologique. Ce type

de regroupement ne donne pas de resultats satisfaisants dans la recherche

d’ élements specifiques, mais offre un apercu global des albums et collections

photos pour la navigation. Sur une frise lineaire, avec une seule échelle de

temps a disposition, ce type de regroupement peut vite devenir gourmand en

espace. C’ est pourquoi Harada et al. [51] se sont interesses au regroupement

chronologique sur trois échelles de temps (annee, mois, jour, cf. fig.3.3). Gem-

mell et al. integrent par ailleurs une fonctionnalite de recherche par mots-cles

[52] afin de repenser la hierarchisation des contenus photos numeriques. L’ al-

gorithme de PhotoMesa [29](cf. fig.3.4) permet par exemple de regrouper les

photos chronologiquement et par nom.

Figure 3.3 � Presentation de photos numeriques sur differentes échelles chro-nologiques, par Harada et al. [51]. De gauche a droite : sur uneannee, sur quatre mois, sur quinze jours (image extraite de l’ articlede Harada et al. [51])

44

Figure 3.4 – PhotoMesa(image extraite de www.cs.umd.edu/hcil/)

2. Algorithme bas�e sur l'information g�eographique : la position g�eographique est

l'une des informations cl�es �a etre enregistr�ees dans la photo [53]. Certains

appareils photos num�eriques �a capteur GPS int�egr�e enregistrent les coordon-

n�ees de la prise de vue dans les m�etadonn�ees du clich�e. Pour les appareils

classiques, le g�eobalisage manuel des photos a posteriori est possible, comme

le proposent Flickr et Google Picasa. Au-del�a des donn�ees GPS, di��erentes

valeurs peuvent etre enregistr�ees et utilis�ees dans le regroupement des photos,

comme par exemple la temp�erature ou l'intensit�e lumineuse.

Le regroupement des photos bas�e sur l'information g�eographique tel que pro-

pos�e par Flickr ou Google Picasa (services Web d'h�ebergement de photos) est

le plus r�epandu. �A la di��erence des syst�emes qui exploitent les informations

enregistr�ees via GPS, l'utilisateur peut g�eobaliser manuellement ses photos

ou utiliser un service de g�eolocalisation. Les photos sont ensuite regroup�ees

« g�eographiquement » sur la base de ces informations. Une �etude publi�ee

par Tomiai et al. de HP Tomiai et al. [54] compare di��erentes applications

Web qui exploitent ces balises. Cette �etude propose un nouveau mode de

navigation parmi les photos, navigation qui se base sur les m�etadonn�ees de

g�eolocalisation et de titre (mod�ele RDF, Resource Description Framework).

Une autre �etude Toyama et al. [55] s'int�eresse aux probl�ematiques associ�ees

au g�eobalisage des photos. Cette �etude propose, d'une part, cinq modes de

visualisation des clich�es pris �a di��erents endroits et, d'autre part, six modes

d'acquisition des balises de g�eolocalisation :

{ par saisie manuelle,

{ �a partir du header de l'image (m�etadonn�ees fournies par l'appareil),

{ �a partir d'un �equipement de localisation, comme par exemple un GPS,

{ �a partir des informations de RDV dans un agenda �electronique (lieu du

RDV),

{ �a partir d'un texte de description de l'image,

{ par association avec d'autres documents num�eriques a�n d'obtenir des ba-

lises de g�eolocalisation.

45

3. Algorithme bas�e sur l'analyse du contenu : l'image est transform�ee en matrice

o�u chaque pixel est indiqu�e par sa valeur math�ematique. On �evalue ensuite les

similitudes entre images �a partir des mod�elisations obtenues[56]. L'algorithme

bas�e sur l'analyse du contenu permet d'extraire les caract�eristiques visuelles

de l'image telles que la couleur, la texture ou les formes. Dans l'approche

bas�ee sur la distribution spatiale des couleurs, l'approche locale (caract�eris-

tiques extraites d'une zone d�etermin�ee de l'image), vient compl�eter l'approche

globale (caract�eristiques extraites de l'image enti�ere), potentiellement trop

stricte pour obtenir une description satisfaisante de l'image. Pour l'extrac-

tion des param�etres de texture, l'algorithme s'int�eresse �a la granularit�e et aux

motifs r�ecurrents �a la surface de l'image. Dans les segments d'image, la d�e-

tection des formes est un param�etre essentiel dans l'identi�cation du contenu.

La forme d'une image est d�ecrite comme un contour simpli��e, repr�esent�e par

une courbe, dans des segments sp�eci�ques de l'image. A�n d'obtenir des r�e-

sultats plus pr�ecis dans l'estimation des contours, di��erents descripteurs ont

�et�e d�evelopp�es, tels que les points d'angle, les points d'int�eret ou les points

saillants.

Typiquement, les applications qui int�egrent le mode de regroupement bas�e sur

l'analyse du contenu travaillent sur les similitudes visuelles entre les photos.

Ces applications permettent, par exemple, d'organiser ses photos par recon-

naissance faciale [57][58][59] ou par similitude [60].La visualisation des photos

par similitude sait traiter les photos quasi identiques [61][62]. Un autre aspect

du regroupement bas�e sur l'analyse du contenu est la gestion des photos si-

milaires d�esordonn�ees [63] [64], puisqu'il est possible de regrouper les clich�es

en fonction de leur point de vue. Par ailleurs, FotoFile [36] (cf. �g.3.5) est un

syst�eme qui facilite l'annotation des photos en ex�ecutant un certain nombre

de techniques d'indexation automatique.

Figure 3.5 – FotoFile(image extraite de l'article of Kuchinsky et al. [36])

4. Algorithme multiple de regroupement : �a un niveau avanc�e et pour un r�esultat

plus pr�ecis, l'algorithme de regroupement peut s'appuyer sur une technique

duelle. Typiquement, l'algorithme se base sur deux crit�eres qui peuvent etre

l'information chronologique et g�eographique, ou encore l'information chro-

nologique et celle mesur�ee par des capteurs. L'algorithme s'int�eresse dans un

premier temps aux informations chronologiques. Le r�esultat obtenu est ensuite

a�n�e via la seconde technique.

Regroupement sur information chronologique et contenu

On peut parler de regroupement sur �ev�enement [65][66], dont l'algorithme

46

travaille �a la fois sur l'information chronologique (date et heure) et les si-

militudes entre images, ce qui permet d'organiser les photos par �ev�enement

et sous-�ev�enement. Un exemple d'int�egration de cette approche est l'appli-

cation PhotoTOC [67]. Certaines applications avanc�ees qui int�egrent le re-

groupement multiple (identi�cation des �ev�enements et des personnes) savent

�egalement prendre en compte les annotations associ�ees aux images, comme

par exemple l'�etude men�ee par Suh and Bederson [68]. Shoebox [69] facilite

la navigation et la recherche de photos, et propose de regrouper les pho-

tos similaires d'un point de vue s�emantique et visuel. Il s'appuie pour cela

sur le contenu, les donn�ees chronologiques et les annotations vocales incor-

por�ees �a l'image. MediaBrowser [70] (cf. �g.3.6), quant �a lui, regroupe les

images et clips vid�eos via un m�ecanisme sp�eci�que de s�election et de �ltrage.

AutoAlbum [71] propose pour sa part de combiner di��erents mod�eles probabi-

listes, puisque les informations chronologiques des photos viennent am�eliorer

les r�esultats du regroupement bas�e sur l'analyse du contenu. MyPhotos [72]

propose un syst�eme prototype de recherche de photos, avec trois m�ethodes

possibles : par chronologie (date et heure), par similitude (sc�enes similaires)

ou par personne (sur la base des annotations et de la reconnaissance faciale).

Figure 3.6 – Mediabrowser(image extraite de www.hanselman.com)

Regroupement sur information chronologique et geographique

PhotoCompas [73] utilise les informations chronologiques et g�eographiques

pour organiser les photos selon deux hi�erarchies : lieux et �ev�enements.

Regroupement sur information chronologique, geographique et contenu

Le syst�eme prototype du labo HP [74] optimise la recherche des photos en

analysant leur contenu ainsi que les m�etadonn�ees fournies par l'appareil. Un

syst�eme d�evelopp�e par le FXPAL et int�egr�e �a diverses applications permet

de simpli�er la gestion des albums via une d�etection automatique des �ev�ene-

ments. Le �ltrage des m�etadonn�ees permet quant �a lui d'organiser les pho-

tos en cat�egories que l'on peut visualiser sous la forme d'un arbre ou d'un

calendrier [75]. L'interface interactive d'EasyAlbum [76] s'appuie sur la re-

connaissance faciale pour annoter les photos. Par ailleurs, un m�ecanisme de

visualisation sur crit�eres multiples permet �a l'utilisateur d'a�cher ses photos

par lieu, date, �ev�enement, ou encore selon le nombre de personnes pr�esentes

sur le clich�e.

Avec pour objectif une gestion optimis�ee des ressources, les algorithmes de

calcul �evoluent sans cesse, amenant les ordinateurs �a mieux comprendre la

s�emantique des contenus audiovisuels. A�n de pouvoir analyser l'information,

l'algorithme de demain devra etre capable non seulement de prendre en charge

une quantit�e �enorme de donn�ees, mais �egalement de partager les informations

acquises au travers d'une base de connaissance exible. Lew et al. [77] ont

47

d�ecrit les principaux enjeux de la recherche de contenus audiovisuels :

{ La recherche s�emantique ax�ee sur la d�etection de concepts dans des conte-

nus pr�esentant des arri�ere-plans complexes,

{ Des algorithmes d'analyse multimodale et de recherche, particuli�erement

pour exploiter les synergies inter-contenus,

{ Des syst�emes exp�erimentaux d'exploration multim�edia pour parcourir les

contenus audiovisuels,

{ Des syst�emes de recherche interactive, de s�emantique �emergente ou de

retour de pertinence,

{ Une �evaluation ax�ee sur des jeux de tests repr�esentatifs et des mod�eles

d'usage.

La section suivante s'int�eresse aux d�eveloppements actuels autour des tech-

niques de visualisation des contenus photos num�eriques.

48

3.3 Outils de gestion pour les contenus photos nu-

meriques

D'un point de vue utilisateur, l'exp�erience quotidienne de la photo num�erique peut

se r�esumer en trois mots : stockage, visualisation et recherche. Les outils de gestion

photo assurent trois fonctions principales qui correspondent aux attentes quoti-

diennes de l'utilisateur : regroupement, navigation et recherche. Ces outils seront

d�ecrits selon la fonction qu'ils assurent.

Le regroupement automatique est consid�er�e comme la fonctionnalit�e essentielle d'un

photoware, les algorithmes associ�es ayant �et�e d�ecrits dans la pr�ec�edente section. Le

regroupement a pour objectif de fournir �a l'utilisateur des techniques automatiques

pour parcourir ses albums photos ou les organiser. Un mode de regroupement clas-

sique se fait par ordre chronologique ou par analyse des contenus visuels sur des cri-

t�eres particuliers, comme par exemple la similitude des couleurs ou des visages [59].

A�n de compenser les faiblesses du regroupement automatique, le balisage (manuel

ou automatique) permet de cat�egoriser les albums. Sur la base d'�etudes labo, de

nombreux outils de gestion des photos ex�ecutent diverses requetes et recherches

au sein des contenus photos. Il s'appuyent pour cela sur di��erents algorithmes de

regroupement On peut citer PhotoTOC [ [67](cf. �g.3.7), Shoebox [69], l'applica-

tion photo EXPAL [75], celle d'HP [74], ou encore AutoAlbum [71], EasyAlbum

[76] (cf. �g.3.8), Myphotos [72] (cf. �g.3.9), SmartAlbum [78] et MiAlbum [79](cf.

�g.3.10). Cependant, ces outils de gestion, orient�es r�esultats, manquent cruellement

de techniques de visualisation qui permettraient d'am�eliorer la pr�esentation des r�e-

sultats et les modes d'interaction possibles. Par ailleurs, les interfaces propos�ees

s'appuient sur un algorithme sp�eci�que de regroupement permettant d'adresser des

cas sp�eci�ques, comme par exemple retrouver les photos d'untel par la reconnais-

sance faciale, ou encore n'a�cher que les photos prises dans un lieu donn�e, par le

regroupement bas�e sur l'information g�eographique. Il s'agit en fait de cas particu-

liers d'usage, et il manque un outil de gestion int�egr�e qui proposerait l'ensemble de

ces fonctionnalit�es.

Certains outils appliquent des mod�eles de visualisation qui facilitent la navigation

non seulement des r�esultats obtenus mais �egalement des contenus photos dans leur

ensemble. PhotoMesa [29] est un exemple typique : son interface simple permet,

d'une part, de visualiser les contenus photos et, d'autre part, de faciliter leur orga-

nisation. FotoFile [36](cf. �g.3.5) est un outil de recherche multim�edia qui applique

di��erentes techniques de visualisation, y compris un navigateur hyperbolique, a�n

de visualiser les r�esultats de la recherche selon di��erents sc�enarii d'usage. Le navi-

gateur de PhotoFinder [80] propose un a�chage multiple des vignettes ainsi qu'une

mise �a jour dynamique des r�esultats. Sur le meme principe de design, MediaBrowser

[70] (cf. �g.3.6), MyLifeBits [52] (cf. �g.3.11) et Agrafo [81](cf. �g.3.12) ont mis en

place des e�ets visuels plus pouss�es dans la pr�esentation des r�esultats. Photohelix

[82](cf. �g.3.13) propose quant �a lui une interface circulaire originale. L'origina-

lit�e de ces outils (mod�eles de visualisation et techniques d'interaction sp�eci�ques)

rend agr�eable la pratique photo au quotidien. N�eanmoins, ces outils pr�esentent tous

le meme inconv�enient : ils ne proposent pas de m�ecanisme simple et exible de

navigation parmi les contenus.

La pratique quotidienne de la photo num�erique varie selon les sc�enarii d'usage (re-

cherche classique d'images, partage photo ou navigation photo pour le plaisir). Les

49

outils logiciels d�evelopp�es en labo se sont jusqu'�a pr�esent int�eress�es uniquement �a

l'obtention des r�esultats, mais pas �a la visualisation de ces derniers. Dans un souci

d'usabilit�e et de satisfaction des attentes utilisateur, il faudrait prendre en compte

les di��erents scenarii d'usage.

Figure 3.7 – PhotoTOC, navigateur d'images avec « vue d'ensemble + d�etail »(image extraite de l'article de PhotoTOC[67])

Figure 3.8 – Navigateur d'images EasyAlbum (image extraite de l'articled'EasyAlbum[76])

50

Figure 3.9 – Navigateur d'images MyPhotos impl�ement�e avec une interface ca-lendrier photo (image extraite de l'article de MyPhotos[72])

Figure 3.10 – Navigateur d'images MiAlbum impl�ement�e avec une approchesemi-automatique d'annotation des images (image extraite del'article d'MiAlbum[79])

Figure 3.11 – MyLifeBits (�a g. : visualisation des r�esultats regroup�es chrono-logiquement, �a dr. : visualisation sur frise chronologique)(imageextraite de l'article de MyLifeBits[52])

51

Figure 3.12 – Di��erents modes de pr�esentation des photos sous Agrafo (imageextraite de l'article d'Agrafo[81])

Figure 3.13 – PhotoHelix (image extraite de l'article de PhotoHelix[82])

52

3.4 Techniques de visualisation des photos nume-

riques

Stockage, visualisation et recherche sont les trois incontournables de la photo num�e-

rique au quotidien. Contrairement aux donn�ees physiques, les donn�ees num�eriques

peuvent etre fortement compress�ees : un disque dur 250 Giga permet de restituer

jusqu'�a 50 000 photos num�eriques (taille moyenne d'une photo : 5 M�ega) [83]. La

visualisation des photos num�eriques se fait sur la base d'une analyse avanc�ee. L'ob-

jectif est « d'�eplucher » le contenu en s'appuyant sur m�ethodes souples, les indices

qui permettent d'acc�eder au contenu cibl�e restant clairement identi�ables durant

la navigation. Pour la visualisation de contenus photographiques cons�equents, un

syst�eme de gestion photo doit assurer deux fonctionnalit�es essentielles que nous

tacherons de pr�esenter ci-apr�es :

1. Visualiser un maximum de contenu sur un �ecran de taille r�eduite (vue macro-

scopique de l'ensemble des photos) ;

2. Visualiser les d�etails d'un contenu (vue microscopique d'une photo donn�ee).

Pour la premi�ere fonctionnalit�e, la solution est de redimensionner le contenu a�n

d'optimiser l'espace �ecran, qui permet alors de visualiser l'ensemble des �el�ements

du contenu. Les p�eriph�eriques de sortie traditionnels (�ecrans) et les photos �etant au

format rectangulaire, les chercheurs ont simplement miniaturis�e les photos puis les

ont arrang�ees en colonnes et en lignes. Si l'a�chage par vignettes permet d'utiliser

l'espace �ecran au maximum, il a tout de meme quelques inconv�enients. En e�et,

une trop forte densit�e d'informations peut etre synonyme de surcharge visuelle et

de navigation laborieuse. Par ailleurs, la miniaturisation des photos entra�ne une

perte d'information sur le contenu des images. Di�cile d'identi�er un contenu �a

partir d'une photo minuscule, �a moins de pouvoir zoomer dessus. Les interfaces de

certains services Web, comme par exemple Flickr, proposent une solution alternative.

La miniature qui s'a�che ne repr�esente pas l'image tout enti�ere mais une partie

de celle-ci uniquement (cf. �g.3.14). Le principal probl�eme avec la visualisation

par vignettes reste n�eanmoins que, dans le cas d'une collection photographique

cons�equente, l'utilisateur n'a pas pleinement conscience du contenu, c'est-�a-dire

qu'on ne lui pr�esente pas d'aper�cu qui r�esumerait en une fois l'ensemble de ce

contenu. A�n d'a�ner cet aper�cu, un mode de visualisation possible est la vue

arbre [84] qui permet d'a�cher les vignettes de fa�con informative, les photos �etant

regroup�ees par cat�egorie. Grace �a ce type d'a�chage, l'utilisateur peut parcourir sa

collection en pleine connaissance du contenu, avec un regroupement des photos bas�e

sur les similitudes visuelles. La deuxi�eme fonctionnalit�e essentielle d'un syst�eme de

gestion photo est la technique de zoom. �A la base, celle-ci consiste tout simplement

en l'agrandissement de l'objet s�electionn�e. Pour l'a�chage en arbre, les chercheurs

vont plus loin et appliquent la technique dite de « focus + contexte » dans les

op�erations de zoom. Cette technique duelle o�re davantage de souplesse dans les

op�erations de zoom et permet aux utilisateurs de changer de vue en un instant. Par

ailleurs, cela permet d'�eviter, durant la navigation, les ph�enom�enes de d�esorientation

dans la hi�erarchie du syst�eme. L'interface de PhotoMesa [[84] en est un exemple.

Visualisation 3D

Les m�ethodes de visualisation pr�ec�edemment d�ecrites sont g�en�eralement consid�e-

r�ees comme des m�ethodes de visualisation 2D. La visualisation 2D permet une

53

Figure 3.14 – Miniature Flickr(image extraite de www. ickr.com)

navigation simple et rapide des contenus. N�eanmoins, elle o�re peu de modes de

pr�esentation visuelle compar�e �a la visualisation 3D. Avec les progr�es des technolo-

gies informatiques, les chercheurs commencent �a int�egrer la visualisation 3D aux

syst�emes d'InfoVis (visualisation de l'information). Ils consid�erent que l'e�et de vi-

sualisation 3D peut etre un levier int�eressant dans l'enrichissement des modes de

visualisation des donn�ees. L'objectif de la visualisation 3D peut etre r�esum�e comme

suit :

1. Augmenter la quantit�e de contenu pr�esent�e �a l'utilisateur,

2. Faciliter la navigation de contenus photos cons�equents,

3. Enrichir les techniques d'interaction dans la navigation de contenus cons�e-

quents,

4. Augmenter le niveau de satisfaction utilisateur d'un point de vue esth�etique,

durant la navigation.

Quand la visualisation 3D est apparue, la capacit�e de calcul des syst�emes �etait as-

sez limit�ee, et ses objectifs sont rest�es th�eoriques. Compar�e �a la visualisation 2D,

la pr�esentation 3D utilise davantage d'e�ets d'animation, typiquement la rotation,

la transformation ou les d�eplacements d'objets. Des e�ets visuels avanc�es tels que

le fade-in (apparition en fondu), le fade-out (fondu au noir) ou l'acc�el�eration per-

mettent �egalement d'am�eliorer l'e�et de visualisation 3D. Combs and Bederson [85]

ont compar�e les interfaces 2D et 3D. Dans cette �etude, la puissance de calcul, in-

su�sante, ne permettait pas une restitution correcte de l'environnement graphique

3D et l'interface 3D �etait, du coup, consid�er�ee comme insatisfaisante. Les syst�emes

informatiques actuels, plus puissants, permettent �a de nombreux syst�emes d'Info-

Vis d'int�egrer la visualisation 3D temps r�eel. Les utilisateurs peuvent manipuler

54

leurs donn�ees et analyser leurs contenus de di��erents points de vue, comme avec

Microsoft PhotoSynth [86](cf. �g.3.15).

Figure 3.15 – PhotoSynth(image extraite de photosynth.net)

RSVP

Une autre technique de visualisation, la RSVP (Rapid Serial Visual Presentation),

propose un mode de pr�esentation rapide et s�equentiel des photos, a�n de faciliter la

navigation de contenus photos cons�equents. Dans l'�etude de Cooper et al. [1] (cf.

�g.3.16), l'auteur compare l'e�cacit�e de la pr�esentation statique �a celle de la pr�esen-

tation dynamique sur di��erentes taches de recherche dans une collection d'images.

Trois modes statiques (diaporama, pele-mele, juxtaposition) et trois modes RSVP

(diagonale, anneau, ux) sont test�es sur trois taches de recherche d'image. Bien que

les conclusions de l'exp�erimentation indiquent une certaine e�cacit�e de la RSVP,

cette technique serait-elle vraiment utile �a l'usage ? Actuellement, la vitesse de pr�e-

sentation des applications RSVP est soit enti�erement automatique, soit r�eglable

manuellement. De par sa vitesse de pr�esentation �xe, la RSVP automatique clas-

sique risquerait de freiner la navigation, voire d'�enerver l'utilisateur, mais un controle

purement manuel de la RSVP pourrait s'av�erer laborieux dans le cas de contenus

trop volumineux. Par cons�equent, en environnement r�eel, la solution ne serait pas

une pr�esentation automatique mais un m�ecanisme de pr�esentation sensible aux in-

tentions de navigation de l'utilisateur. Ce type de m�ecanisme dynamique n'a jamais

�et�e propos�e sur de la RSVP. L'id�ee de cette interface est que, sur d�etection des

intentions de l'utilisateur, on d�e�nit la vitesse de navigation la plus appropri�ee. Par

exemple, sur l'iPhone, la vitesse de d�e�lement et le contenu pr�esent�e sur le cover

ow varient selon la fr�equence �a laquelle on « feuillette » l'iPhone du doigt.

Un autre d�ebat autour de la RSVP classique est le contenu qui est pr�esent�e. Tout

comme la vitesse de pr�esentation, le contenu pr�esent�e en RSVP est �xe, ce qui n'est

pas sans pr�esenter certains inconv�enients. La RSVP a�che une ou plusieurs photos

�a la fois. Le nombre d'objets pr�esent�e est �xe et il n'existe aucun m�ecanisme qui

permette la transition du contenu pr�esent�e, c'est-�a-dire, par exemple, de n'a�cher

non plus une mais trois photos lorsque l'on d�etecte que l'utilisateur feuillette �a une

fr�equence �elev�ee.

Somme toute, la RSVP vise un mode de pr�esentation vari�e et anim�e, �a meme

d'attirer l'attention de l'utilisateur. Cette technique de pr�esentation « active » est

susceptible de convenir �a des applications plus orient�ees divertissement qu'analyse,

55

comme par exemple des navigateurs d'images. Une application potentielle de la

RSVP est la pr�esentation de photos num�eriques sur interface mobile.

Figure 3.16 – Six modes de pr�esentation de RSVP(image extraite de l'article de Cooper et al. [1])

Visualisation focus + contexte

Dans les grandes lignes, la visualisation focus + contexte permet d'a�cher �a la

fois l'objet d'int�eret et un aper�cu g�en�eral du contenu de l'image. L'utilisateur peut

ainsi observer simultan�ement les informations de premier et d'arri�ere-plan (le focus

et le contexte, respectivement), et ainsi « voir l'arbre sans qu'il cache la foret ».

Le principe de design de ce type de visualisation est d'agrandir le point d'int�eret

jusqu'�a un niveau de d�etail avanc�e, pour mettre en valeur le point de focus par

rapport �a l'espace d'information dans sa globalit�e. Quelques exemples de visualisa-

tion focus + contexte sont le perspective wall [87](cf. �g.3.17), le m�elange [88](cf.

�g.3.18), l'arbre hyperbolique [89](cf. �g.3.19) et la vue �sheye (oeil-de-poisson,

[90],cf. �g.3.20). Les deux premi�eres applications s'appuient sur une technique de

« pliage » des objets, les deux derni�eres sur une technique de distorsion classique.

La visualisation focus + contexte permet la navigation contextuelle de contenus

tr�es vastes. Toutefois, dans le cas d'une telle quantit�e de contenus, quid de la sur-

charge visuelle ? Et pour quelle e�cacit�e sur petit �ecran ? Doit-on mettre au point

une nouvelle technique de visualisation qui permettrait de situer le focus dans son

contexte, a�n de contrer cet inconv�enient ? La solution reste �a trouver.

Figure 3.17 – Perspective wall (image extraite de l'article de Mackinlay et al.[87])

56

Figure 3.18 – M�elange (image extraite de l'article de Elmqvist et al. [88])

Figure 3.19 – Arbre hyperbolique (image extraite de Lamping et al. [89])

Figure 3.20 – Vue �sheye(image extraite de en.wikipedia.org)

57

3.5 Casual Infovis et techniques d’interaction sur

les appareils mobiles

De nos jours, de par leurs capacit�es de calcul et d'a�chage �elev�ees, les appareils

mobiles jouent un role important : grace �a eux, les utilisateurs peuvent acc�eder �a

leur contenus num�eriques n'importe o�u, n'importe quand. En g�en�eral, les d�evelop-

pements des techniques de visualisation sur appareils mobiles grand public suivent

deux directions : le divertissement ou l'e�cacit�e. La visualisation orient�ee divertisse-

ment propose davantage d'interactivit�e dans ses pr�esentations, et tend �a n'a�cher

qu'une partie limit�ee du contenu photo. A l'inverse, la visualisation orient�ee e�ca-

cit�e optimise l'espace d'a�chage via l'utilisation de vignettes, et pr�esente davantage

de contenu. Dans un souci de clart�e, pr�ecisons que la pr�esente th�ese s'int�eresse aux

appareils mobiles disposant de capacit�es de visualisation et de calcul. Elle ne traite

pas des p�eriph�eriques mobiles.

Dans le cadre d'�etudes labo, di��erents outils syst�eme ont �et�e int�egr�es sur des ap-

pareils mobiles a�n de tester l'interface conceptuelle et les techniques propos�ees.

Pocket PhotoMesa [91], avec son interface zoomable h�erit�ee de PhotoMesa, a �et�e

int�egr�e �a des PDAs. Sur des PDAs, toujours, Flutter [92](cf. �g.3.21) a �et�e int�e-

gr�e avec des techniques d'interaction tangible et des pr�esentations plus artistiques

(approche similaire aux travaux de Van Renesse et al. [93], Demontis et al. [94]

et Porta [95]. Le but est d'encourager l'usage du PDA dans la navigation photo

et de rendre celle-ci plus plaisante. En ce qui concerne les donn�ees chronologiques,

l'�etude d'Harada et al. [51] propose une interface zoomable avec visualisation par

frises multiples, pour une navigation des contenus photos sur di��erentes �echelles de

temps. En ce qui concerne les d�eveloppements industriels sur t�el�ephones mobiles

Figure 3.21 – Flutter(image extraite de Williamson and Brown [92])

grand public, notons que l'Apple iPhone applique un a�chage vignettes classique

et une pr�esentation Cover ow avec feuilletage intuitif, ce qui permet de zoomer

et de naviguer d'une fa�con rapide et personnalis�ee. Le Acer F900 (cf. �g.3.22 et

le HTC touch HD (cf. �g.3.22 proposent quant �a eux une visualisation des photos

sous forme de cartes empil�ees que l'on fait d�e�ler. Pour a�cher en simultan�e photos

et albums musicaux, le LG KM900 (cf. �g.3.24 divise son �ecran en deux carrousels

verticaux. Le Nokia N82 (cf. �g.3.23 propose pour sa part une visualisation via

un carrousel en demi-cercle qui permet d'optimiser l'espace d'a�chage des photos.

Autrement, l'application iPhone MyPhotoEgg [96](cf. �g.3.24 propose une visuali-

sation sph�erique 3D des albums photos. L'utilisateur peut visualiser ses photos dans

58

(a) Acer F900 (b) HTC Touch HD

Figure 3.22 – Interface de l'Acer F900(a) et du HTC Touch HD(b)(image(a) extraite de www.acer.com)(image(b) extraite de www.htc.com)

un ou plusieurs « oeufs » ottant dans l'espace.

La visualisation des photos sur des appareils mobiles en est �a ses pr�emices. En

g�en�eral, les widgets fournis avec le t�el�ephone portable permettent des modes de

visualisation multiples, orient�es e�cacit�e ou esth�etique. Le souci est qu'un widget

esth�etiquement r�eussi peut etre source de ralentissement, de par les capacit�es de

calcul limit�ees des appareils mobiles. Le probl�eme se pose surtout dans le cas de

contenus photo cons�equents. C'est probablement une des raisons pour lesquelles

les mobiles que l'on retrouve actuellement sur le march�e n'int�egrent toujours pas

certaines interfaces graphiques utilisateur trop gourmandes en ressources syst�emes.

Techniques de manipulation sur appareils mobiles

De dimensions r�eduites, les appareils mobiles s'emportent partout avec soi. De par

leur petite taille, les mouvements n�ecessaires �a leur manipulation sont plus phy-

siques, que l'interaction se fasse �a une ou deux mains. Les appareils mobiles clas-

siques, de par leurs capacit�es r�eduites, ne permettent pas d'int�egrer une grande

vari�et�e de techniques d'interaction et s'appuient majoritairement sur un mode de

saisie avec utilisation de boutons. D�es ses d�ebuts, l'int�egration d'�ecrans tactiles sur

des appareils mobiles a permis de d�ecouvrir des modes d'interaction di��erents. L'in-

t�egration de ce type d'�ecran sur les appareils mobiles n'est pas encore tr�es fr�equente

de par son cout et les limitations autour de son impl�ementation. Avec le lancement

de l'iPhone en 2007, Apple a donn�e corps �a une vision nouvelle de l'appareil mobile.

L'introduction de l'�ecran multi-touch et de divers capteurs (ex : acc�el�erom�etres,

capteurs de proximit�e ou de lumi�ere ambiante) enrichit l'interaction naturelle et les

modes de visualisation associ�es. Suite au succ�es commercial de l'iPhone, l'a�chage

tactile et les gestes de controle qui lui sont associ�es sont devenus des probl�ematiques

59

(a) NokiaN82 (b) Motorola A3100 Fun Al-bum

Figure 3.23 – Interface du Nokia N82(a) et du Motorola A3100 Fun Album(b)(image(a) extraite de www.nokia.com)(image(b) extraite de www.sogi.com.tw)

de design incontournables, qui repr�esentent d�esormais les sp�eci�cations fondamen-

tales d'un appareil mobile.

En r�egle g�en�erale, on interagit avec une interface gestuelle via des gestes tactiles

ou non-tactiles. Une interface gestuelle est d�e�nie comme « tactile » lorsqu'elle est

�equip�ee d'un �ecran tactile ou d'autres m�ecanismes sp�eci�ques, et qu'elle n�ecessite

des gestes de manipulation physique dans l'activation de fonctions. �A l'inverse, une

interface gestuelle est d�e�nie comme « non-tactile » lorsqu'elle int�egre des capteurs

qui permettent l'activation de fonctions sur d�etection, �a distance, de mouvements

de la main. Un exemple de ce type d'int�egration est le panneau 3D d�evelopp�e par

Mitsubishi Electronic [98](cf. �g.3.25), avec controle gestuel tactile et non-tactile.

Toshiba a �egalement d�evelopp�e le laptop Qosmio G55, dont l'interface gestuelle 3D

permet de commander �a distance le bureau Windows ainsi que certaines applications

[99](cf. �g.3.26). Toshiba a d'ailleurs int�egr�e ce type d'interface �a ses t�el�eviseurs. Si

le controle gestuel 3D permet la commande �a distance d'un syst�eme, on consid�ere

n�eanmoins qu'il manque encore de pr�ecision et de sensibilit�e.

Les techniques de d�etection se retrouvent dans di��erentes applications mobiles.

Leurs usages sont sp�eci�ques et elles s'appuient sur di��erents types de capteurs.

Certaines interfaces int�egrent par exemple des capteurs d'inclinaison. La moindre

inclinaison de la main est capt�ee et traduite en mouvement dans l'application pour

parcourir une carte, un album photo [100] [101] ou s�electionner un menu [102][103].

On parle alors d'application �a capteur unique. En r�egle g�en�erale, les applications in-

t�egrent directement des capteurs d'inclinaison, mais une autre solution est de plug-

ger sur l'appareil mobile un dongle USB qui contient le capteur d'inclinaison [101].

Compaq a d�evelopp�e un prototype de cadre photo num�erique [102] qui int�egre un

capteur d'inclinaison deux axes, l'utilisateur pouvant faire d�e�ler ou orienter ses

photos via un controle gestuel. Un autre exemple est un PDA int�egrant des cap-

teurs multiples [104] : capteur de proximit�e, capteur tactile et capteur d'inclinaison.

60

(a) LG KM900

(b) My Photo Egg

Figure 3.24 � Interface du LG KM900(a) et du My Photo Egg(b)(image(a) extraite de www.lg.com)(image(b) extraite de www.myphotoegg.com)

61

Figure 3.25 – Panneau tactile 3D d�evelopp�e par Mitsubishi(image extraite de techon.nikkeibp.co.jp)

Figure 3.26 – Ordinateur portable TOSHIBA Qosmio avec interface gestuelle(image extraite de www.cbc.ca)

L'�etude �evalue les performances de chaque capteur sur la base de tests techniques.

SideSight est une application particuli�erement int�eressante [105] des techniques de

d�etection. Il s'agit d'un t�el�ephone portable qui int�egre des capteurs de proximit�e

infra-rouge, permettant ainsi un controle gestuel non-tactile autour du t�el�ephone.

D'un point de vue utilisateur, les mouvements d'inclinaison permettent d'interagir

d'une fa�con naturelle avec les appareils mobiles. Cependant, l'association simulta-

n�ee de certains mouvements (rotation ou inclinaison) avec un a�chage �a l'�ecran

peut entra�ner des probl�emes d'usabilit�e lors de l'ex�ecution de certaines taches. Par

exemple, d�erouler une carte sur inclinaison de l'appareil en meme temps qu'on la

consulte prend un certain temps. Cela risque, �a force, de perturber le point d'int�e-

ret visuel et d'entra�ner certains e�ets physiques genants, comme par exemple une

sensation de vertige. A�n d'�eviter ce genre d'inconv�enient, on pourrait imaginer

n'appliquer ce type de controle qu'�a des taches r�ealis�ees en un instant, c'est-�a-dire

sur une p�eriode assez courte pour n'a�ecter que peu ou pas du tout l'usage pre-

mier, comme par exemple pour passer du mode portrait au mode paysage. Actuel-

lement, les techniques d'inclinaison sont largement r�epandues dans les applications

de gaming sur mobiles. Quoi qu'il en soit, avant int�egration de toute technique de

d�etection, il faudrait commencer par identi�er et lister les usages possibles, a�n

d'aider les designers dans la mise au point de techniques d'interaction cr�eatives et

intuitives.

62

3.6 Methodologie d’evaluation des navigateurs d’images

Les performances d'un outil syst�eme d�evelopp�e pour la navigation de photos num�e-

riques sont fortement li�ees �a son usage en environnement r�eel. En g�en�eral, les �etudes

labos s'organisent autour de taches intensives permettant de simuler les comporte-

ments utilisateur en environnement r�eel. Les �etudes quantitatives ont pour objectif

de d�egager des donn�ees signi�catives �a partir des r�esultats obtenus sur les taches

en question. Typiquement, on suivra cette approche dans l'�evaluation d'un syst�eme

complexe ou encore dans celle d'un simple m�ecanisme d'interface, l'objectif �etant

d'�evaluer le degr�e d'e�cacit�e du syst�eme. Les �etudes qualitatives, quant �a elles,

sont souvent men�ees dans le but d'observer les comportements sur le long terme et

d'identi�er d'�eventuelles variations de ces comportements.

Les navigateurs d'images d�evelopp�es dans le cadre d'�etudes labos sont pour la plu-

part pr�evus pour un usage de bureau. L'�etude quantitative de ce type d'application

consiste g�en�eralement en une comparaison avec des applications similaires ou en

une auto-observation dont l'objectif est d'�evaluer les performances de chacune des

techniques propos�ees. L'objectif de l'�evaluation �etant d'appr�ecier l'e�cacit�e du sys-

t�eme propos�e, on va, typiquement, demander �a l'utilisateur de retrouver une image

ou une photo donn�ee. Des taches typiques de recherche peuvent etre les suivantes :

1. Recherche d'une cible sur la base d'un exemple visuel.

2. Recherche d'une cible sur la base d'une description textuelle pr�ecise, par

exemple, « un chat blanc sur un vieux bureau jaune ».

3. Recherche d'une cible sur la base de mots-cl�es, sans description d�etaill�ee de

la cible.

4. Recherche des photos pr�ef�er�ees.

Ces taches re �etent probablement un usage en environnement r�eel, que l'on ait ou

non une id�ee pr�ecise de la photo recherch�ee. N�eanmoins, sur la troisi�eme tache,

les r�esultats obtenus peuvent varier, tous les participants n'associant pas les memes

concepts aux mots-cl�es qui leur sont pr�esent�es. Par ailleurs, le crit�ere �etant de voir �a

quelle vitesse les taches peuvent etre accomplies, ces taches, except�e la quatri�eme,

sont souvent ex�ecut�ees avec une limite dans le temps, ce qui fait pression sur les

utilisateurs. Sur certaines taches intensives visant �a simuler la navigation de contenus

photos dans un cadre professionnel, cette limitation temporelle peut agir comme un

stimulant sur les participants et augmenter la fr�equence d'ex�ecution. Consid�eration

qui n'a toutefois pas lieu d'etre dans un contexte de navigation d'albums photos,

dans la mesure o�u cette navigation vise le plaisir, pas l'e�cacit�e.

L'usage des navigateurs d'images ne se limite pas �a la recherche de photos dans le

cadre d'une activit�e individuelle. Il permet �egalement l'ex�ecution de taches de par-

tage de photos en environnement multi-utilisateurs. Les �etudes qualitatives placent

souvent les participants dans un environnement permettant l'ex�ecution de taches

de narration et de partage des photos. A�n d'encourager l'�emergence de compor-

tements utilisateurs au cours de l'exp�erience, il est important que les participants

parcourent leurs propres contenus photos, car cela stimule l'�evocation du souvenir

et la narration. Leur connaissance des contenus a�ecte les r�esultats obtenus et va

probablement, dans un premier temps, faciliter la tache de recherche.

La m�ethodologie �a peine d�ecrite est appliqu�ee dans l'�evaluation de navigateurs

d'images de type InfoVis classique et Casual InfoVis. Si Porta [95] �evaluent les

63

interfaces Casual InfoVis sur la base d'une m�ethodologie quantitative, ils n'ont

peut-etre pas su �evaluer les avantages que les utilisateurs en retirent. Pousman

et al. [19] ont identi��e plusieurs probl�ematiques dans l'�evaluation du Casual Infovis.

La di�cult�e d'�evaluation du Casual InfoVis tient au fait qu'il est moins orient�e «productivit�e » que les InfoVis classiques. Avec le Casual InfoVis, on ne sait pas

exactement ce que l'on souhaite mesurer. Par ailleurs, si les syst�emes d'InfoVis

classiques proposent une pr�esentation « cadr�ee » des donn�ees dans une perspective

d'analyse, le Casual Infovis propose quant �a lui une pr�esentation souple des contenus

permettant de d�eclencher des indices �emotionnels chez l'utilisateur. En�n, le point le

plus important est que les �etudes labos classiques s'appuient sur un mod�ele d'usage

r�egulier dans l'�evaluation des taches, m�ethodologie qui n'est que peu adapt�ee au

Casual Infovis dans la mesure o�u ce dernier concerne des usages occasionnels. Les

�etudes labos classiques peinent par ailleurs �a mesurer les b�en�e�ces potentiels qui

r�esulteraient d'une accumulation d'usages occasionnels.

On peut n�eanmoins sugg�erer une approche potentielle d'�evaluation du Casual Info-

vis :

1. Mesure du Casual Infovis par une observation sur le long terme englobant

usages r�eguliers et occasionnels. Si le syst�eme est per�cu comme satisfaisant,

les r�esultats obtenus devraient permettre de d�e�nir si cela est du �a l'e�et de

nouveaut�e ou �a l'attraction visuelle.

2. �Evaluation du Casual InfoVis via des entretiens ouverts qui invitent les partici-

pants �a « raconter » les photos apr�es ex�ecution de taches orient�ees e�cacit�e.

Ces entretiens, lorsqu'ils sont accumul�es sur di��erentes p�eriodes, permettent

de r�ev�eler les di��erentes r�e exions des participants vis-�a-vis du Casual InfoVis.

En conclusion, le Casual InfoVis implique des usages sur des intervalles de temps

irr�eguliers. Les utilisateurs sont invit�es �a interagir avec des contenus multim�edia

personnels �a partir de points de vue vari�es, ce qui les am�ene �a se rem�emorer des

histoires, souvenirs et moments particuliers de leur existence. Dans la mesure o�u ces

m�ecanismes d�eclench�es par des signaux �emotionnels sont susceptibles de varier dans

le temps, une observation sur le long terme est n�ecessaire a�n de pouvoir mesurer

les b�en�e�ces potentiels du Casual InfoVis.

64

3.7 Reflexion sur le design et conclusion

Nous dressons l'�etat de l'art de la visualisation des photos num�eriques, par le biais

d'une pr�esentation des technologies associ�ees, des impl�ementations d'outils logi-

ciels et de divers dispositifs permettant la visualisation de ces contenus. En ce qui

concerne le d�eveloppement des technologies de reconnaissance, la plupart d'entre

elles ont tendance �a ne prendre en compte qu'un usage unique qui ne permet

d'adresser qu'un type sp�eci�que de photo. De ce fait, les �etudes qui s'appuient sur

ces technologies ne peuvent pas adresser un �eventail tr�es large d'usages et/ou de

contenus photos. Par ailleurs, les outils syst�emes actuels manquent d'une interface

sp�eci�que qui permettrait d'interagir avec plusieurs types de photos num�eriques.

A�n d'int�egrer di��erentes technologies de reconnaissance, l'outil syst�eme id�eal de-

vrait proposer des interfaces multiples capables de supporter diverses taches, sur

des sc�enarii sp�eci�ques.

Les outils d'InfoVis classiques permettent de pr�esenter des donn�ees professionnelles

et personnelles. Le Casual InfoVis adresse quant �a lui des usages plus sp�eci�ques,

plus souples, autour de contenus personnels tels que des photos num�eriques. Dans

la gestion des photos num�eriques, les syst�emes potentiels vont devoir satisfaire la

demande utilisateur en environnement r�eel. L'interface associ�ee joue �egalement un

role cl�e : permettre �a l'utilisateur d'appr�ehender la nature premi�ere de contenus

�emotionnellement riches. En ce qui concerne le Casual InfoVis, les appareils mobiles

sont le medium essentiel �a un usage court terme, que la condition de mobilit�e soit

continue ou nomade. Les d�eveloppements en design d'interfaces mobiles mettent

rarement l'accent sur le Casual InfoVis dans la navigation de contenus personnels.

Le plus souvent, c'est lors de moments de ottement que les utilisateurs parcourent

les contenus photos num�eriques stock�es sur leur mobile. Ce type d'usage est suscep-

tible d'amener �a la fois du divertissement et une piste de r�e exion sur les aspects

�emotionnels. L'int�egration du Casual Infovis aux appareils portables permettrait

d'enrichir �a la fois le divertissement et les aspects �emotionnels, puisqu'il s'agit d'un

m�ecanisme permettant un transfert des contenus photos num�eriques sur des usages

vari�es.

Face �a un contenu riche en indices �emotionnels, la premi�ere question que se pose le

designer est la suivante : comment proposer une plateforme qui permette la commu-

nication contenus/utilisateurs ? De par la vari�et�e des contenus et usages concern�es,

le p�erim�etre de cette plateforme est potentiellement vaste. Les contenus �emotionnels

sont complexes, la fa�con dont ils sont appr�ehend�es et reconstruits variant fortement

d'une personne �a l'autre. Pour communiquer avec des contenus visuels, on peut

imaginer une approche s'appuyant sur une pr�esentation visuelle, l'insertion de si-

gnaux auditifs vecteurs d'�emotions et de souvenirs, la manipulation tangible ou

encore un mode d'organisation qui attirerait dans un premier temps l'attention de

l'utilisateur puis d�eclencherait des indices potentiels tout au long de l'exp�erience

d'utilisation. En �g.3.27, nous revenons sur la �g.2.12 et nous int�eressons aux com-

posants de l'interface et contenus �emotionnels. Les approches de communication,

quelles qu'elles soient, devront int�egrer les �eventuels d�eveloppements de l'�etat de

l'art a�n de pouvoir tenir techniquement le cap. Le designer devra explorer toutes

les pistes technologiques possibles a�n de construire une ressource riche en « d�e-

clencheurs d'�emotions ». Pr�esent�es de di��erentes mani�eres, ces �el�ements devraient,

a fortiori, faire ressortir les indices �emotionnels pr�esents dans les contenus et susciter

l'�evocation de souvenirs chez l'utilisateur. Id�ealement, la plateforme de communica-

65

tion devra int�egrer un m�ecanisme de manipulation de ces �el�ements « d�eclencheurs »des contenus �emotionnels. Cela devrait favoriser la d�ecouverte de l'inattendu lors de

la navigation parmi des contenus personnels.

Figure 3.27 – Composants de la plateforme de communication et contenus�emotionnels

66

Chapitre 4

Design I

Le pr�esent chapitre s'appuie en partie sur l'article « A tangible interface for browsing

digital photo collections » pr�esent�e au TEI 2008. Nous nous int�eressons aux tech-

niques d'interaction sur appareils portables et analysons les gestes de manipulation

associ�es. D'un cot�e, les interfaces WIMP traditionnelles ne satisfont plus l'interac-

tion avec les contenus num�eriques sur appareils portables. De l'autre, les appareils

portables contribuent largement �a la di�usion des contenus personnels, contenus

dont la manipulation n'a plus grand-chose �a voir avec celle de donn�ees �a carac-

t�ere professionnel. Sur ce constat, nous r�e �echissons �a des techniques potentielles

d'interaction pour usage sur les futurs appareils portables. Apr�es une pr�esentation

des gestes de manipulation associ�es, nous nous int�eressons aux principes de mou-

vement de la main et �etudions les gestes tactiles. Nous mettons en relation ces

gestes de manipulation et la probl�ematique d'interaction sur des contenus photos

num�eriques et proposons dans ce sens di��erents mappages permettant la mise en

place des techniques d'interaction. La m�etaphore du jeu inspir�ee du Rubik's cube

nous permet de g�en�erer di��erents mod�eles de pr�esentation. Nous introduisons, pour

�nir, notre concept d'interaction inspir�e du Rubik's cube ainsi que le mod�ele de

pr�esentation qui lui est associ�e.

67

4.1 Interaction appareils portables/mains

Tout syst�eme interactif doit proposer des techniques d'interaction sp�eci�ques per-

mettant aux utilisateurs d'ex�ecuter certaines taches dans un environnement de tra-

vail donn�e. Les PC de bureau sont en g�en�eral dot�es de fortes capacit�es de calcul et

de nombreux p�eriph�eriques qui leur permettent d'assurer des taches dans un envi-

ronnement statique. Les appareils portables ont quant �a eux �evolu�e et leurs capacit�es

de processing, de stockage, de communication et d'a�chage les am�enent �a concur-

rencer les PC de bureau sur le terrain des fonctionnalit�es traditionnellement assur�ees

par ces derniers. De par ces capacit�es nouvelles, les appareils portables sont d�esor-

mais consid�er�es comme la plateforme par excellence pour acc�eder �a ses contenus

multim�edia �a tout moment et dans di��erentes conditions de mobilit�e : en balade,

en voyage ou en visite, comme le sugg�erent Kristo�ersen and Ljungberg [106]. La

croissance rapide des contenus num�eriques met la pression sur les d�eveloppeurs qui

doivent trouver des solutions e�caces pour interagir avec des contenus cons�equents

et pr�esenter ces memes contenus. Les mains humaines sont le pr�e-requis essentiel

�a l'interaction avec un appareil portable, tout particuli�erement dans l'ex�ecution de

taches au cours de di��erentes activit�es.

Karlson et al. [107] se sont int�eress�es aux usages de l'interaction �a une main sur des

appareils portables. Une de leurs conclusions : les utilisateurs pr�ef�erent l'interaction

�a deux mains pour les activit�es plus statiques. Sur les t�el�ephones mobiles avec

interface tactile, la pr�ef�erence des utilisateurs va �egalement �a ce mode d'interaction.

Selon la tache, on e�ectue di��erents gestes de manipulation. L'ex�ecution de taches

simples telles que r�epondre au t�el�ephone ne n�ecessite qu'une seule main, quand

saisir un texte ou jouer �a un jeu peut en n�ecessiter deux. Cette �etude qui porte sur

18 taches indique que la navigation parmi les contenus photo se fait souvent �a une

seule main. Il faut n�eanmoins rappeler que cette �etude, publi�ee en 2006, s'int�eressait

sp�eci�quement �a des portables �equip�es d'un �ecran tactile traditionnel et d'un clavier

de type QWERTY. Avec le lancement des interfaces multi-touch en 2007, l'usage

des t�el�ephones portables a radicalement �evolu�e, d'o�u l'�eventuelle n�ecessit�e de mettre

�a jour ces r�esultats.

Avec le succ�es commercial de l'iPhone d'Apple, l'a�chage tactile et les gestes de

controle associ�es sont devenus des probl�ematiques de design incontournables dans

la d�e�nition de modes de manipulation plus directs. Ils constituent d�esormais les

sp�eci�cations fondamentales des appareils mobiles. Compar�e aux interfaces tradi-

tionnelles avec boutons, les interfaces tactiles peuvent s'av�erer tr�es intuitives pour

certaines taches. N�eanmoins, y avoir recours dans l'ex�ecution de tout type de tache

peut entra�ner non pas une am�elioration des performances produit mais plutot cer-

tains probl�emes d'usabilit�e. Par exemple, il peut etre r�ebarbatif de saisir des textes

longs sur interface tactile [108]. Par ailleurs, sur �ecran plat, la manipulation par

gestes tactiles peut entra�ner une limitation du sens haptique.

Dans le monde naturel, les mains sont la partie du corps la plus utilis�ee dans les

taches quotidiennes. Elles savent appliquer de la force dans l'ex�ecution de taches

lourdes, mais �egalement faire preuve de pr�ecision sur des taches d�elicates. De nom-

breuses taches �electroniques sur PC sont fortement analogues �a certaines taches

physiques du quotidien. De ce fait, les techniques d'interaction utilis�ees dans cer-

taines taches physiques peuvent am�eliorer l'interaction avec des contenus num�e-

riques. Ainsi, la technique du « feuilleter » des pages d'un livre a �et�e largement

68

int�egr�ee �a l'interaction sur des documents num�eriques. La gestuelle actuellement

int�egr�ee aux interfaces tactiles classiques ne constitue que l'une des techniques po-

tentielles d'interaction avec des appareils portables. Nous contredisons l'id�ee selon

laquelle l'int�egration de cette gestuelle constituerait la panac�ee aux probl�ematiques

d'interaction sur appareils portables. Comme l'ont d�ecrit Nielsen et al. [109], « L’in-

terface gestuelle n’est pas la solution universelle a tout type d’application, l’objectif

est de developper une interface qui soit plus efficace sur une application donnee. ».

Par cons�equent, il faudrait consid�erer d'autres mouvements de la main qui seraient

impliqu�es dans l'ex�ecution de taches physiques au quotidien. Notre objectif : favo-

riser une manipulation plus intuitive et am�eliorer les modes d'usage sur appareils

portables.

4.2 Presentation generale des gestes et mouvements

de manipulation de la main

La d�e�nition du geste selon le Larousse de la langue fran�caise est la suivante : « un

mouvement du corps, principalement de la main, des bras, de la tete, porteur ou

non de signification. ». Le geste, en tant que forme de communication non-verbale,

joue un role alternatif : remplacer ou am�eliorer le message verbal durant la commu-

nication. En g�en�eral, on distingue deux types de gestes : les gestes embl�ematiques

et les gestes co-verbaux. Un geste embl�ematique peut avoir di��erentes signi�cations

selon le contexte culturel et la fa�con dont il est ex�ecut�e. C'est le cas par exemple du

signe V r�ealis�e en tendant l'index et le majeur. S'il est r�ealis�e paume de la main vers

l'auditoire, il repr�esente la victoire, mais si c'est le dos de la main que l'on pr�esente,

les Anglais l'interpr�eteront comme une insulte (cf. �g.4.1). Un geste co-verbal, pour

sa part, accompagne la parole et appara�t en synchronisation avec certains �el�ements

saillants du discours [110].

Figure 4.1 – Le V de la victoire (�a g.) et le V �a valeur d'insulte (�a dr.)

Nielsen et al. [109] proposent une taxonomie permettant de d�ecrire le vocabulaire

gestuel selon deux �etiquettes : �etiquette descriptive et �etiquette s�emantique. Les

�etiquettes descriptives d�ecrivent le statut du geste, les �etiquettes s�emantiques son

objectif et la cible �a laquelle il sera appliqu�e.

{ �Etiquettes descriptives

Les �etiquettes descriptives indiquent le statut du geste : statique ou dynamique.

Les gestes statiques sont des postures, les gestes dynamiques des mouvements

qui sont r�ealis�es sur une p�eriode de temps donn�ee.

{ �Etiquettes s�emantiques

Les �etiquettes s�emantiques s'appuient sur la d�e�nition de Cassell [111]. Elles

permettent de d�e�nir des gestes conscients ou spontan�es, interactionnels ou pro-

69

positionnels. Les gestes conscients ont une signi�cation en soi, tandis que les

gestes spontan�es n'ont du sens que dans le contexte du discours.

Dans le domaine de l'interaction homme-ordinateur, la d�e�nition du geste est plus

large et concerne les mouvements pouvant etre d�etect�es par di��erents capteurs.

Pour Sa�er, les gestes sont les di��erents mouvements du corps humain qui peuvent

etre reconnus par des syst�emes de captation dans le but d'ex�ecuter des fonctions

sans recourir aux dispositifs classiques de pointage. Ces gestes peuvent etre un

mouvement des doigts, un d�eplacement de la main ou meme un lever de sourcil en

tant qu'expression du visage.[108]

{ Geste tactile

Les gestes int�egr�es aux appareils portables actuels (lecteurs mp3, PDAs, t�el�e-

phones portables, terminaux Internet mobiles) avec interface tactile sont des mou-

vements monos (cliquer, cliquer-glisser, faire d�e�ler ?) ou multi-doigts (avec deux

doigts : action de pincer et d'�etaler, avec quatre : le fameux « swipe » ou e�eure-

ment sur Apple Macbook Air). En g�en�eral, les interfaces gestuelles command�ees

par des mouvements des doigts sont assez intuitives. N�eanmoins, certaines pro-

bl�ematiques d'ergonomie doivent imp�erativement etre prises en compte, comme

par exemple le manque de pr�ecision du pointage au doigt sur une cible donn�ee

ou le manque de visibilit�e du au positionnement des doigts sur l'�ecran. Si l'ex�ecu-

tion de taches via des mouvements des doigts permet une manipulation directe

des contenus num�eriques, les interfaces tactiles atteignent leurs limites d'e�ca-

cit�e sur des op�erations « lourdes ». Par exemple, d�eplacer un objet sur un �ecran

tactile extra-large peut s'av�erer chronophage et fatigant puisque cela n�ecessite

d'ex�ecuter de nombreuses actions physiques.

Jusqu'�a pr�esent, les mouvements multi-doigts ont �et�e largement int�egr�es aux in-

terfaces des appareils portables. On note par ailleurs une augmentation du nombre

de doigts pouvant etre g�er�es par la reconnaissance multi-touch. Le ClearPad 3000

de Synaptics est par exemple capable de tracer jusqu'�a 10 contacts simultan�es

sur une diagonale d'�ecran de 8 pouces [112]. La manipulation multi-touch sur

appareils portables reste n�eanmoins limit�ee �a quelques fonctionnalit�es pr�ecises.

Par ailleurs, la plupart des mouvements multi-doigts n'utilisent en fait que deux

doigts, comme par exemple le zoom sur des objets qui s'e�ectue �a l'aide du pouce

et de l'index. L'interaction multitouch prend tout son sens avec les applications

de gaming telles que TouchEliss [113] ou certains simulateurs d'instruments de

musique [114] qui n�ecessitent des controles multiples dans les taches de jeu. Par

ailleurs, une des raisons pouvant expliquer pourquoi les interfaces multi-touch

conventionnelles n'int�egrent pas de gestes impliquant plus de deux doigts est la

probl�ematique de la « couverture d'�ecran » : le positionnement des doigts sur

l'�ecran risque en e�et d'a�ecter le rendu visuel.

{ Geste non-tactile�A la di��erence des gestes tactiles, les gestes non-tactiles sont activ�es par des

capteurs qui sont situ�es sur l'appareil portable et qui permettent �a l'utilisateur

d'ex�ecuter des mouvements plus libres de la main. Ces mouvements de la main

toute enti�ere sont souvent int�egr�es �a des taches ex�ecut�ees en mode « yeux libres ».

Par exemple, le walkman phone Sony Ericsson W910 [115], l'Apple iPod Nano 4G

[116] et le Motorola ROKR ZN50 [117] proposent une fonctionnalit�e « shake-to-

shu�e » qui permet de changer le titre en �ecoute de fa�con al�eatoire, par simple

secousse de l'appareil. Lorsqu'un appareil portable int�egre une interface gestuelle,

se pose la question de l'a�ordance, autrement dit de la capacit�e de l'interface �a

fournir les indices qui induiront intuitivement le geste associ�e (capacit�e suggestive

d'action). Un autre aspect �a prendre en consid�eration est la fa�con dont l'interface

70

gestuelle propose un usage sur la dur�ee et pas une simple fonctionnalit�e gadget.

Dans notre �etude, la tache de navigation photo requiert une forte attention vi-

suelle. Notre objectif : un transfert de l'exp�erience utilisateur acquise sur des

taches physiques existantes. Les gestes non-tactiles ne conviennent pas aux taches

n�ecessitant une certaine attention dans la dur�ee. Nous ne les avons pas retenus.

Nous nous sommes int�eress�es aux gestes tactiles et proposons une interface intui-

tive pour int�egration sur appareils portables. Nous avons cherch�e �a comprendre

le fonctionnement des mains ainsi que les objets et m�ecanismes associ�es �a l'ex�e-

cution de taches physiques au quotidien.

Napier [118] r�epartit les mouvements de la main en deux groupes : les mouvements

pr�ehensiles et non-pr�ehensiles. Les mouvements pr�ehensiles sont des mouvements

de la main qui permettent de tenir tout ou partie d'un objet dans sa paume. Les

mouvements non-pr�ehensiles ne permettent quant �a eux pas d'attraper des objets

mais plutot de pousser ou soulever ces derniers dans le but de les d�eplacer. Nous

adoptons une approche similaire �a celle de Napier et consid�erons que le controle

gestuel fait appel �a deux types de gestes : gestes pr�ehensiles (gestes tactiles) et

non-pr�ehensiles (mouvements de la main toute enti�ere).

L'�etude d'Elliott and Connolly [119] classi�e les mouvements de manipulation de

la main en trois mod�eles de mouvements intrins�eques. Un mouvement intrins�eque

suppose une coordination des doigts dans le but de manipuler un objet �a l'int�e-

rieur de la main, par opposition au mouvement extrins�eque o�u la main qui tient

l'objet se d�eplace librement. Le mouvement intrins�eque de la main peut impliquer

des mouvements simultan�es et des mouvements s�equentiels (d�eplacements ind�epen-

dants des doigts). Les mouvements simultan�es impliquent des synergies simples et

r�eciproques. On les retrouve dans des gestes impliquant le pouce, l'index et le majeur

pour manipuler avec pr�ecision un petit objet �a l'int�erieur de la main. Ces synergies

simples se retrouvent dans des gestes tels que l'action de pincer, de serrer ou encore

la prise tripode dynamique (cf. �g.4.2). Des exemples de synergies r�eciproques avec

abduction du pouce sont les suivants : faire rouler un objet entre le pouce et l'index

ou tourner un bouton, comme on le fait par exemple pour r�egler le volume sur une

cha�ne st�er�eo (cf. �g.4.3). Des exemples de synergies r�eciproques avec extension du

pouce, cette fois : faire rouler le pouce sur l'index, faire rouler l'index sur le pouce

ou faire rouler tous ses doigts sur un objet (cf. �g.4.4). Les mouvements s�equentiels

concernent pour leur part des mouvements successifs, particuli�erement dans la ro-

tation d'objets selon un angle pr�ecis. Les gestes associ�es sont la rotation pas �a pas,

la rotation par actions successives des doigts et la translation lin�eaire (cf. �g.4.5).

La classi�cation ci-dessus des mouvements de la main s'appuie sur l'analyse de la

manipulation �a une main d'objets physiques. Ces mouvements de la main sont tr�es

fortement li�es �a des objets m�ecaniques. De nos jours, on num�erise toujours plus d'ob-

jets physiques, ce qui a�ecte tr�es fortement la capacit�e tangible de ces objets une

fois qu'ils sont pr�esent�es �a l'�ecran. Di�cile par cons�equent d'adopter une approche

cin�ematique pour les gestes d'interaction quand tous les composants m�ecaniques

font place �a un �ecran tactile. L'ex�ecution de taches sur appareils portables fait sou-

vent appel �a des mouvements de la main plus complexes �a la fois dans la prise et

la manipulation (prise de force et de pr�ecision [118]). Les d�eveloppements actuels

visent �a rendre les appareils portables toujours plus petits, toujours plus intelligents.

Le probl�eme est que ces appareils, de par leurs m�ecanismes m�ecaniques limit�es, s'ap-

puient exclusivement sur l'a�chage tactile dans le controle du mod�ele d'interaction.

Par cons�equent, presque aucun des gestes class�es par Elliott and Connolly [119] ne

71

(a) Pin-cer

(b) Pin-cer

(c) Tri-pode

(d) Ser-rer

Figure 4.2 � Synergies simples de mouvements intrinseques simultanes : pincer(les deux a g.) prise tripode dynamique (les deux a dr.) et action deserrer (a dr.).(images extraites de l’ article d’ Elliott and Connolly[119]

(a) Faire rouler (b) Tourner

Figure 4.3 � Synergies reciproques de mouvements intrinseques simultanes :faire rouler un objet entre le pouce et l’ index (a g.) et tourner unbouton (a dr.). (images extraites de l’ article d’ Elliott and Connolly[119]

(a) Rou-ler

(b) Rouler (c) Rouler

Figure 4.4 � Synergies reciproques de mouvements intrinseques simultanes :faire rouler le pouce sur l’ index (a g.), faire rouler l’ index sur lepouce (au centre) et faire rouler tous ses doigts sur un objet (adr.). (images extraites de l’ article d’ Elliott and Connolly [119]

(a) Ro-ta-tionpasapas

(b) Rota-tionsuc-ces-sive

Figure 4.5 � Mouvements intrinseques sequentiels : rotation pas a pas (a g.),rotation par actions successives des doigts (en haut a dr.) et trans-lation lineaire (en bas a dr.). (images extraites de l’ article d’ Elliottand Connolly [119]

72

se retrouve sur les interfaces tactiles actuelles. Une premi�ere raison �a cela : les gestes

couramment int�egr�es aux interfaces tactiles sont con�gur�es pour une interaction sur

�ecran plat 2D. Di�cile donc, dans ce cadre, d'int�egrer une approche cin�ematique

dans le design des gestes de manipulation. Les di��erentes recherches et �etudes n'ont

par ailleurs pas encore permis d'identi�er de mappage m�etaphorique appropri�e pour

les mouvements de la main sur des taches physiques. A�n d'am�eliorer l'interaction

sur des taches �electroniques, il faudrait �etudier en profondeur le rapport qui existe

entre mouvement de la main et type de tache physique. De ce point de vue, le point

faible des d�eveloppements actuels sur appareils portables soul�eve la probl�ematique

suivante : quels gestes utiliser, et sur quelles fonctions ?

Gaver [120] a identi��e di��erents types de mappage qui permettent de d�ecrire la

fa�con dont les contenus des syst�emes informatiques sont transform�es en informa-

tion visuelle pr�esent�ee �a l'�ecran. Il existe deux types de mappages principaux, le

plus important �etant le mappage conceptuel. Ce dernier permet de traduire, par

expression m�etaphorique, une tache de calcul abstraite en un mod�ele conceptuel

compr�ehensible par l'utilisateur. Le mappage perceptuel, quant �a lui, traduit visuel-

lement le mod�ele conceptuel en pr�esentation perceptuelle (cf. �g.4.6). L'expression

du mod�ele via la pr�esentation perceptuelle peut etre symbolique, m�etaphorique ou

iconique. Gaver prend comme exemple la fonction « supprimer » pour illustrer ces

trois modes de pr�esentation perceptuelle. Le mappage symbolique de la fonction

« supprimer » utilise la lettre « x » pour indiquer la suppression d'un �chier. Le

mappage m�etaphorique s'appuie quant �a lui sur l'analogie entre la suppression et

la disparition. En�n, le mappage iconique fait intervenir un objet concret, la « cor-

beille », qui indique la suppression. Si on la compare aux mappages symbolique et

m�etaphorique, la pr�esentation visuelle bas�ee sur le mappage iconique est davantage

li�ee �a la fonction, autrement dit, la forme rappelle ais�ement la fonction associ�ee. La

�g.4.7 permet de visualiser chaque mappage avec le niveau correspondant de limita-

tion de la forme. Le mappage iconique est fortement limit�e de par une pr�esentation

totalement li�ee aux �ev�enements physiques. Le mappage symbolique est quant �a lui

tout �a fait libre.

Sur la d�e�nition des mappages selon Gaver, nous consid�erons que les mappages

iconique et m�etaphorique peuvent am�eliorer les gestes d'interaction sur des taches

num�eriques. Pourquoi ? Parce que ces deux types de mappage permettent de tra-

duire des �ev�enements physiques qui sont soit totalement soit partiellement ana-

logues aux taches num�eriques. Pour les taches physiques fortement li�ees aux taches

num�eriques, nous proposons d'appliquer un mappage iconique et de transf�erer la

technique d'interaction �a la manipulation de contenus num�eriques. Pour les taches

physiques partiellement analogues aux taches num�eriques, nous proposons d'appli-

quer un mappage m�etaphorique. C'est ce que propose par exemple Gummi [121],

qui associe le geste d'�etirer un objet �a la fonctionnalit�e de zooming. Dans la section

suivante, nous nous int�eressons au mappage iconique de taches physiques du quoti-

dien ayant �a voir avec la navigation de documents papier. Nous analysons ces taches

a�n d'en d�egager des gestes pertinents pour utilisation sur des taches num�eriques.

73

Figure 4.6 – Processus de mappage conceptuel et perceptuel propos�e par Gaver[120]

Figure 4.7 – Mappages et niveaux de limitation de la forme propos�es par Gaver[120]

74

4.3 Gestes d’interaction sur contenus photos nume-

riques

Pour interagir avec une cible donn�ee, la manipulation d'objets physiques repose sur

un contact physique, franc et tridimensionnel. Dans le cas de contenus num�eriques

abstraits, ce type de contact physique est fortement diminu�e. Pour une interac-

tion e�cace, le pr�erequis d'une interface gestuelle est d'o�rir des fonctionnalit�es

intuitives. Ces fonctionnalit�es doivent �evoquer une exp�erience utilisateur, un geste

physique que l'utilisateur ma�trise, et l'amener �a accomplir ce geste dans un usage

num�erique. Lorsqu'une m�etaphore de manipulation d'objets est r�eussie, l'utilisateur

sait imm�ediatement et intuitivement quel geste lui permettra d'accomplir une action

donn�ee.

Harrison et al. [122] ont travaill�e sur le transfert des exp�eriences utilisateurs ac-

quises sur des taches physiques. Ces exp�eriences permettent selon eux d'am�eliorer

l'usage des appareils num�eriques. Ils s'int�eressent particuli�erement aux taches num�e-

riques traditionnelles qui sont fortement li�ees �a des taches physiques, et en d�egagent

des techniques pertinentes d'interaction avec des contenus num�eriques. Tourner une

page, balayer une liste du regard ou annoter un document sont tout autant de taches

physiques qui sont appliqu�ees dans l'interaction sur livres num�eriques et PDAs. Par

ailleurs, Marshall and Bly [123] ont observ�e les comportements de lecture. Leur

objectif : d�eterminer la fa�con dont les utilisateurs parcourent des documents phy-

siques. Ils proposent d'utiliser leurs r�esultats dans le design d'interfaces permettant

la lecture de documents num�eriques.

A�n d'explorer les techniques potentielles de manipulation pour la navigation des

albums photos, nous avons suivi le meme type d'approche. Nous avons observ�e

les taches du quotidien et en avons extrait des gestes potentiels. Les photographies

dans leur version physique �etant sur papier, nous nous sommes int�eress�es aux gestes

utilis�es dans l'interaction avec des documents papier. L'objectif est d'identi�er les

mouvements de la main qui pourraient etre utilis�es dans la m�etaphore de la « naviga-

tion » ou de l'« exploration » des albums photos num�eriques. Nous avons identi��e

les gestes quotidiens (cf. tableau 4.1) associ�es aux di��erentes actions : �etaler, rouler,

feuilleter, m�elanger, d�etacher. Ces actions sont rattach�ees �a divers objectifs : prise

de connaissance du contenu (cf. tableau 4.1, n°2, 3), divers types de navigation

(cf. tableau 4.1, n°1, 6, 7, 8), comptage (cf. tableau 4.1, n°4, 5), organisation (cf.

tableau 4.1, n°9) et retrait (cf. tableau 4.1, n°10).

Ces actions sont ex�ecut�ees �a une ou deux mains. Les mouvements �a une main

impliquent une manipulation pr�ecise, ceux �a deux mains impliquent �a la fois mani-

pulation pr�ecise et prise de force. En g�en�eral, les taches plus complexes n�ecessitent

l'usage des deux mains a�n de surmonter les di�cult�es de manipulation, comme

par exemple pour le feuilletage rapide (cf. tableau 4.1, n°5, 8, 9). Par contraste,

une seule main est su�sante pour rabattre des feuilles de papier (Tableau 1, n°4),

d�etacher une page (cf. tableau 4.1, n°10), �etaler des pages (cf. tableau 4.1, n°2,

3) ou simplement les tourner (cf. tableau 4.1, n°6, 7). Par ailleurs, les mouvements

ex�ecut�es �a deux mains sont utilis�es pour « naviguer selon l'envie », c'est-�a-dire

lorsque l'utilisateur adapte librement la vitesse �a laquelle il feuillette les pages (cf.

tableau 4.1, 5, 8, 9).

75

Tableau 4.1 – Analyse des gestes quotidiens identi��es.

No./Pro�l Geste Mains Objet Objectif Procede Vitesse Continuiteimpliques implique

1 Deux Brochure Ouverture/ Etaler Rapide Continuaccord�eon navigation

2 Une Feuilles Conaissance Etaler Rapide Continupapier du contenu

3 Une Cartes �a Conaissance Etaler Rapide Continujouer du contenu

4 Une Feuilles Comptage Rabattre Page par Discretpapier Page

5 Deux Feuilles Comptage Rabattre Page par Discretpapier page

6 Une Carnet Navigation Feuilleter Page par Discretpage

7 Une Livre Navigation Feuilleter Page par Discretpage

8 Deux Feuilles Navigation Feuilleter Rapide Continupaper

9 Deux Papier/ Organisation M�elanger Rapide Continucartes �ajouer

10 Une Post-it Retrait D�etacher Page Discretpar page

76

Tableau 4.2 – Gestes quotidiens selon la fonction des doigtsPoints de couleur rouge : doigt travaillant seulPoints de couleur bleue : doigts travaillant en groupePoints de couleur magenta : doigts travaillant de fa�con s�equen-tielle

No./Pro�l Geste Tache par la main doigts impliques

1 Gauche : pincer pour d�eplacerDroite : prise

2 Rouler pour �etaler

3 Rouler pour �etaler

4 Rouler pour s�eparer

5 Gauchet : priseDroite : pincer pour rouler

6 Pincer pour rouler

7 Pincer pour rouler

8 Gauche : pincer pour roulerDroite : prise

9 Gauche : pincer pour lib�ererDroite : pincer pour lib�erer

10 Pincer

77

Elliott and Connolly [119] utilisent des diagrammes pour visualiser le groupement

des doigts dans chaque geste. Nous adaptons leur approche et d�e�nissons trois

groupes fonctionnels qui permettent de caract�eriser la fonction assur�ee par chacun

des doigts : doigt travaillant seul, doigt travaillant en groupe, doigt travaillant de

fa�con s�equentielle. Les gestes et visuels associ�es sont pr�esent�es tableau 4.2. Les

conclusions du tableau 4.2 sont les suivantes :

1. Pour les mouvements �a deux mains, la fonction de chaque main varie selon

la tache physique. Chaque main peut assurer le geste de prise ou celui de

manipulation. Pour les gestes du tableau 4.2 , n°1, 5, 8 la manipulation de

pr�ecision est assur�ee par une seule main. N�eanmoins, pour ceux du tableau 4.2,

n°9, aucun geste de maintien n'est n�ecessaire puisque les cartes ou les feuilles

de papier sont pos�ees sur la table.

2. Les taches identi��ees (navigation) sont tr�es analogues �a leurs �equivalents

�electroniques, mais la pr�esentation des documents papier du tableau 4.2 est

limit�ee (mode portrait ou paysage). Par cons�equent, les mouvements de la

main associ�es aux taches physiques sont relativement limit�es, et les gestes

que nous avons pu observer s'e�ectuent simplement dans un mouvement soit

vertical, soit horizontal.

3. Pour les mouvements ex�ecut�es �a une comme �a deux mains, les doigts les plus

utilis�es sont le pouce, l'index et le majeur. Ces trois doigts sont dominants

dans la manipulation de pr�ecision comme dans la prise, ce qui laisse supposer

qu'ils pr�esentent une capacit�e de manipulation plus �elev�ee que les autres. Sur

cette conclusion, on pourrait proposer un nombre de trois contacts maximum

pour les interfaces tactiles des appareils portables avec �ecran de taille limit�ee.

Cela pourrait permettre d'adresser la probl�ematique de la couverture d'�ecran

(positionnement des doigts qui gene la visibilit�e).

Les gestes du quotidien pr�esentent des techniques riches d'interaction haptique sur

des taches impliquant des objets physiques, gestuelle qui est tr�es fortement li�ee �a

une pr�esentation physique. De ce fait, si l'on souhaite int�egrer certaines techniques

d'interaction utilis�ees sur des taches physiques dans l'ex�ecution de taches num�e-

riques, un aspect essentiel est la capacit�e �a simuler la transformation de la forme

physique. Par exemple, les prototypes TWEND [124] et Gummy [121], int�egr�es

sur �ecran OLED, permettent d'ex�ecuter des gestes de manipulation sur une forme

exible d'appareil.

Comme nous avons pu en discuter au chapitre pr�ec�edent, di��erents types de pr�e-

sentation permettent d'am�eliorer la navigation des documents num�eriques. Ici, le

probl�eme est que si nous copions les modes d'interaction et de pr�esentation utilis�es

sur des taches physiques et les appliquons tels quels �a la navigation de contenus

photos num�eriques, nous risquons de perdre les caract�eristiques du contenu nu-

m�erique. Par ailleurs, dans la vie r�eelle, feuilleter un album photo correspond �a

un mod�ele d'interaction et de pr�esentation relativement limit�e. Pour cette raison,

nous orientons notre recherche d'un mod�ele potentiel d'interaction vers un mappage

m�etaphorique plus large. Nous cherchons �a identi�er quelles taches physiques pr�e-

sentent des techniques de manipulation et des mod�eles de pr�esentation analogues

non pas aux taches de navigation sur documents papier mais plutot sur d'autres

types d'objets.

78

(Passer �a la page suivante)

79

4.4 Reflexion autour du Rubik’s cube

Comme discut�e au chapitre 2, le Casual InfoVis permet une navigation des contenus

personnels pour le plaisir. Parmi di��erentes options, le jeu appara�t comme un levier

de motivation e�cace dans la recherche du divertissement. Avec comme objectif le

plaisir, qui est per�cu comme grati�ant, les m�ecanismes de jeu am�enent l'utilisateur

�a parcourir un contenu par divertissement et �a accomplir des taches sur la dur�ee.

Apr�es notre proposition de design en �n de chapitre 2, nous poursuivons notre

r�e exion autour du Rubik's cube. Notre objectif : comprendre ses m�ecanismes de

jeu ainsi que ses applications et adaptations potentielles �a di��erents usages.

Le Rubik's cube [40] est le fameux puzzle tridimensionnel invent�e en 1974 par

le sculpteur et professeur d'architecture hongrois Ern}o Rubik. Le Rubik's cube a

suscit�e un vif int�eret pour les domaines scienti�ques tels que les math�ematiques, la

m�ecanique et l'interaction homme-ordinateur.

En g�en�eral, le Rubik's cube est �etudi�e selon deux axes : sa r�esolution [125] [126]

et les techniques de manipulation associ�ees au mod�ele de pr�esentation cubique.

Cube Browser [127] permet de naviguer parmi les images (pr�ec�edentes, suivantes)

en tournant un cube. Secouer le cube permet de changer de cat�egorie d'images (cf.

�g.4.8). Les cubes ind�ependants d'AudioCubes [128], application musicale tangible,

sont des param�etres qui permettent �a l'utilisateur de composer de la musique (cf.

�g.4.9). 3D story Cube int�egre pour sa part des capteurs multiples [129], l'utilisateur

�etant invit�e �a d�ecouvrir une histoire par multimodalit�e (cf. �g.4.10). Cognitive Cubes

[130] utilise des cubes comme des outils physiques permettant de s'int�eresser �a la

relation entre �evaluation cognitive et �evaluation de la construction d'un concept

d'objet (cf. �g.4.11). L'�etude « Wooden Brains » (cf. �g.4.12) utilise quant �a elle

une IRM (imagerie par r�esonance magn�etique) du cerveau. Le r�esultat : un ensemble

de 60 cubes de 2,54 cm. 94 faces ext�erieures sont laiss�ees telles quelles tandis que

266 faces internes sont recouvertes d'un d�etail de l'IRM. Ce mod�ele 3D physique

invite les utilisateurs �a explorer la structure du cerveau en touchant et manipulant

les cubes. En�n, le site Web Search Cube [132] int�egre une pr�esentation cubique

4x4x4 dans la pr�esentation des r�esultats de recherche (cf. �g.4.13).

Ces applications sont des exp�eriences int�eressantes d'exploration de contenus via la

manipulation de cubes, d'autant plus qu'elles sont fortement associ�ees �a la pr�esen-

tation de contenus photos. Dans ces applications, le cube invite �a la manipulation et

�a une interaction intuitive. L'application de navigation photo la plus pertinente est

Cube Browser, dont le concept d'interface propose des fonctions simpli��ees dans la

navigation de contenus photos. Malheureusement, la probl�ematique de la navigation

parmi des contenus photos cons�equents n'y est pas �etudi�ee de fa�con aboutie.

Figure 4.8 – Cube Browser(image extraite de www.cubebrowser.de)

80

Figure 4.9 – AudioCubes(image extraite de www.percuss.com)

Figure 4.10 – 3D story cube (image extraite de Zhou et al. [129] )

Figure 4.11 – Cognitive cubes (image extraite de Sharlin et al. [130] )

81

Avec comme point de d�epart la �g.3.27, nous travaillons sur les relations entre

utilisateurs, moyens de communication et contenus �emotionnels (cf.�g.4.14). Nous

proposons les moyens de communication suivants : pr�esentation visuelle, manipula-

tion tangible, signaux auditifs et m�ethode d'organisation. Sur portable, imaginons

que ces moyens de communication permettent de d�eclencher les indices �emotionnels

v�ehicul�es par les photos num�eriques. Quel mod�ele de communication serait alors le

mieux accept�e ? Quelle m�etaphore appliquer �a l'approche de communication et qui

permettrait d'�ecourter le temps d'apprentissage cot�e utilisateur ?

Nous proposons la m�etaphore du Rubik's cube comme moyen de communication

potentiel dans la navigation de photos num�eriques. Nous observons les modes de pr�e-

sentation visuelle et les techniques de manipulation du Rubik's cube pour d�evelopper

un navigateur d'images portable. Le Rubik's cube propose un mode de pr�esentation

simple permettant la mise en valeur du contenu pr�esent�e. La dimension « cubique »facilite par ailleurs la manipulation �a deux mains, avec une possibilit�e de rotation

complexe sur trois dimensions. Un design qui int�egrerait de telles caract�eristiques

se d�emarquerait des classiques interfaces WIMP. La section suivante pr�esente notre

premier mod�ele d'interaction, qui s'appuie sur notre connaissance des domaines as-

soci�es et nous am�ene �a r�e �echir sur les probl�ematiques associ�ees �a la navigation de

contenus photos dans un contexte de mobilit�e.

Figure 4.12 – Wooden brains(image extraite deneil.fraser.name)

Figure 4.13 – Search Cube(images extraites des r�esultats de recherche sur le mot-cl�e deXocial search-cube.com)

82

Figure 4.14 � Communication entre utilisateurs et contenus émotionnels

4.5 Proposition de design - Phora

Les appareils portables sont devenus le support universel des contenus numeriques,

tout particulierement des contenus personnels. Les appareils portables commerciaux

integrent differentes specifications selon l’ usage. Par exemple, un simple lecteur mp4

convient a des contenus audio ou photo, quand un appareil multifonctions (ex : te-

lephone) convient a des contenus multimedia. Le volume et la complexite des conte-

nus numeriques stockes sur appareil portable mettent a rude épreuve les interfaces

WIMP classiques. Chaque type de contenu personnel presente des caracteristiques

propres qui necessitent un modele d’ interaction specifique. Dans ce sens, afin d’ en-

richir l’ experience utilisateur, l’ interaction avec des contenus numeriques personnels

ne saurait suivre une approche unique.

Notre proposition de design s’ interesse a l’ interaction avec des contenus numeriques

personnels : les photos numeriques. Elle se presente comme une reflexion autour d’ un

modele d’ interaction qui integrerait presentation visuelle et manipulation tangible

et permettrait d’ identifier les problematiques liees a la navigation de contenus sur

portable. Avec le Rubik’ s cube comme point de depart, nous cherchons a definir un

modele d’ interaction sur appareil portable qui soit tres éloigne des classiques inter-

faces WIMP et dispositifs d’ entree de type souris/boutons. Ce modele est suppose

integrer l’ experience utilisateur acquise sur d’ autres taches du quotidien. L’ objectif :

proposer une interface plus intuitive afin d’ écourter le temps necessaire a la prise

en main d’ un nouveau dispositif. Voici donc Phora, proposition de design construite

autour du principe de reproduction des modes de manipulation du Rubik’ s cube.

83

Nous proposons trois commandes gestuelles auxquelles nous associons des modes

de pr�esentation visuelle permettant d'interagir avec des photos num�eriques sur ap-

pareils portables. Suite �a notre r�e exion sur l'�ecran circulaire (cf. chapitre 2), Phora

int�egre un �ecran circulaire pour deux raisons. Tout d'abord, cette forme permet

une exp�erience visuelle tout �a fait in�edite sur appareils portables. Ensuite, elle se

retrouve fr�equemment sur des taches de manipulation d'objets physiques.

Phora peut etre consid�er�e comme un navigateur personnel de photos permettant de

parcourir ses albums photos en ligne (service Internet) ou en local (contenus stock�es

sur l'appareil). Phora comprend un �ecran LCD tactile (cf. �g.4.15 A), un anneau

circulaire m�ecanique (cf. �g.4.15 B) et un cylindre r�etractable de type « longue-

vue » (cf. �g.4.15 C). L'objet fait 10 cm de diam�etre, son �ecran LCD 8,5 cm. Une

fois extraites, les photos sont visualis�ees sous forme de miniatures sur un bloc 4x4.

Les ux de photos sont pr�esent�es par couches et en perspective (cf. �g.4.15 E). Les

photos stock�ees sur Phora sont automatiquement pr�e-cat�egoris�ees, cat�egorisation

qui peut s'appuyer sur les balises provenant de services de partage en ligne tels que

Flickr. La premi�ere couche du bloc pr�esente les di��erentes cat�egories de photos.

Les photos de la cat�egorie s�electionn�ee sont pr�esent�ees automatiquement dans le

sens des aiguilles d'une montre �a partir du centre de l'�ecran. Seules les 16 premi�eres

photos sont pr�esent�ees sur la zone d'a�chage principal. Autrement dit, pour une

cat�egorie contenant plus de 16 photos, on doit passer �a la couche suivante pour

a�cher le reste des photos. Le num�ero de couche et la cat�egorie sont a�ch�es en

haut de l'�ecran. Dans notre exemple, nous visualisons la premi�ere couche de photos

(01) de la cat�egorie n°2 (C2) (cf. �g.4.15 D). L'ordre de pr�esentation des couches

prend en compte l'historique de navigation de l'utilisateur. L'appareil est �equip�e

d'une barre de d�e�lement circulaire qui entoure le bloc 4x4 (cf. �g.4.15 F).

Figure 4.15 – Description de Phora

84

Trois gestes de manipulation Le premier geste permet une navigation avant/arri�ere

des contenus. Nous avons mapp�e la m�etaphore de la rotation sur la barre circulaire.

Faire glisser la barre permet de faire d�e�ler les ux de photos vers l'avant ou vers

l'arri�ere (cf. �g.4.16, en haut). Le ux de photos est rafra�chi miniature par minia-

ture le long d'une spirale, ce qui permet de renforcer l'a�ordance entre le geste et

le mode de pr�esentation des photos. Le deuxi�eme geste s'inspire du m�ecanisme de

zoom sur appareil photo m�ecanique. La rotation de l'anneau circulaire permet de

zoomer/d�ezoomer sur l'image s�electionn�ee (cf. �g.4.16, au milieu). Le m�ecanisme

r�etractable de la longue-vue nous a amen�es �a d�evelopper un troisi�eme geste de mani-

pulation : pousser ou tirer le cylindre permet d'explorer rapidement les contenus, par

exemple �a la recherche de photos cibles (cf. �g.4.16 en bas, �g.4.17 A). Les modes

de navigation induits par le premier et le troisi�eme geste sont consid�er�es comme

des formes de RSVP manuelle dont la vitesse de navigation personnalis�ee o�re une

certaine souplesse dans l'exploration. Le premier geste permet la navigation conti-

nue parmi une petite quantit�e de photos issues d'une meme couche, tandis que le

troisi�eme permet la navigation discr�ete parmi un large volume de photos issues de

di��erentes couches. L'interface retravaill�ee (cf. �g.4.16 B) vise �a encourager la d�e-

couverte accidentelle de photos via un espace compl�ementaire situ�e autour du bloc

4x4. S'y a�chent al�eatoirement 16 images extraites de di��erentes cat�egories, images

qui vont jouer un role de raccourci et permettre d'acc�eder �a d'autres cat�egories de

photos sans avoir �a revenir sur la premi�ere couche.

Figure 4.16 – Geste de navigation avant/arri�ere (en haut). Geste permettantde zoomer (au milieu). Geste de navigation inter-couches (enbas).

85

Figure 4.17 – (A) Couches de photos. (B) A�chage a�n�e des photos.

Implementation du prototype

A�n de simuler l'interface visuelle pour discussion pr�eliminaire, nous avons proto-

typ�e Phora sous Adobe Flash (cf. �g.4.18). Phora �etant vou�e �a etre int�egr�e sur

�ecran tactile, le geste de manipulation de la barre circulaire de d�e�lement pose la

probl�ematique de couverture de l'�ecran [108]. Autrement dit, le doigt utilis�e pour

manipuler la barre risque de recouvrir l'�ecran et de gener la pr�esentation visuelle (cf.

�g.4.19). Nous avons donc d�ecid�e de retirer cette barre et de substituer au geste de

« glisser » qui lui �etait associ�e le geste de rotation. Nous retravaillons la structure

g�en�erale de l'interface. Le Tableau 4.3 liste les taches et gestes de manipulation as-

soci�es. Cinq taches op�erationnelles permettent de d�ecrire l'ensemble des fonctions

propos�ees par l'interface.

Les deux premi�eres taches concernent la pr�esentation des photos. Les utilisateurs

peuvent les faire d�e�ler une par une ou couche par couche, avec une certaine libert�e

dans le choix de la vitesse de pr�esentation. Les objectifs de la navigation di��erent

selon le mode de pr�esentation. Par exemple, parcourir les photos une �a une (retour

sur la photo pr�ec�edente, passage �a la suivante) permet aux utilisateurs d'appr�ecier

chaque photo en d�etail et de comparer les di��erentes photos. Parcourir les photos

couche par couche n'apporte pas exactement la meme satisfaction.

Cliquer sur l'�ecran tactile permet de s�electionner une photo, faire tourner l'anneau

circulaire permet ensuite de zoomer sur la photo s�electionn�ee. Cliquer �a nouveau

sur l'�ecran permet de revenir �a l'�ecran pr�ec�edent. La derni�ere fonction de l'interface

exploite l'espace situ�e autour du bloc carr�e (espace de visualisation des 16 photos).

L'id�ee est de proposer des raccourcis suppl�ementaires vers d'autres albums photos

ainsi qu'une navigation �a l'envie parmi les di��erents albums. L'objectif de cet espace

est d'encourager la navigation par s�erendipit�e. Les photos qui y sont pr�esent�ees sont

susceptibles de d�eclencher des indices �emotionnels sp�eci�ques chez l'utilisateur et

d'�evoquer chez lui le souvenir d'�ev�enements sp�eci�ques.

A�n de proc�eder �a l'�etude pr�eliminaire de Phora, nous avons d�evelopp�e un prototype

dont l'interface visuelle est simul�ee sous l'environnement Processing (cf. �g.4.20)

et l'interface physique est support�ee par le m�ecanisme de SpaceNavigator [133](cf.

86

�g.4.21, �a g.). Nous simulons ainsi deux gestes de manipulation : la rotation et

le tirer/pousser. Pour l'a�chage, aucun �ecran tactile circulaire n'�etant disponible

sur le march�e, nous avons du s�eparer rendu visuel et manipulation haptique. Nous

a�chons l'interface visuelle �a sa taille originale sur l'�ecran d'un PC portable. Un

touch pad (cf. �g.4.21, �a dr.) permet aux utilisateurs de « cliquer » directement

sur l'appareil.

Figure 4.18 – Simulation visuelle via Adobe Flash

Figure 4.19 – Probl�ematique de couverture de l'�ecran sur Phora

87

Tableau 4.3 – Interface retravaill�ee de Phora : fonctions et gestes de manipu-lation associ�es

Fonction Presentation visuelle Geste de manipulation associe

Presentation du contenu(photo par photo)

Passer �a la photo suivante / revenir �ala pr�ec�edente en faisant tourner l'anneaucirculaire (rotation de Spacenavigator)

Presentation du contenu(couche par couche)

Passer �a la couche suivante / revenir �ala couche pr�ec�edente en poussant ou entirant le cylindre (pousser / tirer Space-navigator)

Selection d’une photo Cliquer sur l'�ecran pour s�electionner unephoto

Zoom avant / arriere surla photo selectionnee

Zoomer sur une photo en faisant tournerl'anneau circulaire (rotation de Spacena-vigator) et cliquer �a nouveau sur la photopour revenir �a la pr�esentation des conte-nus.

Espace supplementaired’affichage des photos

Les espaces A, B et C a�chent des imagesincompl�etes qui sont des raccourcis versd'autres cat�egories de photos.

88

Figure 4.20 – Interface visuelle simul�ee sous Processing.

Figure 4.21 – M�ecanisme de SpaceNavigator (�a g.), touch pad (�a dr.)

89

4.6 Evaluation du design

Introduction du plan de test

Dans notre �etude utilisateur, nous proposons des techniques de visualisation et d'in-

teraction non conventionnelles permettant d'interagir avec des photos num�eriques

sur un appareil portable avec �ecran circulaire (Phora). Notre objectif : sur des taches

simulant di��erents sc�enarii d'usage quotidien, observer les comportements de navi-

gation et de manipulation associ�es �a notre mod�ele de visualisation. La description

du plan de test nous permet de d�e�nir les di��erents points qui seront abord�es et

de d�etailler l'�evaluation et ses di��erentes �etapes (mise en place, enregistrement des

donn�ees, rapport �nal). Ce plan permet de mettre en place un environnement de test

complet et de guider les participants dans l'accomplissement du processus, tache

par tache. L'�evaluation de Phora inclut les points suivants :

1. Appr�ecier l'e�cacit�e des deux gestes sur des albums photos de di��erentes

tailles.

2. Observer un mod�ele de comportement utilisateur via les taches de navigation

photo.

3. Estimer le degr�e de satisfaction des participants vis-�a-vis de l'interface propo-

s�ee.

Approche d’evaluation

L'�evaluation est organis�ee autour de trois taches que les utilisateurs sont invit�es �a

mener sur deux albums de taille di��erente. L'objectif est de comparer et d'analyser

les r�esultats sur di��erents crit�eres et via un questionnaire.

Description des trois taches sans limite de temps (cf. Tableau 4.4)

1. Tache de navigation de recherche (d'une cible pr�ecise)

2. Tache de navigation mixte (recherche d'une cible pr�ecise ou impr�ecise / d'une

cible appr�eci�ee)

3. Tache de navigation fortuite (recherche d'une cible impr�ecise / appr�eci�ee)

Description des deux tailles d’album :

La taille de l'album photo pouvant a�ecter la recherche de photos, nous d�ecidons

d'arranger deux albums de taille di��erente a�n d'appr�ecier l'e�cacit�e des gestes

propos�es. La taille des albums photos personnels utilis�es pour des �evaluations de

navigateurs d'images (cf. Tableau 4.5), varie entre 100 et 3500. N�eanmoins, �a l'ex-

ception d'Harada et al. [51], ces navigateurs sont tous pr�evus pour une utilisation

de bureau, pas pour une utilisation sur des appareils portables.

Notre �evaluation portant sur les appareils portables, nous avons souhait�e d�e�nir deux

tailles d'albums permettant de simuler la navigation photo sur ce type d'appareil.

Nous avons men�e une �etude aupr�es de 45 propri�etaires de camera phones et leur

avons demand�e combien de photos ils y stockaient. Nous avons obtenu un nombre

moyen de 221. Au vu de ce r�esultat et des �etudes d�ecrites au Tableau 4.5, nous avons

d�e�ni la taille du premier album : 300 photos minimum, qui seront fournies par le

participant. Le deuxi�eme album en contiendra 1000 : les 300 photos du participant

seront m�elang�ees avec 700 photos qu'il ne conna�t pas et appartenant �a l'un de ses

amis. On suppose que cet album « m�elang�e » contiendra certains indices qui lui

donneront envie de parcourir ces photos inconnues, le facteur « r�eseau social » en

quelque sorte.

90

Tableau 4.4 – Trois types de taches et r�eactions potentielles des participants

Tache Reaction des participants

Navigation de re-cherche

Les participants sont invit�es�a retrouver une photo sur labase d'un exemple qui leurest pr�esent�e.

Les participants scannent visuelle-ment les contenus �a la recherchede la cible.

Navigation fortuite Les participants sont invi-t�es �a choisir plusieurs pho-tos de fa�con al�eatoire et �a« raconter » celles-ci. (nar-ration des photos)

Les participants parcourent lescontenus sans id�ee pr�ecise de cequ'ils recherchent.

Navigation mixte Dans un premier temps,les participants sont invit�es�a retrouver une photo surla base d'un exemple quileur est pr�esent�e.Dans undeuxi�eme temps, les partici-pants sont invit�es �a choisirdes photos en particulier et�a les raconter.

Cette tache a pour objectif de si-muler une situation de d�ecouverteaccidentelle.

1. Taille d'album 1 : abum personnel du participant (300 photos distribu�ees

al�eatoirement)

2. Taille d'album 2 : album personnel du participant + album personnel d'un

ami (1000 photos distribu�ees al�eatoirement)

Nous d�e�nissons par ailleurs trois modes de manipulation qui nous permettent d'ob-

server comment la manipulation s'e�ectue. Ces modes sont les suivants :

1. Seul le geste de rotation est activ�e (mode RG, Rotation Gesture)

2. Seul le geste de tirer/pousser est activ�e (mode PG, Pulling/Pressing Gesture)

3. Les deux gestes sont activ�es (mode RPG)

Pour l'album de 300 photos, notre hypoth�ese concernant l'e�cacit�e de ces di��erents

modes est la suivante : mode RG > mode RPG > mode PG. Pour l'album de 1000

photos, notre hypoth�ese est : mode RPG > mode PG > mode RG. La proc�edure

g�en�erale d'�evaluation comprend cinq �etapes. Lors de la premi�ere �etape, le participant

est accueilli et une introduction �a l'�evaluation lui est propos�ee. Lors de la deuxi�eme

�etape, avant de passer aux taches formelles, l'utilisateur « s'�echau�e » sur l'appareil

et fait part de ses premi�eres impressions. Lors de la troisi�eme �etape, le participant

ex�ecute une s�erie de taches sur l'album de 300 photos en utilisant di��erents modes

de manipulation. Ce meme proc�ed�e est r�ep�et�e en quatri�eme �etape, cette fois-ci sur

l'album de 1000 photos. Les participants sont interview�es entre chaque album et

font part de leurs suggestions. Cette �evaluation s'ach�eve sur un entretien global.

Entre chaque �etape, nous marquons une pause de cinq minutes. La mise en place

de l'environnement est illustr�ee en �g.4.22.

91

Figure 4.22 – Mise en place de l'environnement d'�evaluation

92

Tableau 4.5 – Panorama des �etudes de navigateurs d'images

Etude Sujets Taches impliquees Usage/photos Taille ducorpus

Platt et al. [67] 8 Rechercher un �echantillon photo via trois interfaces Bureau Imagespersonnelles

850 images enmoyenne

Graham et al.[50]

12 �Evaluation de deux interfaces via cinq taches. T1 : Retrou-ver une image donn�ee parmi 1000 images en cinq minutes.T2 : Retrouver une image donn�ee parmi 3500 images en2 minutes 30 secondes. T3 : Retrouver des images sur labase de 10 descriptions textuelles en trois minutes. T4 :Retrouver une image similaire �a celle montr�ee en exemple,parmi des images issues d'une meme p�eriode (un mois), encinq minutes. T5 : Retrouver des images sur la base de 10descriptions textuelles en cinq minutes.

Bureau Imagespersonnelles

850 images onaverage

Chang et al.[134]

15 Rechercher une image sur la base d'une description verbale Bureau pein-tures

Non pr�ecis�e

Demontiset al. [94]

15 Rechercher une image via les di��erentes interfaces propos�ees Bureau Imagesprofession-nelles

Deux corpusde 300 photoschacun

Harada et al.[51]

17 Tache 1 : Retrouver un �echantillon photo dans l'al-bum.Tache 2 : Choisir la photo que l'on pr�ef�ere.

Mobile Imagesprofession-nelles

Album photopr�epar�e par leparticipant :1200 imagesen moyenne

Christmannand Carbonell[135]

17 ex-perts

Tache 1 : Retrouver une image sur un ensemble de crit�eres.Tache 2 : Retrouver une photo famili�ere.

Bureau Imagesprofession-nelles

869 photos

Hilliges et al.[82]

20 Taches dans un cadre de narration et de partage de photosT1 : Cat�egoriser les photos. T2 : Parcourir les photos etchoisir une photo repr�esentative d'une cat�egorie. T3 : Choi-sir une photo �a partager avec un ami. T4 : Choisir quatrephotos �a utiliser en fond d'�ecran

Bureau Imagespersonnelles

Album photopr�epar�e par leparticipant 80-100 photos

Combs andBederson [85]

30 Comparer quatre navigateurs sur trois groupes d'images.Choisir un premier navigateur. T1 : Trouver une image �aenvoyer �a un ami (pas de limite de temps). T2 : Retrouverquatre images parmi les trois groupes d'images. Choisir unautre navigateur et l'utiliser sur un seul groupe d'images.Tache 1 : Retrouver quatre images parmi les trois groupesd'images.

Bureau Imagesprofession-nelles

Trois corpus de25, 75 et 225images

Yee et al. [136] 32 T1 : Retrouver des images int�eressantes en trois minutes.T2 : Regrouper des images sur le th�eme des beaux arts (en11-14 minutes). T3 : Comparer les images obtenues en T2et r�ediger un texte �a ce sujet en dix minutes. T4 : Retrouverdes images int�eressantes en cinq minutes.

Bureau ImagesBeaux Arts

35000 photos

Cooper et al.[1]

40 T1 : Retrouver une image cible apr�es l'avoir regard�ee pen-dant deux secondes. T2 : Retrouver une image cible sur labase d'une description verbale d�etaill�ee. T3 : Retrouver uneimage cible sur la base d'une description par mots-cl�es.

Bureau (po-tentiellementapplicationmobile)Images �avocationprofessionnelle

200 photos

Porta [95] Inconnu Tache 1 : Retrouver un maximum de photos sur di��erentsth�emes en trois minutes. Tache 2 : Retrouver quatre imagescorrespondant �a un th�eme en particulier (sur trois th�emesau total).

Bureau Images�a vocation pro-fessionnelle

400 photos

Rodden et al.[60]

Inconnu Deux groupes de participants r�ep�etent la meme tache enutilisant trois techniques de visualisation di��erentes. Tache :Lire une description de 200 mots puis choisir trois photosparmi 100.

Bureau Images�a vocation pro-fessionnelle

Quatre th�emesphoto, chacuncomprenant100 images

93

4.7 Resultat de l’evaluation

Avant de mener l'�evaluation o�cielle, nous avons men�e deux �etudes pilotes a�n

d'�eprouver la proc�edure d'�evaluation. Lors de l'�evaluation formelle, nous avons in-

vit�e six participants ag�es de 20 �a 30 ans �a �evaluer Phora. La dur�ee moyenne de

l'�evaluation a �et�e d'une heure et demie. Les participants poss�edent au moins un ap-

pareil permettant de prendre, visualiser ou parcourir des photos num�eriques (camera

phone, appareil photo ou cadre num�erique). La plupart prennent des photos num�e-

riques au moins une fois par mois, et le PC de bureau est le moyen qu'il privil�egient

pour stocker leurs albums photos. De ce fait, la plupart des participants conserve

moins de 500 photos sur appareil portable, �a l'exception d'une participante qui avait

conserv�e plus de 1000 photos sur son t�el�ephone. Les participants indiquent que, le

plus souvent, ils parcourent les photos num�eriques stock�ees sur leur portable dans

le but de montrer un clich�e �a une tierce personne.

Les participants consid�erent les services Internet pour photos num�eriques comme

une option suppl�ementaire dans le stockage de leurs contenus photos personnels, ou

comme une plate-forme permettant de partager leurs photos avec leur r�eseau social.

La plupart d'entre eux poss�edent au moins un compte sur un service conventionnel

tel que Flickr, Picasa ou Facebook.

Leur premi�ere impression sur Phora est g�en�eralement neutre. S'ils trouvent les in-

dices visuels fournis par l'interface faciles �a comprendre, ils sont l�eg�erement contra-

ri�es par la trop forte sensibilit�e de l'appareil. La manipulation �a deux mains fatigue

certains, qui intervertissent alors leurs mains entre prise de l'appareil et manipulation

de l'interface. Les participants trouvent Phora de taille trop grande, ce qui pourrait

entra�ner une fatigue musculaire sur un usage long terme. Un participant trouve

la manipulation haptique int�eressante et tr�es di��erente de la manipulation tactile

classique, notamment de par le contact physique fort dans le controle du dispositif.

Resultats obtenus sur differentes tailles d’albums

Au total, chaque participant ex�ecute trois taches (recherche, navigation, navigation

mixte) dans chacun des trois modes de manipulation (RG, PG, RPG) sur deux

albums de taille di��erente. Aucune limite de temps n'�etant impos�ee, les participants

sont libres mais n�eanmoins inform�es qu'ils peuvent abandonner la tache s'ils la jugent

trop di�cile ou frustrante. Sur les 108 taches men�ees par les six participants, huit ont

�et�e abandonn�ees en cours de route. Un des participants a abandonn�e quatre taches.

Les taches abandonn�ees en cours de route sont toutes des taches de recherche

d'une photo cible via di��erents modes de manipulation et sur di��erentes tailles

d'album. Nous avons remarqu�e que les taches associ�ees �a une meme cible sont

susceptibles d'�echouer quand le participant ne parvient pas �a accomplir la toute

premi�ere tache impliquant ladite cible. Une situation int�eressante s'est pr�esent�ee

avec une participante : apr�es avoir abandonn�e, elle a retrouv�e par hasard la photo

cible lors de l'ex�ecution d'une autre tache.

Le temps moyen consacr�e aux trois taches est illustr�e en �g.4.23, �g.4.24 and

�g.4.25. Le temps consacr�e aux di��erentes taches est indiqu�e pour les trois modes

de manipulation. Sa dur�ee augmente sensiblement avec la taille de l'album qui est

parcouru. Selon notre hypoth�ese (RG>RPG>PG>), sur l'album de 300 photos,

nous supposons que le geste de rotation sera le plus e�cace de par sa pr�ecision

dans la pr�esentation des photos, et que le geste de manipulation « libre » (RPG)

94

sera juste un peu plus e�cace que celui de tirer/pousser (PG). Par ailleurs, nous

supposons que le mode RPG sera de loin le plus performant sur l'album de 1000

photos (hypoth�ese RPG>RG>PG)

Les r�esultats illustr�es �g.4.23 viennent n�eanmoins r�efuter ces deux hypoth�eses. Les

modes RPG et PG sont tous deux plus e�caces que le mode RG. Le mode RPG

est plus souple puisqu'il permet aux participants de passer librement d'un mode

de manipulation �a l'autre en cours de tache. Bien que le mode RG permette une

manipulation plus stable que le mode PG, son mode de pr�esentation (photo par

photo) fait que la recherche de photos prend tout de meme un certain temps. Un

�el�ement int�eressant est obtenu lors de la discussion avec les participants. Bien que

ceux-ci disent pr�ef�erer le mode RG sur les taches de recherche a�n de ne manquer

aucune photo, ce mode n�ecessite de scanner les d�etails, ce qui allonge sensiblement

la dur�ee d'accomplissement de la tache.

Le temps consacr�e aux taches de navigation parmi les photos est li�e d'une part

au niveau de narration des participants et, d'autre part, �a la profondeur �a laquelle

ils explorent les contenus. Certains participants vont passer �a la couche suivante

de photos pour choisir un clich�e quand d'autres choisiront des photos issues d'une

seule et meme couche. Bien que le r�esultat (cf. �g.4.24) n'indique qu'une di��erence

mineure entre les trois modes de manipulation, la pr�ef�erence des participants va au

mode PG, qui o�re selon eux davantage de souplesse dans la navigation. Passer

d'une page �a l'autre avec ce mode de navigation faciliterait l'exploration de conte-

nus cons�equents, particuli�erement lorsque l'on ne recherche pas de photo pr�ecise.

Les participants indiquent �egalement trouver ce mode de navigation visuellement

int�eressant car v�ehiculant une id�ee de jeu qui leur permet d'appr�ecier leurs albums.

Comme illustr�e la �g.4.25, le temps pass�e sur les taches de navigation mixte est plus

cons�equent que sur d'autres taches. Fait surprenant : lorsque les participants doivent

ex�ecuter �a la fois des taches de navigation et des taches de recherche, l'allongement

du temps d'ex�ecution n'est pas imputable �a une tache en particulier mais est du

indi��eremment aux deux taches impliqu�ees.

Discussion autour de chaque mode de manipulation

Le questionnaire qui suit la discussion indique un ressenti positif quant �a la navi-

gation, que notre interface faciliterait. Mais le ressenti est n�egatif sur les taches de

recherche de photos. De par la forte sensibilit�e de Phora, les participants trouvent

di�cile de controler la pr�esentation des photos et se sentent d�esorient�es durant la

navigation.

D'entr�ee de jeu, le mode RG recueille la pr�ef�erence des participants. Nous nous

sommes donc int�eress�es �a la fa�con dont les participants changent de mode de ma-

nipulation en cours de tache. Le �chier journal enregistr�e sous l'environnement

Processing indique que, pour toute tache ex�ecut�ee en mode RPG, la strat�egie des

participants est de choisir d'abord le mode RG puis, si celui-ci ne leur permet pas

d'accomplir la tache, de se replier sur le mode PG. Parmi les 36 taches ex�ecut�ees

en mode RPG, seulement trois ont �et�e ex�ecut�ees en mode PG seul, contre 11 pour

le mode RG seul.

De plus, concernant la probl�ematique de la sensibilit�e de manipulation, nous avons

identi��e certains comportements utilisateurs int�eressants adapt�es au dispositif. De

par la sensibilit�e du mat�eriel, les participants trouvent la manipulation par tirer/pousser

95

plus d�elicate que celle par rotation. L'usage formel de Phora est illustr�e en �g.4.16 :

une main tient l'appareil, l'autre le manipule �a plusieurs doigts. Dans les faits, a�n

de ne pas appuyer trop fort, les participants n'utilisent qu'un seul doigt qui vient

taper l�eg�erement sur le cylindre (cf. �g.4.26, en haut). Ils vont �egalement tenir l'ap-

pareil et venir taper sur la table avec le cylindre, ou encore taper le cylindre avec la

paume de leur main. Cela leur permet de n'appuyer qu'une seule fois sur le cylindre

et pas en continu (cf. �g.4.26, en bas).

Un usage similaire se retrouve sur le mode RG. Certains participants placent l'ap-

pareil �a la verticale de fa�con �a pouvoir le faire tourner plus facilement (cf. �g.4.27,

�a g.). Une participante va jusqu'�a retourner l'appareil, ce qui correspond en fait au

mode de fonctionnement de SpaceNavigator, qu'elle n'a pourtant jamais vu aupa-

ravant (cf. �g.4.27, �a dr.). En g�en�eral, ces comportements utilisateurs peuvent etre

dus au fait que l'a�chage est d�ecorr�ell�e de l'appareil, les participants consid�erant

probablement Phora comme un simple p�eriph�erique d'entr�ee plutot qu'un dispositif

int�egr�e.

Presentation visuelle et manipulation

La plupart des participants trouvent le couple pr�esentation visuelle + geste de ma-

nipulation assez logique et facile �a comprendre. Toutefois, ils regrettent que la

pr�esentation circulaire associ�ee au mode RG ne leur permette pas de savoir « o�u

ils se trouvent ». Autrement dit, leur impression g�en�erale est que s'ils voient bien

que les photos sont en mouvement, ils ne savent pas dire avec exactitude quelle

photo est apparue en dernier. Une solution serait d'appliquer des e�ets visuels �a la

photo la plus r�ecemment apparue (cadre color�e ou sur�el�evation). Les participants

font �egalement remarquer que Phora ne permet pas de parcourir l'album photo par

photo en mode plein �ecran. Ils sugg�erent de personnaliser le nombre de vignettes

pr�esent�ees �a l'�ecran selon le contexte d'utilisation (4x4, 3x3 ou 2x2).

96

Figure 4.23 – Temps moyen consacr�e aux taches de recherche, selon le modede manipulation

Figure 4.24 – Temps moyen consacr�e aux taches de navigation, selon le modede manipulation

Figure 4.25 – Temps moyen consacr�e aux taches de navigation mixte, selon lemode de manipulation

97

(a) Taper du doigt

(b) Taper de la paume

Figure 4.26 � Comportement utilisateur adapte au mode PG

(a) Tourner (b) Rouler

Figure 4.27 � Comportement utilisateur adapte au mode RG

98

4.8 Conclusion

Le pr�esent chapitre adresse la probl�ematique de la manipulation gestuelle sur ap-

pareil portable lors de la navigation de photos. Nous cherchons �a comprendre le

fonctionnement des mains sur des taches quotidiennes ainsi que la manipulation

de photos papier sur di��erents usages. Avec pour point de d�epart la m�etaphore du

Rubik's cube, nous proposons un mod�ele d'interaction avec manipulation haptique

sur appareil portable.

Si leurs capacit�es de calcul ont augment�e, les appareils portables n'en restent pas

moins physiquement limit�es. Ex�ecuter des taches d'ordre professionnel sur un por-

table demeure une exp�erience d�elicate. Sur portable, une activit�e �a l'origine diver-

tissante peut devenir d�esagr�eable si pratiqu�ee trop longtemps. Ainsi, si regarder un

clip vid�eo sur son portable est somme toute assez agr�eable, le divertissement fait

place �a l'agacement si le �lm dure deux heures. Les appareils portables proposent

un mod�ele d'usage fr�equent et d'une dur�ee limit�ee. Sur son portable, on va regar-

der quelques photos ou �ecouter sa playlist mp3. Autrement dit, le portable est une

plateforme qui permet d'appr�ecier ses contenus personnels dans le cadre d'un usage

occasionnel.

Les appareils portables sont la plateforme par excellence pour appr�ecier ses contenus

personnels. Lorsque l'on visualise quelque chose que l'on tient entre ses mains, ce

quelque chose devient pr�ecieux. Lorsqu'elle est pr�esent�ee dans son �ecrin (le petit

�ecran du portable), la photo devient une sorte de bijou qui capte l'attention de

l'utilisateur. Certains collectionneurs de joyaux gardent toujours sur eux leurs plus

belles pi�eces, qu'ils exhibent autour d'eux. Ils vont les faire briller a�n d'observer

leurs belles couleurs sous di��erentes lumi�eres et r�ep�eter ce rituel jour apr�es jour,

ce qui leur apporte une satisfaction �emotionnelle et ach�eve de les convaincre qu'ils

poss�edent bel et bien un tr�esor exceptionnel. Pour appr�ecier au mieux ses photos

num�eriques personnelles sur portable, pourquoi ne pas suivre une approche analogue

�a celle du collectionneur ? En induisant davantage de divertissement, on devrait

pouvoir d�eclencher les signaux �emotionnels v�ehicul�es par les photos. L'int�egration de

m�ecanismes de jeu aux modes de navigation photos classiques permettrait d'obtenir

une visualisation agr�eable ainsi qu'un mode d'interaction riche. Avec le Rubik's cube,

nous introduisons la m�etaphore du jeu qui nous permet d'int�egrer le Casual InfoVis

�a notre proposition de mod�ele d'interaction. Bien que les performances du mod�ele

d'interaction propos�e sur Phora n'aient pas forc�ement convaincu les participants,

les r�esultats de l'�evaluation sont positifs en ce qu'ils nous permettent de poursuivre

notre r�e exion sur un mod�ele d'interaction plus pertinent.

99

100

Chapitre 5

Meta-categorisation des

photos numeriques

Le pr�esent chapitre s'appuie sur l'article « Phorigami : A photo browser based on

meta-categorization and origami visualization » publi�e lors de la conf�erence HCI

International 2009.

TLe pr�esent chapitre propose une interface centr�ee sur l'utilisateur dont l'objectif

est de faciliter l'organisation des contenus photos personnels. Notre approche s'ins-

pire de l'exp�erience quotidienne des utilisateurs dans la prise de photos. En fonction

de la situation, le photographe va prendre di��erents types de prises de vue. Sur ce

constat, notre m�eta cat�egorisation s'int�eresse �a la relation qu'il existe entre mouve-

ment de l'appareil et mouvement de la cible. Cette approche de cat�egorisation peut

etre adopt�ee dans le cadre de di��erentes technologies de reconnaissance, existantes

ou futures. Nous avons men�e deux exp�eriences qui nous ont permis d'�evaluer la

pertinence de notre approche. Sur la base de cette m�eta-cat�egorisation, notre m�eta

interface applique di��erentes techniques d'interaction en cons�equence. Nous d�ecri-

vons le mappage m�etaphorique que nous avons �etabli entre les six m�eta-cat�egories

propos�ees et l'art de l'origami. Nous nous sommes pour cela appuy�es sur des mo-

d�eles papier, avec di��erents niveaux de pliage. Nous pr�esentons les premiers retours

utilisateur en �n de chapitre.

101

5.1 Problematique de la gestion des photos nume-

riques

Nous sommes en pleine explosion num�erique. Entre les appareils de capture d'image,

les �equipements de stockage et les di��erents services Web, organiser nos contenus

photos est devenu indispensable. La tr�es forte augmentation des contenus photos

num�eriques en ligne (Flickr, Google Picasa) ou sur PC a donn�e naissance �a un « trou

noir » du point de vue de leur gestion. Cette croissance des contenus num�eriques

a mis �a rude �epreuve les traditionnelles interfaces WIMP de gestion. Organiser les

contenus num�eriques par cat�egories ou par th�emes est une fa�con �evidente de r�e-

duire ou de �ltrer le ux d'information pr�esent�e aux utilisateurs. La cat�egorisation

a posteriori via des techniques d'analyse du contenu appara�t quant �a elle comme

une approche tr�es prometteuse, dans la mesure o�u la production des m�etadonn�ees

s'est av�er�ee chronophage et ine�cace sur des applications grand public. Comme l'a

d�ecrit Rodden [60] , pour faciliter la navigation parmi les photos, une interface doit

int�egrer des techniques de gestion automatique. Dans ce sens, certaines techniques

comme par exemple le regroupement automatique ont �et�e largement int�egr�ees aux

outils syst�eme. Ces techniques utilisent les m�etadonn�ees fournies par l'appareil pour

appliquer di��erentes strat�egies de regroupement photo. Rodden and Wood [12] ap-

pliquent une analyse bas niveau du contenu dans le regroupement des images par

similitude. Pour une meilleure e�cacit�e de navigation, l'utilisateur doit n�eanmoins

savoir avec pr�ecision ce qu'il recherche. PhotoTOC [67] int�egre un regroupement

bas�e sur l'information chronologique et sur le contenu, qui lui permet d'organiser

automatiquement les photos num�eriques en fonction des �ev�enements qui leur sont

associ�es. Cette �etude indique des r�esultats positifs concernant l'utilisation de tech-

niques d'organisation automatique dans la gestion de contenus photos num�eriques.

Foto�le [36] et EasyAlbum [76] utilisent quant �a eux une technique d'analyse du

contenu et des annotations pour g�erer les photos par reconnaissance faciale. Pour

les photos num�eriques d�esordonn�ees, Scha�alitzky and Zisserman [63] analysent le

contenu des images et �etablissent un point de vue relatif qui sera utilis�e dans le

regroupement. Jaimes et al. [61] adressent quant �a eux la probl�ematique de la d�e-

tection des photos quasiment identiques dans les contenus photos personnels. Ils

proposent une analyse bas�ee sur le contenu et, a�n d'�evaluer les performances de

leur algorithme, conduisent une exp�erience de classement manuel. Ils ne proposent

n�eanmoins aucune interface concr�ete. �A ce jour, si les outils classiques de gestion

propos�es �a l'utilisateur �nal int�egrent des techniques de regroupement automa-

tique, ils ne permettent n�eanmoins d'adresser la demande que dans une situation

bien sp�eci�que. La pertinence de ces situations sp�eci�ques dans le cas des contenus

photos de « Mr Tout-le-monde » est un th�eme rarement �etudi�e de fa�con aboutie.

Les photoware bas�es sur des techniques d'analyse du contenu sont surtout orient�es

r�esultats : leurs modes de visualisation et leurs techniques d'interaction s'appuient

toujours sur une interface WIMP classique [44]. Pour ces outils d'InfoVis, les inter-

faces WIMP pr�esentent certaines faiblesses : leurs techniques de visualisation sont

limit�ees, �xes, et donc potentiellement insu�santes dans la navigation de contenus

photographiques cons�equents. Certaines interfaces exp�erimentales telles que Pho-

toMesa [29], Photo tourism [64], Face Bubble [59] et le travail de Porta [95] ont

tent�e de pallier cet inconv�enient en int�egrant des techniques non conventionnelles de

visualisation et d'interaction �a un navigateur photo. Les techniques de visualisation

et d'interaction d�edi�ees �a un usage sp�eci�que sont quant �a elles toujours en cours

d'�etude.

102

5.2 Objectif de l’etude

L'inconv�enient des �etudes actuelles sur les techniques automatiques de cat�egorisa-

tion est qu'elles ne proposent pas d'interface int�egr�ee qui permettrait d'adresser la

diversit�e des photos au quotidien. En r�eponse, le pr�esent chapitre introduit Phori-

gami, navigateur photo bas�e sur la m�eta cat�egorisation et la visualisation origami.

Cette approche de cat�egorisation peut etre adopt�ee dans le cadre de di��erentes

technologies de reconnaissance, existantes ou futures. Phorigami a pour objectif

non pas une simple approche de cat�egorisation dans la gestion des photos, mais

plutot la caract�erisation des di��erents contextes photos �a partir de cette meme

cat�egorisation. L'art de l'origami permet un mappage s�emantique entre technique

de visualisation et technique d'interaction. A�n d'�evaluer la pertinence de notre

m�ethode, nous avons men�e deux exp�eriences bas�ees sur des taches de classement

manuel. Nous pr�esenterons dans ses grandes lignes notre m�eta interface qui permet

d'appliquer di��erentes techniques d'interaction et de visualisation origami selon le

contexte de chaque groupe photo.

5.3 Elements de meta-categorisation

Modes de prise de vue des appareils photos numeriques

Avec un appareil photo m�ecanique, pour controler la qualit�e photo sur di��erentes

sc�enes, le photographe doit ma�triser certains param�etres essentiels tels que l'ouver-

ture de l'objectif, la longueur focale ou le temps d'exposition. Les progr�es des appa-

reils num�eriques ont grandement simpli��e le r�eglage de ces param�etres. Amateurs et

novices peuvent d�esormais prendre des photos le plus simplement du monde. Cette

facilit�e d'utilisation passe tout d'abord par l'automatisation de certaines fonctions

de capture d'image. En e�et, les appareils photos num�eriques actuels proposent

davantage de fonctions adapt�ees �a chaque sc�ene et qui permettent de satisfaire dif-

f�erents sc�enarii. Les modes automatiques de prise de vue dans les appareils photos

actuels varient selon le fabricant et les sp�eci�cations des di��erentes s�eries. L'Olym-

pus SP-590UZ [137] propose par exemple 19 modes de prise de vue di��erents, quand

le Kodak Easyshare Z980 [138] en int�egre 10. Un autre exemple est le cameraphone

K800i de Sony Ericsson [139], dont l'interface permet de s�electionner �a la fois un

mode de prise de vue et un type de sc�ene en particulier (cf. �g.5.1). L'utilisateur

a le choix entre quatre modes de capture : Normal, BestPic, Panorama et Frame

(Cadre) et six types de sc�enes : Auto, Twilight Landscape (paysage de nuit), Twi-

light portrait (portrait de nuit), Beach/Snow (plage/neige), Sport et Document.

L'int�egration de fonctions de prise de vue automatique entra�ne une « cat�egorisa-

tion » automatique des photos num�eriques dans di��erents contextes et scenarii de

prise de vue. Il est int�eressant de noter que, si les recherches vont vers une utilisa-

tion accrue des m�etadonn�ees fournies par l'appareil dans la recherche des photos,

aucune interface ne s'int�eresse �a l'utilisation de ces m�etadonn�ees dans la gestion des

photos. D'apr�es nous, les m�etadonn�ees relatives aux modes de prise de vue peuvent

etre d'une grande utilit�e dans la gestion des photos num�eriques, puisqu'elles peuvent

contribuer �a la cat�egorisation automatique des di��erents scenarii de prise de vue.

103

Le point de vue du photographe

Le mode de prise de vue qui est choisi repr�esente l'intention du photographe, ce qui

peut ouvrir certaines pistes dans la gestion des photos num�eriques. Selon la situation,

le photographe va prendre di��erents types de photos qui seront tout autant de m�eta-

cat�egories. Comme l'ont montr�e les m�ethodes de recherche adopt�ees par Rodden and

Wood [12], Malone [140], Marshall and Bly [141], observer les modes quotidiens de

manipulation des donn�ees num�eriques permet de dessiner des approches potentielles

dans la gestion de ces donn�ees.

Dans la pratique quotidienne de la photo, que l'aspect num�erique de celle-ci a�ecte

ou non notre comportement, on a tendance �a photographier un batiment de di��e-

rents points de vue, a�n d'en capturer une vue d'ensemble. On prend par ailleurs

plusieurs clich�es successifs d'un objet en mouvement, a�n de capturer chaque mo-

ment de l'action. �A l'occasion d'une r�eunion de famille, les photos de groupe ont

valeur d'objet souvenir, puisqu'elles permettent de se rem�emorer les personnes et les

histoires. En fonction de ces di��erents usages, la fa�con dont le photographe prend

un clich�e indique �a quel type de photo on a a�aire.

Les trois cercles en �g.5.2 illustrent le contexte de la prise de vue. Le cercle int�e-

rieur repr�esente la motivation du photographe (cercle 1) d�eclench�ee par des cibles

sp�eci�ques dans son environnement (cercle 2), cibles qui peuvent etre �xes ou en

mouvement, selon la situation. A�n de di�user plus largement le contexte de la

prise de vue, les photos sont d�ecrites soit par le photographe lui-meme, soit par des

personnes invit�ees �a participer (cercle 3). Le but est de restituer le contexte original

du clich�e. Une meme photo peut etre « racont�ee » de di��erents points de vue, �a

di��erents moments.

Figure 5.1 – Interface du cameraphone K800i : s�election du mode de prise devue (Shooting Mode, SM) et du type de sc�ene (Scene Selection,SS).

Figure 5.2 – Contextes de la prise de vue : contexte du point de vue (1),contexte environnemental (2) et contexte narratif (3).

104

5.4 Definition des six categories

Nous supposons que l'approche propos�ee pourra etre int�egr�ee par l'�etat de l'art, dans

les algorithmes bas�es sur l'analyse du contenu de l'image ainsi que les m�etadonn�ees

fournies par l'appareil. Sur la base des �el�ements fournis par les modes de prise de vue

automatiques, nous analysons la prise de vue selon deux param�etres : d�eplacement

de l'appareil et statut des cibles (statiques et en mouvement).

Une id�ee similaire a �et�e propos�ee dans la d�etection de photos quasiment identiques.

L'approche de Jaimes et al. [61] v�eri�e les di��erences entre les images selon trois

�el�ements : la sc�ene (�eclairage et arri�ere-plan), l'appareil (statut de l'exposition et

du point de vue) et l'image (contenu visuel). Compar�e �a l'approche propos�ee par

Jaimes, notre point de vue est centr�e sur l'utilisateur. Le but est d'�etudier la s�e-

mantique des photos (sc�ene et objets) via une analyse de la relation entre ce qui

est photographi�e (la sc�ene) et qui photographie (l'appareil/le photographe), a�n

de restituer le contexte de la prise de vue. Nous �evitons ainsi une approche syn-

taxique des photos qui s'int�eresserait �a l'analyse de leur contenu visuel (couleur,

luminosit�e, etc.). Par ailleurs, si les m�etadonn�ees fournies par l'appareil sont juste

suppos�ees enregistrer des mesures relatives aux di��erents modes de prise de vue,

l'analyse syntaxique, elle, doit �egalement permettre le regroupement des photos.

Une comparaison des deux approches est propos�ee dans le tableau 5.1.

Nous avons ajout�e une troisi�eme dimension, le « groupe » , qui permet de caract�eri-

ser les cibles dans une situation sp�eci�que et de prendre en consid�eration l'exp�erience

utilisateur dans la prise de photos de groupe. Le tableau 5.2 pr�esente la r�epartition

des param�etres et dimensions associ�ees.

Tableau 5.1 – Comparaison des deux approches.

�El�ement/Type d'approche Approche deJaimes et al.

Notre approche

Scene �Eclairage, d�eplace-ment des cibles etarri�ere-plan

D�eplacement descibles et arri�ere-plan

Appareil photo Exposition, point devue

Point de vue.

Image (description visuelle) Bruit, luminosit�e,couleur

-

Tableau 5.2 – Mouvement de l'appareil photo et des cibles.

Cible du photographe/Appareil Fixe En mouvement

Fixe

En mouvement

Groupes (remplacement du su-jet)

105

Tableau 3.4.2, nous cr�eons six cat�egories de photos A, B, C, D, E et F qui sont

d�ecrites avec les scenarii associ�es au tableau 5.3. Le sc�enario de la cat�egorie A cor-

respond �a un point de vue statique simple : chaque photo pr�esente un objet statique

di��erent, tous les objets provenant d'un seul et meme environnement. Par exemple,

l'utilisateur photographie di��erentes ıuvres d'art au cours d'une exposition. Le sc�e-

nario « multivues » de la cat�egorie B d�ecrit comment le photographe change de

position a�n de photographier chaque face d'un objet statique, typiquement un ba-

timent. Des exemples de cat�egorie A et B sont pr�esent�es en �g.5.3. Les cat�egories

C et D ont quant �a elles pour sc�enario la capture de mouvement : le photographe

prend plusieurs clich�es d'un objet en mouvement. La di��erence entre ces deux cat�e-

gories tient au statut de l'appareil photo. Un exemple de cat�egorie C est propos�e en

�g.5.4 : le photographe reste immobile et photographie des pi�etons, en vue a�erienne.

En cat�egorie D, le photographe d�eplace son appareil a�n de suivre un objet en mou-

vement. Dans le meme ordre d'id�ees, les cat�egories E et F concernent les photos

de groupe lors de r�eunions. Si la cat�egorie E se rapporte aux photos de groupes

statiques, la cat�egorie F concerne les remplacements de sujet[61] ou les l�eg�eres dif-

f�erences de mouvement. Par ailleurs, les clich�es doubles ou multiples d'une meme

cible posent probl�eme dans la gestion des contenus photographiques[61]. Dans notre

cat�egorisation, ces clich�es doubles d'un meme contexte pourront etre rang�es sous la

cat�egorie B, C, D ou F, l'intention du photographe �etant tout simplement de r�eussir

le « meilleur » clich�e.

Tableau 5.3 – Cat�egories, contextes et techniques d'interaction associ�es.

Categorie Intention du photo-graphe

Contexte Technique d’in-teraction

Vue statique simple Panorama Pr�esentation Pa-noramique

Vues multiples

Capture de mouvement Action Pr�esentationPhoto Anim�ee

Capture de mouvement

Groupes Lien social Pr�esentationpli�ee

Groupes en mouvement etremplacement du sujet

106

Figure 5.3 – Type A : Vue statique simple (�a g.), Type B : vues multiples (�adr.).

Figure 5.4 – Type C : Capture de mouvement avec appareil �xe (�a g.), TypeD : Capture de mouvement avec appareil en mouvement (�a dr.).

Figure 5.5 – TType E : Groupes (�a g.), Type F : Groupes en mouvement (�adr.)

5.5 Evaluation de la meta-categorisation

Objectif et procedure

A�n d'�etudier la pertinence de notre m�eta-cat�egorisation sur des contenus photos

personnels, nous avons men�e deux exp�eriences incluant des taches de classement

manuel. Ces r�esultats pr�eliminaires seront utilis�es comme r�ef�erence dans l'impl�e-

mentation de notre m�eta-interface. L'objectif de la premi�ere exp�erience (E1) est de

d�ecouvrir combien de photos peuvent etre class�ees en utilisant notre m�ethode. Les

photos proviennent de di��erentes collections personnelles. Notre hypoth�ese sur E1

�etait que notre m�ethode de cat�egorisation permettait d'obtenir un taux de clas-

sement de 50 % pour chaque collection photo. Nous avons men�e une deuxi�eme

exp�erience (E2) a�n d'�etudier l'impact des variations de jugement personnel sur le

classement des photos. En E2, 10 participants sont invit�es �a utiliser notre m�ethode

pour classer le contenu d'un meme album photo. L'objectif de cette exp�erience

est non seulement d'obtenir le taux d'erreur moyen (taux de variation) du classe-

ment manuel, mais �egalement d'observer comment les sujets ex�ecutent les taches

en termes de jugement personnel �a l'�egard de contenus photos qui leur sont incon-

nus (cf. tableau 5.4). Les �echantillons de contenus photographiques sont fournis

sur la base du volontariat, le crit�ere �etant de collecter les albums photos de « Mr.

Tout-le-monde » aupr�es de photographes novices et amateurs. Notre collection ras-

semble vingt albums photos personnels appartenant �a 10 photographes hommes et

femmes, d'un age compris entre 24 et 34 ans. Les pro�ls des participants : �etudiants

�a l'universit�e, jeunes enseignants en lyc�ee, personnel administratif en universit�e, in-

g�enieurs, assistants marketing, hotesses de l'air et stewarts. Les collections photos

vont de 1149 �a 14297 photos num�eriques (cf. �g.5.6). Pour r�eduire la taille des

�echantillons photos, nous avons choisi les photos selon l'ordre chronologique des

albums, pour aboutir �a un �echantillon d'environ 1000 photos. La collection �nale

ainsi obtenue �a partir des contributions des 20 volontaires contient entre 973 et

1333 photos.

107

Tableau 5.4 – R�esum�e des deux exp�eriences.

Exp�erience Objectif Nombre departicipants

Nombre d'al-bums photosobserv�es

E1 Taux de classementsuperieur a 50%

1 20

E2 Verification du tauxde variation

10 1

Figure 5.6 – R�epartition de la taille des albums photos entre les 20 participants.

Figure 5.7 – Taches de classement manuel sur photos imprim�ees.

108

Nos exp�eriences s'appuient sur des taches de classement manuel. Les participants

sont invit�es �a grouper les photos selon notre m�ethode, en les cerclant de di��erentes

couleurs (cf. �g.5.7). En E1, les participants ont class�e manuellement 20 collections

photos personnelles, �a raison de deux collections par jour, et de deux heures de

temps par collection. En E2, nous avons choisi un �echantillon de 973 photos et

invit�e 10 volontaires �a le classer manuellement. Avant chaque tache de classement,

nous expliquons notre m�ethode de cat�egorisation aux participants. Une copie papier

du tableau 5.2 leur est fournie pour chaque tache. Les volontaires sont des �etu-

diants rennais en Master, dont aucun n'est li�e aux propri�etaires de notre collection

d'�echantillons. La dur�ee de la tache de classement en E2 est �egalement de deux

heures environ.

Les participants n'�etant pas les auteurs des photos qu'ils classent manuellement,

nous avons �egalement men�e une tache que nous avons appel�ee « choix des photos

pr�ef�er�ees » . L'objectif est de d�eterminer quels sont les indices visuels qui retiennent

l'attention des participants lorsqu'ils parcourent rapidement un album photo qui ne

leur est pas familier . �A l'issue de cette tache, chaque participant s�electionne ses 10

photos pr�ef�er�ees.

109

5.6 Resultats de l� évaluation

T�ache de classement Les resultats de chaque experience sont presentes sur des

diagrammes circulaires et sequentiels. Fig.5.8, les diagrammes circulaires montrent

la repartition des differents types de photos. La categorie G, en noir, correspond aux

photos non classees. Le taux de classement en E1 est de 57% (dev std= 7,9%). En

E2, le taux de classement est de 83% (dev std = 1,3%). Ces resultats confirment

notre hypothese : notre meta-categorisation permet bien de classer plus de 50%

des photos de « Mr Tout-le-monde » . La fig.5.9 presente les resultats de E1 sur

20 albums photos. Le jugement personnel affecte les taches de classement, ce qui

explique que le taux de classement soit plus éleve en E2 qu’ en E1. Une autre raison

a ce taux plus éleve est que deux des participants ont consciencieusement classe

l’ ensemble des photos.

Figure 5.8 � Repartition des types de photos en E1 et E2.

Figure 5.9 � Repartition detaillee des resultats en E1.(Axe vertical : taux de classement pour chaque participant ; axehorizontal : participants).

110

En g�en�eral, quand il n'est pas possible d'associer leurs di��erents contextes, les par-

ticipants ne r�eussissent pas �a classer les photos, particuli�erement si elles ne suivent

pas d'ordre chronologique. Par ailleurs, quand une seule photo se rapporte �a une

sc�ene donn�ee, le classement ne peut etre e�ectu�e.

A�n d'�etudier les di��erences de classement entre les participants, nous avons appli-

qu�e une m�ethode de permutation matricielle [142]. L'objectif : analyser le classement

�etabli par les di��erents participants via des diagrammes s�equentiels (voir �g.5.10).

L'axe horizontal du diagramme en �g.5.10 correspond au nombre de photos (de 1

�a 973), l'axe vertical aux participants. La permutation matricielle permet de r�eor-

ganiser les participants sur l'axe vertical a�n de faire �emerger certaines coh�erences

dans les r�esultats �etablis par les participants. Nous n'avons pas r�eorganis�e l'axe ho-

rizontal, a�n de pouvoir conserver les contextes photos par cat�egorie au sein de

l'album. Le diagramme original est illustr�e �g.5.10, quatre zones de coh�erence des

r�esultats �etant s�electionn�ees et illustr�ees �g.5.12. Le diagramme r�eorganis�e, dont

nous discuterons les conclusions, est quant �a lui illustr�e �g.5.13.

Diagrammes originaux : conclusions�A la lecture des diagrammes originaux pr�esentant les classements �etablis par 10 par-

ticipants, on distingue trois cat�egories de r�esultats : r�esultats coh�erents, r�esultats

relatifs et r�esultats constrast�es. Tout d'abord, il appara�t que le nombre de cat�e-

gories est li�e �a la vari�et�e des contenus photos, c'est-�a-dire que plus la collection

pr�esente de th�emes, plus on a de cat�egories. Pour les zones de coh�erence des r�e-

sultats W, X, Y et Z en �g.5.12, les contextes photos laissent deviner des th�emes

plus concrets que d'autres, ce qui explique qu'il y ait une plus grande coh�erence

dans les classements �etablis. Les zones W, X et Y pr�esentent des r�esultats relatifs.

Prenons par exemple la zone W : la plupart des photos ont �et�e class�ees en cat�egorie

F (Groupe en mouvement), une petite partie en cat�egorie E (Groupe). De fa�con

�evidente, le contexte photo de la zone W est per�cu comme des « personnes au

sein d'un groupe », mais la condition des objets dans la photo (en mouvement

Figure 5.10 – Vue globale des diagrammes de 10 participants �a E2.

Figure 5.11 – Vue globale des diagrammes de 10 participants �a E2, sur la basedes trois contextes principaux (panorama, capture de mouve-ment, groupe).

ou statique) ne fait pas l'unanimit�e. En ce qui concerne les r�esultats contrast�es de

111

la zone X, certains participants classent les photos en cat�egorie B (vues multiples)

quand la majorit�e d'entre eux choisit la Z (capture de mouvement). Un tel contraste

peut etre du �a une erreur de leur part ou �a une variation de leur jugement subjectif.

Fig.5.11, nous pr�esentons �egalement des diagrammes bas�es sur les trois contextes

principaux : panorama (en bleu), capture de mouvement (en rouge) et groupe (en

violet).

Diagrammes reorganises : conclusions

Nous avons r�eorganis�e les 10 diagrammes a�n de faire �emerger une certaine co-

h�erence dans les r�esultats ainsi que des mod�eles de classement. Notre premi�ere

conclusion est que la fr�equence des photos non class�ees est plus �elev�ee sur les 120

premi�eres photos (cf. �g.5.13, zone A). Les participants sont encore au stade de

l'�echau�ement dans leur approche de classement ou consid�erent, en l'absence d'un

lien �evident entre les di��erents th�emes des photos, qu'ils ne peuvent pas classer

celles-ci. Par ailleurs, les 120 premi�eres photos pr�esentent une grande vari�et�e de

th�emes, ce qui peut surcharger les participants et a�ecter leur prise de d�ecision.

Les participants n'�etant pas les auteurs des photos, ils tentent d'en reconstruire le

contexte en s'inspirant de leurs propres exp�eriences visuelles. Ceux qui n'�eprouvent

pas d'�emotion vis-�a-vis du contexte des photos les classent sur simple analyse vi-

suelle de leur contenu. C'est typiquement l'approche que suivent les algorithmes

informatiques d'analyse des images. Un des participants a d�eclar�e qu'il lui �etait bien

plus facile de classer les photos s'il s'�etait lui-meme d�ej�a trouv�e dans une situation

semblable �a celle du photographe. En g�en�eral, la subjectivit�e a�ecte les d�ecisions

des participants, selon que les contextes photos d�eclenchent ou non chez eux des

signaux �emotionnels. Par ailleurs, les r�esultats indiquent que certains participants

ont des di�cult�es �a d�etecter un mouvement simultan�e de l'appareil et de la cible, et

ne prennent en compte qu'un seul �el�ement au cours de leurs taches de classement.

Nous pr�esentons 11 diagrammes, chacun r�eorganis�e d'une fa�con di��erente (�g.5.13

�a �g.5.20), a�n de d�egager 11 sections parmi les r�esultats. Fig.5.13, de par la grande

diversit�e des th�emes photos en zone A, il est di�cile d'obtenir une zone bien d�e�nie

et �etendue de r�esultats coh�erents. On obtient par contre plusieurs petites zones de

cat�egorie D (en jaune, capture de mouvement). Globalement, le r�esultat pour la

zone B en Fig.5.13 est un contexte de capture de mouvement, avec des di��erences

selon le statut de l'appareil photo. Lorsque la photo est prise avec un appareil en

mouvement, elle est class�ee en cat�egorie D (en jaune), mais lorsque l'appareil est

�xe et qu'il capture une cible en mouvement, la photo est class�ee en C (en rouge).

La �g.5.14 pr�esente les r�esultats partiels de classement de la 200�eme �a la 400�eme

photo environ. Compar�e �a d'autres sections, les zones C et D pr�esentent une coh�e-

rence moindre dans leurs r�esultats. La plupart des photos de la zone C sont dans

un contexte « Photo de groupe »(cat�egories E et F), tandis qu'un autre r�esultat

contrast�e concerne la partie de la cat�egorie D o�u l'appareil et la cible sont consid�er�es

comme �etant tous deux en mouvement. Nous revenons aux �echantillons photos a�n

de comprendre pourquoi ils ont �et�e class�es en D ou F. Il s'av�ere que les participants

retiennent di��erents crit�eres pour les photos qui pr�esentent des sujets multiples, no-

tamment la prise de conscience vis-�a-vis de l'appareil photo au moment de la prise.

Les photos class�ees en cat�egorie F pr�esentent des sujets en mouvement qui regardent

le photographe. Celles class�ees en D pr�esentent des sujets qui ignorent qu'on est en

train de les photographier. L'exemple �g.5.15 montre plusieurs enfants en train de

danser, sans un regard pour le photographe. Ce clich�e serait probablement class�e

en F, l'attention des sujets n'�etant pas �eveill�ee.

112

Figure 5.12 – Diagrammes originaux : Zones W, X, Y et Z de coh�erence desr�esultats

Figure 5.13 – Diagramme r�eorganis�e pour les zones A (haut) et B (bas) dansl'ordre 1 et 2.

Figure 5.14 – Diagramme r�eorganis�e a�n de d�egager les zones C (haut) et D(bas) dans l'ordre 3 et 4.

113

La zone D en �g.5.14 pr�esente encore moins de r�esultats coh�erents, les participants

�etant juste tomb�es d'accord sur une petite partie des photos qu'ils ont class�ee en

cat�egorie F. Un �el�ement int�eressant : les participants 1 et 2 sur la zone D. S'ils ont

tous deux choisi des cat�egories compl�etement di��erentes, leur taux de classement est

�a peu pr�es identique. S'ils sont tous deux capables de distinguer di��erents contextes

photos, ils n'en ont clairement pas la meme d�e�nition.

Nous avons r�eorganis�e les r�esultats des zones A et B de la �g.5.13 a�n d'obtenir

un r�esultat plus parlant (cf. �g.5.16). �A la lecture du diagramme, la plupart des

photos de la zone E ont clairement �et�e class�ees en cat�egorie F (Photo de groupe, en

mouvement), et une petite partie l'a �et�e en cat�egorie E (Photo de groupe, statique).

De fa�con �evidente, les participants ne tombent pas d'accord sur le statut des sujets

pr�esents sur les photos. Les photos 400 �a 520 environ pr�esentent di��erentes sc�enes

impliquant un groupe de jeunes danseurs. Ces di��erentes poses, discontinues (cf.

�g.5.17), permettent de tester les participants sur leur capacit�e �a d�eterminer si les

danseurs sont ou non en mouvement. Par ailleurs, la zone F pr�esente davantage de

r�esultats coh�erents en cat�egorie B (panoramique, en mouvement) et D (capture de

mouvement, en mouvement). Si les deux cat�egories indiquent un contexte d'appareil

en mouvement, le statut des cibles di��ere. Les photos de la zone D montrent une

touriste femme posant devant di��erents monuments en Italie. La di�cult�e avec

ces photos est que les participants doivent v�eri�er non seulement la pose mais

�egalement l'arri�ere-plan a�n de d�eterminer un �eventuel changement. Les participants

qui classent ces clich�es en cat�egorie B consid�erent que l'ensemble des monuments

visit�es constitue en fait une seule et meme sc�ene et que seul l'appareil photo se

d�eplace. Quant �a ceux qui les classent en D, ils consid�erent que l'appareil et la cible

se d�eplacent tous deux.

En zone G (cf. �g.5.18), une moiti�e des participants a retenu que les sujets �etaient

en mouvement. Mais, pour une autre moiti�e, c'est le contexte de groupe qui a �et�e

retenu. Nous revenons aux �echantillons photos et d�ecouvrons que les participants

3 et 9 ont class�e l'ensemble des photos de la zone en cat�egorie E et F. Le parti-

cipant 5 cr�ee quant �a lui la surprise, puisqu'il les a class�ees en cat�egorie A, « Vue

simple statique ». En zone H, le contexte exprim�e est surtout celui d'une « photo de

groupe »(mariage, c�er�emonie de remise des diplomes), ce qui explique que les parti-

cipants aient class�e la plupart des photos en cat�egorie E ou F. La zone I en �g.5.19

r�ev�ele quant �a elle un r�esultat contrast�e, avec une pr�epond�erance de la cat�egorie A

et des photos non class�ees. Les photos de cette zone repr�esentent di��erentes sc�enes

au sein d'un hall d'exposition. Si la moiti�e des photos n'a pas �et�e class�ee, c'est

parce que certains participants n'arrivent pas �a penser les di��erents arri�ere-plans

comme �etant la repr�esentation partielle d'un seul et meme environnement : le hall

d'exposition. Autrement dit, ils ne comprennent pas su�samment le contexte de

la photo, surtout quand ils n'en sont pas les auteurs. La zone J, assez r�eduite, est

quant �a elle r�epartie moiti�e-moiti�e entre la cat�egorie E et la F. Cela indique une

di��erence de jugement parmi les participants vis-�a-vis du statut « en mouvement »d'un groupe.

En �g.5.20, pour les zones K et L (les deux derni�eres), les classements �etablis sont

�a peu de choses pr�es identiques : la plupart des photos y ont �et�e class�ees soit

en cat�egorie D, soit en B. Si le contexte est clairement celui d'un « appareil en

mouvement », les r�esultats semblent tout de meme indiquer que les participants

ont une certaine di�cult�e �a di��erencier cible en mouvement et cible statique.

114

Figure 5.15 – Sujets d'une photo ayant conscience (�a g.) ou non (�a dr.) del'appareil photo.

Figure 5.16 – Diagrammes r�eorganis�es a�n de d�egager les zones E (haut) et F(bas) dans l'ordre 5 et 6.

Figure 5.17 – Poses discontinues.

115

Pour r�esumer, notre approche de cat�egorisation s'int�eresse au statut de l'appareil

par rapport �a la cible et vice versa. Cela nous permet de d�egager certains contextes

photos et d'adopter un point de vue di��erent de celui des syst�emes de gestion photo.

Nous invitons les participants �a mener des taches de classement sur des contenus

photos qui leur sont inconnus. Puisque qu'ils ne sont pas les auteurs des clich�es, les

participants s'appuient sur des indices et �el�ements de comparaison dans l'analyse des

contenus visuels. Cette approche est typiquement celle qu'adoptent les algorithmes

d'analyse du contenu des images. La premi�ere exp�erience (E1) vient con�rmer notre

approche, l'application d'une permutation matricielle permettant ensuite de r�eor-

ganiser les diagrammes et d'�etudier les variations entre les participants. Dans ce

type de classement manuel, si certaines erreurs et une certaine part de subjectivit�e

dans le jugement sont in�evitables, notre id�ee est surtout de soumettre une vision

susceptible d'inspirer les syst�emes futurs.

D�e�nir le contexte d'une photo est encore plus di�cile quand on n'en est pas l'au-

teur. Une photo donn�ee peut meme traduire di��erents messages au �l du temps

qui passe. Le contexte est une information complexe qui embarrasse les participants

lors du classement manuel des photos. Comme le pr�evoit notre approche de cat�ego-

risation, les photos sont class�ees selon le statut de l'appareil et de la cible. En r�egle

g�en�erale, les participants distinguent le statut de l'appareil ou de la cible de deux

fa�cons : l'analyse d'un point de vue micro ou macro. Par exemple, pour conna�tre

le statut d'une cible, les participants vont observer des photos pr�esentant un chan-

gement continu et en d�eduire des indices �evidents. Ils obtiennent dans ce cas le

contexte photo correspondant d'un point de vue micro. Cependant, dans certaines

situations, une cible en mouvement n'est captur�ee qu'�a des intervalles de temps

assez �eloign�es les uns des autres. Dans ce cas, si les participants �etablissent une

transition visuelle �a partir de ces clich�es, ils obtiennent le contexte photo correspon-

dant d'un point de vue macro (cf. �g.5.21).

Pour conna�tre le statut de l'appareil photo, les participants adoptent une approche

similaire. Ces deux fa�cons de faire sont mises �a mal s'il faut analyser simultan�ement

statut de la cible et statut de l'appareil. Il manque aux participants certaines infor-

mations qui leur permettraient de d�e�nir qui de la cible ou de l'appareil se d�eplace.

Cela explique pourquoi, dans de nombreuses occasions, les photos ont �et�e class�ees

dans un contexte identique mais dans des cat�egories di��erentes. La solution pourrait

r�esider dans les m�etadonn�ees. Les techniques actuelles exploitent tr�es largement les

m�etadonn�ees fournies par les appareils photos, et les utilisateurs peuvent �egalement

baliser manuellement ou automatiquement leurs clich�es. �A l'avenir, avec un peu de

chance, un syst�eme s'appuyant �a la fois sur ces m�etadonn�ees et sur des algorithmes

d'analyse s�emantique permettra de r�esoudre les di�cult�es mentionn�ees dans nos

conclusions.

116

Figure 5.18 – Digrammes r�eorganis�es a�n de d�egager les zones G (haut) et H(bas) dans l'ordre 7 et 8.

Figure 5.19 – Diagrammes r�eorganis�es a�n de d�egager les zones I (haut) et J(bas) dans l'ordre 9 et 10.

Figure 5.20 – Diagramme r�eorganis�e a�n de d�egager les zones K (�a g.) et L (�adr.) dans l'ordre 11.

117

Conclusions sur l’attraction visuelle des photos preferees

En plus des deux exp�eriences pr�ec�edentes, chaque participant est invit�e �a s�election-

ner ses 10 photos pr�ef�er�ees dans notre collection. Nous avons recueilli les r�esultats

et �etabli un tableau de pr�ef�erence (cf. tableau 5.5) pour 10 participants. Les parti-

cipants sont list�es dans la colonne de gauche et la premi�ere ligne, num�erot�ee de 1 �a

10, correspond au nombre de photos pr�ef�er�ees. Aucun ordre de pr�ef�erence n'est �eta-

bli entre les photos s�electionn�ees. Dans la colonne de droite, on indique �egalement

combien de photos chaque participant a en commun avec d'autres. Nous invitons

ensuite les participants �a expliquer leur choix. Bien qu'ils indiquent avoir choisi les

photos pour des raisons esth�etiques ou parce qu'elles �evoquaient chez eux des sou-

venirs de voyages ou des moments agr�eables, il appara�t que certaines photos ont

�et�e choisies pour leur originalit�e compar�e aux clich�es voisins. Par exemple, la photo

d'une paire de chaussures se d�etache des autres photos de par son contexte tr�es

di��erent. Meme chose pour une photo de eurs : elle attirera l'attention si entour�ee

de photos de voyages. Les quatre photos les plus appr�eci�ees des participants sont

pr�esent�ees �g.5.22 dans leur contexte original.

Que les photos de la �g.5.22 soient ou non dans le d�esordre, l'id�ee est que, durant

la navigation de contenus photos inconnus, les caract�eristiques visuelles de certaines

photos peuvent attirer notre attention. Lorsque l'on parcourt de fa�con r�ep�et�ee ses

propres contenus photos, la probabilit�e d'y faire des d�ecouvertes int�eressantes s'en

trouve r�eduite. Dans le chapitre pr�ec�edent, nous avons abord�e la notion de d�efami-

liarisation vis-�a-vis de contenus familiers. Nous avons montr�e qu'il �etait possible de

reconstruire l'exp�erience visuelle vis-�a-vis de ces contenus en �etablissant par exemple

un ordre al�eatoire dans leur visualisation ou en changeant leur mode de pr�esenta-

tion. Cette d�efamiliarisation pourrait amener les utilisateurs �a appr�ecier davantage

leurs propres photos, en leur faisant adopter un point de vue radicalement nouveau.

Tableau 5.5 – Pr�ef�erences photos de 10 participants.

118

Figure 5.21 – Photos d'une cible en mouvement d'un point de vue macro (haut)et micro (bas). La transition visuelle est n�ecessaire pour com-prendre le contexte des photos pr�esent�ees.

Figure 5.22 – R�epartition des photos pr�ef�er�ees.

Figure 5.23 – Contexte original des quatre photos les plus appr�eci�ees : chaus-sures (�a g.), eurs (milieu, haut), hall (milieu, bas) et enfant (�adr.).

119

5.7 Meta-interface basee sur la visualisation origami

Dans notre exploration des mappages m�etaphoriques pertinents pour nos techniques

d'interaction, nous avons suivi deux directions : l'exp�erience d'interaction humaine

avec des documents papier et l'art de l'origami. Dans la navigation de contenus

photos cons�equents, l'utilisateur doit avoir non seulement une vue g�en�erale de l'en-

semble du contenu, mais �egalement pleinement conscience des informations relatives

�a chaque cat�egorie. Si l'a�chage vignettes classique o�re une vue g�en�erale durant la

navigation de contenus cons�equents, il est n�eanmoins gourmand en espace et peut

entra�ner une surcharge visuelle. Notre approche a pour objectif de caract�eriser le

contexte photo via l'application de notre mod�ele de cat�egorisation. On suppose que

chaque contexte photo est pr�esent�e via une technique de visualisation sp�eci�que.

Cette technique doit pr�esenter, d'une part, les capacit�es visuelles permettant de re-

pr�esenter le contexte photo via le mappage m�etaphorique adapt�e, et, d'autre part,

les capacit�es d'interaction indispensables �a une interface intuitive.

Le principe de la technique de pliage dans l'art de l'origami est la reconstruction d'un

objet par le biais d'une pr�esentation minimaliste. La technique de pliage se retrouve

aussi bien dans de simples objets du quotidien que dans des pr�esentations artistiques

pouss�ees. La brochure est l'un de ses usages pratiques au quotidien (cf. �g.5.24).

Les r�egles de pliage origami ont �et�e appliqu�ees dans la r�esolution de probl�ematiques

d'ing�enierie, de design industriel ou encore dans certains travaux scienti�ques [143].

Certains produits int�egrent ces techniques de pliage, comme par exemple le Rovi

Liquid media guide lanc�e en 2009 [144](cf. �g.5.26) ou encore le Nokia Scentsory,

concept de t�el�ephone mobile d�evoil�e en 2008 [145](cf. �g.5.25). La technique de

pliage int�egr�ee �a l'interface du Rovi Liquid media guide permet une pr�esentation

continue des programmes TV et contenus multim�edia. Quant au concept Nokia

Scentsory, son objectif est d'optimiser la mobilit�e de l'appareil par un m�ecanisme

de pliage int�egr�e �a une interface utilisateur novatrice. Les �etudes labo ont tout

d'abord appliqu�e la technique de pliage �a la visualisation focus + contexte dans le

cadre d'un Perspective Wall [87]. Une technique de pliage simple a ainsi permis de

mieux caract�eriser l'information d'int�eret. Dans le meme ordre d'id�ees, la technique

de pliage a �et�e propos�ee en « m�elange »[88] pour l'interaction multi-focus dans un

syst�eme d'InfoVis complexe.

Pour un usage dans un navigateur d'images, le m�ecanisme de pliage pourrait per-

mettre de minimiser l'espace n�ecessaire �a la visualisation d'un contenu photo cons�e-

quent. Sur cette id�ee, nous sommes partis de mod�eles papier avec photos imprim�ees.

L'objectif de ce mod�ele de pliage est d'�etudier le rendu de la pr�esentation « en pli »pour des photos. Notre objectif : un prototypage rapide sur mod�eles papier qui

permette d'identi�er le mappage m�etaphorique appropri�e entre technique de pliage

et mode de visualisation, selon le contexte photo. La �g.5.27 pr�esente certaines

id�ees de pliage que nous avons explor�ees. Nous imprimons recto/verso un carr�e de

4x4 photos sur deux th�emes (chat + voyages). Cette technique de pliage permet

de d�ecouvrir les photos �a partir du centre de l'objet, pr�esentation m�etaphorique de

l'�eclosion d'un bourgeon.

Nous avons �elabor�e un autre mod�ele qui minimise l'objet par des techniques de

pliage permettant de d�eployer verticalement les photos. Mod�ele vierge et mod�ele

imprim�e sont pr�esent�es en �g.5.28. Deux �el�ements permettent d'expliquer pourquoi

les photos« pli�ees » sont distordues et moins visibles.

120

Figure 5.24 – Types des brochures di��erentes

Figure 5.25 – Scentsory-Nokia, concept de t�el�ephone mobile int�egrant des tech-niques de pliage.(image extraite dewww.tuvie.com)

Figure 5.26 – L'interface du Rovi Liquid media guide lanc�e en 2009.(image extraite denews.cnet.com)

121

Primo, il peut y avoir un con it entre le nombre de vignettes photos et la complexit�e

du mod�ele de pliage. Secondo, la technique de pliage peut ne pas convenir aux

caract�eristiques du contenu. Bien que les photos pr�esent�ees soient rattach�ees au

meme th�eme, leur contenu visuel ne permet pas vraiment de les associer les unes

aux autres. Notre m�eta-interface int�egrera une version simpli��ee de ce mod�ele de

pliage dans la pr�esentation d'une s�erie de photos.

Un autre essai de mod�ele de pliage papier est pr�esent�e �g.5.29. La technique de

pliage est libre, et la surface du papier a �et�e enti�erement pli�ee. C'est pr�ecis�ement �a

cette grande libert�e de pliage que l'on doit l'�echec de ce mod�ele, qui n'�etait adapt�e

�a aucune cat�egorie de photos.

La cat�egorie « capture de mouvement » indique le contexte de l'action. Dans le

cadre d'une interaction qui serait centr�ee sur l'utilisateur, la meilleure solution pour

parcourir des photos de cette cat�egorie est de les faire d�e�ler sous la forme d'une

pellicule cin�ematographique. La vue « pellicule » est int�egr�ee �a de nombreux lo-

giciels, notamment audiovisuels. Une premi�ere fenetre de navigation permet de

parcourir les photos, l'int�egralit�e du contenu �etant pr�esent�ee d'une fa�con lin�eaire

dans une deuxi�eme fenetre, sous forme de pellicule. Cette technique pr�esente n�ean-

moins quelques inconv�enients, puisqu'elle n�ecessite d'avoir su�samment d'espace

pour a�cher deux fenetres. Nous sommes remont�es aux origines de la projection de

s�equences anim�ees. Un des premiers appareils est le Zoopraxiscope, cr�e�e en 1879

par Eadweard Muybridge [146] (cf. �g.5.30). Les images sont imprim�ees sur un

disque de verre qui assure la fonction d'une bande vid�eo. Pour notre m�eta-interface,

cette pr�esentation en rond pourrait s'av�erer trop gourmande en espace. Nous retien-

drons donc un autre mode de pr�esentation pour les images anim�ees. Dans l'esprit

des id�ees d�evelopp�ees plus haut, notre interface, Phorigami, int�egre trois modes de

visualisation origami qui sont : pli accord�eon, Rolodex et pli simple (cf. �g.5.31).

Pour les photos de cat�egorie A et B, nous utilisons une technique de pliage en accor-

d�eon. On compresse l'espace occup�e par les photos panoramiques, celles-ci pouvant

etre a�ch�ees dans leur int�egralit�e si �etir�ees �a l'horizontale. Pour les images en mou-

vement de cat�egorie C et D, le m�ecanisme consid�er�e doit permettre de les manipuler

comme une animation GIF. Certaines techniques pourraient convenir, comme par

exemple la RSVP, qui permet de pr�esenter les images �a une vitesse sp�eci�que. Tou-

tefois, comme discut�e au chapitre pr�ec�edent, cette vitesse de pr�esentation est �xe

et pas adapt�ee �a certains contextes, o�u elle risque de freiner la navigation. C'est

pourquoi nous proposons une technique Rolodex « manuelle » qui permet �a l'uti-

lisateur de d�e�nir sa vitesse de navigation de fa�con �a restituer le sc�enario original

par le biais de photos en mouvement. Par ailleurs, nous simpli�ons et am�eliorons le

carr�e de 4x4 pr�ec�edemment abord�e. Les photos de cat�egorie E et F sont quant �a

elles visualis�ees sous la forme d'une pile de jetons.

Il est bon de noter que, lorsqu'ils sont pli�es, tous les mod�eles de pr�esentation (except�e

le pliage accord�eon) tiennent dans un petit carr�e de la taille d'une vignette. La

pr�esentation en pile de jetons et le Rolodex o�rent un aper�cu compr�ehensible pour

l'utilisateur, grace �a la vignette et �a la forme de pr�esentation choisie. La pr�esentation

en accord�eon n'o�re quant �a elle pas d'aper�cu compr�ehensible, puisque le contenu

est pli�e. Pour pallier ce probl�eme, lorsqu'elle est pli�ee, sa taille est deux fois sup�erieure

�a celle des autres modes de pr�esentation. On r�ev�ele ainsi davantage de messages,

pour une meilleure compr�ehension du contenu photo.

Nous avons d�evelopp�e notre prototype d'interface avec l'environnement Processing,

122

Figure 5.27 – Prototypage rapide sur pliage papier. Non-pli�e (�a g.), �a moiti�epli�e (au milieu) et pli�e (�a dr.).

Figure 5.28 – Etat pli�e et d�epli�e de deux mod�eles de pliage papier : mod�elevierge (en haut) et mod�ele imprim�e (en bas).

Figure 5.29 – Mod�ele de pliage papier libre

123

Figure 5.30 – Le Zoopraxiscope de Muybridge expos�e au Kingston Museum.

a�n de stimuler la visualisation et les techniques d'interaction associ�ees. On suppose

que les trois mod�eles de visualisation int�egrent une technologie tactile qui permet

d'am�eliorer la manipulation d'objets virtuels. Comme illustr�e 5.31, les utilisateurs

peuvent interagir avec les trois mod�eles de pr�esentation Phorigami par di��erentes

gestes tactiles. Ils peuvent par exemple, du bout du doigt, faire cliquer-glisser l'objet

virtuel ou faire d�e�ler les photos sur le Rolodex. La �g.5.32 est un exemple de

visualisation Phorigami sur 561 photos (provenant d'une moiti�e des �echantillons

utilis�es en E2). L'espace �ecran utilis�e par Phorigami est plus de trois fois inf�erieur �a

celui qu'aurait n�ecessit�e une interface vignettes classique. Le mode de pr�esentation

Phorigami pour des albums photos o�re en g�en�eral une visualisation plus riche, ce qui

permet �a la fois d'avoir une certaine conscience vis-�a-vis du contenu et d'�economiser

de l'espace.

Ce prototype a �et�e pr�esent�e de fa�con informelle dans le but d'obtenir un premier

retour utilisateur. En g�en�eral, les utilisateurs con�rment qu'il existe une certaine

coh�erence entre la cat�egorie photo et la technique de visualisation qui est pr�esent�ee.

La pr�esentation en accord�eon et le Rolodex les impressionnent davantage que la

pr�esentation en pile de jetons. Le souci est que, lorsque le contenu de toutes les

photos est pli�e, toutes les photos, qu'elles soient class�ees ou non, se retrouvent

au meme niveau. L'id�ee de d�esordre qui en d�ecoule est telle que les trois modes

de visualisation propos�es sont compl�etement �eclips�es. Davantage d'e�ets visuels

pourraient permettre de recti�er cet inconv�enient. Le protocole pr�evoit que notre

prototype d'interface soit �evalu�e par le biais d'un plan de test int�egral avec ex�ecution

de taches sp�eci�ques. L'objectif sera d'�evaluer l'usabilit�e des di��erentes techniques

d'interaction ainsi que les mappages m�etaphoriques choisis.

124

Figure 5.31 – Pr�esentation en accord�eon (en haut), en pile de jetons (au milieu)et en Rolodex (en bas) : gestes tactiles d'interaction.

125

Figure 5.32 – Visualisation Phorigami de 561 photos. Vue du contenu pli�e (enhaut) et d�epli�e (en bas).

126

5.8 Conclusion

Depuis de nombreuses ann�ees, les outils syst�eme de gestion photo ont progress�e

via l'int�egration d'algorithmes puissants qui permettent de traiter plus e�cacement

les contenus visuels des images num�eriques. L'approche conventionnelle, orient�ee

technique, va dans le sens d'une am�elioration continue des technologies et d'une

augmentation de leurs capacit�es. Face �a une probl�ematique similaire, notre approche

propose un point de vue centr�e sur l'utilisateur. L'interface que nous proposons jette

les bases d'un syst�eme futur.

En 2005, Nokia introduit la notion de « technologie humaine », principe fondamen-

tal de sa vision de la mobilit�e. Au cıur de cette notion, l'id�ee que c'est l'exp�erience

utilisateur qui suscite la technologie innovante, et non l'inverse. La notion de de-

sign centr�e sur l'utilisateur a d�ej�a �et�e pr�econis�ee dans le domaine de l'interaction

homme machine (IHM). Des �etudes se sont pench�ees sur ces aspects dans le but

d'optimiser l'usabilit�e du syst�eme et d'orienter les d�eveloppements technologiques

a�n d'approcher toujours au plus pr�es les demandes utilisateurs. Pour la gestion des

photos num�eriques, notre id�ee originale s'inspire de l'exp�erience utilisateur dans la

prise de photo au quotidien. Nous avons travaill�e cette id�ee et en avons d�eduit une

approche de cat�egorisation bas�ee sur l'�etat de l'art. Loin d'une simple solution de

cat�egorisation, notre vision s'appuie sur un design d'interface centr�e sur l'utilisateur

et qui facilite l'organisation des photos num�eriques. Pour classer les photos num�e-

riques, les approches traditionnelles s'appuient sur certaines techniques permettant

d'ajouter des informations aux clich�es existants, comme par exemple le balisage

automatique des photos. Les outils syst�emes actuels proposent une cat�egorisation

bas�ee sur di��erentes techniques (balisage de texte, regroupement sur l'information

chronologique et l'analyse du contenu). Nous nous sommes lib�er�es de ces principes

et avons adopt�e un point de vue davantage centr�e sur l'utilisateur, ce qui nous

permet de d�egager di��erents contextes photos qui seront utilis�es dans la cat�ego-

risation des photos. Pourquoi ce choix ? Tout d'abord, si l'ajout d'informations �a

un clich�e s'e�ectue a posteriori exclusivement, le contexte photo peut quant �a lui

etre identi��e en un coup d'ıil, sans qu'aucun ajout ne soit n�ecessaire. Par ailleurs,

le contexte pr�esente une vari�et�e d'�el�ements invisibles qui peuvent �evoquer des sou-

venirs �a l'utilisateur et restituer de ce fait sc�enarii et histoires. Dans l'ensemble,

nous marquons notre attachement au d�eveloppement fondamental dans le domaine

technologique. Notre proposition d'interface centr�ee sur l'utilisateur jette les bases

des futurs syst�emes de gestion des photos num�eriques.

127

128

Chapitre 6

Deuxieme proposition de

design

Le pr�esent chapitre introduit notre design d'interface retravaill�e sur la base des

r�esultats obtenus Chapitre 4. Nous proposons �a nouveau une interface circulaire qui

adresse les probl�ematiques de navigation sur des �ecrans de dimension r�eduite int�egr�es

�a des appareils portables. Dans un contexte de Casual InfoVis, la navigation photo

sur interface mobile pourrait simplement consister en un m�ecanisme de visualisation

sp�eci�que adapt�e �a divers usages, qui permettrait une navigation libre des contenus

sur �ecran de taille r�eduite. Nous �etablissons un panorama des �etudes impliquant

une interface circulaire dans la visualisation de photos, puis proposons notre design

d'interface et ses di��erents types de visualisation.

129

6.1 Reflexion sur les resultats obtenus chapitre 4

Les r�esultats de l'�evaluation de Phora ont permis de recueillir les remarques utilisa-

teurs sur divers aspects. Premier point : les modes de manipulation. Avec Phora, la

recherche et la navigation sont des taches simples de manipulation, par comparaison

avec la saisie de texte sur appareils portables classiques. L'ex�ecution �a deux mains

de taches n�ecessitant une faible manipulation physique ne participe probablement

pas �a l'e�cacit�e de l'interface mais risque d'accentuer le sentiment de p�enibilit�e.

Deuxi�eme point : parcourir ses contenus photos est surtout un comportement de

« scanning » visuel. Lors de l'exploration de contenus de grande dimension, l'�ecran

de portable, avec sa capacit�e d'a�chage r�eduite, est susceptible de fournir davan-

tage d'indices essentiels compar�e �a un �ecran de grande taille, et de susciter une

r�eaction instantan�ee. Notre design cherchait �a faciliter la navigation de photos sur

�ecran circulaire via une pr�esentation en spirale ou par couches. Nous ne sommes

n�eanmoins pas parvenus �a mettre au point un m�ecanisme vraiment adapt�e �a la

visualisation des contenus. Troisi�eme point : notre mappage de la m�etaphore du

Rubik's cube et de ses modes de pr�esentation n'a pas �et�e concluant, sans doute de

par une trop faible correspondance entre pr�esentation cubique et circulaire.

Pour l'essentiel, le Casual InfoVis sur portable permet l'�evocation du souvenir �a

partir de photos que l'on parcourt bri�evement et fr�equemment. Par cons�equent, les

taches induites sont plutot br�eves, simples, et men�ees dans un cadre de divertisse-

ment. Potentiellement, ce type d'usage court terme am�ene les utilisateurs �a mener

deux types de taches. Le premier : choisir des photos �a partager avec ses amis. Les

utilisateurs ne conservent sur leur portable que les photos qu'ils jugent repr�esenta-

tives. Ces photos sont en ce sens di��erentes de celles qui sont conserv�ees sur PC de

bureau ou sur dispositif de stockage externe. La relation de l'utilisateur vis-�a-vis de

chaque photo �etant assez forte, le choix des photos �a partager est facilit�e, surtout

sur des albums de taille r�eduite.

Le deuxi�eme type de tache : parcourir les contenus photos dans un but unique

d'�evocation du souvenir, sans cible de recherche pr�ecise �a l'esprit. Ce type de tache

sort du cadre de l'InfoVis classique. D'apr�es Rodden et al. [60], la visualisation

d'images par similitude pourrait ne pas faciliter la s�election d'images. Cependant,

dans un cadre de Casual Infovis, ce type de pr�esentation visuelle pourrait susciter

l'int�eret de l'utilisateur et l'amener �a percevoir des indices �emotionnels.

Les entretiens r�ealis�es chapitre 4 indiquent qu'une des participantes parcourt 300

photos tout au plus sur les 1000 qu'elle conserve sur son iPhone, navigation qu'elle

e�ectue dans le but d'�evoquer ses souvenirs. Autrement dit, les utilisateurs ne sont

pas assez patients pour parcourir l'int�egralit�e de leurs contenus photos sur petit

�ecran. Dans ce sens, il ne serait pas pertinent de proposer une interface Casual Infovis

mobile qui permettrait d'examiner les contenus photos en d�etail et sur la dur�ee.

Notre interface Casual InfoVis proposera un m�ecanisme qui permettra d'extraire les

�el�ements essentiels des contenus selon l'int�eret de l'utilisateur, que celui-ci ait ou

non une cible pr�ecise �a l'esprit.

Les navigateurs photos classiques proposent g�en�eralement une visualisation lin�eaire

des photos num�eriques. Cette visualisation suit un ordre pr�ed�e�ni de pr�esentation

qui s'appuie sur les balises de m�etadonn�ees associ�ees aux photos. Ce type de pr�e-

sentation est susceptible de contraindre les utilisateurs qui souhaiteraient visualiser

130

librement leurs contenus. A�cher les photos par page �etablit un niveau de priorit�e

dans la navigation. Autrement dit, les utilisateurs sont contraints dans leur naviga-

tion puisqu'ils doivent parcourir les photos page par page, meme s'ils restent libres

de « passer » �a une autre page. Une autre probl�ematique autour de ce type de

pr�esentation est la familiarisation vis-�a-vis des contenus, puique l'appr�ehension d'un

contenu photo passe non seulement par ce qu'il pr�esente mais �egalement par la

fa�con dont il est pr�esent�e.

Potentiellement, un navigateur Casual InfoVis d'images pourrait proposer une pr�e-

sentation lin�eaire (avec r�egle �xe ou adaptable) ou non lin�eaire des photos (sans

r�egle sp�eci�que). De fa�con �evidente, ce navigateur devra remettre en cause les

modes de pr�esentation conventionnels a�n de favoriser la vari�et�e des modes d'usage

dans la navigation de contenus.

6.2 Presentation de l’interface circulaire

Presentation circulaire : usages

D'apr�es la d�e�nition du Larousse, un cercle est « une courbe plane ferm�ee dont

tous les points sont �a �egale distance d'un point int�erieur appel�e centre », qui at-

tire l'attention visuelle. Dans le d�eveloppement de techniques de visualisation, des

techniques de contexte + focus telles que le �sheye [90](cf. �g.6.1 (a)) et l'arbre

hyperbolique [89] (cf. �g.6.1 (b)) sont int�egr�ees �a des modes de pr�esentation circu-

laires a�n, d'une part, de faire ressortir le point de focus et, d'autre part, de donner

un aper�cu de l'environnement situ�e autour de ce point. Lorsqu'il est appliqu�e �a un

contenu de grande dimension, le �sheye d�eforme l'ensemble de la pr�esentation vi-

suelle. L'arbre hyperbolique redimensionne quant �a lui chaque �el�ement en fonction

de sa distance vis-�a-vis du centre.

(a) Vue fisheye (b) Hyperbolic tree

Figure 6.1 – (a)Fisheye, (b)Arbre hyperbolique(image(a) extraite de en.wikipedia.org)(image(b) extraite de [89] )

Le navigateur d'images FotoFile [36] (cf. �g.6.2) int�egre des arbres hyperboliques qui

permettent de visualiser les di��erentes cat�egories de photos sous forme de cercles.

N�eanmoins, son interface est occup�ee en grande partie par la structure de l'arbre et

les photos, de format rectangulaire, se superposent les unes aux autres. FaceBubble

[59] (cf. �g. 6.3) propose une pr�esentation circulaire des r�esultats de recherche.

131

Chaque photo est pr�esent�ee de fa�con �a former un cercle de photos et �a optimiser

l'utilisation de l'espace disponible sur l'interface, exemple int�eressant d'adaptation

des sp�eci�cations d'a�chage de chaque photo. L'interface circulaire de Shen et al.

[147] (cf. �g.6.4) est int�egr�ee �a un environnement de type table qui encourage la

narration des photos. Cette distribution circulaire des photos a pour but de faciliter

la manipulation, o�u que l'on se situe autour de la table, dans un contexte multi-

utilisateurs. Une pr�esentation horizontale est �egalement propos�ee pour la navigation

mono utilisateur (cf. �g.6.5)

Une autre interface pour la pr�esentation circulaire de contenus photos, di��erente

de l'arbre hyperbolique : MyPhotoEgg [96], application mobile avec pr�esentation

sph�erique 3D des photos et visualisation contexte + focus. La pr�esentation d'un

contenu photo de grande dimension peut se faire en mode « d�etail » sur un �el�e-

ment sp�eci�que ou via un aper�cu du contenu dans son ensemble. Deux modes de

pr�esentation des contenus sont illustr�es �g.6.6. L'interface « id�eale » propose une

transition dans la visualisation des contenus, selon l'usage. Une autre interface, sans

transition, propose un passage rapide du mode d�etail �a la vue globale. Si certains

navigateurs de bureau (Apple iPhoto) ou services en ligne (Google Picasa) int�egrent

une fonctionnalit�e de zoom avec visualisation contexte + focus (cf. �g6.7), les na-

vigateurs d'images portables ne prennent pas encore en compte cette probl�ematique

de design.

Figure 6.2 – Foto�le(image extraite de l'article de [36])

Figure 6.3 – Face Bubble(image extraite de l'article de [59])

132

Figure 6.4 � Interface circulaire(image extraite de l’ article de Shen et al. [147]

Figure 6.5 � MyPhotoEgg(image extraite de www.myphotoegg.com)

Figure 6.6 � Passage d’ une vue a l’ autre sur navigateur d’ images traditionnel(en haut), transition pas a pas de la vue detail a la vue globale,sur un navigateur ideal (en bas).

Figure 6.7 � Transition de la vue detail a la vue globale sous Google Picasa

133

6.3 Propositions de design et analyse

Notre r�e exion nous am�ene �a d�e�nir les directives suivantes dans la mise au point

d'une interface circulaire sur appareil portable.

1. La proposition de design vise la mise au point d'une interface avec visualisation

contexte + focus, pour int�egration sur appareil portable.

2. L'interface propos�ee est suppos�ee s'appuyer sur le Casual InfoVis et a pour

objectif de favoriser le sentiment divertissement dans la navigation de contenus

photos.

3. L'interface propos�ee est suppos�ee proposer un mode d'interaction �a une main.

4. L'interface propos�ee est suppos�ee etre adapt�ee �a une pr�esentation circulaire.

5. Chaque photo est visualis�ee dans un cadre circulaire a�n d'optimiser l'utilisa-

tion de l'espace circulaire disponible.

6. La pr�esentation visuelle bas�ee sur la m�etaphore du cercle est suppos�ee rendre

l'interface plus intuitive et faire correspondre visuel et �ecran.

Notre concept g�en�eral s'appuie sur une pr�esentation sph�erique 3D qui permet, d'une

part, d'attirer l'attention vers le centre de l'�ecran et, d'autre part, de manipuler li-

brement les contenus. Par ailleurs, nous appliquons la m�etaphore des poles terrestres

(Nord et Sud) �a notre pr�esentation sph�erique a�n de guider les utilisateurs �a tra-

vers les di��erentes zones d'a�chage. La visualisation g�en�erale est structur�ee sur

trois vues qui sont : menu, contenu et d�etail (cf. �g.6.8). Lors de notre premi�ere

tentative, nous int�egrons les photos cat�egoris�ees du Phorigami (cf. chapitre 5) �a

la pr�esentation sph�erique. Nous proposons une interface dont nous d�ecrivons les

di��erentes vues et usages :

1. Le menu : il pr�esente tous les albums sous forme de cercles dont la taille varie

selon le nombre de photos qu'ils contiennent (cf. �g.6.8, les deux du haut)

2. La vue contenu : une fois qu'un album est s�electionn�e, ses contenus s'a�chent

dans cette vue et les utilisateurs peuvent les parcourir en manipulant librement

la pr�esentation sph�erique (cf. �g.6.8 en bas �a g.).

3. La vue d�etail : elle permet de pr�esenter la photo s�electionn�ee dans un espace

ind�ependant dont l'arri�ere-plan est d�elimit�e par les photos voisines (cf. �g.6.8

en bas �a dr.).

L'int�egration du Phorigami sur pr�esentation sph�erique pose n�eanmoins un probl�eme :

la taille d'�ecran, limit�ee, pourrait ne pas supporter le d�eploiement complet des trois

modes de visualisation Origami. Par cons�equent, notre deuxi�eme proposition de

design int�egre des photos « classiques » (rectangulaires) �a des cadres circulaires. Sur

la meme structure d'interface, nous enrichissons la visualisation par davantage de

vues « d�etail » . Notre diagramme radar pr�esente les avantages et inconv�enients de

notre proposition selon six crit�eres. Le Tableau 6.1 pr�esente les propositions de design

selon la tache op�erationnelle concern�ee. A�n de proposer une discussion g�en�erale sur

le design d'interface, Phora y est �egalement pr�esent�e. Pour la s�election d'album, nous

proposons deux id�ees de design. La premi�ere s'appuie sur Face Buble[59], la seconde

sur une pr�esentation en spirale. Pour la navigation des contenus, nos propositions

de design exploitent le principe de contexte + focus et proposent di��erents parcours

de manipulation autour de la cible objet du focus. Nous avons �egalement adapt�e la

visualisation hyperbolique �a la pr�esentation de photos circulaires.

134

Figure 6.8 – Premier essai avec Phorigami.Menu sur deux vues (deux du haut), vue contenu (en bas �a g.)et vue d�etail (en bas �a dr.).

Nous pr�eparons un diagramme radar (cf. �g.6.9 et �g.6.10) avec six crit�eres : « Vi-

sibilit�e et caract�ere informatif », « Quantit�e de photos a�ch�ees », « Variation des

e�ets visuels », « Potentiel de d�eclenchement de d�ecouvertes inattendues », « Faci-

lit�e de manipulation », et « Facilit�e de navigation ». La fonction de s�election d'album

(cf. 6.9) permet de visualiser tous les albums disponibles avec deux modes de pr�e-

sentation possibles qui sont « S�election simple d'album » et « S�election d'album

avec contexte des contenus ». La probl�ematique centrale de design est la suivante :

comment adapter le contenu visuel �a un �ecran de taille r�eduite lorsque le nombre

d'albums augmente ? Dans le cas d'un contenu de grande dimension, di�cile de

garantir, d'une part, sa visibilit�e (reconnaissance de son contenu) et, d'autre part,

son caract�ere informatif (lecture de son message). La quantit�e visualis�ee en mode

s�election d'album est largement inf�erieure �a ce qui est r�eellement disponible sur

l'appareil : 30 albums photos sur un t�el�ephone portable peuvent correspondre �a un

total de 300 photos. En tant que menu, il ne sera probablement pas n�ecessaire

d'a�cher la vue s�election d'album en plein �ecran ou en mode contexte + focus.

Nous proposons de ne pr�esenter que les informations essentielles (date & heure,

�ev�enement, taille) a�n de faciliter, d�es le d�ebut, la navigation cot�e utilisateur.

Pour la pr�esentation des contenus, le diagramme radar synth�etique (cf. �g.6.10)

indique que nos propositions �equilibrent les crit�eres « Caract�ere informatif » et

« Quantit�e de photos a�ch�ees ». Comme mentionn�e au pr�ec�edent paragraphe, dif-

�cile de satisfaire les deux crit�eres. La plupart de nos propositions proposent une

visualisation contexte + focus via di��erents mod�eles de visualisation. N�eanmoins,

la plupart de nos mod�eles de pr�esentation �etant sur structure �xe, nos propositions

135

ne recueillent qu'un faible score sur le crit�ere « Variation des e�ets visuels », ce

qui restreint davantage les modes de navigation possibles parmi les contenus. Glo-

balement, l'analyse r�ev�ele que notre design bas�e sur l'arbre hyperbolique satisfait

chacun des six crit�eres.

Lorsqu'il est visualis�e par le biais d'une interface, un contenu de grande dimen-

sion perd de son caract�ere informatif, situation certainement aggrav�ee sur �ecran

de taille r�eduite. La technique de visualisation contexte + focus, avec sa transi-

tion dans l'animation, participe �a la caract�erisation de la partie de la photo objet

du focus. Dans la navigation de contenus de taille cons�equente, elle n'entra�ne ni

perte d'information contextuelle ni sentiment de d�esorientation. L'un des avantages

�a proposer ce mode de visualisation en plein �ecran serait de favoriser la navigation

par s�erendipit�e ou encore les possibilit�es de d�ecouvertes inattendues. Toutefois, sur

le petit �ecran d'un appareil portable, seule la partie objet du focus sera r�eellement

reconnaissable. Le contexte, qu'il s'agisse des images voisines ou du reste de la

photo, sera probablement indiscernable. Autrement dit, l'information contextuelle

dans la pr�esentation de vignettes n'apportera pas forc�ement grand'chose et ne sera

par ailleurs pas forc�ement plaisante visuellement.

Figure 6.9 – Analyse par diagramme radar de la s�election d'album (AS1, AS2,AS3, AS4)

136

Figure 6.10 – Analyse par diagramme radar de la navigation de contenus ( neufpropositions de g. �a dr. et de haut en bas : AC1, AC2, AC3, AC4,AC5, AC6,AC7,AC8,AC9 )

137

Si les navigateurs d'images classiques int�egrent de plus en plus d'impressionnants

e�ets 3D, leurs interfaces restent n�eanmoins bas�ees sur un a�chage classique des

photos sous forme de vignettes. L'a�chage par vignettes o�re un niveau �el�ementaire

de visibilit�e et de prise d'information vis-�a-vis du contenu pr�esent�e. Le fait que les

utilisateurs n'aient pas une vue globale de l'ensemble des contenus est compens�e par

des e�ets visuels plus travaill�es ainsi qu'une interface de navigation plus intuitive,

comme c'est le cas avec le scrolling de l'iPhone ou le « glisser » de Cooliris 3D [148]

(cf. �g.6.11) sur Google Nexus One[149] (cf. �g.6.12). La raison pour laquelle on

int�egre davantage d'e�ets visuels sur les navigateurs d'images portables se r�esume

selon nous comme suit :1. La navigation d'images sur appareil portable implique un usage uctant et

bref. Ce type d'usage correspondant �a des attentes assez faibles, les utilisa-

teurs peuvent se contenter de fonctionnalit�es �el�ementaires pour parcourir leurs

contenus photos.

2. Les attentes concernant les fonctionnalit�es �etant faibles, le visuel joue un role

important dans la satisfaction vis-�a-vis de l'interface.Impossible de le nier, l'aspect visuel est un �el�ement important du design d'interface.

Nous lui avons n�eanmoins pr�ef�er�e une r�e exion sur l'usabilit�e dans la navigation de

contenus photos de grande dimension sur portable. Dans le choix du design �nal,

notre proposition bas�ee sur l'arbre hyperbolique (cf. �g.6.10 AC9) satisfait certaines

attentes quant �a la navigation de contenus de grande dimension.

1. L'arbre hyperbolique permet une visualisation contexte + focus des photos

rondes (cf. �g.6.13). On peut zoomer sur la photo dans son ensemble (en plein

�ecran), visibilit�e globale n�eanmoins alt�er�ee dans le cas de photos de grande

dimension.

2. La manipulation du contenu se fait par un « glisser » du doigt, ce qui permet

une interaction �a une main sur appareils portables.

3. Le centre de la structure hyperbolique fait logiquement ressortir le point de

focus et permet d'attirer l'attention de l'utilisateur.

4. La visualisation radiale sur �ecran circulaire o�re un e�et visuel qui n'est pas

sans rappeler les rosaces de vitraux (cf. �g.6.14) et induire un certain niveau

d'esth�etique.

Sur la base de ces caract�eristiques de design d'interface, nous compl�etons et retra-

vaillons Phora. La section suivante pr�esente ce design d'interface retravaill�e.

Figure 6.11 – Scrolling photo sur iPhone(image extraite de www.phonescorporation.com)

138

Figure 6.12 – Mur Cooliris 3D sur Google Nexus supportant le scrolling photo(image extraite de www.cooliris.com)

Figure 6.13 – Visualisation de 173 photos rondes sur arbre hyperbolique

Figure 6.14 – Visualisation de photos rondes sur arbre hyperbolique (�a g.) etrosace de vitraux (�a dr.).(image extraite de www.cooliris.com)

139

Tableau 6.1 – Propositions de design et taches associ�ees

Taches Proposition de design Cheminement de mani-pulation

Selection d’album

Navigation decontenus

140

6.4 Implementation

Nous retravaillons Phora sur la base de l'analyse de notre proposition de design.

Ce « nouveau » Phora est pr�evu pour int�egration sur �ecran circulaire en tant que

navigateur d'images portable. Comme mentionn�e auparavant, plus qu'un design de

produit, nous proposons un mod�ele d'interaction.

L'interface retravaill�ee de Phora propose pour l'essentiel deux modes d'a�chage :

s�election d'album et navigation des contenus. Le mode s�election d'album permet de

visualiser tous les albums sur l'�ecran et est suppos�e fournir des informations suppl�e-

mentaires venant faciliter la pr�evisualisation du contenu. L'information temporelle

�etant selon nous utile dans la s�election d'album, nous proposons deux interfaces

de type carrousel permettant une visualisation des albums par ann�ee et par mois

(cf. �g.6.15). Tous les albums sont pr�esent�es le long de l'anneau sur la vue men-

suelle. Une image repr�esentative est extraite de chaque album pour lui servir de

« couverture » et donner une indication de sa taille.

Le second mode d'a�chage (navigation des contenus) permet de visualiser les conte-

nus de l'album sur un arbre hyperbolique. L'ensemble des photos est organis�e autour

du centre de l'�ecran. Toute photo que l'on fait glisser vers le centre de l'�ecran est

automatiquement agrandie, les photos qui l'entourent �etant modi��ees en cons�e-

quence (cf. �g.6.16). On peut penser cette visualisation sur �ecran circulaire comme

une sorte de plateau tournant, l'utilisateur faisant tourner le bord de l'�ecran pour

faciliter le partage des photos (cf. �g.6.17).

Cette version am�elior�ee de Phora permet une interaction �a une main. La mani-

pulation des contenus se fait via un « glisser » du doigt permettant d'ex�ecuter

l'ensemble des taches. Le ux de taches est illustr�e �g.6.18. Nous avons d�evelopp�e

une animation Adobe Flash qui permet de d�emontrer les fonctions et op�erations

possibles sur chaque mode d'a�chage.

141

Figure 6.15 – Mode d'a�chage pour la s�election d'album : pr�esentation car-rousel avec vue par ann�ee (�a g.) et par mois (�a dr.).

Figure 6.16 – Mode d'a�chage pour la navigation des contenus et manipula-tion simul�ee via une visualisation hyperbolique.

Figure 6.17 – M�etaphore du plateau tournant dans la visualization (�a g.), pla-teau tournant sur une table de restaurant (�a dr.)

142

Figure 6.18 – Flux de taches sur la version retravaill�ee de Phora. Work ow pourla navigation des contenus (�a g.) et la s�election d'album (�a dr.).

143

6.5 Problematique du prototype

Sur la base de notre animation Flash et du work ow de l'interface utilisateur, nous

int�egrons notre interface sous l'environnement Processing. L'objectif est de pouvoir

utiliser les algorithmes de calcul de collision dans le d�eveloppement d'une visualisa-

tion contexte + focus, plutot que l'algorithme existant de l'arbre hyperbolique en

Java InfoVis Toolkits [150](cf. �g.6.19). A�n que notre proposition de design at-

teigne son objectif, trois imp�eratifs doivent etre respect�es dans son impl�ementation :

1. Toutes les images doivent tenir �a l'int�erieur de l'�ecran circulaire, comme illustr�e

�g.6.20.

2. La taille de chaque image doit etre calcul�ee en fonction de sa distance relative

avec le centre de l'�ecran. Chaque image atteint sa taille maximale lorsque

plac�ee au centre de l'�ecran (cf. �g.6.21), ce qui permet de simuler l'e�et de

zoom lorsque l'on fait glisser une photo vers le centre.

3. Il doit y avoir synchronisation entre la position et la taille de chaque image :

d�es qu'une image est d�eplac�ee, les autres sont redimensionn�ees et d�eplac�ees

en cons�equence. De par la limite de temps impos�ee au projet, nous n'avons

pu impl�ementer que les deux premiers imp�eratifs et ne sommes pas parvenus

�a r�esoudre la probl�ematique de synchronisation des images.

Figure 6.19 – Arbre hyperbolique en Javascript InfoVis Toolkits

Figure 6.20 – Maintien des �el�ements dans la limite du cercle, lors du calcul decollision.

Figure 6.21 – Impl�ementation de l'e�et de zoom lorsqu'un �el�ement est gliss�evers le centre.

144

6.6 Proposition de plan de test

Bien que notre prototype n'ait pas encore �et�e impl�ement�e, nous avons pr�epar�e un

plan de test pour �evaluation ult�erieure.

Objectif de l’evaluation

1. �Evaluer l'usabilit�e de notre visualisation contexte + focus dans la navigation

de contenus photos num�eriques. L'analyse des r�esultats obtenus sur les taches

ainsi que des entretiens oraux permettent de recueillir l'opinion des utilisateurs.

2. Observer les comportements utilisateurs sur di��erents sc�enarii de navigation

photo.

3. Observer les comportements de navigation de l'utilisateur sur ses contenus

personnels ou sur des contenus appartenant �a un tiers, auxquels il peut etre

li�e.

Approche d’evaluation

Notre approche d'�evaluation repose essentiellement sur la r�ep�etition d'une s�erie

de taches sur trois sc�enarii. Les types de taches et hypoth�eses associ�ees sont les

suivantes : Trois types de taches :1. Tache de navigation de recherche (d'une cible pr�ecise)

2. Tache de navigation fortuite (recherche d'une cible pr�ef�er�ee et narration des

photos)

3. Tache de navigation mixte (recherche d'une cible pr�ecise puis d'une cible

pr�ef�er�ee pour la narration)Deux sc�enarii :

1. S1 : Navigation des contenus personnels du participant (300 photos au total)

2. S2 : Navigation des contenus personnels du participant (1000 photos au total)

3. S3 : Navigation de contenus tiers auxquels le participant peut etre li�e (1000

photos au total, dont 500 appartiennent �a un de ses amis).

Hypothese d’evaluation

Notre hypoth�ese est que les participants vont suivre di��erentes strat�egies a�n de

retrouver la cible le plus rapidement possible. Ils pourront suivre pour cela un chemin

en croix (d�eplacement de haut en bas et de gauche �a droite) ou circulaire (rotation

de l'�ecran et recherche sur les bords de l'�ecran). La taille de l'album et le niveau de

familiarisation vis-�a-vis des contenus vont tous deux a�ecter l'e�cacit�e des taches

de recherche. La visualisation hyperbolique pourrait poser probl�eme dans l'a�chage

de 1000 photos sur �ecran rond de taille r�eduite.

145

Mise en place

1. Hardware setup : Notre proposition d'interface sera int�egr�ee sous Processing

�a un ordinateur portable �equip�e d'un touch panel transparent ou d'un �ecran

tactile.

2. Mise en place des donn�ees : Chaque participant doit amener 1000 photos

issues de sa collection personnelle, qui seront utilis�ees lors de l'�evaluation.

3. Mise en place de l'environnement : L'environnement de test sera mis en place

dans un salon avec sofa ou un simple bureau permettant d'ex�ecuter les taches.

La cam�era vid�eo sera plac�ee de fa�con �a enregistrer l'int�egralit�e de la proc�edure

(cf. �g.6.22).

4. Participants : Environ 8 �a 10 participants seront convi�es �a ce test.

Taches en detail

Description des trois types de taches

Tache Reaction des participants

Navigation de

recherche

Les participants sont invit�es

�a retrouver une photo sur la

base d'un exemple qui leur

est pr�esent�e.

Les participants scannent

visuellement les contenus �a

la recherche de la cible.

Navigation for-

tuite

Les participants sont invi-

t�es �a choisir plusieurs pho-

tos de fa�con al�eatoire et �a

« raconter » celles-ci. (nar-

ration des photos).

Les participants par-

courent les contenus sans

id�ee pr�ecise de ce qu'ils

recherchent.

Navigation

mixte

Dans un premier temps,

les participants sont invit�es

�a retrouver une photo sur

la base d'un exemple qui

leur est pr�esent�e. Dans un

deuxi�eme temps, les partici-

pants sont invit�es �a choisir

leur photo pr�ef�er�ee et �a la

raconter.

Cette tache a pour objectif

de simuler une situation de

d�ecouverte accidentelle.

Trois types de scenario

Contenu de l’album

Scenario 1 Album photo personnel (300 photos)

Scenario 2 Album photo personnel (1000 photos)

Scenario 3) Album mixte (1000 photos)

146

Procedure d’evaluation

(Lancement de l'enregistrement vid�eo)

Etape I Accueil du participant

1. Accueil du participant et renseignement du pro�l sur le questionnaire.

2. Rapide introduction �a l'�evaluation : objectif, proc�edure, dur�ee estim�ee et environnement de

test.

Etape II �Echau�ement

1. Pr�esentation du navigateur d'images, �a l'exclusion de son mode de fonctionnement. Le partici-

pant s'essaie au navigateur pendant 10 minutes (l'album photo qui est charg�e dans le navigateur

est un exemple contenant des photos de chats).

2. Entretien avec le participant.

3. �Evaluation via le questionnaire.

Pause de 3 minutes

Etape III Navigation des contenus personnels (300 photos provenant de l'album personnel du participant)

1. Nouvelle pr�esentation du navigateur d'images et de son fonctionnement.

2. (L'album photo charg�e dans le navigateur est celui du participant)

Tache 1 (Navigation de recherche)

Tache 2 (Navigation fortuite). Pause de 2 minutes et r�einitialisation du navigateur

Tache 3 (Navigation mixte) :

3. Entretien avec le participant

4. �Evaluation via le questionnaire

Pause de 3 minutes

Etape IV Navigation des contenus personnels (1000 photos provenant de l'album personnel du participant)

1. Nouvelle pr�esentation du navigateur d'images et de son fonctionnement.

2. (L'album photo charg�e dans le navigateur est celui du participant)


Tache 2 (Navigation fortuite).Pause de 2 minutes et r�einitialisation du navigateur.

Tache 3 (Navigation mixte) :



Pause de 3 minutes

Etape V Navigation parmi les contenus personnels d'un ami, certaines photos �etant li�ees au participant

(1000 photos d'un album m�elang�e)


Tache 2 (Navigation fortuite)

Tache 3 (Navigation mixte)



Pause de 3 minutes

Etape VI Discussion g�en�erale

1. Entretien general avec le participant : ressenti / satisfaction vis-�a-vis des usages propos�es par

le navigateur d'images, taches, exp�erience de navigation d'images au quotidien.


Etape

VII

Fin du test et remerciements.

147

Enregistrement des donnees

Les donn�ees portant sur l'int�egralit�e de l'�evaluation seront enregistr�ees selon quatre

approches :

1. Fichier de temps

2. Rapport d'activit�e

3. Niveau d'accomplissement des taches

4. Transcription des entretiens

Analyse des donnees

1. Niveau d'accomplissement de la tache : Il permet de comprendre si l'interface

est intuitive ou si elle induit de la di�cult�e dans l'ex�ecution des taches. Les

taches de navigation sont les seules �a etre examin�ees sous l'angle du temps

qui leur est consacr�e et de leur niveau d'accomplissement.

Trois crit�eres permettent de v�eri�er le niveau d'accomplissement de la tache

Niveau 1 : r�eussite, sans l'aide de la personne en charge du test. Niveau 2 :

r�eussite, avec l'aide de la personne en charge du test. Niveau 3 : �echec.

2. Rapport d'activit�e : Ce �chier consigne les actions ex�ecut�ees (mouseClick,

mouseOver), l'intention du participant ainsi que la position du curseur dans

le diagramme de ux au moment o�u l'utilisateur clique sur l'�ecran (au centre,

en haut, en bas, �a gauche, �a droite). Les r�esultats permettent d'identi�er

di��erents comportements de navigation.

3. Niveau de satisfaction vis-�a-vis du navigateur hyperbolique d'images : Le ques-

tionnaire et les entretiens permettent d'�evaluer le niveau de satisfaction des

utilisateurs vis-�a-vis de notre navigateur hyperbolique d'images. Ses avantages

comme ses points faibles sont rapport�es.

4. Transcription de l'opinion des participants sur la base de l'entretien.

Structure du rapport

1. Introduction g�en�erale et objectif de l'�evaluation.

2. Pro�l des participants et temps total pass�e sur l'�evaluation.

3. V�eri�cation de l'hypoth�ese.

4. Rapport entre caract�ere intuitif et fonction de l'interface, sur la base des r�esultats

obtenus et des entretiens.

5. Comportement utilisateur de navigation photo sur di��erents sc�enarii.

a) Navigation de ses propres contenus avec ex�ecution de trois taches de navigation.

b) Navigation des contenus photos d'un ami, contenus qui lui sont li�es, avec ex�e-

cution de trois taches de navigation.

6. Mod�ele de comportement de navigation sur �ecran circulaire.

7. R�e exion / suggestion autour d'un design d'interface bas�e sur ce mod�ele de com-

portement.

8. Opinion g�en�erale des participants �a partir des questionnaires et de l'entretien.

148

Figure 6.22 – Mise en place de l'environnement.

149

6.7 Reflexion sur le design et conclusion

Notre design d'interface retravaill�e int�egre un m�ecanisme de transition dans la pr�e-

sentation de photos num�eriques et propose une visualisation contexte + focus sur

l'�ecran circulaire d'un appareil portable. Notre proposition pourrait se substituer

aux navigateurs d'images traditionnels sur portables. Nous n'avons n�eanmoins pas

encore men�e de test d'usabilit�e qui viendrait con�rmer la valeur de notre design. �A

ce jour, les navigateurs d'images sur portables, �a l'exception de Fun Album browser

sur Motorola A3100[97], a�chent majoritairement les contenus photos via une vue

vignettes. Les capacit�es de calcul graphique des appareils portables repr�esentent

encore une entrave �a l'int�egration de modes complexes de visualisation. Depuis l'in-

t�egration r�eussie d'applications telles que MyPhotoEgg[96] avec visualisation 3D de

contenus photos num�eriques, le foss�e qui restait �a franchir a �et�e combl�e.

D'apr�es nous, la raison pour laquelle on continue �a d�evelopper des navigateurs

d'images avec vue vignettes est probablement que ce type de navigateur o�re une

certaine visibilit�e lors de la navigation de contenus de grande dimension. Comme

illustr�e �g.6.23, la vue vignettes ne permet de pr�esenter qu'une petite partie du

contenu via des miniatures photos de taille acceptable. L'indisponibilit�e d'une vue

compl�ete du contenu est compens�ee par un m�ecanisme de manipulation sp�eci�que

permettant une navigation rapide. �A l'inverse, si une interface contexte + focus o�re

une vue compl�ete du contenu de grande dimension a�n de faciliter sa pr�esentation,

elle ne propose pas un niveau de visibilit�e qui permet sa reconnaissance.

On peut alors se demander si, sur les appareils petit �ecran, la vue compl�ete avec

information contextuelle importe davantage que la visibilit�e du contenu pr�esent�e

(cf. �g.6.24) : inconv�enients de chaque vue). Dans un contexte de Casual InfoVis,

que la navigation fortuite des photos sur portables s'e�ectue ou non pour le plaisir,

elle n'en requiert pas moins un minimum de controle ou d'usabilit�e vis-�a-vis de

la pr�esentation des contenus de l'album, a�n d'appr�ecier pleinement ces derniers.

Bien que visualiser en mode vignettes un contenu de grande dimension via une

pr�esentation limit�ee (quelques photos par page) soit assez d�eplaisant, cela garantit

n�eanmoins une certaine visibilit�e du contenu et permet d'�eviter la surcharge visuelle.

Dans cet ordre d'id�ees, Cooliris[148] est pass�e d'une pr�esentation page �a un mur 3D

continu dont les utilisateurs peuvent faire d�e�ler les contenus en les faisant glisser

dans l'une ou l'autre direction.

Pour r�esumer, a�n d'enrichir le Casual Infovis sur appareils portables, la priorit�e

serait d'am�eliorer la visibilit�e dans la pr�esentation des contenus a�n de garantir

une usabilit�e acceptable. Par la suite, nous pourrions int�egrer des e�ets visuels qui

viendraient am�eliorer l'usabilit�e g�en�erale.

Dans le cadre de notre discussion autour des applications mobiles conventionnelles

avec vue miniatures, l'�etude sur la RSVP de Cooper et al. [1] (cf. �g.6.25) m�erite

d'etre cit�ee. Cette �etude propose des modes de pr�esentation permettant de mettre

en �evidence certains usages dans di��erents contextes. Copper et al. s'int�eressent �a

d�e�nir une vitesse de pr�esentation ad�equate sur observation du scanning visuel ef-

fectu�e par notre ıil. D'apr�es nous, seul l'usage permet de d�eterminer quelle vitesse

150

Figure 6.23 – Description des deux m�ecanismes de changement de vue.

Figure 6.24 – Pr�esentation en vue vignettes (�a g.) et en mode contexte + focus(�a dr.).

Figure 6.25 – Trois modes de pr�esentation propos�es par Cooper et al. [1] (imageextraite de l'article de Cooper et al. [1])

Figure 6.26 – Vues vignettes adaptable et gestes de navigation

151

de pr�esentation est la plus ad�equate, et les utilisateurs devraient pouvoir personna-

liser la vitesse de pr�esentation a�n de synchroniser celle-ci sur leur comportement

de navigation. La RSVP pose �egalement la probl�ematique de la quantit�e de contenu

pr�esent�ee. Selon nous, les utilisateurs devraient �egalement pouvoir d�eterminer la

taille du contenu pr�esent�e. Nous proposons �g.6.26 une vue vignettes qui s'adapte

�a la vitesse de pr�esentation et �a la quantit�e de contenu. Les gestes r�ealis�es �a l'aide

de di��erents doigts permettent de d�eterminer la transition dans la vitesse de pr�e-

sentation et la taille du contenu.

Les appareils portables conventionnels avec entr�ees et sorties physiques sont d'une

capacit�e mat�erielle limit�ee et n�ecessitent de ce fait une interface plus adapt�ee et

souple permettant de satisfaire les di��erents usages. Il faut adapter le mod�ele d'in-

teraction, dans les modes de manipulation comme de visualisation. Bientot, la limite

du petit �ecran sur portable n'aura plus raison d'etre puisque les portables devraient

int�egrer des minis projecteurs issus d'une technologie mature. N�eanmoins, peu im-

porte la taille de l'�ecran que l'on utilise pour pr�esenter des contenus photos, ce qui

compte dans le design d'interface, c'est avant tout la prise en compte de l'usage,

autrement dit : �a quoi les contenus vont-ils servir, et quand les utilisera-t-on ?

152

Chapitre 7

Conclusions et perspectives

Le pr�esent chapitre vient clore notre dissertation. Nous y rappelons les probl�ema-

tiques li�ees �a l'interaction avec des contenus photos num�eriques et r�esumons les

propositions soumises dans ce sens. Dans le cadre d'une r�e exion autour de l'inter-

action avec des contenus multim�edia num�eriques, nous introduisons notre design

d'interface, navigateur tangible d'images inspir�e du Rubik's cube.

153

7.1 Conclusions

Les nouvelles technologies ouvrent des perspectives vari�ees quant �a la cr�eation et la

di�usion de contenus num�eriques toujours plus nombreux, tout particuli�erement en

ce qui concerne les contenus multim�edia complexes. Les contenus num�eriques sont

analogues �a des liquides : leur pr�esentation varie selon le contenant. Sur cet ordre

d'id�ees, la traditionnelle interface clavier est un contenant unique qui a, d'une part,

perdu sa capacit�e d'interaction et, d'autre part, limit�e les usages li�es �a l'interaction

avec les contenus num�eriques. Ce ph�enom�ene contribue �a la transition des GUI

(Interfaces Graphiques Utilisateur) vers les NUI (Interfaces Naturelles), ce qui non

seulement lib�ere l'utilisateur de l'interaction conventionnelle via clavier, mais fait

�egalement �emerger davantage d'usages nouveaux.

Exploration des solutions potentielles a travers le prisme de l’etat de l’art

A�n d'adresser les probl�ematiques li�ees �a la gestion des photos num�eriques, nous ob-

servons les d�eveloppements technologiques, leurs circonstances ainsi que les usages

quotidiens de la pratique photo. Nous dressons l'�etat de l'art (technologies, algo-

rithmes, techniques de visualisation) a�n d'o�rir un niveau de compr�ehension g�en�eral

vis-�a-vis des d�eveloppements technologiques actuels et de faciliter l'exploration des

techniques potentielles. �A partir d'un panorama des algorithmes de regroupement

photo, nous pr�esentons notre approche de cat�egorisation qui s'appuie sur di��erents

usages de la pratique photo.

Interaction avec des photos numeriques d’un point de vue design

La pr�esente dissertation vise �a proposer des solutions potentielles dans la gestion

des contenus photos num�eriques, et ce d'un point de vue design. Le design est le

�l conducteur de notre recherche. Nous suivons des proc�edures scienti�ques dans la

v�eri�cation des techniques d'interaction, l'int�egration d'interface sur appareil por-

table et l'organisation des contenus photos. Ce point de vue orient�e design nous

am�ene �a formuler des solutions concr�etes qui sont issues d'une r�e exion centr�ee sur

l'utilisateur. Nos propositions de design s'appuient sur une interaction intuitive et

se d�emarquent en cela tr�es clairement des interfaces avec clavier.

De nos jours, les navigateurs d'images int�egrent des techniques d'interaction plus

naturelles et des techniques de visualisation plus riches. Notre interface gestuelle

intuitive permet de parcourir des contenus photos num�eriques. Elle s'appuie sur une

�etude des gestes de manipulation physique que nous ex�ecutons sur des taches du

quotidien. Le type de pr�esentation (2D, 3D) importe peu : l'interaction avec des

contenus num�eriques ne s'appuie pas sur une distinction bas�ee sur la « dimension »des contenus, mais plutot sur l'aspect fonctionnel de ce qui est pr�esent�e �a l'utilisateur

et sur ce qu'il va pouvoir faire de ces contenus.

Proposition preliminaire de design visant a faire correspondre visualisation

et manipulation

Actuellement, les interfaces mobiles avec �ecran tactile qui permettent de manipuler

des contenus num�eriques s'attachent surtout �a d�e�nir une grammaire de gestes.

Elles �echouent n�eanmoins �a d�e�nir une pr�esentation visuelle qui correspondrait �a

ces gestes. Nos propositions d'interfaces gestuelles visent �a d�emontrer comment la

pr�esentation visuelle de l'interface peut d�eclencher l'usage du geste. A�n d'enrichir le

sens haptique, nos propositions s'appuient aussi bien sur des mouvements ex�ecut�es �a

main enti�ere que sur des mouvements ex�ecut�es �a un ou plusieurs doigts. Nous avons

154

�egalement int�egr�e di��erentes m�etaphores de visualisation a�n de mapper geste et

visualisation.

Les appareils portables disponibles sur le march�e sont en g�en�eral petits et �ns,

en forme de « tablette ». Loin d'enrichir la manipulation haptique, cette forme la

limite. D'apr�es nous, a�n de compenser l'insu�sance de manipulation physique li�ee

�a leur �ecran tactile, ces appareils devraient davantage s'appuyer sur une pr�esentation

virtuelle riche des contenus num�eriques. Loin des appareils portables classiques avec

�ecran rectangulaire, nous proposons Phora, design d'interface avec �ecran circulaire

et manipulation haptique riche permettant de visualiser des albums photos de taille

cons�equente. A�n de pouvoir s'adapter �a l'usage dans di��erentes conditions de

mobilit�e, l'interaction avec des photos num�eriques sur appareil portable n�ecessite

des techniques de manipulation plus intuitives et des modes de visualisation plus

adapt�es. Ceci est particuli�erement vrai lorsque les photos v�ehiculent des signaux

�emotionnels. Il faut alors induire des techniques d'interaction originales qui am�enent

l'utilisateur �a revivre ses exp�eriences pass�ees.

155

7.2 Presentation tangible inspiree du Rubik’s cube

pour interaction future avec des photos nume-

riques

Le Rubik's cube propose �a la fois des techniques riches de manipulation et un mod�ele

de pr�esentation original. Nous nous int�eressons �a sa capacit�e d'interaction tangible

et d�eveloppons un navigateur d'images permettant de parcourir des albums photos

de taille cons�equente.

Sur la base du Rubik's cube, nous d�e�nissons deux cat�egories de pr�esentation cu-

bique : pr�esentation cubique r�eguli�ere et irr�eguli�ere. La pr�esentation cubique r�e-

guli�ere permet d'arranger les cubes en une matrice 3D (Rubik's cube de 3x3x3,

4x4x4 ou 5x5x5). Cette matrice comporte six faces carr�ees, souvent de di��erentes

couleurs, et qui pr�esentent des visuels vari�es. La manipulation d'une pr�esentation

cubique r�eguli�ere s'e�ectue en tournant verticalement ou horizontalement le rang

ou la colonne de cubes miniatures. Par ailleurs, il existe deux types de pr�esentation

cubique irr�eguli�ere : celle bas�ee sur des petits cubes et celle bas�ee sur des « briques »3D irr�eguli�eres (sorte de Tetris 3D). Un exemple de pr�esentation sur petits cubes

est l'�etude Wooden Brains [131] o�u chaque cube peut etre librement retir�e a�n de

construire di��erentes faces. La pr�esentation Tetris 3D permet quant �a elle d'assem-

bler di��erentes briques 3D irr�eguli�eres pour construire soit une matrice cubique (cf.

�g.7.1), soit une pr�esentation ouverte par di��erentes combinaisons de briques sur

une base matricielle carr�ee (cf. �g.7.2).

Figure 7.1 – Cube obtenu via la pr�esentation Tetris 3D.

Figure 7.2 – Pr�esentation Tetris 3D

156

La pr�esentation cubique r�eguli�ere pr�esente un contenu riche aux joueurs sur des

faces planes et compl�etes. Meme richesse de contenu pour la pr�esentation cubique

irr�eguli�ere, avec toutefois quelques di��erences. Si nous projetons des images 2D

sur une pr�esentation cubique r�eguli�ere et sur une pr�esentation irr�eguli�ere, la vue

du dessus est la meme pour les deux pr�esentations : il s'agit d'une matrice carr�ee.

Mais, si on la regarde de cot�e, la pr�esentation irr�eguli�ere permet une mise en relation

visuelle des contenus pr�esent�es sur deux vues di��erentes. A�n d'�etuder les possibilit�es

visuelles de la pr�esentation cubique, nous avons d�evelopp�e un prototype qui illustre

les deux types de pr�esentation irr�eguli�ere. Nous avons achet�e un jeu de cubes en

bois (huit blocs) et avons coll�e des photos sur chaque face. Les blocs sont assembl�es

pour construire une matrice cubique 3x3x3 (cf �g.7.3). Notre prototype permet de

visualiser deux types de pr�esentation cubique irr�eguli�ere. La premi�ere pr�esentation

est directement inspir�ee de l'�etude « Wooden Brains », dans un espace de 4x4x4 (cf.

�g.7.4). La deuxi�eme n'est pour sa part pas limit�ee dans l'espace (cf. �g.7.5). Pour

chaque pr�esentation, nous avons photographi�e cinq vues qui permettent d'appr�ecier

les di��erents rendus pour des memes images.

Potentiel de la presentation cubique dans la visualisation de photos nume-

riques

Sur la base de la pr�esentation cubique, nous avons mis au point un prototype per-

mettant de simuler la visualisation de contenus photos num�eriques. Notre objectif :

identi�er les possibilit�es o�ertes par la pr�esentation cubique dans la gestion des

photos num�eriques.

1. Pr�esentation cubique et organisation des contenus photos

Dans notre prototype, chaque pr�esentation cubique est constitu�ee de groupes

de blocs (trois ou quatre blocs par groupe) de formes di��erentes. On peut

consid�erer chaque groupe comme un regroupement d'images qui serait ob-

tenu par di��erents algorithmes de regroupement, comme discut�e au chapitre

2. Nous avons appliqu�e notre cat�egorisation d�ecrite au chapitre 3 �a la pr�esen-

tation cubique. Sur cette id�ee, nous avons associ�e chaque forme particuli�ere

de bloc Tetris [151] �a l'une de nos six cat�egories (cf. tableau 7.1). Pour d�e-

�nir la position relative de chaque bloc photo dans la pr�esentation cubique,

on peut utiliser les balises extraites des m�etadonn�ees, comme par exemple

l'information chronologique ou g�eographique.

2. Caract�eristiques de la pr�esentation cubique irr�eguli�ere

La caract�eristique principale de ce type de pr�esentation est le caract�ere irr�egu-

lier de ses faces, construites par assemblage de di��erents blocs. Comme pour

le prototype en �g.7.4, chaque face de la pr�esentation cubique est arrang�ee

de fa�con �a pouvoir caract�eriser le contenu de l'album photo. Chaque face pro-

pose un rafra�chissement du mode d'a�chage et de pr�esentation d'un meme

contenu. Une autre caract�eristique de ce type de pr�esentation est l'exp�erience

visuelle singuli�ere que permet son arrangement irr�egulier. Par exemple, �g.7.4,

si on observe la pr�esentation du dessus, le rendu visuel est une matrice car-

r�ee de 4x4 constitu�ee de miniatures photos, alors qu'il s'agit en r�ealit�e d'une

accumulation de photos sur di��erentes couches. Ce genre d'illusion pourrait

encourager les utilisateurs �a explorer le contenu d'une collection photo, avec

une surprise �a la cl�e sur chaque face. Par ailleurs, on sait que l'interaction

avec un objet 3D n�ecessite des techniques complexes de manipulation. On

peut donc imaginer que l'interaction avec une pr�esentation cubique irr�eguli�ere

int�egr�ee �a un espace 3D n�ecessitera des techniques encore plus complexes de

manipulation pour tourner ou d�eplacer librement chacun des blocs.

157

3. Mise en relation avec la d�ecouverte inattendue

Pour un contenu familier tel qu'un album photo personnel, on peut rattacher

le contexte de la d�ecouverte de l'inattendu �a la d�efamiliarisation vis-�a-vis du

contenu. Comme discut�e au chapitre 2, la d�efamiliarisation att�enue la compr�e-

hension �etablie vis-�a-vis de choses famili�eres. Il y a d�efamiliarisation lorsque

l'on arrange ou dispose le contenu d'un album photo d'une fa�con inhabi-

tuelle. Le mode d'arrangement utilis�e dans la pr�esentation cubique irr�eguli�ere

peut etre consid�er�e comme un m�ecanisme de d�efamiliarisation vis-�a-vis du

contenu. Son caract�ere irr�egulier peut induire la d�ecouverte de l'indice qui

guidera l'utilisateur vers l'inattendu, augmentant de ce fait la probabilit�e de

faire une d�ecouverte heureuse. �g.7.4, par exemple, chaque face de la pr�esen-

tation cubique permet une d�efamiliarisation vis-�a-vis du contenu, lequel revet

un caract�ere inconnu et nouveau au fur et �a mesure qu'on le parcourt.

De par cet arrangement irr�egulier, les utilisateurs peuvent explorer et appr�ecier

leurs contenus photos avec davantage de curiosit�e. On peut rapprocher ce mo-

d�ele de visualisation du Casual InfoVis, avec son approche non-conventionnelle

dans l'exploration et la pr�esentation de contenus num�eriques (e�ets visuels

prononc�es). Et surtout, la pr�esentation cubique irr�eguli�ere, divertissante, in-

cite l'utilisateur �a poursuivre son exploration des contenus photos.

4. Cube transform�e, un nouveau type d'Origami

Le cube de la �g.7.3 �etant un assemblage de di��erents modules permettant

de pr�esenter 124 photos, on peut consid�erer qu'il existe deux modes possibles

de pr�esentation pour ce cube : mode pli�e et d�epli�e. Lorsqu'il est compact�e en

matrice 3x3x3, chacune de ses faces pr�esente 9 images. Si on le met �a plat,

on peut a�cher 27 images. Les utilisateurs ont par ailleurs la possibilit�e de

manipuler les di��erents blocs a�n d'explorer le contenu cach�e. La pr�esentation

cubique pr�esente selon nous une capacit�e de transformation libre qui permet

d'a�cher les contenus photos d'une fa�con plus dynamique. De meme, si on

les rapproche, la visualisation Origami (discut�ee chapitre 3) et la transforma-

tion du cube suivent le meme principe : plier un contenu riche de di��erentes

mani�eres qui sont tout autant de modes de pr�esentation.

Pour r�esumer, les r�esultats obtenus avec notre prototype nous am�enent �a penser

que la pr�esentation cubique est un concept riche dans son mod�ele de pr�esentation

comme dans ses techniques intuitives d'interaction. La pr�esentation cubique peut

s'int�egrer de deux fa�cons. La premi�ere : int�egrer les techniques de visualisation et

d'interaction de la pr�esentation cubique �a un syst�eme 3D, a�n d'interagir avec les

contenus photos personnels. Ou encore, les int�egrer �a une installation physique qui

permette de manipuler les cubes par interaction tangible. La deuxi�eme : simpli�er la

technique de visualisation de la pr�esentation cubique et l'int�egrer �a un syst�eme 2,5D,

c'est-�a-dire une pr�esentation 2D avec des e�ets visuels sp�eci�ques permettant de

simuler une visualisation 3D. Le mod�ele de visualisation de la pr�esentation cubique

peut par ailleurs etre d�ecorrell�e de sa technique d'interaction. On peut ainsi �etablir

un mappage m�etaphorique qui s'inspirerait des techniques d'interaction utilis�ees

sur d'autres taches physiques, et adapter ce mod�ele de visualisation �a un �eventail

plus vaste d'applications. Ce mod�ele pourrait tout particuli�erement concerner les

appareils sur lesquels on ne pourrait pas ex�ecuter des gestes de manipulation aussi

complexes que sur un Rubik's cube (par exemple tourner dans un sens, puis dans

l'autre). Le Rubik's cube �etant un puzzle 3D que l'on manipule �a deux mains, il

faudrait id�ealement int�egrer ses techniques de manipulation �a des appareils portables

qui seraient eux aussi manipul�es �a deux mains.

158

Tableau 7.1 – Correspondance entre notre cat�egorisation et les formes repr�e-sentatives bas�ees sur Tetris.

Categories Forme Teris Representationvisuelle

Cat�egorie A Lettre I(vue statique simple)

Cat�egorie B) Lettre J(vues multples)

Cat�egorie C Lettre L(capture de mouvement)

Cat�egorie D Lettre O(capture de mouvement)

Cat�egorie E Lettre S(groupes)

Cat�egorie F Lettre T(groupes en mouvement)

Figure 7.3 – Prototype de pr�esentation cubique irr�eguli�ere

159

Figure 7.4 – Six vues di��erentes du prototype du premier type de pr�esentationcubique irr�eguli�ere : vue 3D (A), vue du dessus (B au centre), vuede face (B en bas), vue arri�ere (B en haut), vue gauche (B �a g.)et droite (B �a dr.)

Figure 7.5 – Six vues di��erentes du deuxi�eme type de prototype de visualisationirr�eguli�ere : vue 3D (A), vue du dessus (B au centre), vue de face(B en bas), vue arri�ere (B en haut), vue gauche (B �a g.) et droite(B �a dr.)

160

7.3 Notre vision de l’avenir

Les progr�es technologiques sont synonyme d'une perp�etuelle �evolution en ce qui

concerne l'interaction avec des contenus num�eriques sur appareils portables. Par

cons�equent, on peut imaginer qu'un nouveau medium viendra pallier certaines limi-

tations physiques des appareils portables classiques, comme par exemple leur taille

d'�ecran et les techniques d'interaction qu'ils int�egrent. �g.7.6, nous illustrons en

trois �etapes les caract�eristiques de ce medium du futur �a travers sa relation avec les

contenus num�eriques.

Les nouveaux m�edia sont semblables �a un entonnoir. Les contenus num�eriques em-

pruntent cet entonnoir et sont interpr�et�es de deux fa�cons : selon une pr�esentation

tangible ou une pr�esentation virtuelle. La premi�ere propose une repr�esentation phy-

sique des contenus qui permet leur manipulation physique. La seconde correspond

�a un mode de visualisation intangible s'appuyant sur des modes de repr�esentation

visuelle de ces memes contenus.

Les d�eveloppements et travaux autour des modes de pr�esentation tangible suivent

assez �d�element les sp�eci�cations des appareils traditionnels avec �ecran. La pr�esen-

tation tangible permet d'interagir �a l'�ecran avec les contenus num�eriques via une

interface physique ou tangible, comme par exemple un �ecran tactile ou un m�eca-

nisme tangible. C'est la direction que suit l'�etude Siftables [152](cf. �g.7.7).

Dans le cas de la pr�esentation intangible, le recours �a des techniques de projection

susceptibles de pallier les limitations de l'�ecran des portables vient accentuer le

caract�ere intangible de l'interaction qu'o�re la pr�esentation virtuelle.

(a) nouveau medium (b) contenus numeriquespar nouveau medium

(c) interactions relativesselon presentations

Figure 7.6 – Diagramme en entonnoir : les trois �etapes de la relation media /contenus num�eriques (�a gauche, au milieu, �a droite)

161

Figure 7.7 � Siftables (image extraite de chatterboxer.wordpress.com)

Figure 7.8 � Sixthsenses (image extraite de www.pranavmistry.com)

La projection virtuelle peut en ce sens être presentee dans tout environnement et

sur des usages varies. Cette presentation introduit un autre modele d’ interaction

avec des contenus numeriques via une manipulation hors écran, comme le propose

l’ étude SixSense [153] (cf. fig.7.8).

En tant que contenus audiovisuels, les photos numeriques sont souvent riches en

informations émotionnelles, particulierement dans le cas de contenus personnels.

Afin d’ enrichir l’ experience de navigation photo, l’ interface du futur devra integrer un

mecanisme base sur la multi modalite (vue, toucher, ouıe, etc . . .) qui permettra de

declencher chez l’ utilisateur davantage d’ indices émotionnels a partir des contenus

numeriques.

162

Bibliographie

[1] K. Cooper, O. De Bruijn, R. Spence, and M. Witkowski. A comparison of

static and moving presentation modes for image collections. In AVI ’06 :

Proceedings of the working conference on Advanced visual interfaces, pages

381{388, New York, NY, USA, 2006. ACM. ISBN 1-59593-353-0. doi : http://doi.acm.org/10.1145/1133265.1133345. (pages 4, 55, 56, 93, 150, and 151)

[2] T. Kindberg, M. Spasojevic, R. Fleck, and A. Sellen. How and why people

use camera phones. Technical report, HP Labs, 2004. (pages 9 and 30)

[3] N. Portolan, S. Jumpertz, and O. Koechlin. Astrolabe ou la nagigation tout

en images et en sons. In IHM ’02 : Proceedings of the 14th French-speaking

conference on Human-computer interaction (Conference Francophone sur l’In-

teraction Homme-Machine), pages 199{200, New York, NY, USA, 2002.

ACM. ISBN 1-58113-615-3. doi : http://doi.acm.org/10.1145/777005.777032. (page 12)

[4] T. Palta. Idc forcasts growth for the digital camera market, 2007. URL

http://www.digitalcamerainfo.com. (page 13)

[5] Media Culpa. Flickr reaches 3 billion photos, 2009. URL http://www.

kullin.net/2009/05/flickr-reaches-35-billion-photos.html.

(page 14)

[6] G. Kim and W. Chan. Understanding camera phone imaging : Motivations,

behaviors and meanings. In HCI (2), pages 374{383, 2007. (page 16)

[7] R. Rosenberg. Computing without Mice and Keyboards : Text and Graphic

Input Devices for Mobile Computing. PhD thesis, University of London, 1998.

(page 16)

[8] I. Salminen, J. Lehikoinen, and J. Huuskonen. Developing an extensible mo-

bile metadata ontology. In Proceedings of the ninth IASTED International

conference on Software Engineering and applications, pages 266{272. ACTA

Press, 2005. (page 16)

[9] Cloud computing : an overview and future direction, 2009. URL http://

blog.taragana.com. (page 17)

[10] J. Vilches. Weekend open forum : Google chrome os and the future of cloud

computing"

2009. URL http://www.techspot.com. (page 17)

163

[11] J. Lehikoinen, A. Aaltonen, P. Huuskonen, and I. Salminen. Personal content

experience : managing digital life in the mobile age. Chichester, England ;

Hoboken, NJ : John Wiley, 2007. (page 17)

[12] K. Rodden and K.R. Wood. How do people manage their digital photographs ?

In Proceedings of the SIGCHI conference on Human factors in computing

systems, pages 409{416. ACM New York, NY, USA, 2003. (pages 24, 44, 102,

and 104)

[13] O. Chavarro. An historical timeline of computer graphics and animation,

2006. URL http://sophia.javeriana.edu.co/~ochavarr/computer_

graphics_history/historia. (page 26)

[14] C. Ford and K. Steinorth, editors. You Press the Button, We Do the Rest :

the Birth of snapshot Photography. Dirk Nishen, 1988. (page 26)

[15] D. Frohlich and E. Tallyn. Audiophotography : practice and prospects. In CHI

’99 : CHI ’99 extended abstracts on Human factors in computing systems,

pages 296{297, New York, NY, USA, 1999. ACM. ISBN 1-58113-158-5. doi :

http://doi.acm.org/10.1145/632716.632897. (pages 28 and 29)

[16] MicrosoftSurface. Microsoft surface, 2008. URL http://www.microsoft.

com/surface/NoSilverlight.aspx. (page 29)

[17] Corel PhotoCD. Corel photocd, 1985. URL http://www.corel.com.

(page 30)

[18] GettyImages. Gettyimages, 2003. URL http://www.gettyimages.com.

(page 30)

[19] Z. Pousman, J. Stasko, and J. Mateas. Casual information visualization :

Depictions of data in everyday life. IEEE Transactions on Visualization and

Computer Graphics, 13 :1145{1152, 2007. ISSN 1077-2626. doi : http://doi.ieeecomputersociety.org/10.1109/TVCG.2007.70541. (pages 31 and 64)

[20] Ambient orb, 2004. URL http://www.ambientdevices.com. (page 31)

[21] J. Stasko, D. McColgin, T. Miller, C. Plaue, and Z. Pousman. Evaluating the

infocanvas peripheral awareness system : A longitudinal, in situ study, 2005.

(page 31)

[22] J. J. Cadiz, G. Venolia, G. Jancke, and A. Gupta. Designing and deploying

an information awareness interface. In CSCW ’02 : Proceedings of the 2002

ACM conference on Computer supported cooperative work, pages 314{323,

New York, NY, USA, 2002. ACM. ISBN 1-58113-560-2. doi : http://doi.acm.org/10.1145/587078.587122. (page 31)

[23] F. B. Viegas, S. Golder, and J. Donath. Visualizing email content : portraying

relationships from conversational histories. In CHI ’06 : Proceedings of the

SIGCHI conference on Human Factors in computing systems, pages 979{

988, New York, NY, USA, 2006. ACM. ISBN 1-59593-372-7. doi : http://doi.acm.org/10.1145/1124772.1124919. (page 31)

164

[24] PopularTagsCloud. Popular tags cloud, 2004. URL http://del.icio.us/

tags. (page 31)

[25] R. Xiong and J. Donath. Peoplegarden : creating data portraits for users. In

UIST ’99 : Proceedings of the 12th annual ACM symposium on User interface

software and technology, pages 37{44, New York, NY, USA, 1999. ACM.

ISBN 1-58113-075-9. doi : http://doi.acm.org/10.1145/320719.322581.

(page 32)

[26] Wignell. Sorting, 2007. URL http://www.annawignell.com. (page 32)

[27] M. Romero and M. Mateas. A preliminary investigation of alien presence. In

HCI, Lecture Notes in Computer Science. Springer, 2005. (page 32)

[28] F. B. Viegas, E. Perry, E. Howe, and J. Donath. Artifacts of the presence era :

Using information visualization to create an evocative souvenir. In INFOVIS

’04 : Proceedings of the IEEE Symposium on Information Visualization, pages

105{111, Washington, DC, USA, 2004. IEEE Computer Society. ISBN 0-7803-

8779-3. doi : http://dx.doi.org/10.1109/INFOVIS.2004.8. (page 32)

[29] B. Bederson. Photomesa : a zoomable image browser using quantum

treemaps and bubblemaps. In UIST’01 : Proceedings of the 14th an-

nual ACM symposium on User interface software and technology, pages

71{80, New York, NY, USA, 2001. ACM. ISBN 1-58113-438-X. doi :

http://doi.acm.org/10.1145/502348.502359. (pages 32, 34, 44, 49, and 102)

[30] R. Merton and E. Barber. The travels and adventures of serendipity, page 1.

Princeton University, 2004. (page 33)

[31] R. Merton and E. Barber. The travels and adventures of serendipity, page 46.

Princeton University, 2004. (page 33)

[32] R. Merton and E. Barber. The travels and adventures of serendipity, page

167. Princeton University, 2004. (pages )

[33] T. W. Leong, F. Vetere, and S. Howard. The serendipity shu�e. In OZCHI

’05 : Proceedings of the 17th Australia conference on Computer-Human Inter-

action, pages 1{4, Narrabundah, Australia, Australia, 2005. Computer-Human

Interaction Special Interest Group (CHISIG) of Australia. ISBN 1-59593-222-

4. (page 34)

[34] T. W. Leong, F. Vetere, and S. Howard. Randomness as a resource for

design. In DIS ’06 : Proceedings of the 6th conference on Designing Interactive

systems, pages 132{139, New York, NY, USA, 2006. ACM. ISBN 1-59593-

367-0. doi : http://doi.acm.org/10.1145/1142405.1142428. (page 34)

[35] T. W. Leong, S. Howard, and F. Vetere. Choice : abidcating or exercising ?

In CHI ’08 : Proceeding of the twenty-sixth annual SIGCHI conference on

Human factors in computing systems, pages 715{724, New York, NY, USA,

2008. ACM. ISBN 978-1-60558-011-1. doi : http://doi.acm.org/10.1145/1357054.1357168. (pages 34 and 35)

165

[36] A. Kuchinsky, C. Pering, M. L. Creech, D. Freeze, B. Serra, and J. Gwizdka.

Foto�le : a consumer multimedia organization and retrieval system. In CHI

’99 : Proceedings of the SIGCHI conference on Human factors in computing

systems, pages 496{503, New York, NY, USA, 1999. ACM. ISBN 0-201-

48559-1. doi : http://doi.acm.org/10.1145/302979.303143. (pages 34, 46,

49, 102, 131, and 132)

[37] A. Walter, D. Webling, K. Essig, and H. Ritter. Interactive hyperbolic image

browsing { towards an integrated multimedia navigator. In KDD ’06 : Pro-

ceedings of the 12th ACM SIGKDD international conference on Knowledge

discovery and data mining, pages 111{118. ACM, 2006. (page 34)


192. Princeton University, 2004. (page 35)


178. Princeton University, 2004. (page 38)

[40] RubiksCube. Rubikscube, 1974. URL http://www.rubiks.com/. (pages 40

and 80)

[41] NISO. Understanding metadata, national information standards organiza-

tion. NISO, 2001. URL http://www.niso.org/standards/resources/

UnderstandingMetadata.pdf. (page 42)

[42] Exchangeable image �le format, 1998. URL http://en.wikipedia.org/.

(page 42)

[43] JEITA. Jeita, 2009. URL www.jeita.or.jp/english/. (page 42)

[44] D. Kirk, A. Sellen, C. Rother, and K. Wood. Understanding photowork.

In Proceedings of the SIGCHI conference on Human Factors in computing

systems, page 770. ACM, 2006. (pages 42 and 102)

[45] Iptcheader, 1990. URL http://www.iptc.org/IIM/. (page 42)

[46] dublincore. dublincore, 1995. URL http://dublincore.org/. (page 42)

[47] DIG35. Dig35, 2000. URL http://www.i3a.org. (page 42)

[48] MPEG-7. Mpeg-7, 2009. URL http://en.wikipedia.org/wiki/MPEG-7.

(page 42)

[49] XMP. Xmp, 2009. URL http://www.adobe.com/products/xmp/. (page 42)

[50] A. Graham, H. Garcia-Molina, A. Paepcke, and T. Winograd. Time as es-

sence for photo browsing through personal digital libraries. In JCDL ’02 :

Proceedings of the 2nd ACM/IEEE-CS joint conference on Digital libraries,



166

[51] S. Harada, M. Naaman, Y.J. Song, Q.Y. Wang, and A. Paepcke. Lost in

memories : interacting with photo collections on pdas. In JCDL ’04 : Procee-

dings of the 4th ACM/IEEE-CS joint conference on Digital libraries, pages

325{333, New York, NY, USA, 2004. ACM. ISBN 1-58113-832-6. doi :

http://doi.acm.org/10.1145/996350.996425. (pages 44, 58, 90, and 93)

[52] J. Gemmell, G. Bell, R. Lueder, S. Drucker, and C. Wong. Mylifebits : ful-

�lling the memex vision. In MULTIMEDIA ’02 : Proceedings of the tenth

ACM international conference on Multimedia, pages 235{238, New York,

NY, USA, 2002. ACM. ISBN 1-58113-620-X. doi : http://doi.acm.org/10.1145/641007.641053. (pages 44, 49, and 51)

[53] M. Naaman, S. Harada, Q.Y. Wang, H. Garcia-Molina, and A. Paepcke.

Context data in geo-referenced digital photo collections. In MULTIMEDIA

’04 : Proceedings of the 12th annual ACM international conference on Mul-

timedia, pages 196{203, New York, NY, USA, 2004. ACM. ISBN 1-58113-


[54] C. Tomiai, S. Battle, and S. Cayzer. Sharing, discovering and browsing geo-

tagged pictures on the web. Technical report, HP Labs, 2007. (page 45)

[55] K. Toyama, R. Logan, and A. Roseway. Geographic location tags on digital

images. In Proceedings of the eleventh ACM international conference on

Multimedia, pages 156{166, New York, NY, USA, 2003. ACM. ISBN 1-

58113-722-2. doi : http://doi.acm.org/10.1145/957013.957046. (page 45)

[56] R. Datta, D. Joshi, J. Li, and J. Z. Wang. Image retrieval : Ideas, in uences,

and trends of the new age. ACM Comput. Surv., 40(2) :1{60, 2008. ISSN


[57] A. Girgensohn, J. Adcock, and L. Wilcox. Organizing photos of people. In

ACM, editor, UIST ’04 - Adjunct Proceedings of the 17th annual ACM Sym-

posium on User Interface Software and Technology, 2004. (page 46)

[58] A. Girgensohn, J. Adcock, and L. Wilcox. Leveraging face recognition tech-

nology to �nd and organize photos. In MIR ’04 : Proceedings of the 6th

ACM SIGMM international workshop on Multimedia information retrieval,


http://doi.acm.org/10.1145/1026711.1026728. (page 46)

[59] J. Xiao and T. Zhang. Face bubble : photo browsing by faces. In AVI ’08 :

Proceedings of the working conference on Advanced visual interfaces, pages

343{346, New York, NY, USA, 2008. ACM. ISBN 1-978-60558-141-5. doi :

http://doi.acm.org/10.1145/1385569.1385628. (pages 46, 49, 102, 131, 132,

and 134)

[60] K. Rodden, W. Basalaj, D. Sinclair, and K. Wood. Does organisation by

similarity assist image browsing ? In CHI ’01 : Proceedings of the SIGCHI

conference on Human factors in computing systems, pages 190{197, New

York, NY, USA, 2001. ACM. ISBN 1-58113-327-8. doi : http://doi.acm.org/10.1145/365024.365097. (pages 46, 93, 102, and 130)

167

[61] R. Jaimes, S.F. Chang, and E. C. Loui. Detection of non-identical duplicate

consumer photographs. In Proc. ICICS – PCM 2003, pages 16{20, 2003.

(pages 46, 102, 105, and 106)

[62] A. Jaimes, S.F. Chang, and A.C. Loui. Duplicate detection in consumer

photography and news video. In In Proc. MM Int. Conf. on Multimedia,

pages 423{424, 2002. (page 46)

[63] F. Scha�alitzky and A. Zisserman. Multi-view matching for unordered image

sets, or "how do i organize my holiday snaps ?". In ECCV ’02 : Proceedings

of the 7th European Conference on Computer Vision-Part I, pages 414{431,

London, UK, 2002. Springer-Verlag. ISBN 3-540-43745-2. (pages 46 and 102)

[64] N. Snavely, S. M. Seitz, and R. Szeliski. Photo tourism : exploring photo

collections in 3d. In SIGGRAPH ’06 : ACM SIGGRAPH 2006 Papers, pages



[65] Alexander Loui. Automatic image event segmentation and quality screening

for albuming applications. In ICME 2000, pages 1125{1128, 2000. (page 46)

[66] M. Cooper, J. Foote, A. Girgensohn, and L. Wilcox. Temporal event

clustering for digital photo collections. In MULTIMEDIA ’03 : Procee-

dings of the eleventh ACM international conference on Multimedia, pages



[67] J.C. Platt, M. Czerwinski, and B.A. Field. Phototoc : Automatic clustering for

browsing personal photographs. In Proceedings of the 2003 Joint Conference

of the Fourth International Conference on Information, Communications and

Signal Processing,, volume 1, pages 6{10. IEEE, 15-18 Dec. 2003. (pages 47,

49, 50, 93, and 102)

[68] B. Suh and B.B Bederson. Semi-automatic image annotation using event

and torso identi�cation. Technical report, Computer Science Department,

University of Maryland, College Park, MD, 2004. (page 47)

[69] T. J. Mills, D. Pye, D. Sinclair, and K.R. Wood. Shoebox : A digital photo

management system. Technical report, ATT Research, 2000. (pages 47 and 49)

[70] S. M. Drucker, C. Wong, A. Roseway, S. Glenner, and S. De Mar. Media-

browser : reclaiming the shoebox. In AVI ’04 : Proceedings of the working

conference on Advanced visual interfaces, pages 433{436, New York, NY,

USA, 2004. ACM. ISBN 1-58113-867-9. doi : http://doi.acm.org/10.1145/989863.989944. (pages 47 and 49)

[71] J.C. Platt. Autoalbum : Clustering digital photographs using probabilistic

model merging. In IEEE Workshop on Content-Based Access of Image and

Video Libraries 2000, pages 96{100. Press, 2000. (pages 47 and 49)

[72] Y. Sun, H. Zhang, L. Zhang, and M. Li. Myphotos : a system for home

photo management and processing. In MULTIMEDIA ’02 : Proceedings of

168

the tenth ACM international conference on Multimedia, pages 81{82, New

York, NY, USA, 2002. ACM. ISBN 1-58113-620-X. doi : http://doi.acm.org/10.1145/641007.641022. (pages 47, 49, and 51)

[73] M. Naaman, Y. J. Song, A. Paepcke, and H. Garcia-Molina. Automatic orga-

nization for digital photographs with geographic coordinates. In JCDL ’04 :

Proceedings of the 4th ACM/IEEE-CS joint conference on Digital libraries,



[74] U. Gargi, Y. Deng, and D. R. Tretter. Managing and searching personal photo

collections. Technical report, HP Labs, 2002. (pages 47 and 49)

[75] A. Girgensohn, J. Adcock, M. Cooper, J. Foote, and L. Wilcox. Simplifying

the management of large photo collections. In In Proc. of INTERACT’03,

IOS, pages 196{203. Press, 2003. (pages 47 and 49)

[76] J. Cui, F. Wen, R. Xiao, Y. Tian, and X. Tang. Easyalbum : an interac-

tive photo annotation system based on face clustering and re-ranking. In

CHI ’07 : Proceedings of the SIGCHI conference on Human factors in com-

puting systems, pages 367{376, New York, NY, USA, 2007. ACM. ISBN

978-1-59593-593-9. doi : http://doi.acm.org/10.1145/1240624.1240684.

(pages 47, 49, 50, and 102)

[77] M.S. Lew, N. Sebe, C. Djeraba, and R. Jain. Content-based multimedia

information retrieval : State of the art and challenges. ACM Trans. Multimedia

Comput. Commun. Appl., 2(1) :1{19, 2006. ISSN 1551-6857. doi : http://doi.acm.org/10.1145/1126004.1126005. (page 47)

[78] T. Tan, J. Chen, P. Mulhem, and M. Kankanhalli. Smartalbum : a multi-

modal photo annotation system. In MULTIMEDIA ’02 : Proceedings of the

tenth ACM international conference on Multimedia, pages 87{88, New York,

NY, USA, 2002. ACM. ISBN 1-58113-620-X. doi : http://doi.acm.org/10.1145/641007.641025. (page 49)

[79] W. Liu, Y. Sun, and H. Zhang. Mialbum - a system for home photo manage-

met using the semi-automatic image annotation approach. In MULTIMEDIA

’00 : Proceedings of the eighth ACM international conference on Multimedia,



[80] H.K. Ben and B. Shneiderman. Visualization methods for personal photo

collections : Browsing and searching in the photo�nder. In Proc. IEEE Inter-

national Conference on Multimedia and Expo (ICME2000), pages 1539{1542.

IEEE, 2000. (page 49)

[81] J. Mota, M. J. Fonseca, D. Gonccalves, and J. A. Jorge. Agrafo : a visual

interface for grouping and browsing digital photos. In AVI ’08 : Proceedings

of the working conference on Advanced visual interfaces, pages 494{495,

New York, NY, USA, 2008. ACM. ISBN 1-978-60558-141-5. doi : http://doi.acm.org/10.1145/1385569.1385673. (pages 49 and 52)

169

[82] O. Hilliges, D. Baur, and A. Butz. Photohelix : Browsing, sorting and sharing

digital photo collections. In Second Annual IEEE International Workshop

on In Horizontal Interactive Human-Computer Systems, pages 87{94. IEEE,

2007. (pages 49, 52, and 93)

[83] WD. Wd, 2009. URL http://www.wdc.com/. (page 53)

[84] B. Bederson, B. Shneiderman, and M. Wattenberg. Ordered and quantum

treemaps : Making e�ective use of 2d space to display hierarchies. ACM

Trans. Graph., 21(4) :833{854, 2002. ISSN 0730-0301. doi : http://doi.acm.org/10.1145/571647.571649. (pages 53)

[85] T. T. A. Combs and B. B. Bederson. Does zooming improve image browsing ?

In DL ’99 : Proceedings of the fourth ACM conference on Digital libraries,



[86] Microsoft. Photosynth, 2008. URL http://photosynth.net/Default.

aspx. (page 55)

[87] J. D. Mackinlay, G. G. Robertson, and S. K. Card. The perspective wall :

detail and context smoothly integrated. In CHI ’91 : Proceedings of the

SIGCHI conference on Human factors in computing systems, pages 173{176,

New York, NY, USA, 1991. ACM. ISBN 0-89791-383-3. doi : http://doi.acm.org/10.1145/108844.108870. (pages 56 and 120)

[88] N. Elmqvist, N. Henry, Y. Riche, and J.D. Fekete. Melange : space folding for

multi-focus interaction. In CHI ’08 : Proceeding of the twenty-sixth annual

SIGCHI conference on Human factors in computing systems, pages 1333{

1342, New York, NY, USA, 2008. ACM. ISBN 978-1-60558-011-1. doi :

http://doi.acm.org/10.1145/1357054.1357263. (pages 56, 57, and 120)

[89] J. Lamping, R. Rao, and P. Pirolli. A focus+context technique based on

hyperbolic geometry for visualizing large hierarchies. In CHI ’95 : Proceedings

of the SIGCHI conference on Human factors in computing systems, pages 401{

408, New York, NY, USA, 1995. ACM Press/Addison-Wesley Publishing Co.


(pages 56, 57, and 131)

[90] G. W. Furnas. Generalized �sheye views. In CHI ’86 : Proceedings of the

SIGCHI conference on Human factors in computing systems, pages 16{23,

New York, NY, USA, 1986. ACM. ISBN 0-89791-180-6. doi : http://doi.acm.org/10.1145/22627.22342. (pages 56 and 131)

[91] A. Khella and B. B. Bederson. Pocket photomesa : a zoomable image browser

for pdas. In MUM ’04 : Proceedings of the 3rd international conference on

Mobile and ubiquitous multimedia, pages 19{24, New York, NY, USA, 2004.

ACM. ISBN 1-58113-981-0. doi : http://doi.acm.org/10.1145/1052380.1052384. (page 58)

170

[92] J. Williamson and L. M. Brown. Flutter : directed random browsing of photo

collections with a tangible interface. In DIS ’08 : Proceedings of the 7th ACM

conference on Designing interactive systems, pages 147{155, New York, NY,

USA, 2008. ACM. ISBN 978-1-60558-002-9. doi : http://doi.acm.org/10.1145/1394445.1394461. (pages 58)

[93] R. Van Renesse, K. P. Birman, and W. Vogels. Astrolabe : A robust and

scalable technology for distributed system monitoring, management, and data

mining. ACM Trans. Comput. Syst., 21(2) :164{206, 2003. ISSN 0734-2071.

doi : http://doi.acm.org/10.1145/762483.762485. (page 58)

[94] G. Demontis, M. Mosconi, and M. Porta. Experimental interfaces for visual

browsing of large collections of images. In In Proc. of HCI International 2003.

Springer, 2003. (pages 58 and 93)

[95] M. Porta. Browsing large collections of images through unconventional vi-

sualization techniques. In AVI ’06 : Proceedings of the working conference on

Advanced visual interfaces, pages 440{444, New York, NY, USA, 2006. ACM.


(pages 58, 63, 93, and 102)

[96] MyPhotoEgg. Myphotoegg, 2008. URL http://www.myphotoegg.com/.

(pages 58, 132, and 150)

[97] Motorola. Fun album, 2009. URL http://www.motorola.com. (page 150)

[98] Mitzubishi. 3dpanel, 2009. URL http://techon.nikkeibp.co.jp/

english/NEWS_EN/20090310/166952/?P=1. (page 60)

[99] TOSHIBA. Qosmiog55, 2009. URL http://www.youtube.com/watch?v=

qpRxF7ZQ2wk. (page 60)

[100] J. Rekimoto. Tilting operations for small screen interfaces. In UIST ’96 :

Proceedings of the 9th annual ACM symposium on User interface software

and technology, pages 167{168, New York, NY, USA, 1996. ACM. ISBN 0-

89791-798-7. doi : http://doi.acm.org/10.1145/237091.237115. (page 60)

[101] D. J. Chatting. Action and reaction for physical map interfaces. In TEI

’08 : Proceedings of the 2nd international conference on Tangible and em-

bedded interaction, pages 187{190, New York, NY, USA, 2008. ACM. ISBN

978-1-60558-004-3. doi : http://doi.acm.org/10.1145/1347390.1347432.

(pages 60)

[102] Joel Bartlett. Rock 'n' scroll is here to stay. IEEE Comput. Graph. Appl.,

20(3) :40{45, 2000. ISSN 0272-1716. doi : http://dx.doi.org/10.1109/38.844371. (pages 60)

[103] S.J. Cho, C. Choi, Y. Sung, K. Lee, Y.B. Kim, and R. Murray-Smith. Dy-

namics of tilt-based browsing on mobile devices. In CHI ’07 : CHI ’07

extended abstracts on Human factors in computing systems, pages 1947{

1952, New York, NY, USA, 2007. ACM. ISBN 978-1-59593-642-4. doi :


171

[104] K. Hinckley, J. Pierce, M. Sinclair, and E. Horvitz. Sensing techniques for

mobile interaction. In UIST ’00 : Proceedings of the 13th annual ACM sym-

posium on User interface software and technology, pages 91{100, New York,

NY, USA, 2000. ACM. ISBN 1-58113-212-3. doi : http://doi.acm.org/10.1145/354401.354417. (page 60)

[105] A. Butler, S. Izadi, and S. Hodges. Sidesight : multi-"touch"interaction around

small devices. In UIST ’08 : Proceedings of the 21st annual ACM symposium

on User interface software and technology, pages 201{204, New York, NY,

USA, 2008. ACM. ISBN 978-1-59593-975-3. doi : http://doi.acm.org/10.1145/1449715.1449746. (page 62)

[106] S. Kristo�ersen and F. Ljungberg. Mobile use of it. In In Proceedings of the

22nd Information Systems Research Seminar in Scandinavia Conference (IRIS

22), 1999. (page 68)

[107] A. K. Karlson, B. B. Bederson, and J. L. Contreras-Vidal. Understanding

single-handed mobile device interaction. Technical report, University of Ma-

ryland, 2006. (page 68)

[108] D. Sa�er. Designing Gestural Interfaces : Touchscreens and Interactive De-

vices. O'Reilly, 2008. ISBN 978-0-596-51839-4. (pages 68, 70, and 86)

[109] M. Nielsen, M. Storring, T.B. Moeslund, and E. Granum. A procedure for

developing intuitive and ergonomic gesture interfaces for man-machine inter-

action. In In Gesture-Based Communication in Human-Computer Interaction,

volume 2915, pages 409{420. Springer Berlin / Heidelberg, 2004. (pages 69)

[110] Type of gesture, 2008. URL http://www.gesture.com/. (page 69)

[111] J. Cassell. A framework for gesture generation and interpretation. In Com-

puter Vision in Human-Machine Interaction, pages 191{215. Cambridge Uni-

versity Press, 2000. (page 69)

[112] Synaptics. Synaptics clearpad3000, 2009. URL http://theclevermonkey.

blogspot.com/2009/07/synaptics-clearpad-3000-up-to-10.html.

(page 70)

[113] Thirion S. Eliss, 2009. URL http://www.toucheliss.com/. (page 70)

[114] B. McDowell. Harmonica"

2008. URL http://www.pocketglow.com/

harmonica/. (page 70)

[115] SonyEricsson. Sony ericsson shows shake-to-shu�e walkman phone,

2007. URL http://www.reghardware.co.uk/2007/06/15/sonye_

updates_walkman_line/. (page 70)

[116] Apple. Apple ipod nano 4g, 2008. URL http://www.apple.com/ipodnano/

features.html. (page 70)

[117] Motorola. Motorola rokr zn50, 2008. URL http://www.mobilestopic.

com/reviews/motorola/rokr-zn50.html. (page 70)

172

[118] J.R. Napier. The prehensile movements of the human hand. Journal of Bone

and Joint Surgery, 38(B) :902{913, 1956. (pages 71)

[119] J. M. Elliott and K. J. Connolly. A classi�cation of manipulative hand mo-

vements. In Developmental Medicine and Child Neurology, 26(3) :283{296,

1984. (pages 71, 72, and 78)

[120] W. W. Gaver. The sonic�nder : an interface that uses auditory icons. Hum.-

Comput. Interact., 4(1) :67{94, 1989. ISSN 0737-0024. doi : http://dx.doi.org/10.1207/s15327051hci0401_3. (pages 73 and 74)

[121] C. Schwesig, I. Poupyrev, and E. Mori. Gummi : user interface for deformable

computers. In CHI ’03 : CHI ’03 extended abstracts on Human factors in

computing systems, pages 954{955, New York, NY, USA, 2003. ACM. ISBN

1-58113-637-4. doi : http://doi.acm.org/10.1145/765891.766091. (pages 73

and 78)

[122] B. L. Harrison, K. P. Fishkin, A. Gujar, C. Mochon, and R. Want. Squeeze me,

hold me, tilt me ! an exploration of manipulative user interfaces. In CHI ’98 :

Proceedings of the SIGCHI conference on Human factors in computing sys-

tems, pages 17{24, New York, NY, USA, 1998. ACM Press/Addison-Wesley

Publishing Co. ISBN 0-201-30987-4. doi : http://doi.acm.org/10.1145/274644.274647. (page 75)

[123] C. C. Marshall and S. Bly. Turning the page on navigation. In JCDL ’05 :

Proceedings of the 5th ACM/IEEE-CS joint conference on Digital libraries,



[124] G. Herkenrath, T. Karrer, and J. Borchers. Twend : twisting and bending

as new interaction gesture in mobile devices. In CHI ’08 : CHI ’08 extended

abstracts on Human factors in computing systems, pages 3819{3824, New

York, NY, USA, 2008. ACM. ISBN 978-1-60558-012-X. doi : http://doi.acm.org/10.1145/1358628.1358936. (page 78)

[125] D. Kunkle and G. Cooperman. Solving rubik's cube : disk is the new ram.

Commun. ACM, 51(4) :31{33, 2008. ISSN 0001-0782. doi : http://doi.acm.org/10.1145/1330311.1330319. (page 80)

[126] D. Kunkle and G. Cooperman. Twenty-six moves su�ce for rubik's cube.

In ISSAC ’07 : Proceedings of the 2007 international symposium on Sym-

bolic and algebraic computation, pages 235{242, New York, NY, USA,

2007. ACM. ISBN 978-1-59593-743-8. doi : http://doi.acm.org/10.1145/1277548.1277581. (page 80)

[127] L. Zeller. Cubebrowser, 2007. URL http://www.cubebrowser.de/.

(page 80)

[128] B. Schiettecatte and J. Vanderdonckt. Audiocubes : a distributed cube tan-

gible interface based on interaction range for sound design. In TEI ’08 :

Proceedings of the 2nd international conference on Tangible and embedded

173

interaction, pages 3{10, New York, NY, USA, 2008. ACM. ISBN 978-1-60558-


[129] Z. Zhou, A. D. Cheok, and J. Pan. 3d story cube : an interactive tangible

user interface for storytelling with 3d graphics and audio. Personal Ubiquitous

Comput., 8(5) :374{376, 2004. ISSN 1617-4909. doi : http://dx.doi.org/10.1007/s00779-004-0300-0. (pages 80 and 81)

[130] E. Sharlin, Y. Itoh, B. Watson, Y. Kitamura, S. Sutphen, and L. Liu. Cognitive

cubes : a tangible user interface for cognitive assessment. In CHI ’02 : Pro-

ceedings of the SIGCHI conference on Human factors in computing systems,



[131] N. Fraser. Wooden brain, 2008. URL http://neil.fraser.name/news/

2008/01/04/. (page 156)

[132] Symmetri. Search cube, 2008. URL http://search-cube.com/. (page 80)

[133] 3dconnexion. Spacenavigator, 2007. URL http://www.3dconnexion.com/.

(page 86)

[134] M. Chang, J. J. Leggett, R. Furuta, A. Kerne, J. P. Williams, S. A. Burns,

and R. G. Bias. Collection understanding. In JCDL ’04 : Proceedings of the

4th ACM/IEEE-CS joint conference on Digital libraries, pages 334{342, New

York, NY, USA, 2004. ACM. ISBN 1-58113-832-6. doi : http://doi.acm.org/10.1145/996350.996426. (page 93)

[135] O. Christmann and N. Carbonell. Browsing through 3d representations of

unstructured picture collections : an empirical study. In AVI ’06 : Proceedings

of the working conference on Advanced visual interfaces, pages 445{448, New

York, NY, USA, 2006. ACM. ISBN 1-59593-353-0. doi : http://doi.acm.org/10.1145/1133265.1133355. (page 93)

[136] K.P. Yee, K. Swearingen, K. Li, and M. Hearst. Faceted metadata for image

search and browsing. In CHI ’03 : Proceedings of the SIGCHI conference

on Human factors in computing systems, pages 401{408, New York, NY,

USA, 2003. ACM. ISBN 1-58113-630-7. doi : http://doi.acm.org/10.1145/642611.642681. (page 93)

[137] Olympus. Olympus sp-590uz, 2008. URL http://www.olympus.co.uk/

consumer/29_digital_camera_sp-590_uz_specifications_20572.

htm. (page 103)

[138] Kodak. Kodak easyshare z980, 2009. URL http://www.kodak.com/.

(page 103)

[139] SonyEricsson. Sony ericsson k800i, 2007. URL http://www.sonyericsson.

com/cws/products/mobilephones/overview/k800i. (page 103)

[140] T. W. Malone. How do people organize their desks ? : Implications for the

design of o�ce information systems. ACM Trans. Inf. Syst., 1(1) :99{112,

174

1983. ISSN 1046-8188. doi : http://doi.acm.org/10.1145/357423.357430.

(page 104)

[141] C. C. Marshall and S. Bly. Saving and using encountered information :

implications for electronic periodicals. In CHI ’05 : Proceedings of the

SIGCHI conference on Human factors in computing systems, pages 111{

120, New York, NY, USA, 2005. ACM. ISBN 1-58113-998-5. doi : http://doi.acm.org/10.1145/1054972.1054989. (page 104)

[142] Grono� J.-D. Bertin, J. Bonin S. and Laclau A. La graphique et le traitement

graphique de l’information. Flammarion, Paris, 1977. ISBN 2 08 211112 1.

(page 111)

[143] R. Lang. Idea plus square is equal to orgami, 2008. URL http://www.ted.

com/index.php/talks/robert_lang_folds_way_new_origami.html.

(page 120)

[144] Rovi. Rovi liquid media guide interface, 2009. URL http://news.cnet.

com/8301-17938_105-10288475-1.html. (page 120)

[145] Nokia. Nokia scentsory, 2008. URL http://www.tuvie.com/

scentsory-nokia-future-of-mobile-phone-concept/. (page 120)

[146] Zoopraxiscope. Zoopraxiscope, 1879. URL http://en.wikipedia.org/

wiki/Zoopraxiscope. (page 122)

[147] C. Shen, N. Lesh, and F. Vernier. Personal digital historian : story sharing

around the table. interactions, 10(2) :15{22, 2003. ISSN 1072-5520. doi :


[148] Cooliris. Cooliris navigator, 2008. URL http://www.cooliris.com/.

(pages 138 and 150)

[149] Google. Google nexus one, 2009. URL http://www.google.com/phone.

(page 138)

[150] N. Belmonte. Javascript infovis toolkits, 2008. URL http://thejit.org/.

(page 144)

[151] A. Pajitnov. Tetris, 1984. URL http://en.wikipedia.org/wiki/Tetris.

(page 157)

[152] D. Merrill, J. Kalanithi, and P. Maes. Siftables : towards sensor network

user interfaces. In TEI ’07 : Proceedings of the 1st international conference

on Tangible and embedded interaction, pages 75{78, New York, NY, USA,

2007. ACM. ISBN 978-1-59593-619-6. doi : http://doi.acm.org/10.1145/1226969.1226984. (page 161)

[153] L. Ravindranath, V. N. Padmanabhan, and P. Agrawal. Sixthsense : R�d-

based enterprise intelligence. In MobiSys ’08 : Proceeding of the 6th in-

ternational conference on Mobile systems, applications, and services, pages

253{266, New York, NY, USA, 2008. ACM. ISBN 978-1-60558-139-2. doi :


175

Documents

DESIGN D’INTERFACES DE MOBILES POUR L ...MOBILE INTERFACE DESIGN FOR BROWSING LARGE COLLECTIONS OF IMAGES Soutenue le 17 mai 2010 Directeur de th ese : M. CUBAUD Pierre Professeur