Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Visual Recognition:The Big Picture

Jitendra MalikUniversity of California at

Berkeley

The more you look, the more you see!

PASCAL Visual Object Challenge

We want to locate the objectOrig. Image Segmentation Orig. Image Segmentation

The Visually Tagged Human Project

And we want to detect and label parts..

Computer Vision GroupUC Berkeley

Categorization at Multiple Levels

TigerGrass

outdoorwildlife

shadow

Examples of Actions• Movement and posture change

– run, walk, crawl, jump, hop, swim, skate, sit, stand, kneel, lie, dance (various), …

• Object manipulation– pick, carry, hold, lift, throw, catch, push, pull, write, type, touch, hit,

press, stroke, shake, stir, turn, eat, drink, cut, stab, kick, point, drive, bike, insert, extract, juggle, play musical instrument (various)…

• Conversational gesture– point, …

• Sign Language

Computer Vision GroupUniversity of California Berkeley

We need to identify

• Objects

• Agents

• Relationships among objects with objects, objects with agents, agents with agents …

• Events and Actions

Taxonomy and Partonomy

• Taxonomy: E.g. Cats are in the order Felidae which in turn is in the class Mammalia– Recognition can be at multiple levels of categorization, or be identification at

the level of specific individuals , as in faces.

• Partonomy: Objects have parts, they have subparts and so on. The human body contains the head, which in turn contains the eyes.

• These notions apply equally well to scenes and to activities.

• Psychologists have argued that there is a “basic-level” at which categorization is fastest (Eleanor Rosch et al).

• In a partonomy each level contributes useful information for recognition.

Visual Processing Areas

Macaque Visual Areas

Object Detection can be very fast

• On a task of judging animal vs no animal, humans can make mostly correct saccades in 150 ms (Kirchner & Thorpe, 2006)

– Comparable to synaptic delay in the retina, LGN, V1, V2, V4, IT pathway.

– Doesn’t rule out feed back but shows feed forward only is very powerful

• Detection and categorization are practically simultaneous (Grill-Spector & Kanwisher, 2005)

Hubel and Wiesel (1962) discovered orientation sensitive neurons in V1

These cells respond to edges and bars ..

Orientation based features were inspired by V1 (SIFT, GIST, HOG, GB etc)

Attneave’s Cat (1954)Line drawings convey most of the information

Rolls et al (2000)

Convolutional Neural Networks (LeCun et al)

Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Documents

Classification using intersection kernel SVMs is efficient Joint work with Subhransu Maji and Alex Berg Jitendra Malik UC Berkeley

Recognizing objects and actions - courses.csail.mit.edu · 2005-03-03 · Recognizing objects and actions in images and video Jitendra Malik U.C. Berkeley. ... Object Recognition

Recognition using Regions - EECS at UC Berkeley€¦ · Recognition using Regions ⁄ Chunhui Gu, Joseph J. Lim, Pablo Arbel´aez, Jitendra Malik University of California at Berkeley

Computer Vision Group University of California Berkeley Recognizing Objects in Adversarial Clutter: Breaking a Visual CAPTCHA Greg Mori and Jitendra Malik

1 Contours and Junctions in Natural Images Jitendra Malik University of California at Berkeley (with Jianbo Shi, Thomas Leung, Serge Belongie, Charless

Introduction to Artifical Intelligence Jitendra Malik U.C. Berkeley Jitendra Malik U.C. Berkeley

Cross Modal Distillation for Supervision ... - Saurabh Gupta · Saurabh Gupta Judy Hoffman Jitendra Malik University of California, Berkeley fsgupta, jhoffman, malikg@eecs.berkeley.edu

1 Ecological Statistics and Perceptual Organization Charless Fowlkes work with David Martin and Jitendra Malik at University of California at Berkeley

Towards Human Level AI Jitendra Malik U.C. Berkeley Jitendra Malik U.C. Berkeley

Professor Jitendra Malik - EECS at UC Berkeleymalik/malik-cv-full.pdf · Professor Jitendra Malik Arthur J. Chick Professor, Department of EECS University of California at Berkeley,

Computer Vision Group University of California Berkeley Visual Grouping and Object Recognition Jitendra Malik * U.C. Berkeley * with S. Belongie, C. Fowlkes,

Convergence of vision and graphics Jitendra Malik University of California at Berkeley Jitendra Malik University of California at Berkeley

Recognizing Surfaces using Three-Dimensional Textons Thomas Leung and Jitendra Malik Computer Science Division University of California at Berkeley

Computational Vision Jitendra Malik University of California at Berkeley Jitendra Malik University of California at Berkeley

Cross Modal Distillation for Supervision Transferjhoffman/papers/Gupta_CVPR16.pdf · Saurabh Gupta Judy Hoffman Jitendra Malik University of California, Berkeley fsgupta, jhoffman,

ADS lab NCKU1 Michael Maire, Pablo Arbelaez, Charless Fowlkes, and Jitendra Malik university of California, Berkeley – Berkeley university of California,

Shape Matching and Object Recognition using Low Distortion Correspondence Alexander C. Berg, Tamara L. Berg, Jitendra Malik U.C. Berkeley

Computational Vision Jitendra Malik, UC Berkeley

Andrea Frome, Yoram Singer, Fei Sha, Jitendra Malik

Finding and exploiting correspondences in Drosophila embryos Charless Fowlkes and Jitendra Malik UC Berkeley Computer Science