Lecture 25: Computer Vision - A Modern Approach to AI

Listen — slide 1 Captions (VTT)

Lecture 25: Computer Vision¶

AIMA Chapter 25 — 1 hour¶

Listen — slide 2 Captions (VTT)

Learning Objectives¶

Understand image formation
Extract features: edges, texture, optical flow
Apply CNNs for classification and detection
Recover 3D from images

Listen — slide 3 Captions (VTT)

Image Formation¶

Pinhole camera: Perspective projection
Lens: Focus, aberrations
Light: Shading, color

Listen — slide 4 Captions (VTT)

Simple Features¶

Edges: Gradients, Canny
Texture: Filters, statistics
Optical flow: Motion between frames

Listen — slide 5 Captions (VTT)

Image Classification¶

CNN: Conv layers → FC → softmax
AlexNet, VGG, ResNet: Architectures
Why CNNs work: Hierarchical features

Listen — slide 6 Captions (VTT)

Object Detection¶

Sliding window: Classify each region
R-CNN: Proposals + CNN
YOLO, SSD: Single-shot

Listen — slide 7 Captions (VTT)

3D Reconstruction¶

Stereo: Two views, triangulation
Structure from motion: Multiple views
Depth from single image: Learned

Listen — slide 8 Captions (VTT)

Summary¶

Formation: Pinhole, lenses
Features: Edges, texture
CNN: Classification, detection
3D: Stereo, SfM

Listen — slide 9 Captions (VTT)

References¶

AIMA Ch. 25
Russell & Norvig, AIMA 4e, Ch. 25
Chapter PDF: chapters/chapter-25.pdf
aima-python: perception4e.py

Listen — slide 10 Captions (VTT)

Questions?¶

Next lecture: Robotics (Chapter 26)