Sistema de detecció de vianants
Avui en dia, els accidents de tràfic representen una de les majors causes de mort. D’acord amb la Organització Mundial de la Salut (OMS), cada dia tres mil persones moren com a resultat d’un accident de tràfic. Durant la darrera dècada, a més dels populars airbags o l’ABS, una nova línia d’investigació enfocada a sistemes més intel·ligents està guanyant interès per part de la comunitat científica. Aquests sistemes, coneguts com a sistemes avançats d’assistència al conductor (coneguts com a ADAS, el seu acrònim en anglès), prediuen i anticipen els accidents per tal d’evitar-los en comptes de pal·liar les seves conseqüències com era habitual amb els altres mètodes. Alguns exemples d’ADAS son els sistemes d’avis de canvi de carril o els controls adaptatius de creuer. Un dels ADAS més complexos son els sistemes de protecció de vianants, degut a que les persones son una de les classes més difícils de modelar. La seva variabilitat en termes de mida, distancia o aparença és molt gran. A més, el propi moviment del vehicle afegeix dificultats com el canvi constant de l’escena i de la posició dels objectes en aquesta quan son vistos des de la càmera.
En aquest treball proposem un sistema basat en tres mòduls, cadascun adreçat a una tasca diferent.
• El primer mòdul fa us de la informació 3D reconstruïda des d’una càmera Pointgrey Bumblebee. En aquest cas proposem l’algoritme adaptive road scanning, que primer estima la posició relativa entre la càmera i la carretera mitjançant RANSAC, i després recorre el pla carretera en 3D amb finestres de la mida d’un vianant. Aquestes finestres son projectades a la imatge i enviades al següent mòdul.
• El segon mòdul rep els candidats, projectats a la imatge en 2D, i els classifica com a vianants o no vianants mitjançant l’algoritme de aprenentatge Real AdaBoost. Aquest classificador fa us de característiques de Haar i histogrames d’orientació de contorns. El classificador ha estat entrenat en la nostra pròpia base de dades de vianants, que consisteix en 1000 exemples positius i 5000 negatius.
• Finalment, el tercer mòdul realitza dos tasques. Primer verifica que les deteccions (finestres classificades com a vianant) siguin realment un vianant. Això es du a terme comprovant que la distancia teòrica de la finestra (això és, depenent de la seva mida i dels paràmetres del sensor a cada finestra li correspon una distancia) i els valors de distancia dels píxels a dins de la finestra (informació 3D) concorden. La segona tasca correspon al refinament de les finestres solapades: s’utilitza el conegut algoritme de clustering Mean shift per agrupar les deteccions que corresponen al mateix vianant.
Els resultats experimentals mostren que tant els mòduls independentment com el sistema donen resultats satisfactoris en seqüències representatives. En el cas de l’estimació de la posició relativa carretera-càmera, s’ha comparat el resultat en forma de línia de l’horitzó (és una mesura fàcil i directe de resumir aquesta posició relativa) calculat per l’algoritme amb la anotació manual en una seqüència. En el cas del classificador proposat, el rendiment s’ha comparat amb els coneguts histogrames d’orientació de gradients. Aquí hem aconseguint guanys quantitatius en temps de càlcul o en rendiment, depenent de la configuració escollida. Respecte a la verificació i el refinament i del sistema, les avaluacions han estat qualitatives utilitzant tant imatges com seqüències, aconseguint resultats prometedors tant en rendiment com en temps de càlcul.
Aquesta recerca ha estat portada a terme pels investigadors David Gerónimo, Angel D. Sappa, Daniel Ponsa i Antonio López, del grup de sistemes avançats d’assistència al conductor (ADAS) del Centre de Visió per Computador, i parcialment finançat pels projectes TRA2007-62526/AUT, Consolider Ingenio 2010: MIPRCV, (CSD200700018) i la beca BES-2005-8864 del Ministeri d’Educació i Ciència i el Fons Social Europeu.
Referències
"A Global Approach to Vision-Based Pedestrian Detection for Advanced Driver Assistance Systems". Tesi doctoral defensada per David Gerónimo el 12 de febrer de 2010 a les 12h, a la Sala d'Actes del Centre de Visió per Computador. Director: Antonio Manuel López Peña.