Svensk seger i global tävling i datorseende

Forskare på Linköpings universitets avdelning för datorseende tog hem segern i en internationell tävling med sin metod att följa rörliga objekt – en bil eller ett ansikte i en folksamling. Metoden bygger på flera examensarbeten och har en mängd tänkbara applikationer för industrin.

Tävlingen Visual Object Tracking Challenge, VOT, avgörs årligen och vinnaren avslöjades i samband med den stora konferensen European Conference on Computer Vision som hölls i Zurich. Forskargrupper från hela världen deltar och i år gick segern till professor Michael Felsberg och hans team vid Linköpings universitet. Bakom den segrande metoden står Martin Danelljan, doktorand på Avdelningen för datorseende, hans handledare Fahad Khan och Michael Felsberg samt Gustav Häger, blivande civilingenjör i Datateknik som gör sitt examensarbete inom just visuell objektföljning.

– En stor del av underlaget till vår vinnande metod har tagits fram av studenter i grundutbildningen. Delar av Martin Danelljans examensarbete publicerades på en av de största konferenserna inom ämnet, Conference of Computer Vision and Pattern Recognition, CVPR. Gustav Häger gör sitt examensarbete nu. Vi har lagt ner ett stort arbete under många år på att höja nivån på grundutbildningen så att den ligger i absoluta fronten. Det har gett resultat och det är fantastiskt roligt både för oss och studenterna, säger Michael Felsberg.

Datorseendet är på väg ut i praktisk användning på bred front. I bilar för att upptäcka skyltar, trottoarkanter eller uppdykande fotgängare. I obemannade flygande farkoster för att hitta nödställda på en stormig alptopp eller ett upprört hav, liksom för säkerhet och bevakning. En enkel variant av datorseende finns också i våra mobiltelefoners kameror. Finns det ett ansikte i din bild ställer kameran själv in fokus på det. Möjligheten att utveckla appar till mobilen som bygger på foton och bilder är i det närmaste oändliga.

Löste skalproblem

Ett problem som världens forskare nu lägger ner möda på att lösa är metoder för att följa rörliga objekt. Att fokusera på och följa ett ansikte i en rörig omgivning, som i en folksamling eller på en friidrottsarena fungerar för de flesta av oss människor. Vi tänker inte ens på vad vi gör. Men för en maskin är det betydligt svårare. Beräkningarna måste dessutom vara snabba för att objektet ska kunna följas i realtid

– Det här är klassiska problem inom datorseende, men vi har tagit fram en både noggrann och robust metod, berättar Martin Danelljan.

En knut LiU-forskarna löst är det faktum att om objektet rör sig från eller mot kameran så minskar respektive ökar storleken på den yta på bilden eller i videon som datorn ska följa.

– Vi har fokuserat på att lösa skalproblemet eftersom vi snabbt tappar effektivitet om inte den del i videon som datorn följer skalas upp eller ner. Risken är annars att man studerar bakgrunden istället för själva objektet.

Metoden är uppdelad i två delar, en del som bestämmer var i bilden det objekt finns som ska följas och den andra hur stort objektet är för närvarande.

Därefter handlar det om avancerad datorinlärning. Datorn får lära sig hur det in-zoomade objektet ser ut i olika lägen, eller snarast hur några väl valda särdrag i bilden ser ut. Det kan vara en kant eller en intensitet i en färg som används för identifikationen. Beräkningarna sker sedan snabbt med väl valda och effektiva algoritmer.

40 olika metoder testades

– Vi har valt metoder med inspiration från biologiska system och gör beräkningarna på helheten istället för att dela upp problemet i många små delar. Vi har valt en holistisk ansats till objektföljning och arbetar även så inom robotiken. Att vi lyckats så väl med vår metod är ett bevis för att vi valt rätt väg, säger Michael Felsberg.

I tävlingen testas de inskickade metoderna på ett stort antal olika videosekvenser. Det handlar om allt ifrån att följa vindsurfare och friidrottare till människor som går över en gata. I år testades närmare 40 olika metoder.

– Det är verkligen roligt att vi vann, de ökar vår synlighet otroligt mycket. Vi har varit kända i branschen sedan tidigare, men nu har vi blivit kändisar, säger Michael Felsberg, som redan fått flera inbjudningar - som att medverka i en expertpanel och i VOT-kommittén.

I ett bidrag till konferensen Computer Vision and Patterning Regognition, CVPR, i USA presenterar LiU-forskarna också en variant av metoden där även färginformationen i bilderna används för att förbättra resultatet.

Text Monica Westman Svenselius, Linköpings universitet

Foto Linköpings universitet

{{ visitor.ipAccess.member.name }}

{{ visitor.ipAccess.corporateClient.name }}

{{ visitor.person.name }}

Svensk seger i global tävling i datorseende

Företagens egna nyheter

Mest läst

Senaste nytt

Utvalda artiklar

Utvalda nyheter från förstasidan

Hela Northvolts styrelse avgår

NKT om att vara först ut i EU: ”Erkännande att vår teknik är en avgörande komponent”

Sveriges Ingenjörer om tullarna – ser möjligheterna i oron

De köper Northvolt-verksamhet

Volvo Cars Håkan Samuelsson ser stor potential i samarbete med Geely

Andra Nordiska Medier

Nyhetsbrev

Sänd till en kollega