Wat is computer vision?

We leven in een wereld dat alles slimmer wilt maken, alles slimmer maken betekent ook dat de plaats van de mens/werknemer in veel gevallen herbekeken wordt. Lijkt het nu of we leven in een sciencefiction film? Dat kan, maar hopelijk met een beter einde dan in de meeste gevallen wanneer de wereld wordt overgenomen door robots.😅

Bepaalde processen slimmer maken heeft ook enkele voordelen, menselijke fouten kunnen misschien verleden tijd worden, we kunnen voorspellingen maken, veel sneller schakelen binnen bepaalde processen en nog zoveel meer. Is de toekomst dat computers veel menselijke taken overnemen? De vraag is eerder wanneer starten we ermee.

Een hot topic is nu artificiële intelligentie, computer vision en machine learning. Je hebt waarschijnlijk het radiospotje van Aion bank al gehoord die met behulp van artificiële intelligentie je helpt om je geld te beheren en de kosten te verlagen. Het is de eerste financiële instelling die het over een andere boeg gooit en heel vernieuwend te werk gaat. Wil je meer weten hoe artificiële intelligentie, computer vision en machine learning nu eigenlijk werkt? Lees dan even verder onder de foto.

Wat is Computer Vision?

Computer vision valt onder artificiële intelligentie, wat de alles omvattende term is. Concreet wilt het zeggen dat onze computers, zoals jij en ik er allemaal één of meerdere hebben, de menselijke taken overneemt. De computer is als het ware in staat objecten te identificeren en op basis van dat maakt hij een beslissing en voert de actie uit.

Wist je dat jouw smartphone ontgrendelen met je gezicht werkt via computer vision? Daarom dat onze smartphone ons gezicht niet meer herkent wanneer we een mondmasker dragen. De kenmerken en facetten van de afbeelding, ons gezicht, die reeds in het geheugen zit komen niet overeen met het gezicht die wordt getoond, er ontbreekt een neus, mond en kin die zorgt dat de randen gedefinieerd worden.

Tip om je gezicht met mondmasker te laten herkennen door jouw gsm.😉

Image for post

Wat is het verband tussen computer vision en artificiële intelligentie?

Computer vision is een onderdeel van artificiële intelligentie. Het houdt zich bezig met het ‘zicht’ geven aan computers, het begrijpen van een beeld met andere woorden. Met computer vision is het de bedoeling dat computers leren hoe ze de visuele wereld kunnen identificeren, classificeren en categoriseren. Net zoals wij het doen met onze ogen.

Hoe werkt computer vision?

Wij kijken naar de wereld en zien allemaal beelden. Computers zien geen beelden maar enkel getallen, binaire getallen. Een foto is opgebouwd uit pixels, die pixels hebben elk een nummerieke waarde. Computer vision converteert elke pixel waaruit een beeld is opgemaakt naar binaire gegevens (combinatie van nullen en eentjes).

Trainen van een computer vision systeem

Een computer vision systeem moet net als een kind gevoed worden. Een computer vision systeem voed je dan weer niet met erwtjes en worteltjes maar met data, heel veel data. Zonder voorafgaande training kan het computer vision systeem niet weten hoe bepaalde objecten eruit zien, wat hun kenmerken zijn en hoe ze zijn opgebouwd. Daarom worden duizenden of miljoenen afbeeldingen van welbepaalde objecten aan het systeem voorgesteld. Zo kan het systeem geleidelijk het verschil leren kennen tussen een vogel en een vliegtuig.

We moeten het systeem voeden met voldoende fotomateriaal zodat het de exacte nuances op pixelniveau kan begrijpen, die dan de afzonderlijke componenten van het grotere beeld definiëren. Het systeem maakt van die informatie gebruik om een idee te vormen wat bijvoorbeeld een vogel is. Het systeem kan op zijn beurt voorspellen dat alles met twee poten en vleugels het label ‘vogel’ moet krijgen. Zoals eerder uitgelegd ziet computer vision de twee poten en de vleugels van de vogel niet, maar gaat opzoek naar patronen in de binaire waardes van de pixels. Het zoekt, net als bij het spelletje ‘zoek dezelfde of memory’ naar dezelfde binaire combinaties.

Image for post

Herhalen!

Op een gegeven moment heeft de output een acceptabel en nauwkeurig niveau bereikt. Echter blijft herhalen belangrijk om het systeem slimmer te maken.

Met veel herhalingen heeft het systeem een idee van wat een foto van bijvoorbeeld een vogel zoal moet bevatten. Als je het systeem een nieuwe afbeelding laat zien en wilt weten of er op die afbeelding een vogel op staat, dan vergelijkt het systeem elke pixel van het beeld met al die andere beelden van vogels waarmee het getraind is. Als de invoer voldoet aan een minimum drempel van vergelijkbare pixels dan verklaart de artificiële intelligentie dat het gaat om een vogel.

In de praktijk

Enkele weken geleden was er veel ophef op het strand in Blankeberge. Amok makers zorgde voor een vechtpartij tussen zichzelf en de politie. Hierop reageerde Burgemeester Lippens ,van de andere badstad, Knokke-Heist direct. Hij weerde alle dagjestoeristen die onze mooie noordzee wouden bezoeken.

Enkele weken voor deze gebeurtenis installeerden we in Knokke-Heist enkele slimme camera’s aan de reddingspost. De slimme camera’s houden de drukte in de gaten en tellen hoeveel mensen zich nu wel degelijk op het strand bevinden. De privacy van alle mensen in bikini, zwembak of short wordt 100% gewaarborgd! We sturen de beelden niet door, deze blijven veilig op de camera zelf. Wat wel uitgestuurd wordt is het resultaat, dus het aantal mensen op het strand. De beelden blijven dus in de veilige omgeving van de camera.

Na het voorval in Blankeberge en na het weren van de dagjestoeristen in Knokke-Heist konden we een mooie daling waarnemen van de bevolking op het strand.

Image for post

Hoe werkt dit technisch?

Een camera, verbonden met ethernet, neemt om die x-tijd een foto. Via een algoritme, herkent hij mensen en telt hij deze. Deze uitkomst wordt doorgestuurd naar Azure. Qua hardware gebruiken we de NVIDIA Jetson computer. Dit is TPU (Tensor processing unit). Dankzij zijn sterke grafische processor is hij ideaal voor artificiële intelligentie. Op deze TPU draait onze IoT edge met Python.

De uitdaging!

Een camera dat mensen herkent en telt klinkt heel gemakkelijk. Als je weet, los van de huidige situatie met corona, dat onze stranden altijd drukbevolkt zijn en er op één vierkante meter heel wat mensen kunnen, is het al snel minder gemakkelijk voor de camera om elke persoon te herkennen.

Maar we did it! Onze detectie van de mensen op het strand is extreem goed. Zo herkennen we gemakkelijk 100 mensen op de foto over een afstand van ongeveer 100 meter!

Image for post

Aptus to the rescue!

Heb je zelf een uitdaging voor ons, of ben je gewoonweg mega geïnteresseerd in deze technologie? Let us know!

Ook interessant