Blog
November 5, 2018
AI og industri 4.0
Alle
Ciklum-nyheder

Hvordan Ciklum’s R&D-team byggede algoritmen til billedklassificering med henblik på at identificere truende isbjerge

Hvordan Ciklum’s R&D-team byggede algoritmen til billedklassificering med henblik på at identificere truende isbjerge

Igor Krashenyi og Oleg Panichev, Senior forskningsingeniører ved Ciklum R&D, sluttede sig sammen i et team for at deltage i en konkurrence, der blev lanceret på datavidenskabsplatformen Kaggle. Læs i stykket nedenfor, hvordan teamet nærmede sig opgaven og byggede en højst nøjagtig AI algoritme.


Drivende isbjerge er farlige for boreplatforme og rørledninger ud for østkysten af Canada. Virksomhederne formilder denne risiko ved at anvende satellitbilleder til at lokalisere dem, men at skelne af isbjergene i forhold til skibe kan være vanskeligt.

Statoil er et internationalt energifirma, der indgår i partnerskab med C-CORE, som har anvendt satellitdata i 30+ år til at konstruere et computer-visionbaseret overvågningssystem til isbjerge. For at gøre operationerne sikre og effektive, er Statoil optaget af at spotte isbjerge tidligt, så partnervirksomheder kan bugsere dem af vejen eller fjerne deres udstyr.

C-CORE og Statoil ønskede at finde bedre måder til at lokalisere isbjerge på, inden de driver tæt på olie- og gasinfrastruktur, og havde behov for at tilnærme sig problemet fra et andet perspektiv. Begge firmaer lancerede en Kaggle-konkurrence, i hvilken deltagerne skulle udvikle et program til at opdage isbjerge i billedmaterialet, der var indsamlet via satellitbilleder.

Udfordringen

Konstruktion af en algoritme til automatisk at identificere, om et mål, der opfattes i det fjerne, er et isbjerg eller ej. Algoritmen skulle være ekstremt nøjagtig, fordi liv og milliarder af dollars var på spil.

Varighed: 2 måneder

Billedkilde: C-CORE

Det er ikke altid let for det menneskelige øje at skelne mellem isbjerge og skibe. Alle billederne i datasættet i konkurrencen var taget fra en Sentinel-1 satellitten 600 kilometer over jorden. Dataene var meget specifikke, og arrangørerne leverede for hvert billede en tilfældevinkel-feature.

Til Kaggle-konkurrencen bedes deltagerne om at se på forskellige slags satellitbilleder, som omfatter isbjerge, skibe og andre mål og bestemme, hvad er hvad. Billedkilde: Kaggle.com

Ciklum R&D-teamet anvendte flere deep learning modeller samlet for at bygge en model. Samlingsteknikker bruger to eller flere algoritmer for at få bedre forudsigelsespræstation, end der kunne opnås alene ved nogen af de konstituerende lærings-algoritmer. Output fra et sådant system er bedre og præcisere end hver metodes output separat.

Slutmodellen inkluderede 40 modeller. Hver blev bestemt i forvejen efter stemmeprincippet på grundlag af 5 undermodeller:

Alle datasættene blev kørt gennem hver af de 40 modeller for at komme med den endelige forudsigelse.

Det endelige resultat blev evalueret med brug af log loss-metrik. Denne metrik måler modellens nøjagtighed, hvor forudsigelses-input er en sandsynlighedsværdi mellem 0 og 1. Målet for vore maskinlæringsmodeller er at minimere denne værdi. En perfekt model ville have et log loss på 0.

Systemet, der udvikledes af Ciklum R&D-teamet definerede isbjerget med et log loss på 0,1310.

For at finde ud af mere om, hvordan din forretning kan inkludere dyb læring og realisere egne AI- projekter, bedes du tage et kig på de projekter inden for deep learning, som vi allerede har gennemført, og som hjalp med at forbedre kundernes forretninger.

 

Læs også: 

Deep Learning To Improve The Accuracy Of Predictions: 3 Project Stories

Senior Ciklum Research Engineer Wins Gold Medal at Kaggle Competition

Highlights From ICML 2018: What Will Drive Machine Learning Development?