Home / Kunstig Intelligens  / Et AI-datasett skaper nye veier til tornadodeteksjon

Et AI-datasett skaper nye veier til tornadodeteksjon

Når våren kommer tilbake på den nordlige halvkule, starter tornadosesongen. En tornados snirklende trakt av støv og rusk er et umiskjennelig syn. Men det synet kan være skjult for radaren, meteorologenes verktøy. Det er vanskelig å vite nøyaktig når en tornado har dannet seg, eller til og med hvorfor.

 

Et nytt datasett kan gi svar på dette. Det inneholder radarbilder fra tusenvis av tornadoer som har rammet USA de siste ti årene. Stormer som skapte tornadoer, er flankert av andre alvorlige stormer, noen med nesten identiske forhold, som aldri gjorde det. Forskerne ved MIT Lincoln Laboratory, som har samlet datasettet TorNet, har nå gitt det ut som åpen kildekode. De håper å kunne bidra til gjennombrudd i oppdagelsen av et av naturens mest mystiske og voldsomme fenomener.

 

“Mange fremskritt er drevet av lett tilgjengelige, sammenlignbare datasett. Vi håper TorNet vil legge grunnlaget for maskinlæringsalgoritmer som både kan oppdage og forutsi tornadoer”, sier Mark Veillette, som leder prosjektet sammen med James Kurdzo. Begge forskerne jobber i Air Traffic Control Systems Group.

 

Sammen med datasettet lanserer teamet modeller som er trent på det. Modellene viser lovende resultater når det gjelder maskinlæringens evne til å oppdage en tornado. Ved å bygge videre på dette arbeidet kan det åpne nye muligheter for prognosemakere, slik at de kan gi mer nøyaktige advarsler som kan redde liv.

 

Virvlende usikkerhet

 

Hvert år rammes USA av rundt 1200 tornadoer, som forårsaker økonomiske skader for millioner eller milliarder av dollar og i gjennomsnitt krever 71 menneskeliv. I fjor drepte en uvanlig langvarig tornado 17 mennesker og skadet minst 165 andre langs en 59 mil lang bane i Mississippi.

 

Likevel er tornadoer notorisk vanskelige å forutsi fordi forskerne ikke har et klart bilde av hvorfor de dannes. “Vi kan se to stormer som ser identiske ut, og den ene vil produsere en tornado, mens den andre ikke vil gjøre det. Vi forstår det ikke helt”, sier Kurdzo.

 

De grunnleggende ingrediensene i en tornado er tordenvær med ustabilitet forårsaket av raskt stigende varm luft og vindskjær som forårsaker rotasjon. Værradar er det viktigste verktøyet for å overvåke disse forholdene. Men tornadoer ligger for lavt til å kunne oppdages, selv når de er moderat nær radaren. Når radarstrålen med en gitt hellingsvinkel beveger seg lenger bort fra antennen, kommer den høyere over bakken, og da ser den for det meste refleksjoner fra regn og hagl som bæres med i “mesosyklonen”, stormens brede, roterende oppdrift. En mesosyklon produserer ikke alltid en tornado.

 

Med dette begrensede overblikket må meteorologene avgjøre om de skal sende ut tornadovarsel eller ikke. De velger ofte å være forsiktige. Resultatet er at andelen falske tornadovarsler ligger på over 70 prosent. “Det kan føre til gutten som ropte ulv-syndromet”, sier Kurdzo.

 

De siste årene har forskere vendt seg til maskinlæring for å bli bedre til å oppdage og forutsi tornadoer. Men rådatasettene og modellene har ikke alltid vært tilgjengelige for allmennheten, noe som har hindret fremskritt. TorNet fyller dette gapet.

 

Datasettet inneholder mer enn 200 000 radarbilder, hvorav 13 587 viser tornadoer. Resten av bildene er ikke tornadobilder, tatt fra stormer i én av to kategorier: tilfeldig utvalgte alvorlige stormer eller falske varsler (de som førte til at en meteorolog utstedte en advarsel, men som ikke produserte en tornado).

 

Hvert utvalg av en storm eller tornado består av to sett med seks radarbilder. De to settene tilsvarer ulike radarsveipevinkler. De seks bildene viser ulike radardataprodukter, for eksempel reflektivitet (som viser nedbørintensitet) eller radialhastighet (som indikerer om vinden beveger seg mot eller bort fra radaren).

Når våren kommer tilbake på den nordlige halvkule, starter tornadosesongen. En tornados snirklende trakt av støv og rusk er et umiskjennelig syn. Men det synet kan være skjult for radaren, meteorologenes verktøy. Det er vanskelig å vite nøyaktig når en tornado har dannet seg, eller til og med hvorfor.

 

Et nytt datasett kan gi svar på dette. Det inneholder radarbilder fra tusenvis av tornadoer som har rammet USA de siste ti årene. Stormer som skapte tornadoer, er flankert av andre alvorlige stormer, noen med nesten identiske forhold, som aldri gjorde det. Forskerne ved MIT Lincoln Laboratory, som har samlet datasettet TorNet, har nå gitt det ut som åpen kildekode. De håper å kunne bidra til gjennombrudd i oppdagelsen av et av naturens mest mystiske og voldsomme fenomener.

 

“Mange fremskritt er drevet av lett tilgjengelige, sammenlignbare datasett. Vi håper TorNet vil legge grunnlaget for maskinlæringsalgoritmer som både kan oppdage og forutsi tornadoer”, sier Mark Veillette, som leder prosjektet sammen med James Kurdzo. Begge forskerne jobber i Air Traffic Control Systems Group.

 

Sammen med datasettet lanserer teamet modeller som er trent på det. Modellene viser lovende resultater når det gjelder maskinlæringens evne til å oppdage en tornado. Ved å bygge videre på dette arbeidet kan det åpne nye muligheter for prognosemakere, slik at de kan gi mer nøyaktige advarsler som kan redde liv.

 

Virvlende usikkerhet

 

Hvert år rammes USA av rundt 1200 tornadoer, som forårsaker økonomiske skader for millioner eller milliarder av dollar og i gjennomsnitt krever 71 menneskeliv. I fjor drepte en uvanlig langvarig tornado 17 mennesker og skadet minst 165 andre langs en 59 mil lang bane i Mississippi.

 

Likevel er tornadoer notorisk vanskelige å forutsi fordi forskerne ikke har et klart bilde av hvorfor de dannes. “Vi kan se to stormer som ser identiske ut, og den ene vil produsere en tornado, mens den andre ikke vil gjøre det. Vi forstår det ikke helt”, sier Kurdzo.

 

De grunnleggende ingrediensene i en tornado er tordenvær med ustabilitet forårsaket av raskt stigende varm luft og vindskjær som forårsaker rotasjon. Værradar er det viktigste verktøyet for å overvåke disse forholdene. Men tornadoer ligger for lavt til å kunne oppdages, selv når de er moderat nær radaren. Når radarstrålen med en gitt hellingsvinkel beveger seg lenger bort fra antennen, kommer den høyere over bakken, og da ser den for det meste refleksjoner fra regn og hagl som bæres med i “mesosyklonen”, stormens brede, roterende oppdrift. En mesosyklon produserer ikke alltid en tornado.

 

Med dette begrensede overblikket må meteorologene avgjøre om de skal sende ut tornadovarsel eller ikke. De velger ofte å være forsiktige. Resultatet er at andelen falske tornadovarsler ligger på over 70 prosent. “Det kan føre til gutten som ropte ulv-syndromet”, sier Kurdzo.

 

De siste årene har forskere vendt seg til maskinlæring for å bli bedre til å oppdage og forutsi tornadoer. Men rådatasettene og modellene har ikke alltid vært tilgjengelige for allmennheten, noe som har hindret fremskritt. TorNet fyller dette gapet.

 

Datasettet inneholder mer enn 200 000 radarbilder, hvorav 13 587 viser tornadoer. Resten av bildene er ikke tornadobilder, tatt fra stormer i én av to kategorier: tilfeldig utvalgte alvorlige stormer eller falske varsler (de som førte til at en meteorolog utstedte en advarsel, men som ikke produserte en tornado).

 

Hvert utvalg av en storm eller tornado består av to sett med seks radarbilder. De to settene tilsvarer ulike radarsveipevinkler. De seks bildene viser ulike radardataprodukter, for eksempel reflektivitet (som viser nedbørintensitet) eller radialhastighet (som indikerer om vinden beveger seg mot eller bort fra radaren).

“Den viktigste grunnen til at vi legger ut modellene våre, er at samfunnet skal kunne forbedre dem og gjøre andre gode ting”, sier Kurdzo. “Den beste løsningen kan være en dyp læringsmodell, eller noen kan finne ut at en modell uten dyp læring faktisk er bedre.”

 

TorNet kan også være nyttig i værmiljøet til andre formål, for eksempel til å gjennomføre storskala casestudier av stormer. Det kan også utvides med andre datakilder, som satellittbilder eller lynkart. Ved å kombinere flere typer data kan man forbedre nøyaktigheten til maskinlæringsmodellene.

 

Skritt mot operasjonell drift

 

I tillegg til å oppdage tornadoer håper Kurdzo at modellene kan bidra til å avdekke hvorfor de oppstår.

 

“Som forskere ser vi alle disse forløperne til tornadoer – en økning i rotasjon på lavt nivå, et krokekko i reflektivitetsdata, spesifikk differensial fase (KDP) og differensial reflektivitetsbuer (ZDR). Men hvordan henger alt dette sammen? Og finnes det fysiske manifestasjoner vi ikke kjenner til?” spør han.

 

Det kan være mulig å finne disse svarene ved hjelp av forklarbar AI. Forklarende AI refererer til metoder som gjør det mulig for en modell å begrunne hvorfor den har tatt en bestemt beslutning, i et format som er forståelig for mennesker. I dette tilfellet kan disse forklaringene avsløre fysiske prosesser som skjer før tornadoer. Denne kunnskapen kan bidra til å lære opp prognosemakere og modeller til å gjenkjenne tegnene tidligere.

 

“Det er aldri meningen at denne teknologien skal erstatte en prognosemaker. Men en dag kan den kanskje veilede prognosemakernes øyne i komplekse situasjoner, og gi en visuell advarsel til et område som forventes å ha tornadoaktivitet”, sier Kurdzo.

 

Slik assistanse kan være spesielt nyttig etter hvert som radarteknologien forbedres og fremtidige nettverk potensielt blir tettere. Det forventes at oppdateringsfrekvensen i neste generasjons radarnettverk vil øke fra hvert femte minutt til omtrent ett minutt, kanskje raskere enn prognosemakerne rekker å tolke den nye informasjonen. Fordi dyp læring kan behandle enorme datamengder raskt, kan det være godt egnet til å overvåke radarsignaler i sanntid, sammen med mennesker. Tornadoer kan dannes og forsvinne i løpet av minutter.

 

Men veien til en operativ algoritme er lang, spesielt i sikkerhetskritiske situasjoner, sier Veillette. “Jeg tror at prognosemiljøet fortsatt er skeptisk til maskinlæring, noe som er forståelig. En måte å skape tillit og åpenhet på er å ha offentlige referansedatasett som dette. Det er et første skritt.”

 

Teamet håper at de neste stegene vil bli tatt av forskere over hele verden som blir inspirert av datasettet og får energi til å bygge sine egne algoritmer. Disse algoritmene vil i sin tur gå inn i testbed, hvor de til slutt vil bli vist til prognosemakere, for å starte en prosess med overgang til drift.

 

Til slutt kan veien gå tilbake til tillit.

 

“Vi får kanskje aldri mer enn 10-15 minutters tornadovarsel ved hjelp av disse verktøyene. Men hvis vi kan redusere antallet falske alarmer, kan vi begynne å gjøre fremskritt når det gjelder publikums oppfatning”, sier Kurdzo. “Folk kommer til å bruke disse advarslene til å ta de nødvendige grepene for å redde livet.

 

 

POST TAGS: