Velg en side

Hvordan lærer maskiner? Grunnleggende om kunstig intelligens

h

Innhold:

=

Kunstig intelligens: bak teknologien

=

Maskinlæring

=

Hvilke data trenes kunstig intelligens på?

=

Spørsmål til diskusjon

=

Filnedlastinger | Lenker

Om ressursen:

Denne ressursen er en del av en serie med ressurser til bruk når du skal lære eller undervise om kunstig intelligens (KI). Her finner du en introduksjon til hvordan maskiner lærer, hvilke data KI blir trent på og spørsmål til diskusjon i klasserommet.

 

h

Kunstig intelligens: bak teknologien

Hvordan lærer maskiner? Dette er et spørsmål elevene ofte stiller – og svaret handler om hvordan kunstig intelligens lærer fra store datamengder og bruker det til å generere språk og bilder. Kunstig intelligens er teknologi elevene møter daglig gjennom søkemotorer, sosiale medier og mobilapper. Maskinlæring danner grunnlaget ved å la datamaskiner lære fra store mengder treningsdata. Naturlig språkprosessering gjør at KI kan forstå og produsere språk, mens generativ kunstig intelligens skaper nye tekster, bilder og lyd basert på det den har lært. Disse teknologiene representerer viktig kunnskap elever trenger for å forstå, bruke og tenke kritisk rundt kunstig intelligens. Se her for en enkel introduksjon til kunstig intelligens.

Four wooden sheds blue red yellow and green

Bilde generert med Microsoft Designer

h

Maskinlæring

Maskinlæring er en undergren av kunstig intelligens der en fokuserer på utvikling av algoritmer som lar datamaskiner lære fra data uten å bli eksplisitt programmert med alle regler for hvordan en oppgave skal løses. I stedet for å følge detaljerte instruksjoner, lærer systemene ved å identifisere mønstre og sammenhenger i treningsdataene de får, og ved å forstå disse mønstrene kan chatboten gi fornuftige svar på mange ulike spørsmål.

Verdier og prioriteringer påvirker hvordan systemene virker. Dette skjer gjennom hvilke data som velges ut til trening – dataene bestemmer hva maskinen lærer. Det skjer også gjennom hvordan selve programmet er bygd opp – noen ting får mer oppmerksomhet enn andre. Og det skjer gjennom hvilke mål programmet skal oppnå – utviklerne bestemmer hva som er en «riktig» eller «god» løsning for programmet.

Maskinlæring brukes i en rekke applikasjoner, fra anbefalingssystemer på nettet (som film- eller produkttips) til avsløring av svindel i banktransaksjoner, bildegjenkjenning, medisinsk diagnostikk, språkoversettelse og mye mer.

Mer om maskinlæring:

Fire hovedmåter for maskinlæring:

Veiledet læring, ikke-veiledet læring, semi-veiledet læring og forsterkningslæring

Veiledet læring (Supervised Learning)

Her lærer datamaskinen fra eksempler som allerede er merket med riktig svar. Tenk på det som en lærer som retter en prøve og forteller deg hva som er riktig svar. Målet er at maskinen skal lære å forutsi riktige svar når den får inn nye eksempler som ligner på det den allerede er trent på.

Eksempler

  • Bildegjenkjenning: Lære å skille mellom bilder av katter og hunder.
  • E-postfiltrering: Bestemme hva som er spam og ikke.
  • oversette mellom språk – for eksempel Google Translate (bruker NMT, Neural Machine Translation også pluss muligens også andre typer maskinlæring)
  • bildegjenkjenning (men bruker også andre typer maskinlæring)

Ikke-veiledet læring (Unsupervised Learning)

Datamaskinen prøver å finne mønstre og strukturer i data den får, uten noen forhåndsdefinerte svar.

Eksempler

  • Anbefalingssystemer: Netflix, Spotify anbefaler filmer og musikk basert på hva du har sett eller hørt før
  • Kundesegmentering: Dele kunder inn i grupper basert på kjøpsatferd.

Semi-Veiledet Læring (Semi-Supervised Learning)

En blanding av veiledet og ikke-veiledet læring. Datamaskinen får noen eksempler med riktig svar, men må også finne ut av ting på egen hånd.

Eksempler

  • Språkmodeller: Forstå og generere språk ved å lære fra både merkede og umerkede tekstdata.
  • Forbedre treffsikkerheten til bildegjenkjenningssystemer 

    Forsterkningslæring (Reinforcement Learning)

    Datamaskinen lærer gjennom prøving og feiling, ved å få belønninger for riktige handlinger.

    Eksempler

    • Spill: En datamaskin som lærer seg å spille sjakk eller videospill.
    • Robotikk: Robotarmer som lærer seg å plukke opp objekter.

     

    Jeg bad ChatGPT om å gi meg en analogi for å forklare ulike typer maskinlæring. Å bruke en analogi kan være en nyttig måte å forklare på, en annen kan være å be KI om å forenkle, gi noen praktiske eksempler, gi en eller flere metaforer osv.

      Analogi om hvordan maskiner lærer:

      La oss bruke en analogi med en gruppe barn som lærer å spille et nytt brettspill for å forklare disse fire konseptene i maskinlæring: veiledet læring, ikke-veiledet læring, semi-veiledet læring, og forsterkningslæring. Vi bruker elementene «brettspillet», «spillereglene», og «målet om å vinne» gjennom alle fire analogiene for å holde det konsistent.

      Veiledet læring (Supervised Learning): Forestill deg at barna lærer å spille brettspillet ved at en voksen sitter med dem og forteller dem nøyaktig hva hvert trekk betyr og hva det beste trekket er hver gang de spiller. Hver gang et barn gjør et trekk, forteller den voksne om det var et godt trekk eller ikke, basert på reglene i spillet. Dette er som veiledet læring, der vi har klare eksempler (trekk) og etiketter (om det er et godt eller dårlig trekk), og målet er å lære seg de beste trekkene for å vinne.

      Ikke-veiledet læring (Unsupervised Learning): Nå forestill deg at barna får brettspillet, men uten noen spesifikke instruksjoner om hvordan de skal vinne. De vet hvordan de kan bevege seg på brettet, men de må selv finne ut hvilke trekk som er gode basert på spillets gang. De observerer og danner grupper av trekk som ser ut til å fungere godt sammen, uten noen direkte tilbakemeldinger om hva som er riktig eller galt. Dette ligner på ikke-veiledet læring, hvor systemet prøver å finne mønstre eller strukturer i dataene uten eksplisitte instruksjoner.

      Semi-veiledet læring (Semi-Supervised Learning): Tenk deg at barna får lære spillet delvis med en voksen som forklarer dem noen av trekkene (som i veiledet læring), men så må de spille mye av spillet på egen hånd uten direkte hjelp (som i ikke-veiledet læring). De har nok informasjon til å starte med og får noen hint underveis, men de må også utforske og lære av spillet selv for å finne ut hvordan de kan vinne. Dette er som semi-veiledet læring, der modellen lærer fra en blanding av merkede og umerkede data.

      Forsterkningslæring (Reinforcement Learning): Til slutt, forestill deg at barna spiller brettspillet der de lærer utelukkende gjennom prøving og feiling. Hver gang de gjør et trekk, får de enten en belønning (poeng) eller ingenting, avhengig av om trekket hjelper dem å komme nærmere å vinne. Basert på disse tilbakemeldingene, justerer de strategiene sine for å få flest mulig poeng over tid. Dette ligner på forsterkningslæring, der målet er å lære den beste strategien (sekvens av trekk) for å maksimere totalbelønningen (vinne spillet) gjennom erfaring.

      h

      Hvilke data trenes kunstig intelligens på?

      Språkmodeller blir trent på en stor mengde tekst fra forskjellige kilder for å lære seg språkets nyanser og ulike bruksmåter. Disse kildene inkluderer:

      Internettinnhold: Dette inkluderer tekster fra nettsider, sosiale medier, nyhetsartikler og blogger. Disse tekstene hjelper modellen å forstå dagligspråk og aktuelle temaer.
      Digitale biblioteker: Her henter modellen innhold fra store samlinger av e-bøker og skannede bøker, som Project Gutenberg og Internet Archive. Dette gir modellen tilgang til både klassisk og moderne litteratur.
      Akademiske ressurser: Modellen bruker vitenskapelige artikler og akademiske databaser for å lære fagspesifikt språk og komplekse ideer.
      Offentlige datasett og dokumenter: Disse inkluderer regjeringsdokumenter og tekniske beskrivelser fra patentdatabaser, som gir modellen innsikt i formelt og teknisk språk.
      Spesialiserte tekstsamlinger: For eksempel lingvistiske korpus som er laget spesielt for språkforskning, eller domenespesifikke datasett som medisinske journaler eller juridiske dokumenter.
      Brukergenerert innhold: Wikipedia er et eksempel på en verdifull kilde til strukturert informasjon, og modellen bruker også produktanmeldelser og spørsmål-svar-plattformer for å forstå folks meninger og spørsmål.
      Programmeringskode: Modellen lærer også fra kode og dokumentasjon som er tilgjengelig på plattformer som for eksempel GitHub, samt diskusjoner og veiledninger om programmering.

      Disse dataene hjelper modellen å forstå alt fra dagligtale til spesialiserte fagområder, og er viktige for at den skal kunne generere nøyaktige og relevante svar.

      t

      Spørsmål til diskusjon:

       

      1. Hvor nøytrale er data som kunstig intelligens er trent på?
      2. Skal data som brukes til trening være nøytrale? I så fall, nøytrale i forhold til hvem?
      3. Hvilke perspektiver kan mangle i innhold generert av KI som er trent på disse dataene?
      4. Siden KI ikke vet noe om “den virkelige verden” LINK, hvor viktig er det at informasjonen er korrekt? Hvem skal sørge for det eller bedømme det?
      Person writing on laptop with notebook on desk

      Bilde generert med Midjourney

      Forslag til svar

       

      1. Hvor nøytrale er data som kunstig intelligens er trent på?

      • Data er sjelden helt nøytrale fordi de er samlet inn, valgt ut og organisert av mennesker med sine egne perspektiver og prioriteringer
      • Store datasett kan inneholde skjevheter basert på hvilke tekster, bilder eller ressurser som er lettest tilgjengelige på internett
      • Historiske data kan gjenspeile tidligere tiders holdninger og verdier
      • Vestlige og engelskspråklige kilder er ofte overrepresentert i treningen av KI-modeller
      • Økonomiske interesser kan påvirke hvilke data som blir prioritert

      2. Skal data som brukes til trening være nøytrale? I så fall, nøytrale i forhold til hvem?

      • Full nøytralitet er kanskje umulig, men det kan være viktig å prøve å ha mest mulig mangfold i dataene
      • Data bør representere ulike kulturer, språk og perspektiver for å være relevante globalt
      • «Nøytralitet» kan bety forskjellige ting i ulike samfunn og kulturer
      • Det kan være mer hensiktsmessig å sikre at dataene er representative og balanserte enn å forsøke å oppnå perfekt nøytralitet
      • Noen ganger kan det være viktig at data gjenspeiler spesifikke verdier som respekt for menneskerettigheter eller vitenskapelig kunnskap

      3. Hvilke perspektiver kan mangle i innhold generert av KI som er trent på disse dataene?

      • Perspektiver fra mindre språkgrupper og kulturer som ikke er godt representert på internett
      • Tradisjonell kunnskap som ikke er dokumentert skriftlig
      • Nyere perspektiver eller hendelser som skjedde etter at treningsdataene ble samlet inn
      • Marginaliserte gruppers erfaringer og synspunkter
      • Lokal kunnskap som er spesifikk for mindre samfunn eller regioner
      • Kreative eller originale ideer som ennå ikke er dokumentert

      4. Siden KI ikke vet noe om «den virkelige verden», hvor viktig er det at informasjonen er korrekt? Hvem skal sørge for det eller bedømme det?

      • Det er fortsatt veldig viktig at informasjonen er korrekt fordi KI-systemer brukes til å ta viktige beslutninger
      • Ansvaret for å sikre korrekt informasjon ligger hos:
        • Utviklerne av KI-systemer som må trene og teste systemene grundig
        • Brukerne som må være kritiske til informasjonen de får
        • Utdanningssystemet som må lære elever kildekritikk og digital dømmekraft
        • Samfunnet som helhet gjennom reguleringer og standarder
      • Fageksperter innen ulike felt bør være med på å vurdere om KI-generert innhold er korrekt
      • Det kan være viktig med uavhengige organisasjoner som kan teste og evaluere KI-systemer

      Kunstig intelligens

      Her finner du flere ressurser og undervisningsopplegg knyttet til kunstig intelligens. Ressursene er laget primært for elever på ungdomstrinnet, men går du på videregående kan du også finne nyttig stoff her! Alle undervisningsressurser er publisert med lisensen CC BY NC SAAlle elevtekster er brukt med tillatelse.

      Introduksjon til kunstig intelligens

      Her finner du introduksjoner KI, maskinlæring og data, og hvordan du kan komme i gang med KI i klasserommet.

      Pedagogiske muligheter med kunstig intelligens

      Her finner du ressurser om KI i planlegging, forbedring og gjennomføring av undervisning.

      Kritisk tenking om kunstig intelligens

      Her finner du ressurser om etiske dilemmaer og kritisk tenking og vurdering av kunstig intelligens

      R

      Kunstig intelligens og vurdering

      Her finner du ressurser om å lage gode oppgaver i samarbeid med KI, og hvordan du kan vurdere og gi tilbakemeldinger med KI.

      SKRIV TIL MEG

      ...hvis du har et spørsmål eller en kommentar. Ta kontakt, jeg vil gjerne høre fra deg!

      Pin It on Pinterest

      Share This