Gå til hovedindhold

Behandling

Sprogmodeller

Sprogmodeller er avancerede AI-systemer, der kan forstå, fortolke og generere menneskelig sprog. Disse modeller trænes på enorme tekstdata og lærer mønstre, ordkombinationer, sætningsstrukturer og endda nuancerne i forskellige sprog og sprogbruger. Kernen i mange moderne sprogmodeller er transformer-arkitekturen, der benytter self-attention-mekanismer for at afgøre, hvilke dele af teksten der er vigtige i en given kontekst.

Ved sprogbehandling bruger disse modeller statistiske metoder til at forudsige, hvilket ord eller den mest sandsynlige næste sætning i en tekst kunne være. De kan forstå kontekst over lange tekststykker og dermed ikke kun generere grammatikalsk korrekte, men også indholdsmæssigt sammenhængende og relevante tekster.

Ved brug af en sprogmodel til for eksempel en chatbot eller en tekstgenerator gives modellen visse prompts eller indledende data, og baseret på disse input genererer modellen tekst, der logisk følger af den givne kontekst. Målet med disse modeller er at producere tekst, der så menneskelignende som muligt, både i indhold og stil.

Tekst-til-billede modeller

Tekst-til-billede-modeller er AI-systemer, der er i stand til at generere visuelle repræsentationer ud fra skriftlige tekstbeskrivelser, som fotografer, illustrationer eller andre typer billedmateriale. Disse modeller bruger avancerede neurale netværk, og mere specifikt generative adversarial netværk (GAN'er) eller varianter deraf som diffusion-modeller.

Processen starter med en tekstbeskrivelse indtastet af en bruger. Modellen vurderer teksten og forsøger at forstå betydningen og konteksten. Herefter genererer modellen billeder, der passer til den tekstlige beskrivelse, ved brug af det, den har lært under træningen, hvor den trænes på enorme datasæt af tekst-billedpar.

Under træningen lærer modellen sammenhænge mellem tekstbeskrivelser og visuelle træk. For eksempel, hvis modellen gentagne gange ser ordkombinationen "en gul sol over et blå hav" sammen med billeder, der illustrerer scenen, lærer den at genkende og gengive disse elementer i fremtidige billedskabelser.

Resultatet er ofte overraskende nøjagtige og detaljerede billeder, der passer til den indtastede tekstbeskrivelse. Disse modeller bliver stadig mere sofistikerede og er i stand til at gengive komplekse scenarier med flere objekter og abstrakte koncepter. De bruges i en bred vifte af anvendelser, herunder kunstnerisk skabelse, spiludvikling, virtuel virkelighed og mere.

AI-Public tilgængelige modeller

Det er vigtigt at forstå, at AI-Public gør forskellige AI-modeller tilgængelige, som tilbydes af store teknologivirksomheder via et API. et API, eller Application Programming Interface, er et sæt regler og definitioner, som softwareprogrammer kan kommunikere med. Det fungerer som en slags 'sprog', som programmer kan forstå for at udveksle oplysninger og kalde funktioner fra hinanden. AI-Public har ikke selv sprogmodeller eller tekst-til-billede-modeller.

Vi er ikke ansvarlige for resultaterne af de forskellige modeller. Vi har dog lagt vægt på udvælgelsen af de bedste og mest interessante modeller til virksomheder.

Behandlingsprocedure

Følgende procedure følges for at generere et svar:

  • Brugeren laver en prompt.
  • Frontend-webapplikationen kobler dette til den aktive chat og tilføjer en chatbesked med status "Initialisering".
  • På AI-Publics servere udløses en funktion ved tilføjelsen af en chatbesked.
  • Chatbeskedens status sættes til "Behandler".
  • Ved udvælgelse af chat med dokumenter sender serveren først en anmodning til Firestore vektor-database for at udvælge tekster fra dokumenterne.
  • Serveren sender derefter anmodningen via en API-kobling til den valgte sprogmodel.
  • Hvis indstillingen Streaming er slået til, gemmer vi beskeden efter hver 10. modtagne chunks og efter hver 25 chunks efter at have modtaget 100 chunks.
  • Så snart hele svaret er modtaget, sættes status til "Afsluttet".
  • Frontend-applikationen opdateres efter hver databaseopdatering.
  • Ved konkluderede fejl sættes status til "Error" og der vises en fejlmeddelelse.

Vi sender ingen personoplysninger med hver API-anmodning. Dog kan brugeren have inkluderet personoplysninger i prompten eller i de uploadede dokumenter.