Språkmodeller kan tolka krav vid mjukvaruutveckling

17.6.2025 07:00:00 CEST | Örebro universitet | Pressmeddelande

Dela

Att sortera tusentals krav vid utveckling av programvara är både komplext och tidskrävande. Nu visar forskare vid Örebro universitet att stora språkmodeller som GPT-4o och LLAMA 3.3-70B kan effektivisera arbetet – men att det samtidigt gäller att hitta rätt balans mellan modellernas stabilitet och kreativitet.

Shang Gao, Tanja E. Havström, Panagiota Chatzipetrou och Fredrik Karlsson, informatikforskare vid Örebro universitet.

När nya IT-system ska utvecklas är det avgörande att användarkraven tolkas korrekt. Det gäller både funktionella krav, som beskriver vad systemet ska göra, och de icke-funktionella, som anger hur systemet ska fungera och vilken kvalitet det ska ha.
I en ny studie har Örebroforskare testat hur väl två stora språkmodeller – GPT-4o och LLAMA 3.3-70B – klarar att automatiskt klassificera dessa krav.

– De språkmodeller vi testade är väldigt bra på att klassa funktionella krav. De visade sig vara sämre på att klassificera icke-funktionella krav, säger Fredrik Karlsson, professor i informatik vid Örebro universitet.

Balans mellan precision och variation

Totalt testade forskarna 625 krav med en metod där modellerna inte har tränats på uppgiften i förväg. De undersökte också hur resultaten påverkas av en parameterinställning som kallas temperatur och hur konsekventa modellerna är i sina klassningar. En låg temperatur gör modellernas svar mer förutsägbara, medan en hög temperatur ger större variation.

– GPT-4o presterar bäst när temperaturinställning tillåter en viss variation. Modellen blir då relativt träffsäker när det kommer till funktionella krav, säger Fredrik Karlsson.

Samtidigt förbättrades klassificeringen av icke-funktionella krav vid högre temperaturer.

– Det innebär att det krävs en avvägning mellan stabilitet och kreativitet, beroende på vad som är viktigast i sammanhanget.

Studien visar också att LLAMA 3.3-70B uppvisar större konsekvens i sina klassificeringar, oavsett temperatur.

Kombination av språkmodeller och människa

Stora språkmodeller som GPT-4o och LLAMA 3.3-70B kan kraftigt effektivisera arbetet med att klassificera krav uttryckta i naturligt språk. Men enligt forskarna får det inte ske helt utan mänsklig granskning.

– Modellerna kan spara mycket tid, men vi rekommenderar att en människa alltid granskar resultatet och regelbundet kontrollerar av att klassificeringen fungerar som den ska. Det gäller särskilt i sektorer med höga krav, som inom sjukvård eller flyg, säger Fredrik Karlsson.

Nyckelord

språkmodeller krav vid mjukvaruutveckling nya it-system

Kontakter

Fredrik Karlsson, professor i informatik vid Örebro universitet
E-post: fredrik.karlsson@oru.se
Mobil: 073 461 87 94

Jasenka DobricForskningskommunikatör

Tel:019 303035Tel:0735 930995jasenka.dobric@oru.se

Bilder

Länkar

How Reliable Are GPT-4o and LLAMA3.3-70B in Classifying Natural Language Requirements?

Om oss

Örebro universitet är ett bredduniversitet med starka professionsutbildningar och forskning som spänner över 36 ämnen inom alla vetenskapliga fält. Vi har 17 000 studenter, 80 utbildningsprogram på grundnivå och avancerad nivå och ett stort utbud av fristående kurser. Örebro universitet har samlat spetskompetens inom tre profilområden: AI, robotik och cybersäkerhet, Mat och hälsa och Föroreningar och samhälle.

Följ Örebro universitet

Abonnera på våra pressmeddelanden. Endast mejladress behövs och den används bara här. Du kan avanmäla dig när som helst.

Senaste pressmeddelandena från Örebro universitet

Så blir lärare i matematik bättre på att undervisa – tillsammans19.12.2025 07:53:55 CET | Pressmeddelande

Det räcker inte att avsätta tid i schemat för att kollegialt lärande ska fungera och leda till ökad kvalitet i undervisningen – och på sikt till bättre matematikkunskaper hos elever. – Vi måste våga förändra gamla normer, säger Frida Harvey, forskare i matematik vid Örebro universitet.

Adhd i familjen kopplas till ökad risk att begå brott18.12.2025 08:59:23 CET | Pressmeddelande

Personer med adhd har en högre risk att begå brott än personer som inte har adhd. Samma mönster syns hos deras släktingar, enligt en ny studie från Örebro universitet. – Det tyder på att både genetiska och miljömässiga faktorer delade inom familjen kan spela roll, säger forskaren Sofi Oskarsson.

Normer och attityder gör vardagen svårare för äldre lgbq-personer17.12.2025 07:00:00 CET | Pressmeddelande

Äldre lgbq-personer på särskilda boenden påverkas av heterosexuella normer och andra boendes attityder. Det kan begränsa deras möjligheter att uttrycka sin sexuella identitet. Det visar en ny studie från Örebro universitet.

Örebrostudenter hittar PFAS-relaterat ämne i glögg16.12.2025 11:40:36 CET | Pressmeddelande

Fyra kemistudenter vid Örebro universitet analyserade tolv glöggprodukter som köpts i dagligvaruhandeln. I samtliga prover påvisades mätbara halter av trifluorättiksyra (TFA). Forskare betonar att den hälsomässiga betydelsen är oklar och att mer forskning behövs.

AI-förordning i EU riskerar tappa legitimitet9.12.2025 08:00:00 CET | Pressmeddelande

Andrew Leyden, rättsvetare vid Örebro universitet, har i en studie granskat EU:s AI-förordning som bygger på tekniska standarder. – Traditionella frågor om rättssäkerhet, ansvar och demokratisk legitimitet får en ny betydelse när tekniska standarder fungerar som ett slags privat lagstiftning, säger han.

I vårt pressrum kan du läsa de senaste pressmeddelandena, få tillgång till pressmaterial och hitta kontaktinformation.

Besök vårt pressrum