Examensarbete inom AI med koppling till Uppsala universitetsbiblioteks text- och bildsamlingar.
STS:are sökes till examensarbete inom artificiell intelligens
Vi tror att du som är mastersstudent/motsvarande inom Teknisk-naturvetenskapliga fakulteten på Uppsala universitet (UU) skulle kunna vara intresserad av att samarbeta med oss på Uppsala universitetsbibliotek. Vi har bildsamlingar och stora digitala textsamlingar som växer kontinuerligt. Att delar av dessa samlingar redan har tillhörande beskrivande metadata öppnar för flera spännande möjligheter vad gäller maskininlärning. Just nu behöver vi din hjälp att skapa automatisk kvalitetsgranskning av forskarinmatad metadata i Digitala Vetenskapliga Arkivet (DiVA).
Det här projektet erbjuder möjligheter att arbeta med stora datamängder, flera källor med olika typer av data och goda möjligheter till träna och applicera algoritmer för maskininlärning. Resultatet kan dessutom komma till stor nytta för verksamheten vid biblioteket. Detta examensarbete är lämpligt för en eller två studenter som fullgör 30 hp (20 veckor) vardera.
Bakgrund och beskrivning av projektet
DiVA är Uppsala universitets plattform för digital publicering och registrering av forskningspublikationer. Universitetsbiblioteket genomför idag en manuell granskning av poster i databasen DiVA för att säkerställa att metadata är korrekt och att publikationer affilieras till rätt personer och organisatoriska enheter vid universitetet. Datan används som underlag till officiell statistik, analyser om UU:s forskningsverksamhet och för att visa upp forskningsresultat från UU.
Ett system som tränats på tidigare poster skulle kunna automatisera stora delar av denna process. En maskininlärningsalgoritm som gör statistiska bedömningar av rimligheten i vad användaren matat in skulle kunna flagga för de poster som verkar bristfälliga och släppa igenom resten. För de poster som behöver kontrolleras skulle systemet även kunna ge lämpliga ändringsförslag som snabbar upp arbetet för bibliotekarien.
Det finns flertalet datakällor som kan användas som underlag för att träna algoritmer för att göra gissningar. T.ex. tidigare inmatad och kvalitetsgranskad metadata i DiVA, metadata från externa tjänster för beskrivning av vetenskapliga publikationer, liksom de publikationer i PDF-format som hänvisas till i DiVA-posterna.
Vad du blir del av
Universitetsbiblioteket är en integrerad del av Uppsala universitet. Vår uppgift är att ansvara för den vetenskapliga informationsförsörjningen inom universitetet samt att stödja forskning och utbildning. De fysiska och digitala biblioteken existerar parallellt. Vi har bildsamlingar och stora digitala textsamlingar som vi utvecklar och tillgängliggör på nya sätt, bl. a genom digital publikation och digitalisering. Vi vill vara en internationell modell i fråga om att erbjuda fysiska och digitala studie- och forskarmiljöer. Antal anställda är ca 180 och omsättningen ca 270 mnkr. På Carolina Rediviva är AI4Research, ett universitetsövergripande gemensamt projekt, lokaliserat. Fokus är på forskningsfälten artificiell intelligens (AI) och maskininlärning (ML).
Kontakt och intresseanmälan
Din intresseanmälan ska innehålla:
- CV
- personligt brev där du motiverar ditt intresse
- intyg på aktiva studier på UU
- ev. andra intyg avseende relevant erfarenhet
Välkommen att skicka din intresseanmälan till fraga.biblioteket@ub.uu.se senast den 19 maj 2021.
Vid frågor, kontakta fraga.biblioteket@ub.uu.se