KURSPLAN

Text Mining 7,5 högskolepoäng

Text Mining
Avancerad nivå, D7058E
Version
Kursplan gäller: Höst 2020 Lp 1 - Tillsvidare
Vald version visar för vilken termin och läsperiod som denna kursplanen gäller för. Senaste version visas först.

Kursplanen fastställd
av Jonny Johansson, HUL SRT 2020-02-21

Reviderad
av Jonny Johansson, HUL SRT 2020-02-21

Utbildningsnivå
Avancerad nivå
Fördjupningskod
A1N
Betygskala
U G VG
Ämne
Informationsteknik
Ämnesgrupp (SCB)
Datateknik
Ingår i huvudområde
Systemvetenskap, Datateknik

Behörighet

Minst 180 högskolepoäng varav minst 60 högskolepoäng i något av ämnena systemvetenskap eller datavetenskap. Studierna skall ha inkluderat introduktion i programmering (exemelvis D0009E eller D0007N) och grunderna inom databaser (exempelvis D0004N eller D0018E). Text Mining-kursen kräver också en grundläggande kurs i data mining (till exempel D0025E Data Mining). Goda färdigheter i engelska, motsvarande engelska 6.


Urval

Urvalet grundas på 20-285 högskolepoäng



Mål/Förväntat studieresultat

Målet med kursen är att studenten ska utveckla sina kunskaper och färdigheter inom Text Mining. Efter genomgången kurs ska studenten kunna:

[1]. Förklara och använda textförbehandlingstekniker

[2]. Beskriv ett textanalyssystem tillsammans med dess komponenter, valfria och obligatoriska

[3]. Förklara hur text kan analyseras

[4]. Utvärdera resultat från textanalys

[5]. Analysera och reflektera över de olika tekniker som används i textanalys och parametrar som behövs samt över lösningen problemet

[6]. Planera och genomföra ett textanalysexperiment 


Kursinnehåll

Kursen Text Mining är utformad för att ge eleverna kunskaper som är relevanta för såväl förbehandling av text som analys av text. Kursen behandlar ett brett utbud av algoritmer, tekniker och verktyg. Dessa inkluderar standardmetoder, såsom: tokenization, TF-IDF, n-grams, Named Entity Extraction, Sentiment Analysis, and Topic Modeling. Dessutom täcks de senaste trenderna i maskininlärning och djupinlärning, inklusive: Word2Vec, Semantic Hashing och Recurrent Neural Networks for Natural Language Processing. Olika exempel och användningsfall används i kursen. 


Genomförande

Föreläsningar, labb, uppgifter, fallstudier eller projektarbete. Under kursen arbetar eleverna med individuella uppgifter eller grupparbete. Vissa uppgifter eller fallstudier i kursen kan vara om eller i företag. Studenten använder olika metoder och tekniker och lärs sig välja rätt metod, teknik eller datorstöd för varje uppgift.
Undervisningen sker på engelska på campus och Internet för distansstudenter. IT-support: Learning management system (LMS), e-post och telefon.  LMS används för att leverera kursmaterial, information och inlämning av uppgifter. Kunskap delas och skapas inom kursen genom virtuella möten med lärare och andra studenter för diskussioner, handledning, grupparbete och seminarier. För studenter på campus kommer det att finnas möten på campus. 


Examination

Examinationen består av skriftliga prov, individuell grupp- och projektuppgifter för att utvärdera studenternas förmågor att förklara och använda Text Mining tekniker och förmågan att hantera affärsproblem med hjälp av Text Mining individuellt och i grupp. 


Övrigt

Tekniska krav: åtkomst till dator med administrativa rättigheter, webbkamera, mikrofon och Internetanslutning.


Examinator
Marcus Liwicki

Litteratur. Gäller från Höst 2020 Lp 1 (Kan ändras fram till 10 veckor innan studiestart)
Titel: Practical Text Analytics: Interpreting Text and Unstructured Data for Business Intelligence (Marketing Science)
Författare: Steven Struhl
Förlag: Kogan Page, 1st edition, 2015
ISBN: 978-07499474010

Titel: Deep Text: Using Text Analytics to Conquer Information Overload, Get Real Value from Social Media, and Add Bigger Text to Big Data
Författarer: Tom Reamy
Förlag: Information Today Inc, 2016
ISBN 9781573875295

Titel: Text Mining and Analysis: Practical Methods, Examples, and Case Studies Using SAS
Författare: Goutam Chakraborty, Murali Pagolu, & Satish Garla
Förlag: SAS Institute, 2014
ISBN 9781612905518

Kursgivare
Institutionen för system- och rymdteknik (SRT)

Moduler
KodBenämningBetygskalaHPTillståndGäller frånTitel
0001TentamenU G VG4.00ObligatoriskH20
0002InlämningsuppgiftU G#1.50ObligatoriskH20
0003Grupp-/ProjektarbeteU G#2.00ObligatoriskH20

Studiehandledning
Studiehandledning finns i lärplattformen Canvas före kursstart. Du som är ny student hittar all information du behöver på www.ltu.se/nystudent. Du som redan studerar vid Luleå tekniska universitet hittar information om kursstart via schema på studentwebben alternativt via kursrummet i lärplattformen. Du når lärplattformen via Mitt LTU.