Cilji in kompetence
Cilj predmeta je, da bodo študenti znali razviti, testirati in oceniti sisteme za procesiranje naravnega jezika.
Vsebina
• Uvod: pregled jezikovnih tehnologij in osnovno procesiranje jezika.
• Modeliranje jezika: verjetnostni jezikovni modeli, ocenjevanje jezikovnih modelov in metode glajenja.
• Popravljanje pravopisa: besedne in nebesedne pravopisne napake.
• Klasifikacija besedil: metode klasificiranja besedil in ocenjevanje metod klasificiranja.
• Analiza sentimenta: osnovne metode analize sentimenta in leksikoni sentimenta.
• Semantika in WordNet: strukture za opis semantike, interpretacija semantike, pomen.
• Statistično strojno prevajanje: metode statističnega strojnega prevajanja in ocenjevanje strojnega prevajanja.
• Ekstrakcija informacij in prepoznavanje imenskih entitet.
• Napredne jezikovne tehnologije.
Metode poučevanja in učenja
• Predavanja: pri predavanjih študentje spoznajo teoretične vsebine predmeta. Predavanja se izvajajo kot klasična predavanja v frontalni obliki z diskusijo ob primerih uporabe jezikovnih tehnologij.
• Seminarske vaje: pri seminarskih vajah se študentje seznanijo s potekom računalniških vaj.
• Računalniške vaje: pri računalniških vajah študentje uporabljajo usvojeno znanje za pridobivanje novega znanja s pomočjo znanstvene literature in implementacijo jezikovnih tehnologij.
Predvideni študijski rezultati - znanje in razumevanje
Po zaključku tega predmeta bo študent sposoben:
• opisati smernice razvoja za procesiranje naravnega jezika,
• razložiti standardne metode, ki jih uporabljamo v sistemih za procesiranje naravnega jezika,
• razložiti pomembnosti pragmatike pri jezikovnih tehnologijah,
• izdelati različne korpuse,
• razviti, preizkusiti in ovrednotiti sisteme za procesiranje naravnega jezika.
Predvideni študijski rezultati - Prenosljive/ključne spretnosti in drugi atributi
• Spretnosti komuniciranja: ustni zagovor laboratorijskih vaj, pisno izražanje pri pisnem izpitu.
• Uporaba informacijske tehnologije: uporaba primernih algoritmov in programskih orodij pri procesiranju naravnega jezika.
Temeljni literatura in viri
• Ekman, M. (2022). Learning deep learning: theory and practice of neural networks, computer vision, natural language processing and transformers using tensorflow (1st ed., p. LIII, 688). Addison-Wesley.
• Koehn, P. (2011). Statistical machine translation (Repr. with corr., p. XII, 433). Cambridge Univ. Press.
• Bird, S., Klein, E., & Loper, E. (2009). Natural language processing with Python (p. XX, 479). O’Reilly.
• Jurafsky, D., & Martin, J. H. (2000). Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition (p. XXVI, 934). Prentice Hall.
• Natural Language Processing and Text Mining. (2007). Springer. http://link.springer.com/book/10.1007/978-1-84628-754-1
• Manning, C. D., & Schütze, H. (1999). Foundations of statistical natural language processing (p. XXXVII, 680). MIT Press.
Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti
Pogojev ni.
Podrobnosti o izvedbi in ocenjevanju Pisni izpit se lahko nadomesti s kolokviji v enakem deležu 50 %.