Uniwersytet w Białymstoku - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Przetwarzanie języka naturalnego

Informacje ogólne

Kod przedmiotu: 400-IS1-3PJN Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Przetwarzanie języka naturalnego
Jednostka: Filia Uniwersytetu w Białymstoku w Wilnie, Wydział Ekonomiczno-Informatyczny
Grupy: 3L stac. I st. studia informatyki - przedmioty obowiązkowe - WILNO
Wilno - informatyka 3 rok 1 st. stacjonarne sem.zimowy
Punkty ECTS i inne: 5.00
Język prowadzenia: polski
Rodzaj przedmiotu:

fakultatywne

Założenia (opisowo):

Przetwarzanie języka naturalnego jest zagadnieniem multidyscyplinarnym. Zakłada się, że student ma bazową wiedzę w zakresie sztucznej inteligencji, rachunku prawdopodobieństwa i statystyki oraz systemów baz danych. Student powinien bez trudu czytać i tworzyć kod w jednym z zaawansowanych języków programowania (np. C++, Java, Phyton) oraz mieć orientację w bibliotekach/repozytoriach oprogramowania. Oczekuje się, że student w miarę nabywania podstawowej wiedzy w zakresie uczenia maszynowego będzie zdolny do zaprojektowania i przeprowadzenia prostego eksperymentu dotyczącego przetwarzania języka naturalnego, np. analizy sentymentu, na zajęciach laboratoryjnych i projektowych.

Tryb prowadzenia przedmiotu:

mieszany: w sali i zdalnie

Skrócony opis:

Celem przedmiotu jest zapoznanie studentów z wybranymi zagadnieniami i metodami automatycznego przetwarzania języka naturalnego, ze szczególnym uwzględnieniem przetwarzania języka naturalnego wykorzystywanego w odniesieniu do zasobów Internetu. W ramach wykładu omówione zostaną podstawowe pojęcia i metody wykorzystywane przy przetwarzaniu dokumentów tekstowych, włącznie z podstawowymi elementami lingwistyki. Omówione zostaną klasyczne metody przetwarzania wykorzystujące reprezentacje dokumentów w postaci przestrzeni wektorowych dokumentów i n-gramów. Wykorzystanie przedstawionych metod zostanie zaprezentowane m.in w praktycznych zastosowaniach w grupowaniu i klasyfikacji dokumentów, przetwarzaniu wyrażeń regularnych oraz w analizie sentymentu. Ponadto podjęte będą zagadnienia dotyczące analiza syntaktycznej i semantycznej zdań. Zastosowanie podanych

metod pokazane zostanie także w odniesieniu do przetwarzania danych pochodzących z Internetu.

Pełny opis:

Profil studiów: praktyczny.

Forma studiów: stacjonarne

Rodzaj przedmiotu: Do wyboru

Dziedzina: Nauki ścisłe i przyrodnicze

Dyscyplina: Informatyka

Rok studiów: 3 rok/5 sem.

Wymagania wstępne: patrz "Założenia (opisowo)"

Liczba godzin wykładu: 15 godzin

Liczba godzin laboratorium: 30 godzin

Liczba godzin na projekt: 15 godzin

Metody dydaktyczne: Wykład metodą tradycyjną z wykorzystaniem tablicy i autorskich prezentacji multimedialnych oraz angażowanie

studentów do aktywnego udziału w dyskusji podczas wykładu i zajęć praktycznych i zadawania pytań.

Punkty ECTS: 5

Bilans nakładu pracy studenta:

(i) związany z zajęciami wymagającymi bezpośredniego nakładu nauczyciela i studenta -- 70 godzin (2,8 ECTS) :

Liczba godzin wykładu: 15 godzin

Liczba godzin laboratorium: 30 godzin

Liczba godzin na projekt: 15 godzin

Czas trwania sprawdzianów i zaliczenia: 4 godziny

Udział w konsultacjach: 6 godziny

(ii) związany z zajęciami o charakterze praktycznym -- 55 godzin (2,2 ECTS)

Przygotowanie się studenta do wykładu: 5 godziny

Przygotowanie się studenta do laboratorium: 20 godzin

Przygotowanie się studenta do projektu: 15 godzin

Przygotowanie się studenta do konsultacji i zaliczenia: 15 godzin

Literatura:

1. Bird S., Klein E., Loper E.: Natural Language Processing with Python. https://www.nltk.org/book/

2. Bolc L., Cichy M., Różańska L: Przetwarzanie języka naturalnego¸ WNT, 1982.

3. Booth J. D.: Natural Language Processing Succinctly. Syncfusion, Inc. 2018, https://www.e-booksdirectory.com/details.php?ebook=12260

4. Liu B.: Sentiment Analysis and Opinion Mining . Morgan & Claypool, 2012. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.244.9480&rep=rep1&type=pdf

5. Mykowiecka A.:Inżynieria lingwistyczna. Komputerowe przetwarzanie tekstów w języku naturalnym. Wydawnictwo PJWSTK, 2007.

6. NLTK python

7. Spacy library

8. PyTorch

9. Tensorflow

Efekty uczenia się:

Student:

WIEDZA

KP6_WG2 - Posiada elementarną wiedzę dotyczącą statystyki.

KP6_WG9 - Zna podstawowe zagadnienia w dziedzinie sztucznej inteligencji, reprezentacji i przetwarzania wiedzy, komunikacji człowiek-komputer.

UMIEJĘTNOŚCI

KP6_UW2 - Umie wykorzystać metody statystyczne do analizy danych.

KP6_UW4 - Wybiera odpowiedni paradygmat i język programowania do rozwiązania określonego typu zadań.

KP6_UW5 - Potrafi samodzielnie implementować algorytmy stosując odpowiednie elementy wybranego języka programowania.

KP6_UW7 - Potrafi zaprojektować i zoptymalizować bazę danych zgodnie ze specyfikacją, umie efektywnie wyszukiwać żądane informacje w istniejących bazach danych, potrafi zaimplementować bazę danych w wybranym systemie baz danych.

KP6_UW11 - Posługuje się wzorcami projektowymi, posługuje się API, umie wykorzystać narzędzia wspomagające proces tworzenia, testowania i debugowania oprogramowania.

KP6_UW12 - Potrafi wykorzystać wiedzę z zakresu języków formalnych do rozwiązywania zagadnień z zakresu komunikacji człowiek-komputer, sztucznej inteligencji, formułowania algorytmów i projektowania systemów informatycznych.

KP6_UW14 - Wykorzystuje technologie tworzenia oprogramowania pracującego w Internecie.

KP6_UK1 - Posługuje się terminologią informatyczną w języku angielskim.

KP6_UO1 - Potrafi pracować w zespole programistycznym przy kompleksowym rozwiązaniu zadanego problemu.

KP6_UO2 - Potrafi współpracować w grupie realizując wspólne projekty

KP6_UU1 - Rozumie potrzebę podnoszenia swoich umiejętności i kwalifikacji.

KOMPETENCJE SPOŁECZNE

KP6_KO1 - Wykazuje postawę kreatywności i innowacyjności niezbędną do podjęcia praktycznej aktywności w społeczeństwie informacyjnym.

Metody i kryteria oceniania:

Forma zaliczenia: zaliczenie wykładu, laboratorium i projektu na ocenę.

Zajęcia w cyklu "Rok akademicki 2020/21" (w trakcie)

Okres: 2020-10-01 - 2021-06-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 30 godzin więcej informacji
Projekt, 15 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Mieczysław Muraszkiewicz
Prowadzący grup: Mieczysław Muraszkiewicz, Kamil Ząbkiewicz
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie na ocenę
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet w Białymstoku.