Przetwarzanie języka naturalnego
Informacje ogólne
Kod przedmiotu: | 400-IS1-3PJN | Kod Erasmus / ISCED: | (brak danych) / (brak danych) |
Nazwa przedmiotu: | Przetwarzanie języka naturalnego | ||
Jednostka: | Filia Uniwersytetu w Białymstoku w Wilnie, Wydział Ekonomiczno-Informatyczny | ||
Grupy: |
3L stac. I st. studia informatyki - przedmioty obowiązkowe - WILNO Wilno - informatyka 3 rok 1 st. stacjonarne sem.zimowy |
||
Punkty ECTS i inne: |
5.00 ![]() |
||
Język prowadzenia: | polski | ||
Rodzaj przedmiotu: | fakultatywne |
||
Założenia (opisowo): | Przetwarzanie języka naturalnego jest zagadnieniem multidyscyplinarnym. Zakłada się, że student ma bazową wiedzę w zakresie sztucznej inteligencji, rachunku prawdopodobieństwa i statystyki oraz systemów baz danych. Student powinien bez trudu czytać i tworzyć kod w jednym z zaawansowanych języków programowania (np. C++, Java, Phyton) oraz mieć orientację w bibliotekach/repozytoriach oprogramowania. Oczekuje się, że student w miarę nabywania podstawowej wiedzy w zakresie uczenia maszynowego będzie zdolny do zaprojektowania i przeprowadzenia prostego eksperymentu dotyczącego przetwarzania języka naturalnego, np. analizy sentymentu, na zajęciach laboratoryjnych i projektowych. |
||
Tryb prowadzenia przedmiotu: | mieszany: w sali i zdalnie |
||
Skrócony opis: |
Celem przedmiotu jest zapoznanie studentów z wybranymi zagadnieniami i metodami automatycznego przetwarzania języka naturalnego, ze szczególnym uwzględnieniem przetwarzania języka naturalnego wykorzystywanego w odniesieniu do zasobów Internetu. W ramach wykładu omówione zostaną podstawowe pojęcia i metody wykorzystywane przy przetwarzaniu dokumentów tekstowych, włącznie z podstawowymi elementami lingwistyki. Omówione zostaną klasyczne metody przetwarzania wykorzystujące reprezentacje dokumentów w postaci przestrzeni wektorowych dokumentów i n-gramów. Wykorzystanie przedstawionych metod zostanie zaprezentowane m.in w praktycznych zastosowaniach w grupowaniu i klasyfikacji dokumentów, przetwarzaniu wyrażeń regularnych oraz w analizie sentymentu. Ponadto podjęte będą zagadnienia dotyczące analiza syntaktycznej i semantycznej zdań. Zastosowanie podanych metod pokazane zostanie także w odniesieniu do przetwarzania danych pochodzących z Internetu. |
||
Pełny opis: |
Profil studiów: praktyczny. Forma studiów: stacjonarne Rodzaj przedmiotu: Do wyboru Dziedzina: Nauki ścisłe i przyrodnicze Dyscyplina: Informatyka Rok studiów: 3 rok/5 sem. Wymagania wstępne: patrz "Założenia (opisowo)" Liczba godzin wykładu: 15 godzin Liczba godzin laboratorium: 30 godzin Liczba godzin na projekt: 15 godzin Metody dydaktyczne: Wykład metodą tradycyjną z wykorzystaniem tablicy i autorskich prezentacji multimedialnych oraz angażowanie studentów do aktywnego udziału w dyskusji podczas wykładu i zajęć praktycznych i zadawania pytań. Punkty ECTS: 5 Bilans nakładu pracy studenta: (i) związany z zajęciami wymagającymi bezpośredniego nakładu nauczyciela i studenta -- 70 godzin (2,8 ECTS) : Liczba godzin wykładu: 15 godzin Liczba godzin laboratorium: 30 godzin Liczba godzin na projekt: 15 godzin Czas trwania sprawdzianów i zaliczenia: 4 godziny Udział w konsultacjach: 6 godziny (ii) związany z zajęciami o charakterze praktycznym -- 55 godzin (2,2 ECTS) Przygotowanie się studenta do wykładu: 5 godziny Przygotowanie się studenta do laboratorium: 20 godzin Przygotowanie się studenta do projektu: 15 godzin Przygotowanie się studenta do konsultacji i zaliczenia: 15 godzin |
||
Literatura: |
1. Bird S., Klein E., Loper E.: Natural Language Processing with Python. https://www.nltk.org/book/ 2. Bolc L., Cichy M., Różańska L: Przetwarzanie języka naturalnego¸ WNT, 1982. 3. Booth J. D.: Natural Language Processing Succinctly. Syncfusion, Inc. 2018, https://www.e-booksdirectory.com/details.php?ebook=12260 4. Liu B.: Sentiment Analysis and Opinion Mining . Morgan & Claypool, 2012. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.244.9480&rep=rep1&type=pdf 5. Mykowiecka A.:Inżynieria lingwistyczna. Komputerowe przetwarzanie tekstów w języku naturalnym. Wydawnictwo PJWSTK, 2007. 6. NLTK python 7. Spacy library 8. PyTorch 9. Tensorflow |
||
Efekty uczenia się: |
Student: WIEDZA KP6_WG2 - Posiada elementarną wiedzę dotyczącą statystyki. KP6_WG9 - Zna podstawowe zagadnienia w dziedzinie sztucznej inteligencji, reprezentacji i przetwarzania wiedzy, komunikacji człowiek-komputer. UMIEJĘTNOŚCI KP6_UW2 - Umie wykorzystać metody statystyczne do analizy danych. KP6_UW4 - Wybiera odpowiedni paradygmat i język programowania do rozwiązania określonego typu zadań. KP6_UW5 - Potrafi samodzielnie implementować algorytmy stosując odpowiednie elementy wybranego języka programowania. KP6_UW7 - Potrafi zaprojektować i zoptymalizować bazę danych zgodnie ze specyfikacją, umie efektywnie wyszukiwać żądane informacje w istniejących bazach danych, potrafi zaimplementować bazę danych w wybranym systemie baz danych. KP6_UW11 - Posługuje się wzorcami projektowymi, posługuje się API, umie wykorzystać narzędzia wspomagające proces tworzenia, testowania i debugowania oprogramowania. KP6_UW12 - Potrafi wykorzystać wiedzę z zakresu języków formalnych do rozwiązywania zagadnień z zakresu komunikacji człowiek-komputer, sztucznej inteligencji, formułowania algorytmów i projektowania systemów informatycznych. KP6_UW14 - Wykorzystuje technologie tworzenia oprogramowania pracującego w Internecie. KP6_UK1 - Posługuje się terminologią informatyczną w języku angielskim. KP6_UO1 - Potrafi pracować w zespole programistycznym przy kompleksowym rozwiązaniu zadanego problemu. KP6_UO2 - Potrafi współpracować w grupie realizując wspólne projekty KP6_UU1 - Rozumie potrzebę podnoszenia swoich umiejętności i kwalifikacji. KOMPETENCJE SPOŁECZNE KP6_KO1 - Wykazuje postawę kreatywności i innowacyjności niezbędną do podjęcia praktycznej aktywności w społeczeństwie informacyjnym. |
||
Metody i kryteria oceniania: |
Forma zaliczenia: zaliczenie wykładu, laboratorium i projektu na ocenę. |
Zajęcia w cyklu "Rok akademicki 2020/21" (w trakcie)
Okres: | 2020-10-01 - 2021-06-30 |
![]() |
Typ zajęć: |
Laboratorium, 30 godzin ![]() Projekt, 15 godzin ![]() Wykład, 15 godzin ![]() |
|
Koordynatorzy: | Mieczysław Muraszkiewicz | |
Prowadzący grup: | Mieczysław Muraszkiewicz, Kamil Ząbkiewicz | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Właścicielem praw autorskich jest Uniwersytet w Białymstoku.