Przetwarzanie języka naturalnego
Informacje ogólne
Kod przedmiotu: | 400-IS1-3PJN |
Kod Erasmus / ISCED: | (brak danych) / (brak danych) |
Nazwa przedmiotu: | Przetwarzanie języka naturalnego |
Jednostka: | Filia Uniwersytetu w Białymstoku w Wilnie, Wydział Ekonomiczno-Informatyczny |
Grupy: |
3L stac. I st. studia informatyki - przedmioty obowiązkowe - WILNO Wilno - informatyka 3 rok 1 st. stacjonarne sem.zimowy |
Punkty ECTS i inne: |
5.00
|
Język prowadzenia: | polski |
Rodzaj przedmiotu: | fakultatywne |
Założenia (opisowo): | Przetwarzanie języka naturalnego jest zagadnieniem multidyscyplinarnym. Zakłada się, że student ma bazową wiedzę w zakresie sztucznej inteligencji, rachunku prawdopodobieństwa i statystyki oraz systemów baz danych. Student powinien bez trudu czytać i tworzyć kod w jednym z zaawansowanych języków programowania (np. C++, Java, Phyton) oraz mieć orientację w bibliotekach/repozytoriach oprogramowania. Oczekuje się, że student w miarę nabywania podstawowej wiedzy w zakresie uczenia maszynowego będzie zdolny do zaprojektowania i przeprowadzenia prostego eksperymentu dotyczącego przetwarzania języka naturalnego, np. analizy sentymentu, na zajęciach laboratoryjnych i projektowych. |
Tryb prowadzenia przedmiotu: | mieszany: w sali i zdalnie |
Skrócony opis: |
Celem przedmiotu jest zapoznanie studentów z wybranymi zagadnieniami i metodami automatycznego przetwarzania języka naturalnego, ze szczególnym uwzględnieniem przetwarzania języka naturalnego wykorzystywanego w odniesieniu do zasobów Internetu. W ramach wykładu omówione zostaną podstawowe pojęcia i metody wykorzystywane przy przetwarzaniu dokumentów tekstowych, włącznie z podstawowymi elementami lingwistyki. Omówione zostaną klasyczne metody przetwarzania wykorzystujące reprezentacje dokumentów w postaci przestrzeni wektorowych dokumentów i n-gramów. Wykorzystanie przedstawionych metod zostanie zaprezentowane m.in w praktycznych zastosowaniach w grupowaniu i klasyfikacji dokumentów, przetwarzaniu wyrażeń regularnych oraz w analizie sentymentu. Ponadto podjęte będą zagadnienia dotyczące analiza syntaktycznej i semantycznej zdań. Zastosowanie podanych metod pokazane zostanie także w odniesieniu do przetwarzania danych pochodzących z Internetu. |
Pełny opis: |
Profil studiów: praktyczny. Forma studiów: stacjonarne Rodzaj przedmiotu: Do wyboru Dziedzina: Nauki ścisłe i przyrodnicze Dyscyplina: Informatyka Rok studiów: 3 rok/5 sem. Wymagania wstępne: patrz "Założenia (opisowo)" Liczba godzin wykładu: 15 godzin Liczba godzin laboratorium: 30 godzin Liczba godzin na projekt: 15 godzin Metody dydaktyczne: Wykład metodą tradycyjną z wykorzystaniem tablicy i autorskich prezentacji multimedialnych oraz angażowanie studentów do aktywnego udziału w dyskusji podczas wykładu i zajęć praktycznych i zadawania pytań. Punkty ECTS: 5 Bilans nakładu pracy studenta: (i) związany z zajęciami wymagającymi bezpośredniego nakładu nauczyciela i studenta -- 70 godzin (2,8 ECTS) : Liczba godzin wykładu: 15 godzin Liczba godzin laboratorium: 30 godzin Liczba godzin na projekt: 15 godzin Czas trwania sprawdzianów i zaliczenia: 4 godziny Udział w konsultacjach: 6 godziny (ii) związany z zajęciami o charakterze praktycznym -- 55 godzin (2,2 ECTS) Przygotowanie się studenta do wykładu: 5 godziny Przygotowanie się studenta do laboratorium: 20 godzin Przygotowanie się studenta do projektu: 15 godzin Przygotowanie się studenta do konsultacji i zaliczenia: 15 godzin |
Literatura: |
1. Bird S., Klein E., Loper E.: Natural Language Processing with Python. https://www.nltk.org/book/ 2. Bolc L., Cichy M., Różańska L: Przetwarzanie języka naturalnego¸ WNT, 1982. 3. Booth J. D.: Natural Language Processing Succinctly. Syncfusion, Inc. 2018, https://www.e-booksdirectory.com/details.php?ebook=12260 4. Liu B.: Sentiment Analysis and Opinion Mining . Morgan & Claypool, 2012. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.244.9480&rep=rep1&type=pdf 5. Mykowiecka A.:Inżynieria lingwistyczna. Komputerowe przetwarzanie tekstów w języku naturalnym. Wydawnictwo PJWSTK, 2007. 6. NLTK python 7. Spacy library 8. PyTorch 9. Tensorflow |
Efekty uczenia się: |
Student: WIEDZA KP6_WG2 - Posiada elementarną wiedzę dotyczącą statystyki. KP6_WG9 - Zna podstawowe zagadnienia w dziedzinie sztucznej inteligencji, reprezentacji i przetwarzania wiedzy, komunikacji człowiek-komputer. UMIEJĘTNOŚCI KP6_UW2 - Umie wykorzystać metody statystyczne do analizy danych. KP6_UW4 - Wybiera odpowiedni paradygmat i język programowania do rozwiązania określonego typu zadań. KP6_UW5 - Potrafi samodzielnie implementować algorytmy stosując odpowiednie elementy wybranego języka programowania. KP6_UW7 - Potrafi zaprojektować i zoptymalizować bazę danych zgodnie ze specyfikacją, umie efektywnie wyszukiwać żądane informacje w istniejących bazach danych, potrafi zaimplementować bazę danych w wybranym systemie baz danych. KP6_UW11 - Posługuje się wzorcami projektowymi, posługuje się API, umie wykorzystać narzędzia wspomagające proces tworzenia, testowania i debugowania oprogramowania. KP6_UW12 - Potrafi wykorzystać wiedzę z zakresu języków formalnych do rozwiązywania zagadnień z zakresu komunikacji człowiek-komputer, sztucznej inteligencji, formułowania algorytmów i projektowania systemów informatycznych. KP6_UW14 - Wykorzystuje technologie tworzenia oprogramowania pracującego w Internecie. KP6_UK1 - Posługuje się terminologią informatyczną w języku angielskim. KP6_UO1 - Potrafi pracować w zespole programistycznym przy kompleksowym rozwiązaniu zadanego problemu. KP6_UO2 - Potrafi współpracować w grupie realizując wspólne projekty KP6_UU1 - Rozumie potrzebę podnoszenia swoich umiejętności i kwalifikacji. KOMPETENCJE SPOŁECZNE KP6_KO1 - Wykazuje postawę kreatywności i innowacyjności niezbędną do podjęcia praktycznej aktywności w społeczeństwie informacyjnym. |
Metody i kryteria oceniania: |
Forma zaliczenia: zaliczenie wykładu, laboratorium i projektu na ocenę. |
Zajęcia w cyklu "Rok akademicki 2022/23" (zakończony)
Okres: | 2022-10-01 - 2023-06-30 |
Przejdź do planu
PN WT ŚR CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin
Wykład, 15 godzin
|
|
Koordynatorzy: | (brak danych) | |
Prowadzący grup: | (brak danych) | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę |
Zajęcia w cyklu "Rok akademicki 2023/24" (w trakcie)
Okres: | 2023-10-01 - 2024-06-30 |
Przejdź do planu
PN WT WYK
ŚR LAB
LAB+PROJ
CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin, 30 miejsc
Laboratorium i projekt, 15 godzin, 30 miejsc
Wykład, 15 godzin, 30 miejsc
|
|
Koordynatorzy: | Mieczysław Muraszkiewicz | |
Prowadzący grup: | Mieczysław Muraszkiewicz, Kamil Ząbkiewicz | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: | Zaliczenie na ocenę | |
Skrócony opis: |
Celem przedmiotu jest zapoznanie studentów z wybranymi zagadnieniami i metodami automatycznego przetwarzania języka naturalnego, ze szczególnym uwzględnieniem przetwarzania języka naturalnego wykorzystywanego w odniesieniu do zasobów Internetu. W ramach wykładu omówione zostaną podstawowe pojęcia i metody wykorzystywane przy przetwarzaniu dokumentów tekstowych, włącznie z podstawowymi elementami lingwistyki. Omówione zostaną klasyczne metody przetwarzania wykorzystujące reprezentacje dokumentów w postaci przestrzeni wektorowych dokumentów i n-gramów. Przedstawiona także zostanie koncepcja modeli językowych. Wykorzystanie przedstawionych metod zostanie zaprezentowane m.in w praktycznych zastosowaniach w grupowaniu i klasyfikacji dokumentów, przetwarzaniu wyrażeń regularnych oraz w analizie sentymentu. Ponadto podjęte będą zagadnienia dotyczące analiza syntaktycznej i semantycznej zdań. Zastosowanie podanych metod pokazane zostanie także w odniesieniu do przetwarzania danych pochodzących z Internetu. |
|
Pełny opis: |
Profil studiów: praktyczny. Forma studiów: stacjonarne Rodzaj przedmiotu: Do wyboru Dziedzina: Nauki ścisłe i przyrodnicze Dyscyplina: Informatyka Rok studiów: 3 rok/5 sem. Wymagania wstępne: patrz "Założenia (opisowo)" Liczba godzin wykładu: 15 godzin Liczba godzin laboratorium: 30 godzin Liczba godzin na projekt: 15 godzin Metody dydaktyczne: Wykład metodą tradycyjną z wykorzystaniem tablicy i autorskich prezentacji multimedialnych oraz angażowanie studentów do aktywnego udziału w dyskusji podczas wykładu i zajęć praktycznych i zadawania pytań. Punkty ECTS: 5 Bilans nakładu pracy studenta: (i) związany z zajęciami wymagającymi bezpośredniego nakładu nauczyciela i studenta -- 70 godzin (2,8 ECTS) : Liczba godzin wykładu: 15 godzin Liczba godzin laboratorium: 30 godzin Liczba godzin na projekt: 15 godzin Czas trwania sprawdzianów i zaliczenia: 4 godziny Udział w konsultacjach: 6 godziny (ii) związany z zajęciami o charakterze praktycznym -- 55 godzin (2,2 ECTS) Przygotowanie się studenta do wykładu: 5 godziny Przygotowanie się studenta do laboratorium: 20 godzin Przygotowanie się studenta do projektu: 15 godzin Przygotowanie się studenta do konsultacji i zaliczenia: 15 godzin |
|
Literatura: |
1. Bird S., Klein E., Loper E.: Natural Language Processing with Python. https://www.nltk.org/book/ 2. Bolc L., Cichy M., Różańska L: Przetwarzanie języka naturalnego¸ WNT, 1982. 3. Booth J. D.: Natural Language Processing Succinctly. Syncfusion, Inc. 2018, https://www.e-booksdirectory.com/details.php?ebook=12260 4. Lane H. et al: Przetwarzanie języka naturalnego w akcji. PWN, 2021. 5. Liu B.: Sentiment Analysis and Opinion Mining . Morgan & Claypool, 2012. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.244.9480&rep=rep1&type=pdf 6. Mykowiecka A.:Inżynieria lingwistyczna. Komputerowe przetwarzanie tekstów w języku naturalnym. Wydawnictwo PJWSTK, 2007. 7. Vajjala S. et al.: Przetwarzanie języka naturalnego w praktyce. Przewodnik po budowie rzeczywistych systemów NLP. Helion, 2023. 8. NLTK python 9. PyTorch 10. Spacy library 11. Tensorflow |
|
Uwagi: |
Przetwarzanie języka naturalnego jest zagadnieniem multidyscyplinarnym. Zakłada się, że student ma bazową wiedzę w zakresie sztucznej inteligencji, rachunku prawdopodobieństwa i statystyki oraz systemów baz danych. Student powinien bez trudu czytać i tworzyć kod w jednym z zaawansowanych języków programowania (np. C++, Java, Phyton) oraz mieć orientację w bibliotekach/repozytoriach oprogramowania. Oczekuje się, że student w miarę nabywania podstawowej wiedzy w zakresie uczenia maszynowego będzie zdolny do zaprojektowania i przeprowadzenia prostego eksperymentu dotyczącego przetwarzania języka naturalnego, np. analizy sentymentu, na zajęciach laboratoryjnych i projektowych. |
Właścicielem praw autorskich jest Uniwersytet w Białymstoku.