Szövegtípusok számítógépes nyelvészeti megközelítésben


vincze-veronikaVincze Veronika


A természetes nyelvek rétegzettsége jól ismert jelenség az elméleti nyelvészet körében: a különböző szaknyelvi rétegek mellett például az internetről, főként a közösségi médiából származó szövegek nyelvezete is több kutatás tárgyát képezi. A nyelvi rétegzettség azonban a számítógépes nyelvészetben viszonylag kevéssé kutatott terület, noha a nyelvfeldolgozó eszközök számára az eltérő nyelvi rétegek automatikus elemzése kihívást jelent. Előadásomban bemutatom, hogy különböző nyelvi rétegekből (elsődlegesen újsághírekből, jogi szövegekből és internetről) származó angol és magyar nyelvű szövegek mennyiben mutatnak (statisztikailag szignifikáns) eltéréseket egymástól, és ezek az eltérések hogyan befolyásolják az automatikus számítógépes nyelvészeti elemzések hatékonyságát.

Friss Hírek

Friss Hírek RSS

Boritokep_32

Kasza Péter az SZTE BTK Klasszika-Filológia és Neolatin Tanszék tanszékvezető egyetemi docense, az SZTE Irodalom- és Kultúratudományi Doktori Iskola Neolatin Programjának vezetője, valamint az SZTE és az OSZK közreműködésével létrejött Kulcsár Péter Historiográfiai Kutatócsoport vezető kutatója. Magyar történelem Bécsből nézve - Wolfgang Lazius elfeledett történeti műve című akadémiai doktori értekezését 2023 szeptemberében védte meg. Kasza Péterrel az értekezés részleteiről, a tudományos pályájának kezdetéről, jelenlegi és jövőbeni kutatásairól és a tanításról beszélgettünk.