Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Gram/tagger for derivasjon og transitivitet ( #13

Open
albbas opened this issue Jun 15, 2020 · 2 comments
Open

Gram/tagger for derivasjon og transitivitet ( #13

albbas opened this issue Jun 15, 2020 · 2 comments
Labels
enhancement New feature or request low priority

Comments

@albbas
Copy link
Contributor

albbas commented Jun 15, 2020

This issue was created automatically with bugzilla2github

Bugzilla Bug 2665

Date: 2020-06-15T15:44:37+02:00
From: Lene Antonsen <<lene.antonsen>>
To: Lene Antonsen <<lene.antonsen>>
CC: inga.l.mikkelsen, lene.antonsen, linda.wiechetek, sjur.n.moshagen, thomas.omma, trond.trosterud

Last updated: 2020-06-15T22:21:52+02:00

@albbas
Copy link
Contributor Author

albbas commented Jun 15, 2020

Comment 13950

Date: 2020-06-15 15:44:37 +0200
From: Lene Antonsen <<lene.antonsen>>

Diskusjon om +Gram/tagger for derivasjon og transitivitet. Jeg skriver BZ, sjøl om sjur har oppfordret om å bruke Zulip, men jeg synes at det blir for uoversiktlig. Det er Inga som har tatt initiativet til denne saka.

Vi bruker +Gram/tagger i dag for tokenisering og ulikestavelses verrb (3syll):
+Gram/TAbbr !!≈ ; @code@ : Transitive abbreviation (it needs an argument)
+Gram/NoAbbr !!≈ ; @code@ : Intransitive abbreviations that are homonymous
+Gram/TNumAbbr !!≈ ; @code@ : Transitive abbreviation if the following
+Gram/NumNoAbbr !!≈ ; @code@ : Transitive abbreviations for which numerals
+Gram/TIAbbr !!≈ ; @code@ : Both transitive and intransitive abbreviation
+Gram/IAbbr !!≈ ; @code@ : Intransitive abbreviation (it takes no argument)
+Gram/3syll !!≈ ; @code@ :trisyllabic verbs

Vi har tidligere diskutert om å endre fra +IV og +TV til +Gram/TV og Ǵram/IV for verb, så jeg tar dette opp samtidig. Dette er ikke implementert, men dette kunne høve å gjøre dette no?

Så er det å bruke +Gram/tagger i forbindelse med grammatisk informsjon for leksikaliserte ord:
adverber har i dag +Comp og +Superl, Det er derivert fra adjektiver. Her kunne man endre +Comp og +Superl til +Gram/Comp og +Gram/Superl
buoremusat buoremusat+Adv+Superl
buoremusat buorre+Ex/A+Sem/Hum+Der/Superl+Ex/A+Der/AAdv+Adv

buorebut buorebut+Adv+Comp
buorebut buorre+Ex/A+Sem/Hum+Der/Comp+Ex/A+Der/AAdv+Adv

Så er det andre ord som er leksikaliserte. Et type er substantiver som er blitt adjektiver via komparering:

maŋit maŋit+Ex/A+Sem/Plc+Der/Comp+A+Sg+Nom

Her er lemmaet allerede +Der/Comp, så dette er ikke en god analyse, En bedre ananlyse kunne være:

maŋit maŋit+A+Sem/Plc+Gramm/Comp+Sg+Nom

Inforamsjonen om Comp og Superl er nyttig i disambigueringa.

Man kunne også diskutere om man skulle tagge flere typer derivasjoner, f.eks.
mánáš mánná+Ex/N+Sem/Hum+Der/Dimin+N+Sg+Nom
mánáš mánáš+N+Sem/Hum+Sg+Nom ==> mánáš+N+Sem/Hum+Gram/Dimin+Sg+Nom

Men kanskje man skulle vente med slik til at man ser at det er nytte for dette i disambiguering eller gramcheck?

@albbas
Copy link
Contributor Author

albbas commented Jun 15, 2020

Comment 13951

Date: 2020-06-15 22:21:52 +0200
From: Inga Lill Sigga Mikkelsen <<inga.l.mikkelsen>>

Jeg syns vi burde kjøre på med Gram/XXX tagger på flest mulig plasser. Ikke bare for avledninger, men for leksikaliserte PrsPrc også. Som oftes har vi jo allerede leksikon som er laget spesielt for en type leksikaliserte avledninger, så det er jo fort gjort å sette slike tagger inn.

Jeg har allerede endret taggene for substantiver som kan kompareres, slik at det blir slik i SMJ:

gáttep gáttep+A+Gram/Comp+Attr
gáttep gáttep+A+Gram/Comp+Sg+Nom

Jeg startet med disse, fordi det var veldig merkelig med:
gáttep+A+Der/Comp+A+Sg+Nom

Jeg vil gjerne fortsette med:
oappásj oappásj+N+Sg+Nom
dárbulasj dárbulasj+A+Sg+Nom
fierun fierun+N+Sg+Nom (selv om vi ikke lager denne avledningen i vårt system)
guollár guollár+N+Sg+Nom
bårre bårre+A+Sg+Nom

Har vi ikke mulighet til å "mute" Gram/XXX tagger, hvis det skulle vise seg at de egentlig ikke blir brukt til noe?

Jeg syns det er tilfredstillende å ha system :)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request low priority
Projects
None yet
Development

No branches or pull requests

1 participant