Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Tagging av derivasjoner av proper nouns ( #5

Open
albbas opened this issue Nov 1, 2020 · 8 comments
Open

Tagging av derivasjoner av proper nouns ( #5

albbas opened this issue Nov 1, 2020 · 8 comments
Labels
bug Something isn't working

Comments

@albbas
Copy link
Contributor

albbas commented Nov 1, 2020

This issue was created automatically with bugzilla2github

Bugzilla Bug 2701

Date: 2020-11-01T11:07:20+01:00
From: Lene Antonsen <<lene.antonsen>>
To: Sjur Nørstebø Moshagen <<sjur.n.moshagen>>
CC: inga.l.mikkelsen, lene.antonsen, linda.wiechetek, sjur.n.moshagen, trond.trosterud, @[email protected]

Last updated: 2021-10-30T09:52:59+02:00

@albbas
Copy link
Contributor Author

albbas commented Nov 1, 2020

Comment 14099

Date: 2020-11-01 11:07:20 +0100
From: Lene Antonsen <<lene.antonsen>>

Det er problemer med tagginga av derivasjoner av proper nouns ved tilpassing til Apertium. Følgende to dervisjoner burde gå an å generere i Apertium, bruke transferegler for å gå fra den ene til den andre, men det fungerer ikke pga av taggene, vi får ikke (ex_np?)

F.eks. i lang-smj:
echo guovddagæjnok| hfst-lookup -q tools/mt/apertium/analyser-mt-apertium-desc.und.hfstol
guovddagæjnok Guovddagæjnno<ex_n><sem_plc><der_k> 0,000000
guovddagæjnok Guovddagæjnno<ex_n><der_k> 0,000000

i lang-sme:
echo guovdageaidnulaš| hfst-lookup -q tools/mt/apertium/analyser-mt-apertium-desc.und.hfstol
guovdageaidnulaš Guovdageaidnu<ex_n><der_lasj> 0,000000
guovdageaidnulaš Guovdageaidnu<ex_n><sem_plc><der_lasj>

echo guovdageaidnulaš |apertium -d. sme-smj-biltrans
^guovdageaidnulaš<@hnoun>/Guovddagæjnno<sem_plc><der_k><@hnoun>$^./.$

@albbas
Copy link
Contributor Author

albbas commented Nov 1, 2020

Comment 14100

Date: 2020-11-01 11:58:17 +0100
From: Lene Antonsen <<lene.antonsen>>

Den siste analysen i apertium kom fra denne entryen:

guovdageaidnulašGuovddagæjnno

Men når jeg kommenterer ut den, så blir de ikke gjenkjent:

echo guovdageaidnulaš |apertium -d. sme-smj
^*guovdageaidnulaš/*guovdageaidnulaš$^./.$

echo guovddagæjnok |apertium -d. sme-smj
^*guovddagæjnok/*guovddagæjnok$^./.$

@albbas
Copy link
Contributor Author

albbas commented Nov 2, 2020

Comment 14102

Date: 2020-11-02 10:24:27 +0100
From: @[email protected]

Eg veit ikkje kor "N Prop" blir til "" i fst-en, men på same stad burde jo "Ex/N Prop" bli til "<ex_np>".

Når det gjeld CG, så ser eg at me har linjer som
SUBSTITUTE:apertium-unhide-derivtags (ex_n) (n) TARGET (ex_n) ;
SUBSTITUTE:apertium-unhide-derivtags SUB:1 (ex_n) (n) TARGET (ex_n) ;
i giella-shared/smi/src/{cg3,syntax}/functions.cg3

men det manglar

SUBSTITUTE:apertium-unhide-derivtags (ex_np) (np) TARGET (ex_np) ;
SUBSTITUTE:apertium-unhide-derivtags SUB:1 (ex_np) (np) TARGET (ex_np) ;

og lang-smj/tools/mt/apertium/tagsets/gt2apertium.cg3relabel har

MAP (Ex/N) (ex_n);

men burde kanskje ha

MAP (Ex/N Prop) (ex_np);
MAP (Ex/N) (ex_n) OR (ex_np);

(på same måte som for vanleg Prop og N)

@albbas
Copy link
Contributor Author

albbas commented Nov 23, 2020

Comment 14145

Date: 2020-11-23 15:21:41 +0100
From: Lene Antonsen <<lene.antonsen>>

Jeg trenger hjelp fra Sjur til denne.
Jeg har prøvd med dette i tools/mt/apertium/tools/mt/apertium/
"<ex_n>" -> "<ex_np>" ,
"+Ex/N+Prop" -> "<ex_np>" ,

men det fungerer ikke, jeg tror dette må fikses i giella-core/am-shared/tools-mt-apertium-tagsets-dir-include.am ?

echo norgalaš |hfst-lookup tools/mt/apertium/analyser-mt-apertium-desc.und.hfstol
norgalaš Norga<ex_n><der_lasj> 0,000000
norgalaš Norga<ex_n><der_lasj> 0,000000
norgalaš Norga<ex_n><sem_plc><der_lasj> 0,000000
norgalaš Norga<ex_n><sem_plc><der_lasj> 0,000000

Her ønsker vi
norgalaš Norga<ex_np><sem_plc><der_lasj>

@albbas
Copy link
Contributor Author

albbas commented Oct 27, 2021

Comment 14219

Date: 2021-10-27 21:38:42 +0200
From: Sjur Nørstebø Moshagen <<sjur.n.moshagen>>

(In reply to Lene Antonsen from comment #3)

Jeg trenger hjelp fra Sjur til denne.
Jeg har prøvd med dette i tools/mt/apertium/tools/mt/apertium/
"<ex_n>" -> "<ex_np>" ,
"+Ex/N+Prop" -> "<ex_np>" ,

men det fungerer ikke, jeg tror dette må fikses i
giella-core/am-shared/tools-mt-apertium-tagsets-dir-include.am ?

Du var veldig nære med det fyste forsøket, ein fungerande versjon finst i innsjekkinga her:

giellalt/lang-sme@992924c

"<ex_n><prop>"       -> "<ex_np>" ,

Dette var nesten rett, det som mangla var at du burde hatt hermeteikn rundt begge dei to taggane på venstre side:

 "<ex_n>" "<prop>"       -> "<ex_np>" ,

Slik ser analysane ut no:

echo norgalaš | hfst-lookup -q tools/mt/apertium/analyser-mt-apertium-desc.und.hfstol
norgalaš norgalaš<sem_hum> 0,000000
norgalaš norgalaš 0,000000
norgalaš Norga<ex_np><der_lasj> 0,000000
norgalaš Norga<ex_np><der_lasj> 0,000000
norgalaš Norga<ex_np><sem_plc><der_lasj> 0,000000
norgalaš Norga<ex_np><sem_plc><der_lasj> 0,000000
norgalaš Norga<ex_np><der_lasj> 0,000000
norgalaš Norga<ex_np><der_lasj> 0,000000
norgalaš Norga<ex_np><sem_plc><der_lasj> 0,000000
norgalaš Norga<ex_np><sem_plc><der_lasj> 0,000000
norgalaš norgalaš 0,000000
norgalaš norgalaš 0,000000
norgalaš norgalaš<sem_hum> 0,000000
norgalaš norgalaš<sem_hum> 0,000000

Eg har berre endra for sme, men no burde det vera rett fram å få dette til for andre språk. Sei frå om det dukkar opp andre problem.

Eg lar lusmeldinga vera open til du har stadfesta at alt er ok / til alle språk er fiksa.

@albbas
Copy link
Contributor Author

albbas commented Oct 28, 2021

Comment 14228

Date: 2021-10-29 00:31:30 +0200
From: Lene Antonsen <<lene.antonsen>>

Det fungerer i apertium:

echo porsáŋgulaš |apertium -d. sme-smj-biltrans
^porsáŋgulaš<sem_hum><@hnoun>/Porsáŋŋgo<sem_plc><der_k><@hnoun>$^./.$

@albbas
Copy link
Contributor Author

albbas commented Oct 29, 2021

Comment 14229

Date: 2021-10-29 08:06:46 +0200
From: Lene Antonsen <<lene.antonsen>>

Jeg tenekte feil da jeg testet. porsáŋgulaš var leksikalisert i bidix, og poenger var nettopp at vi ikke skal trenge å leksikalisere.
porsáŋgulaš Porsáŋgu+N+Prop+Sem/Plc+Der/lasj+A+Sg+Nom

Jeg må legge dette inn i smj og Makefile i apertium. skal teste på nytt

@albbas
Copy link
Contributor Author

albbas commented Oct 30, 2021

Comment 14230

Date: 2021-10-30 09:52:59 +0200
From: @[email protected]

$ echo guovdageaidnulaš|apertium -d . sme-smj-morph
^guovdageaidnulaš/Guovdageaidnu<ex_np><der_lasj>/Guovdageaidnu<ex_np><der_lasj>/Guovdageaidnu<ex_np><sem_plc><der_lasj>/Guovdageaidnu<ex_np><sem_plc><der_lasj>/guovdageaidnulaš<sem_hum>$^./.$

i nyaste sme-smj

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

No branches or pull requests

1 participant