<fajl>.lt-00.xml
do XMLcd XML for ff in *.xml; do echo $ff u2lat7ent.pl < $ff |\ recode u8..l7 |\ perl -pe 's:(<s\ [^>]+>):$1\n:g' |\ perl -pe 's:(</s>):\n$1:g' |\ perl -pe 's:(</?[uib]>):\n$1\n:g' |\ perl -pe 's:(</?subscrpt>):\n$1\n:g' |\ perl -pe 's:(</?suprscrpt>):\n$1\n:g' |\ perl -pe 's:(</?s?ti>):\n$1\n:g' > ../IL7/${ff%.xml}.il7 done
nebo použít hotový skript xml2il7.sh
(je třeba být v adresáři nad XML)
splitxml
na kousky:splitxml Acquis < Acquis.lt-00.il7
<fajl>.lt-00.il7
do adresáře H:\Dokumenty\Cz-Lt-Dict\Tagger\texts
a spustit tagger.exe
(na něj jít přes ikonu Počítač!)<fajl>.lt-00.il7.lem
přetáhnout do adresáře LEM a nezapomenout udělat dos2unix
!!!:for ff in *; do dos2unix $ff; done
lem2tag < LEM/<fajl>.lt-00.il7.lem > TAG/<fajl>.lt-00.tag.xml
anebo
cd LEM for ff in *; do echo $ff; lem2tag.sh < $ff > ../TAG/${ff%.il7.lem}.tag.xml; done