[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Lokalizace
> A co takhle:
>
> 1. ke kazdemu slovu se prida nejaky znak, ktery se v cestine normalne
> nevyskytuje, a kdyz, tak ne na konci slova (treba x,w,q nebo @)
> 2. pak to projet spellcheckerem, ktery ohlasi sice kazde slovo, ale
> pravdepodobne nabidne taky spravnou variantu - pak se nemusi prepisovat,
> ale jen kliknout mysi na spravne slovo
> 3. slova, ktera nebyla opravena budou stale oznacena tim specialnim
> pismenem a muzou se potom v pohode hodit bokem
Problem je, ze ceska slova nemaji takovouhle "spojitou posloupnost pismen"
budes mit treba slovo "mnoho", pridas jeden znak a on Ti to nevezme,
protoze takove slovo neni. Ale jak se potom od slova mnoho dostanes treba
ke slovu "mnozstvi"? To spis zkusit pouzit nektere lingvisticke postupy na
sklonovani slov a to potom sjizdel spellcheckerem, takze by potom
Jezismarja!!! Ted me napadlo, kdo tady mel ten slovnik se slovama bez
carku a hacek? U nas na matfyzu jel asi pred trema rokama
lingvistickej projekt na ocestovani posty... Tzn. ze slova z mailu z
cistyho ASCII to dokazalo ohackovat a ocarkovat. Uspesnost byla silne
pres 90%. Ten slovnik by tim stacilo protahnout a pak JEDNOU project
spellcheckerem!!!
> Je to sice porad prace pro vraha, ale mozna by se touz dalo.
> Taky by slo nechat ho to opravit vsechno bez oznacovani pismenem. Pak by
> nepridal diakritiku ke slovum, ktera jsou dobre i bez ni. Takova slova
> by se ovsem dala po doplneni diakritiky najit, protoze budou duplicitni
> (pokud ovsem budou dvakrat taky v tom puvodnim slovniku, coz asi
> nebudou...)
Chtel jsem reagovat jeste na tohle, ale z duvodu meho minuleho odstavce je
to asi zbytecny. Fakt me to napadlo v pulce vety, nekecam.
Tomaasch