Comparator na retezce s diakritikou
Oto Buchta
tapik na buchtovi.cz
Čtvrtek Listopad 5 15:46:31 CET 2009
Nakonec jsem se rozhodl, že se zeptám přímo na správné adrese, tedy
Ústavu pro jazyk český AV ČR. Zrovna jsem se přeptal na překlad "Java
Program"
Přikládám odpověď, která nás v žádném případě nemůže těšit, neb řazení
podle sémantiky opravdu vyžaduje:
"Vážený pane Buchto,
norma ČSN 97 6030 uvádí, že při abecedním řazení se římské číslice převádějí
na arabské. Domníváme se však, že uvádění římských číslic u jmen panovníků
je natolik vžité, že zapisovat je kvůli abecednímu řazení číslicí arabskou
by působilo přinejmenším podivně.
V zásadě tedy římské číslice chápeme jako číslice, nikoli jako písmena
a podle toho je také řadíme.
Pokud zkratku CHR čteme po písmenech, zařazujeme ji samozřejmě pod písmeno
C. Problém u těchto zkratek je, jak poznat, zda se jedná o spřežku Ch nebo o
spojení C a H. V tomto případě nám bohužel pomůže pouze věcná znalost.
Vedle spojení "program vytvořený v jazyce Java" lze použít také výraz
se shodným přívlastekem "javový program" (s malým písmenem v přídavném
jménu). Jeho význam je ovšem méně zřetelný, vztah k Javě zde není
zcela jasný, doporučujeme Vám proto používat uvedené opisné spojení.
Úspornější vyjádření by nemělo být na úkor srozumitelnosti.
S pozdravem
Jana Svašková
Ústav pro jazyk český AV ČR
oddělení jazykové kultury - jazyková poradna"
Správné pořadí je tedy:
náš Václav Marhoul
náš Václav Míl
náš Václav Šestý
náš Václav Třetí
náš Václav III.
náš Václav IIL.
náš Václav IV.
náš Václav V.
náš Václav MIL.
a navíc platí, že CHR < CHKO
a navíc správný shodný přívlastek je "javový", ale nelíbí se jim díky
nižší srozumitelnosti.
2009/11/4 Oto Buchta <tapik na buchtovi.cz>:
> Dne 4. listopadu 2009 9:09 Podlesak Kamil <Kamil.Podlesak na ips-ag.net> napsal(a):
>>
>> Predem mého príspevku bych rád odpovedel na flamebait: Co je, proboha, na starejch mladejch plešatejch pražského?? Pragocentristo...
>
> a) pragocentrista je nejhorší nadávka, jakou mne kdy kdo počastoval... :-(
> b) podle toho, oc si pamatuji, tak dle historických pramenů "přerod"
> vzoru mladý z mladý/mladá/mladé/mladí/mladé/mladá na
> mladej/mladá/mladý/mladý/mladé/mladé (zahrnující tvary jako mladejch
> či mladejma) opravdu pochází z Prahy, zrod není datován, předpokládá
> se v době postupné odgermanizace, ustálení je pak datováno na období
> po roce 1925, a to obé mezi pražskou spodinou
>
>> No a k tématu: Myslím že nikomu nebude vadit tretí varianta. Navíc mi to prijde docela umelý príklad.
>> Celé toto téma zacal muj naprosto praktický príklad, kdy meli uživatelé problém se seznamem názvu ulic serazených algoritmem, který ignoruje mezery.
>
> Toto chápu, pouze jsem chtěl upozornit na to, že s normou to není až
> tak jednoduché a že se nedivím, že se Collator podle ní nechová. Jsem
> ale rád, že je to nyní mnohem jednodušší a že by Adeltonovo
> čtyřprůchodové třídění mohlo normu dokonce i splňovat
> (http://www.fi.muni.cz/~adelton/l10n/)
>
> Oto 'tapik' Buchta
>
> PS: Neberte toto jako souboj plamenných řečí (český eqivalent pro
> flamewar :-D ), pouze informaci navíc k problematice implementace
> java.text.Collator dle java.util.Locale, varianta "cs".
>
Další informace o konferenci Konference