Přejít na obsah


Fotka

Diakritika v názvech keší - bude někdy?


  • Pokud chcete vložit odpověď, přihlašte se
72 odpovědí na toto téma

#21 mh.mail

mh.mail

    Advanced Member

  • Members
  • PipPipPip
  • 1 781 příspěvků(y)

Publikováno 21 březen 2018 - 10:22

Proč bych se měl přizpůsobovat neschopné aplikaci, když existují desítky jiných, které to zvládají.

 

Tedy nic ve zlém, ale zajímaly by mě ty desítky jiných aplikací, které zvládají vyhledávat keše.

 

Já tedy znám jenom tyhle:

1. „Nativní“ vyhledávač na gc.com.

2. Google (a možná podobné obecné vyhledávače jako Seznam apod., ale u nich ta kvalita už může být horší)

3. project-gc.com

 

U č. 2 a 3 je problém v tom, že mají sice možná kvalitnější možnosti vyhledávání (Google určitě), ale aby mohly něco vyhledávat, tak si musí ty stránky nejprve načíst do své vlastní databáze (indexovat). Což se děje s nějakým zpožděním, takže nově založené keše v nich vyhledáš až po uplynutí určité doby.

 

Č. 1 má tu výhodu, že vyhldáváš přímo v primárních datech, ale zase to vyhledávání není tak kvalitní.

 

Ale ty další aplikace na vyhledávání by mě opravdu zajímaly.


  • 0
„Normální je nepodvádět.“
http://gc.i-mh.net/ | gc@i-mh.net

#22 mpik

mpik

    Advanced Member

  • Members
  • PipPipPip
  • 8 774 příspěvků(y)

Publikováno 21 březen 2018 - 10:29

Už nějaký čas neprogramuju, ale byl jsem přesvědčen, že unicode a jeho převodní tabulky už jsou dávno součástí nějaké knihovny, kterou stačí použít a že to bude i v javaskriptu.

Jiná věc by bylo třeba chtít vyhledávat v azbuce její transkripcí do latinky, případně jejich různým přepisem do národních jazyků (Charkov, Kharkov, Moskva, Moskau,...), to už je moc daleko.

I když... když jsem zadal na Mapách.cz Mnichov (ves u Strakonic), házelo mě to vždycky do Německa. Katovice (4km odtud) do Polska. Takže tam určitě slovník synonym používají.

On s tím byl i jiný problém. Délka textového řetězce byla vždy jasná, ale najednou se jeden znak zapisuje jedním, dvěma, třemi byty. Ale vím, že na to už knihovní funkce byly dávno.


  • 0

#23 mpik

mpik

    Advanced Member

  • Members
  • PipPipPip
  • 8 774 příspěvků(y)

Publikováno 21 březen 2018 - 10:30

Myslím že Google i Project-GC indexuje dost rychle. Na FTF to není, ale tam většinou nevyhledávám ve fultextu.


  • 0

#24 gord

gord

    Advanced Member

  • Members
  • PipPipPip
  • 10 107 příspěvků(y)

Publikováno 21 březen 2018 - 10:49

Muzeme si 100 x vzajemne dokazovat, ze to jde, ze je toho spousta udelaneho a podobne. Kdyz to nema GS (pripadne jine aplikace, viz SQLite na androidu) aplikovane, je nam houby platne, ze to nekde jinde neco jineho umi.


  • 0

MHD/PID vybranych mest CR jako POI (diskuse)
GeoGet:
- Combine - automatizace opakovanych cinnosti (diskuse, dávky)

Stator - statistiky y GeoGetu (diskuse)

- Spoiler - uložení spoilerů do GPS jako POI (diskuse)

- Náhrada GJ legálními postupy

 


#25 ubuster

ubuster

    ubuster

  • Members
  • PipPipPip
  • 582 příspěvků(y)

Publikováno 21 březen 2018 - 11:07

Teď jsou v módě i obrázkové názvy keší - viz např. GC7J8KQ  Hmyzi domecek


Tento příspěvek byl upraven od ubuster: 21 březen 2018 - 11:08

  • 0

HW: Motorola One Action _ Garmin eTrex Legend HCx

SW: c:geo _ WhereYouGo _ GDAK _ GCC _ Go(x)°


#26 gord

gord

    Advanced Member

  • Members
  • PipPipPip
  • 10 107 příspěvků(y)

Publikováno 21 březen 2018 - 11:36

No, za to bych strilel. Tohle se podle nazvu vyhledat proste neda (na GS).


  • 2

MHD/PID vybranych mest CR jako POI (diskuse)
GeoGet:
- Combine - automatizace opakovanych cinnosti (diskuse, dávky)

Stator - statistiky y GeoGetu (diskuse)

- Spoiler - uložení spoilerů do GPS jako POI (diskuse)

- Náhrada GJ legálními postupy

 


#27 ladislavappl

ladislavappl

    Advanced Member

  • Members
  • PipPipPip
  • 886 příspěvků(y)

Publikováno 21 březen 2018 - 12:06

Předesílám, že z hlediska IT jsem naprostý laik. Kdysi jsem zakládal keš s názvem Erömü https://coord.info/GC2TDQZ a ty přehlásky mi reviewer nakonec povolil, když jsem přidal odkaz na pár finských keší.

Ale s kódováním češtiny i současné systémy problém mají. U mne ve Wind. XP i Wind. 7, když vytvářím listing v Kompozeru, tak se mi pak při prohlížení zobrazuje třeba místo Ži ši či ři ži ý ě ů   tohle: ®i ąi či ři ľi ý ě ů. Kdysi tohle dělal Text602, když se napsal text v kódu bratří Kamenických a pak to četl program omylem nastavený na Latin2 (přesné názvy si ale už nepamatuji). Takže teď musím vždycky napsat pár znaků v programu NVU, soubor uložit, otevřít v Kompozeru a v něm už pokračovat dál. Zdrojový text v HTML vypadá stejně, ale proč to ty programy (NVU a Kompozer) dělají, mi není jasné. Už jsem si ale zvykl.


Tento příspěvek byl upraven od ladislavappl: 21 březen 2018 - 12:10

  • 0
Quaerendo invenietis (Kdo hledá, najde).

#28 mh.mail

mh.mail

    Advanced Member

  • Members
  • PipPipPip
  • 1 781 příspěvků(y)

Publikováno 21 březen 2018 - 12:18

V zásadě sis na to odpověděl tím příkladem s T602. V Kompozeru máš nastaveno, že defaultní znakovou sadou pro uložení je něco (možná Latin2) a tak se ti to zmrší. V NVU to máš nastaveno dobře. Uložený soubor už v sobě nese informaci o (správné) znakové sadě, proto jeho otevření v Kompozeru a jeho další editace je v pořádku.
Mělo by stačit to někde v nastavení změnit. Teď ale nejsem u počítače a přesně ti to neřeknu.
  • 1
„Normální je nepodvádět.“
http://gc.i-mh.net/ | gc@i-mh.net

#29 Roman_Jaromer

Roman_Jaromer

    Roman_Jaroměř

  • Members
  • PipPipPip
  • 4 188 příspěvků(y)

Publikováno 21 březen 2018 - 12:29

Už několik let tvrdím, že je to diskriminace češtiny, když se povolují cizí znaky a česká diakritika ne. Vždyť to, jestli má znak nějakou přehlásku, nebo háček už není takový rozdíl. Snad jen to, v které znakové sadě je. A Pokud se GS kasal tím, že umí ty "unicode" názvy (viz ta zde zmíněná keš s názvem se všemi možnými znaky), tak proč doprčic pořádně tohle neimplementuje?

 

Myslím si, že bychom opravdu měli zatlačit, aby veškerou diakritiku prostě GS implementoval včetně toho vyhledávání přes zjednodušení, jak to dělá Geoget a další programy. Vždyť to snad nemůže být tolik práce. Víc práce určitě dá vymýšlení blbostí jako "vesmírná liga" a jejich programování, bez kterých by se dalo v pohodě žít - tím jen ztrácí čas!

 

V Novém Městě byla i jedna keš, co měla arabský název. A je to už řadu let. Hlavně že ta napsat šla.

 

Jak napsal Chasseur.cz, nezbývá nám, než tlačit na GS, aby to zavedli...


  • 0

#30 mh.mail

mh.mail

    Advanced Member

  • Members
  • PipPipPip
  • 1 781 příspěvků(y)

Publikováno 21 březen 2018 - 13:25

Takže teď musím vždycky napsat pár znaků v programu NVU, soubor uložit, otevřít v Kompozeru a v něm už pokračovat dál.

 

 

Mělo by stačit to někde v nastavení změnit. Teď ale nejsem u počítače a přesně ti to neřeknu.

 

Použij tenhle postup:

1. Vytvoříš si v KompoZeru novou stránku.

2. Z menu zvolíš File > Save And Change Character Encoding.

3. V zobrazeném okně vybereš volbu Unicode (UTF-8) a potvrdíš.

 

Pak už je to v pořádku.

 

Proč je to takhle, netuším. I když je v nastavení KompoZeru uvedeno UTF-8, přesto to soubor standardně uloží ve Western (ISO-8859-1). Výše uvedené přeuložení to však napraví.


  • 0
„Normální je nepodvádět.“
http://gc.i-mh.net/ | gc@i-mh.net

#31 hauskaa

hauskaa

    Advanced Member

  • Members
  • PipPipPip
  • 713 příspěvků(y)

Publikováno 21 březen 2018 - 13:54

Roman Jaromer defacto přesně vystihl i můj prvotní motiv. Němci, Fini, Švédi, i Portugalci s jejich "A s vlnovkou", dokonce i Litevci si používají své speciální znaky a to je velmi malý národ. Pouze my se tu pořád tváříme jako upozaděná menšina.

Nevím jak moc je to alibismus náš, že něco nejde, nechceme, neumíme, nebo neschopnost z USA. 

Jako prémiáci jim platíme nemalé peníze, z Česka jim přitéká ročně spousta milionů, tak by pro nás mohli taky něco udělat. Asi je pravda, že se musíme ozvat, sami od sebe to řešit nezačnou. 

Nechcu tady vypadat jako nacionalista. Kdyby se používala všude na světě pouze anglická abeceda (a nikde jinak), vzal bych naši pozici jako nutnou a danou. Ale když vidím všechny ty malé národy, kde to jde, prostě mi připadá nefér, že zrovna u nás to nejde. 

Nevadí mi ani ty obrázky berušek v názvech keší. Když se objevím kdesi na služebce a otevřu appku gc.com, lovím co chcu ať se to jmenuje s obrázkem nebo bez. Třídění podle názvů jsem asi nikdy moc nepotřeboval. 


  • 2
Livet är en fråga om kvalitet, inte lengt.

#32 Zagloba

Zagloba

    Advanced Member

  • Members
  • PipPipPip
  • 478 příspěvků(y)

Publikováno 21 březen 2018 - 14:20

Tady asi nejde o to, že to nejde, neumíme. Ono to jde a umíme to, ale protože je zjevně pro nás důležité vyhledávání, tak to nechceme. Není to náhodou tak, že tam kde diakritiku používají, nezáleží jim tak moc, že se jim bude špatně vyhledávat a spíš preferují tu diakritku?

 

A ano, pokud něco chceme, tak nestačí o tom plkat tady na fóru, ale je to třeba (a dost hlasitě) říct GS. Podobně se tady plkalo o (ne)řetězení eventů, jak je to hrozné, že se žádný pořádný event neudělá - ale řekl to někdo GS?


  • 1
Zastavte zeměkouli, chci vystoupit

#33 nalano

nalano

    Advanced Member

  • Members
  • PipPipPip
  • 631 příspěvků(y)

Publikováno 21 březen 2018 - 14:25

Myslím, že se tu pláče na špatném hrobě a ještě asi neoprávněně. Jsem teď dal vyhledat na GC kešky, které obsahují "čes" a našlo jich to tak 15 kousků, vyhledání proběhlo bez ohledu na velikost písmen a s ohledem na diakritiku. Takže u nás určitě zakládat kešky s diakritikou jdou. Jde o to, jestli to je výjimka po ukecání revírníka nebo to brzdí autocenzura autorů.
  • 0

#34 mpik

mpik

    Advanced Member

  • Members
  • PipPipPip
  • 8 774 příspěvků(y)

Publikováno 21 březen 2018 - 14:44

Česká diakritika se nepoužívá jen v Čechách. Některé háčky mají i ti zmínění Litevci, Chorvati, Poláci, atd. Čárky maji i Irové, já nevím kdo ještě. A což takoví Vietnamci, ti mají diakritiky spoustu a bez ní je prý prakticky nečitelná.

Latin2, univerzální abeceda pro východní Evropu - jak jsme na ni nadávali. Že Amerika vidí Evropu jako jeden ze států a vymýšlí kraviny, když máme Kameníky. To byla sada, s obtížemi čitelná i když to HW neuměl zobrazit správně. Nakonec přišlo Win kódování, atd. až Unicode. Třídění a hledání v Unicode vyřešeno je. Tak jen donutit GS, aby to použil.Pak by padnul argument, proč nemůžeme diakritiku používat.

Dalším problémem ale je, jak totéž naučit SQLite na Androidu.


  • 0

#35 geotrain

geotrain

    Advanced Member

  • Members
  • PipPipPip
  • 171 příspěvků(y)

Publikováno 21 březen 2018 - 14:49

A kdybych pří schvalování na diakritice v názvu trval, nemůže se náhodou stát, že reviewer prostě řekne NE?


  • 0

#36 Guest_Chasseur.cz_*

Guest_Chasseur.cz_*
  • Guests

Publikováno 21 březen 2018 - 15:49

A kdybych pří schvalování na diakritice v názvu trval, nemůže se náhodou stát, že reviewer prostě řekne NE?

 

To "NE" sice říct může, ale v tom případě bude chtít něco, co nemá oporu v pravidlech  ;)  Já jsem za svého revírničení o odstranění diakritiky poprosil, ale pokud na ní někdo trval, publikoval jsem i s ní. Řekl bych, že všichni revírníci to dělají taky tak  :)  


Tento příspěvek byl upraven od Chasseur.cz: 21 březen 2018 - 15:50

  • 1

#37 MiroslavRouta

MiroslavRouta

    Advanced Member

  • Members
  • PipPipPip
  • 1 124 příspěvků(y)

Publikováno 21 březen 2018 - 15:56

Podobně se tady plkalo o (ne)řetězení eventů, jak je to hrozné, že se žádný pořádný event neudělá - ale řekl to někdo GS?

Samozřejmě. Nicméně mají tam takovou hezkou zásadu. Na nepříjemnosti neodpovídají.

Diakritiku jsem v názvu nikdy nepoužíval. Kdysi v mých začátcích, to je 5 let nazpět, jsem četl, že do názvu keše a do hintu nepatří. Tak ji tak nedávám. A nijak moc mi to problém nedělá, přizpůsobuji tomu třeba i logbooky, kam tu diakritiku taky pak nepíšu. Ale je to prznění jazyka českého.
Ale ano, dojde pak někdy k takové situaci, že jsem se třeba dozvěděl, že moje keš Zábisko se čte zásadně Žabisko a Sirá není Sirá, ale Síra. Na druhou stranu, to jsou v podstatě detaily.

Tento příspěvek byl upraven od MiroslavRouta: 21 březen 2018 - 15:57

  • 0

#38 phrkt

phrkt

    věčný rejpálek

  • Members
  • PipPipPip
  • 2 734 příspěvků(y)

Publikováno 21 březen 2018 - 15:56

A kdybych pří schvalování na diakritice v názvu trval, nemůže se náhodou stát, že reviewer prostě řekne NE?

Možná by stálo za úvahu uspořádat s revírníky na tohle téma brainstorming v nějaké osvěžovně  :) .


  • 0

#39 hauskaa

hauskaa

    Advanced Member

  • Members
  • PipPipPip
  • 713 příspěvků(y)

Publikováno 21 březen 2018 - 16:37

Možná by stálo za úvahu uspořádat s revírníky na tohle téma brainstorming v nějaké osvěžovně  :) .

Revírníci to nezakazují jen tak z rozmaru, nebo z vlastní újmy. Nějaké požadavky na keše má GS, nějaké požadavky mají ouneři. A revírníci jsou jakási nárazníková zóna mezi těmito subjekty - plní přání obou stran. Čili nám ty háčky a čárky zakazují na objednávku "někoho". Laicky tipuji české ajťáky. HaLuMa s Gordiky to částečně rozkryli a vysvětlili, proč to tak máme. 

Teď to vypadá, že problém mají jen ti, kteří hledají keše podle názvu. Kolik takových je? 5%? 10%? 50%? A pokud jsou tito lidé v menšině, stojí za to se jim podřizovat? 

Tedy zpátky k phrkt: pokud se komunita usnese, že háčky chceme, revírníci s tím problém mít nebudou. Ti jen přestanou trvat na požadavku. 

 

Netlačím na to... Ptám se a diskutujeme. 

Možná zkusím ten pohled na věc jinak:

když si háčky odsouhlasíme a budeme používat, bude daleko pádnější nóta na GS "chceme toto a toto, protože my to tak máme, posíláme vám prachy, tak to vyřešte"

než když budeme psát sms-czech a psát jim:

My bysme do budoucna chtěli to a ono, připravte systém na to, že to za pět let chceme. Aby mohli vyvíjet a testovat, chca nechca potřebují relevantní vstupní data. 

A ta jim dodáme mimoděk tak, že to budeme hojně užívat. 


  • 0
Livet är en fråga om kvalitet, inte lengt.

#40 von Bronin

von Bronin

    Advanced Member

  • Members
  • PipPipPip
  • 599 příspěvků(y)

Publikováno 21 březen 2018 - 16:50

Tohle je tak jedno...
  • 0




0 uživatel(ů) prochází toto téma

0 uživatelů, 0 návštěvníků 0 anonymních uživatelů

Reklama