sākums

2010. gada 27. jūlijs

Google Maps dīvainības

Google Maps nenoliedzami ir forša un ļoti lietderīga tehnoloģija. Bet nesen (kaut kad pavasarī) tā nepatīkami pārsteidza ar dažādiem krieviskiem vietu nosaukumiem Latvijas kartē. Liekas, ka pirmais, vai vismaz pirmais pamanītais, bija Brīvības piemineklis. Un tad sāka parādīties arvien vairāk un vairāk šādu nosaukumu, īpaši Rīgas kartē.

Nenoliedzami, arī manī tas izraisīja emocionālu nepatiku tieši tādēļ, ka tā bija krievu valoda. Līdz ar nepatiku bija arī jautājums, kā šie nosaukumi tur rodas. Vai kāds (cilvēks) tos tur speciāli raksta, vai tā ir kaut kāda sistēmas fīča? Likās, ka neviens neko vairāk par sašutušu pukstēšanu nedara, lai novērstu šos krieviskos vietu apzīmējumus. Vēlāk gan izrādījās, ka, kamēr es nebiju Latvijā, te kāds šīs problēmas risināšanai uzrunāja Drošības Policiju.
Es šo epopeju palaidu gar ausīm un acīm. Dīvaini gan, protams, kāds gan Drošības Policijai varētu būt ar to sakars. Google Maps nav Latvijas produkts un labi, ka mēs vispār tai kartē esam attēloti vismaz kaut kādā valodā. Lai nu kā, bet, kad atgriezos Latvijā un atkal pievērsos dzīvei datorā un Latvijas kartei, redzēju, ka Brīvības pieminekļa uzraksts ir izlabots. Par to, protams, bija prieks. Bet prieka brīdis bija īss, jo krieviskie uzraksti bija saradušies daudzām citām vietām.

Diskusijas Google Help forumā

Tas jau vairs nepavisam nešķita normāli. Tad nu rakstīju uz Google Help forumu jautājumu, kas par lietu, kāpēc tā notiek. Lai arī Google ar savu produktu var darīt ko grib un attēlot to, kā grib, tomēr diez vai viņus iepriecinātu fakts par kartes popularitātes samazināšanos lietotāju vidū. Skaidrs, ka mani kā viņu produktu lietotāju neapmierina, ka uzraksti manas valsts kartē ir krievu valodā. Ja tie būtu angļu valodā, tad viss ok, tā tomēr ir starptautiska valoda, bez tam Google kodols tomēr ir ASV. Labi, es krieviski vairāk vai mazāk saprotu, man tā ir vairāk tiešām emocionāla nepatika, bet kā ar tiem ārzemniekiem, kas vēlas apciemot Latviju, bet uzraksti kartē ir krievu valodā, neatkarīgi no tā, kāda kartes apskatīšanas valoda ir izvēlēta?

Mans jautājums tika pievienots jau aizsāktai diskusijai par Brīvības pieminekli.

Tur sarakstē ar kādu Google starpnieku (vācieti) Ehg, kurš gan pats, kā liekas, neko daudz par Google iekšējām tehnoloģijām nezina un ir tikai tāds kā diskusiju moderators, noskaidrojās, ka šie krieviskie nosaukumi ir sistēmas kļūda un tam tā nevajadzētu būt. Bet uz to, kādēļ tie tomēr parādās un kādēļ šī kļūda rodas, neviens skaidru atbildi nav devis. Ehg izteica savus pieņēmumus, vēl kādā diskusijā izlasīju pāris citus pieņēmumus. Tomēr tie visi ir tikai pieņēmumi, vairāk vai mazāk ticami. Nekādu oficiālu skaidrojumu gan Google nav devis (vai neesmu atradusi). Izņemot dažus „Google Employee”, kuri diskusijās šo to ir ierakstījuši, kas tomēr neizskaidro visu problēmas būtību.

Atzīst par kļūdu

Būtiskākais, kas tika pateikts diskusijās bija, ka Google apzinās šo problēmu un atzīst to par kļūdu, un cenšas to labot. Kā arī to, ka šāda problēma nav specifiska tikai Latvijai.

Arābiešu uzraksti ASV kartē (diskusija)

Līdzīga problēma ir bijusi (vai joprojām ir) arī pašai ASV, kuru kartē vairāki uzraksti tika attēloti arābu valodā. Nav grūti iedomāties, kādu sašutumu tas izraisīja amerikāņu vidū. Tika radītas dažādas konspirācijas teorijas un aicināts FIB risināt šo problēmu. FIB gan līdzīgi kā mūsu DP šo jautājumu risināt atteicās, saprotamu iemeslu dēļ (kāds gan viņiem ar to sakars). Savukārt Google to skaidroja tikai un vienīgi kā tehnisku kļūdu. Un tieši arābu valodā uzraksti parādoties tikai sagadīšanās pēc.

Zviedriski uzraksti Somu kartē (diskusija)

Arī Somi jau ilgāk par gadu cīnās ar līdzīgu problēmu, jo viņu kartē ne vien vietu nosaukumi, bet pat ielas daudzviet tiek attēlotas zviedru valodā. Un pat viņi tur saskata kaut kādus politiskus, nevis tehniskus, iemeslus. Laikam jau grūti ir noticēt, ka atzītu tehnisku kļūdu Google nespēj novērst jau ilgāk par gadu. Kādā brīdī Google darbinieks paziņoja, ka kļūda ir izlabota, tomēr izrādījās, ka nav vis (pilnībā) izlabota vēl joprojām.


Iespējamie problēmas skaidrojumi

Kāpēc tad galu galā tā ir, ka kartes saturs rādās „nepareizās” valodās?

Sistēmas kļūda

Kāds Google darbinieks vienā no Help diskusijām skaidro, ka Google datubāzes satur dažādus vienas vietas nosaukumus. Daži no tiem ir atzīmēti kā pārāk neuzticami, lai tiktu attēloti kartē. Bet tā vietā, lai sistēma saprastu, ka „nedrīkst attēlot šo nosaukumu kartē”, tā to saprot kā „nedrīkst attēlot šo anglisko nosaukumu kartē”. Un tad sistēma meklē nosaukuma tulkojumu, ko varētu attēlot angliskā nosaukuma vietā un attēlo to. Lai gan, tas būtu tieši tas, ko sistēmai nevajadzētu darīt – nevajadzētu tos attēlot. Šī sistēmas kļūda var izvēlēties nosaukumu jebkurā valodā, bet parasti izvēlas alfabēta secībā. Tādēļ, piemēram, ASV kartē tiek attēlots nosaukums arābu valodā.
Googler Dave, Google Employee, 5/20/10 „We have lots of names for cities in our database, some of which are flagged as too obscure or untrustworthy to bother labeling on the map.  But we had a bug where for such labels our software should have known "Don't put this label on the map" but instead thought "Don't put this *English* label on the map" and then happily went searching for a translation of the label that it could add instead of the English label.  That's why the names are translations of often strange names for places - because they're names that we wouldn't have shown in the first place.  The bug might choose a label for any language, but tends to choose Arabic simply because that is one of the first language options it runs into alphabetically.
Thanks for bringing it to our attention, and for your patience as we work on resolving the issue.”
Šis pieņēmums (vai apgalvojums) varētu izskaidrot Kalngales un Garciema krievisko nosaukumu parādīšanos kartē.


Lietotāju radīts saturs

Google starpnieks Ehg šo problēmu skaidro ar to, ka kartes saturs tiek ģenerēts no dažādiem avotiem – no vikipēdijas, panoramio foto un tml. Daudziem no kartē redzamajiem nosaukumiem ir iespēja uz tiem noklikšķinot iegūt papildus informāciju par konkrēto vietu. Tur arī ir redzami dažādi avoti, kuros ir informācija par šo vietu. Tomēr man joprojām nav pilnīgi skaidrs, pēc kāda principa tiek izvēlēts, kura avota nosaukums tiek attēlots kartē un kura nē. Kāpēc tieši krievu valodas nosaukums, ja par konkrēto vietu ir apraksti arī citās valodās? Bez tam, noklikšķinot kartē, tālākais apraksts nebūt neseko krievu valodā, bet pārsvarā tajā valodā, kura ir izvēlēta Google kartes apskatei (hl=lv vai hl=en vai cita).

Papildus automātiski ģenerētajam saturam, lietotāji var paši pievienot savas kompānijas vai organizācijas nosaukumu un atrašanās vietu kartē, izmantojot Google Places.

Parametrs (G)

Pētot Stradiņu slimnīcas nosaukuma iespējamos avotus, atradu kādu interesantu faktu. (Stradiņu slimnīca Rīgas kartē arī jau labu laiku tiek attēlota krievu valodā.) Noklikšķinot uz nosaukuma un atverot papildus info, apakšā redzam „User Content” sadaļu. Tur noklikšķinām uz krievisko vikipēdijas ierakstu un redzam pievienoto koordinātu atribūtu, kuram vēl klāt ir parametrs (G) ar paskaidrojuma tekstu „šī vieta ir attēlota Google kartē”.
Angliskajā rakstā arī ir koordinātas, bet šāda (G) burta nav. Latviskā raksta vispār vēl nebija. Es to izveidoju, gan pavisam skopu, jo mans galvenais mērķis bija arī tajā ievietot koordinātas un mēģināt panākt, lai nosaukums kartē parādītos no šī avota. To gan es tikai nedaudz papētīju, nekas pagaidām nesanāca.

Vikipēdijas rakstos, noklikšķinot uz koordinātām, atveras GeoHack lapa ar visādu papildus informāciju. Piemēram, ar to, kurā zoom līmenī konkrētais nosaukums parādīsies kartē. Piemēram, krieviskais Stradiņa slimnīcas nosaukums Google kartē parādīsies iezūmojot līdz piektajam līmenim (Zoom 5).

Man gan vēl neizdevās noskaidrot, kādēļ tieši krievu vikipēdijā ir šāds (G) parametrs un kā ko tādu ievietot latviskajā vikipēdijas rakstā. Kā arī man nav pilnīga pārliecība, ka tas ir pie vainas, jo, piemēram, Mākslas muzejam, kas arī kartē tiek attēlots krievu valodā, nav šāda parametra vikipēdijā. Varbūt šis nosaukums tiek ņemts no kāda cita avota? Bet no kāda? Un kāpēc tas parādās krieviski, nevis kādā citā valodā (kā redzams noklikšķinot, „User Content” ir arī citās valodās). Starp citu, Mākslas muzeja uzraksts parādās iezūmojot līdz ceturtajam līmenim.
Varbūt šis (G) nemaz nav nekāds vikipēdijas parametrs, bet lietotāja paša pievienots burts? Apskatot raksta kodu, gan nekas par to neliecina. Tur ir tikai šī rindiņa {{Coord|56|55|54|N|24|03|54|E}} Varētu to, protams, brutāli izdzēst vai nomainīt zoom līmeni, bet nevēlos to darīt un tas neatrisinātu globālo problēmu.

Web 3.0?

Kopumā tas nebūt nav slikti, ka Google kartes saturs tiek ģenerēts automātiski no dažādiem citiem internet resursiem. Tā ir tā sauktā Web 3.0 un semantiskā tīkla raksturiezīme jeb nākamā globālā tīmekļa attīstības stadija, par ko nedaudz minēju savā iepriekšējā bloga ierakstā. Bet šobrīd gan Google karte, vismaz Rīgā, izskatās pēc palielas miskastes un saģenerētais saturs man liekas diezgan mistisks.

2007. gada aprīlī Search Engine Land raksīja, ka Google apsver iespēju kaut kad nākotnē daļu no lietotāju ģenerēta satura integrēt Google kartē. Rakstā šī ideja tika slavēta, minot, ka citu aplikāciju (third party) un lietotāju radīts saturs bagātinātu kartes datu bāzi, sniedzot informāciju par interesantiem apskates objektiem, labiem restorāniem un citām noderīgām lietām, kas savādāk netiktu attēlota Google kartē, un tādējādi karti padarītu lietderīgāku un interesantāku.

Šķiet, ka šis brīdis nu ir pienācis...

Jā, jau diezgan pasen pastāv iespēja izvēlēties, lai kartē tiek attēloti vēl papildus informācijas līmeņi, bet vietu nosaukumu attēlošanai šāda izvēles iespēja netiek dota. Tie tiek ģenerēti no dažādiem avotiem un attēloti kartē padarot karti pavisam nebaudāmu. Un nekāda liela lietderība vismaz Rīgas kartē tur šobrīd nav, drīzāk popularitātes zudums. Arī somi, kuriem jau ir apnicis gaidīt, kad zviedriskie nosaukumi viņu kartē pazudīs, izvēlas lietot citas kartes nevis Google Maps.
yamaneko 7/19/10 „I do not use Google maps anywhere anymore, it is completely useless for me. I do not believe that they never will fix this. Trust me, Finland is so small country so it is insignificant for Google if we have useless language in Google maps.”
Mistika
Daži mistiskumi, kas man nepavisam nav saprotami.

Kāpēc tieši krieviskais avots

Jau iepriekš rakstīju, ka man nav skaidrs, kādēļ tiek attēloti tieši krieviskie nosaukumi. Krievu (Russian) valoda alfabētā ir gan aiz angļu (English), gan latviešu (Latvian) valodām. Viens no skaidrojumiem vismaz dažiem nosaukumiem varētu būt tas (G) parametrs pie koordinātām vikipēdijas rakstos. Bet tas neizskaidro visus gadījumus, kā arī nav skaidrs, kur tas (G) rodas.

Kāpēc Kalngale un Garciems

Kāpēc tieši Kalngale un Garciems šobrīd ir attēloti arī krievu valodā? Vai iespējams, ka šeit saturs tiek ņemts no kādas vecākas krievu kartes?

Kāpēc kirilicā?

Kāpēc daudzviet nosaukumi ir rakstīti it kā latviešu valodā (vai kaut kas līdzīgs), bet kirilicā? Tas ir iezūmojoties līdz trešajam līmenim (saite).
Noklikšķinot uz kiriliciskā nosaukuma, papildus informācijā nekāds krieviskais vai kirilicā rakstītais teksts neparādās...

Kurzemes Hercogiste

Un pēdējā laika prikols – Balasta dambī attēlotais Kurzemes Hercogistes nosaukums krievu valodā, bet noklikšķinot uz tā parādās nosaukums japāņu valodā.


Par Kurzemes Hercogisti, kā izrādās, ir ieraksti vikipēdijā ļoti daudzās valodās, tai skaitā arī japāņu (bet ne latviešu). Tas, protams, priecē, bet atkal neskaidrība, kādēļ Google karte par prioritāti ņem krievu valodu, papildus informācijas nosaukumam – japāņu valodu, bet pašu informāciju sniedz vēl citā valodā.

Gan jau salabos

Kopumā šis viss ir diezgan interesanti un gribētos dzirdēt Google oficiālo un tehniski detalizēto skaidrojumu. Šobrīd, pārlasot dažādas diskusijas, šķiet, ka viņiem pašiem nav gluži skaidrs, kā saturs kartē tiek ģenerēts un pēc kāda principa attēlots. Tiek gan apgalvots, ka viņi arī to atzīst par kļūdu un cenšas labot. Man gribētos ticēt, ka tā tiešām ir un šī satura integrēšanas lieta tiks attīstīta tālāk un nonāks līdz baudāmākam un lietojamākam līmenim kā šobrīd.

Principā jau vienīgais, ko viņiem vajadzētu sakārtot ir attēlošanas valodu prioritāšu sakārtošana. Nosaukumiem vajadzētu parādīties vai nu angļu valodā, kas tomēr ir starptautiska valoda, vai kartes apskatīšanai izvēlētajā valodā.
Izrādās, ka Latvijas karti var izvēlēties apskatīt krievu valodā un tad ļoti daudz vietu nosaukumu parādās krievu valodā.
Tas ir ideālais variants, kādai vajadzētu būt Google kartei, lai man būtu patīkami to lietot - satura attēlošana angļu vai izvēlētajā valodā.


Sižets Panorāmā
Pirms pāris dienām par šo problēmu bija arī neliels sižets Panorāmā

http://www.ltvzinas.lv/?n=video&id=2169


11 koment�ri:

Maija teica...

Ļoti labs un izsmeļošs materiāls, paldies Dacei!

Anonīms teica...

Neko sev "bloga rakstiņš". Vienam otram tāds derētu par bakalaura darbu. Interesanti un izsmeļoši. 5 zvaigznes.

Nomoda teica...

jaa labs :)

malahija teica...

Labais. Es te savā Fāterlandē nemaz nebiju pamanījusi šādus brīnumus. :)
Mums gan te virmo kaislības par ielu un māju filmēšanu un publicēšanu. Šajā kontekstā daudziem Vācijā rodas jautājums, kāpēc un kā uzdevumā tas tiek darīts. Bet tiešām interesanti, cik ilgi par spīti šādiem "sīkumiem" google noturēs savas vadošās pozīcijas...

dace teica...

Izskatās, ka krieviskās dīvainības no kartes nu ir pazudušas!
Šādas tādas dīvainības gan joprojām pastāv.

Anonīms teica...

RAkstinjam nav ne vainas.... Vieniigi uzsvars, ka anglju valoda ir starptautiska, bet krievu itkaa ne.... murgs.

dace teica...

Lai nebūtu jāmurgo, palasi, kas ir starptautiska valoda http://en.wikipedia.org/wiki/World_language Krievu valoda bija "starptautiska" padomju savienībā.

Anonīms teica...

Mees runaajam par definiiciju, jeb praksi?

dace teica...

Par praksi. Cik valstīs krievu valoda ir oficiālā valoda un cik angļu? Cik valstīs krievu valoda tiek mācīta kā pirmā svešvaloda un cik angļu?

Anonīms teica...

Ir pieejami dati lai uz skaadiem skaitljiem spekuleetu?
Tad jau visu dizho juurasbrauceeju kolonijas njemsim veeraa un arii, piemeeram, franchu valodu liekam blakus krievu... un kur buus taa robezha?
Vienkaarshi fakts, ka paaris uzraksti paraadaas kirilikaa liek cept skaistus rakstus blogos, neuzkriitoshi mekleet politiska rakstura iemeslus... Un ntaas reizes rakstiit cik tas ir aizskaroshi lasiit krieviski... Un ja buutu vaacu valodaa?

dace teica...

Nu, te vairs nav vērts tālāk diskutēt...

Ierakstīt komentāru