Discussion:
Notre Dame
(too old to reply)
Eero Mäki
2006-08-22 10:45:03 UTC
Permalink
Kun klassillisen musiikin keskustelu liukui kieliasioihin, niin tulipa
mieleeni...

Eräs suosittu ranskalainen urkuteos on

Leon Boellmann: Suite Gothique
I Introduction - Choral
II Menuet gothique
III Priere a Notre Dame
IV Toccata

Kolmas osa on suomennettu Suomen Yleisradiossa
Rukous Notre Damen katedraalissa

Ranskan kielen a (pilkku päälle) ei kaiketikaan tarkoita jossakin vaan
jollekin. Rukous Notre Damelle kuulostaisi koomiselta
mutta eikö Notre Dame eli meidän naisemme ole Neitsyt Maria

siis Rukous Neitsyt Marialle

Muuten teos on varsin helposti sulavaa musiikkia. Kannatta kuunnella.
Toccata lienee Widorin ja Gigout´n toccatan jälkeen eniten kuultu
ranskalainen toccata.

Eero
Jukka K. Korpela
2006-08-22 12:14:50 UTC
Permalink
Post by Eero Mäki
III Priere a Notre Dame
Pitää olla "Prière à Notre-Dame". Nykyisen standardin mukaan pyritään
vieraissa sanoissa säilyttämään kaikki niihin kuuluvat tarkkeet. Kirjaimet è
ja à kuuluvat Latin 1 -merkistöön, joten niitä voi käyttää sfnetissä yhtä
turvallisesti kuin ä:tä ja ö:tä. Niiden kirjoittamisesta ks. esim.
http://www.cs.tut.fi/~jkorpela/nappis.html
Post by Eero Mäki
Kolmas osa on suomennettu Suomen Yleisradiossa
Rukous Notre Damen katedraalissa
Kuulostaa erikoiselta. (Pääasiasta sivuun mennäkseni: Ylen virallinen nimi
on nykyisin vain "Yleisradio Oy"; sana "Suomen" taidettiin pudottaa nimestä
1940-luvulla.)
Post by Eero Mäki
Ranskan kielen a (pilkku päälle) ei kaiketikaan tarkoita jossakin vaan
jollekin.
Ranskan prepositiolla "à" on monta merkitystä, myös paikallisuutta
osoittava. Netistä poimittu esimerkki, jonka merkitys avautunee ranskaa
osaamattomallekin:
"En outre, le 14 mars, nous organisons un concert à Notre-Dame de Paris."

Mutta vaikuttaa ilmeiseltä, että tässä "Notre Dame" (tai oikeammin kai
"Notre-Dame") tarkoittaa meidän rouvaamme eli Neitsyt Mariaa eikä (jotakin)
hänen kunniakseen nimettyä kirkkorakennusta.
Post by Eero Mäki
Rukous Notre Damelle kuulostaisi koomiselta
mutta eikö Notre Dame eli meidän naisemme ole Neitsyt Maria
siis Rukous Neitsyt Marialle
Niinpä kai. Hetken aikaa jouduin miettimään, kirjoitetaanko tässä "neitsyt"
vai "Neitsyt", ja päättelin, että luonnollisinta on tulkita sana lisänimeksi
eli epiteetiksi ja kirjoittaa se versaalialkuisena. Yleensähän epiteetti on
nimen jäljessä (Johannes Kastaja, Kaarle Suuri, Maunu Ladonlukko jne.).
Post by Eero Mäki
Toccata lienee Widorin ja Gigout´n toccatan jälkeen eniten kuultu
ranskalainen toccata.
Kielipuolesta vielä sen verran, että akuutti aksentti ´ ei ole sopiva
heittomerkin korvike. Silloin kun oikeanlaista heittomerkkiä ei ole
turvallista käyttää (kuten sfnetissä), on parasta käyttää ns.
Ascii-heittomerkkiä. Siis: Gigout'n, ei Gigout´n. Tässä on muuten sekin
pikku puoli, että ns. laajennetussa suomalaisessa näppäimistössä, joka on
tulossa käyttöön, näppäinyhdistelmä ´n tuottaa n:n, jossa on aksentti
päällä.
--
Jukka K. Korpela ("Yucca")
http://www.cs.tut.fi/~jkorpela/
Teemu Likonen
2006-08-22 12:44:58 UTC
Permalink
Tässä on muuten sekin pikku puoli, että ns. laajennetussa
suomalaisessa näppäimistössä, joka on tulossa käyttöön,
näppäinyhdistelmä ´n tuottaa n:n, jossa on aksentti päällä.
Mitä tarkoittaa tämä laajennettu suomalainen näppäimistö? Jotain
standardia? Entä mitä tarkoitat sanomalla "tulossa käyttöön"? En näistä
asioista paljon tiedä, mutta Unix-tyyppisten käyttöjärjestelmien
X-ikkunoinnissa tuo näppäinyhdistelmä on käsittääkseni iät ja ajat
tuottanut U+0144:n (tai versaalina U+0143:n), mikäli se vain käytettyyn
merkistöön kuuluu.

Jatkot vain kieliryhmään.
H. Markus Lang
2006-08-22 13:01:26 UTC
Permalink
Post by Teemu Likonen
Mitä tarkoittaa tämä laajennettu suomalainen näppäimistö? Jotain
standardia?
Microsoft on laatinut laajennetun monikielisen näppäimistöasettelun
Windows XP -käyttöjärjestelmää varten, ja siitä on julkaistu ns.
arviointiversio:
<http://www.microsoft.com/downloads/details.aspx?displaylang=fi&FamilyID=583F29D0-9187-4A22-9A0D-2B69BBF08D40>.
Vaikuttaa toimivalta.
Post by Teemu Likonen
En näistä
asioista paljon tiedä, mutta Unix-tyyppisten käyttöjärjestelmien
X-ikkunoinnissa tuo näppäinyhdistelmä on käsittääkseni iät ja ajat
tuottanut U+0144:n (tai versaalina U+0143:n), mikäli se vain käytettyyn
merkistöön kuuluu.
Windows kolistelee jälkijunassa. (No, muistelen aikoja, jolloin
Macintosh-tietokoneella ei pystynyt kirjoittamaan hattu-s:ää [š].
Olikohan se eilen...)

-----------------------------------
***@elisanet.fi
http://www.elisanet.fi/markus.lang/
Pasi Pikkupeura
2006-08-22 13:32:57 UTC
Permalink
Microsoft on laatinut laajennetun monikielisen näppäimistöasettelun Windows XP -käyttöjärjestelmää varten
Eikä ole. Näppäimistömääritelmän on laatinut Opetusministeriön alaisen
Kotimaisten kielten tutkimuskeskuksen Tietotekniikan kotoistus -hankkeen
ohjausryhmän alaisuudessa toimiva näppäimistötyöryhmä.
Jukka K. Korpela
2006-08-22 14:00:59 UTC
Permalink
Post by Teemu Likonen
Tässä on muuten sekin pikku puoli, että ns. laajennetussa
suomalaisessa näppäimistössä, joka on tulossa käyttöön,
näppäinyhdistelmä ´n tuottaa n:n, jossa on aksentti päällä.
Mitä tarkoittaa tämä laajennettu suomalainen näppäimistö?
Näppäimistöasettelua, joka olennaisesti laajentaa tavallisen suomalaisen
näppäimistön toiminnallisuutta, ja myöhemmin myös näitä laajennuksia tukevia
lisäkaiverruksia (lisämerkintöjä näppäinhattuihin). Tavallisella
suomalaisella näppäimistöllä tarkoitan tässä sellaista, mikä tyypillisesti
myydään tietokoneen mukana. Ks. tarkemmin lyhyttä kuvausta ja linkkejä:
http://www.cs.tut.fi/~jkorpela/uusinappis.html
Post by Teemu Likonen
Jotain standardia?
Standardinomaista valmistetta. :-) Aiheesta on tulossa juttu mm. SFS:n
tiedotuslehteen, ja jutussa todetaan, ettei SFS-standardin laatimisesta ole
päätöstä. Vanha näppäimistöstandardi kumottiin vanhentuneena jo jokin aika
sitten, ja nyt on käytössä eräänlainen de facto -standardi. Sen rinnalle ja
tilalle on siis tulossa määrittely, joka ei ainakaan toistaiseksi ole
standardi mutta on kuitenkin täsmällisesti kuvattu ja yhteistyöhankkeessa
laadittu.
Post by Teemu Likonen
Entä mitä tarkoitat sanomalla "tulossa käyttöön"?
On tällä hetkellä saatavissa vapaasti kokeilukäyttöön ja tulee
todennäköisesti vähitellen uusien tietokonejärjestelmien mukana
toimitettavaksi vakioasetteluksi, ensin ehkä vaihtoehtoiseksi.
Post by Teemu Likonen
Unix-tyyppisten
käyttöjärjestelmien X-ikkunoinnissa tuo näppäinyhdistelmä on
käsittääkseni iät ja ajat tuottanut U+0144:n (tai versaalina
U+0143:n), mikäli se vain käytettyyn merkistöön kuuluu.
Jos käytetyssä merkistössä on akuutti-n eli U+0144 ja jos toteutetaan jokin
tapa kirjoittaa se nykyisenkaltaisella suomalaisella näppäimistöllä, niin ´n
on tietysti ainoa järkevä ratkaisu. Sehän vain laajentaa akuuttinäppäimen
toiminnallisuutta.

Sen sijaan monien muiden merkkien osalta ratkaisut eivät ole ollenkaan
ilmeisiä. Heti kun tarkastellaan tarkkeita, joita nykyiseen
näppäimistöasetteluun ei sisälly millään tavalla, huomataan, että mitään
ilmeistä vaihtoehtoa ei ole ja että kaikilla vaihtoehdoilla on huonoja
puolia. Tässä oli melkoinen palapeli, mutta käsittääkseni siihen löytyi
varsin hyvä ratkaisu.
--
Jukka K. Korpela ("Yucca")
http://www.cs.tut.fi/~jkorpela/
Pekka Peura
2006-08-22 15:45:20 UTC
Permalink
Post by Jukka K. Korpela
Post by Teemu Likonen
Mitä tarkoittaa tämä laajennettu suomalainen näppäimistö?
Näppäimistöasettelua, joka olennaisesti laajentaa tavallisen suomalaisen
näppäimistön toiminnallisuutta, ja myöhemmin myös näitä laajennuksia tukevia
lisäkaiverruksia (lisämerkintöjä näppäinhattuihin). Tavallisella
suomalaisella näppäimistöllä tarkoitan tässä sellaista, mikä tyypillisesti
http://www.cs.tut.fi/~jkorpela/uusinappis.html
Onko tämä puhtaasti suomalainen hanke, vai ollaanko yhteistyössä Ruotsin
kanssa?
Ymmärtääkseni nykyisten PC-laitteistojen näppäimistökaiverrukset ovat
identisiä Suomen ja Ruotsin markkinoilla, eli laitevalmistajille tästä
koituu selvää etua suuruuden ekonomian kautta.

Pekka
Jukka K. Korpela
2006-08-22 16:07:57 UTC
Permalink
Post by Pekka Peura
Post by Jukka K. Korpela
http://www.cs.tut.fi/~jkorpela/uusinappis.html
Onko tämä puhtaasti suomalainen hanke, vai ollaanko yhteistyössä
Ruotsin kanssa?
Sivulla mainittujen linkkien kautta löytyy myös tieto hankkeen taustasta.
Mutta lyhyt selostus: Ruotsissa oltiin tekemässä Ruotsin viranomaisten
käyttöön suunniteltua näppäimistöasettelua, jossa erikoismerkkien sijainnit
ovat hyvin epäintuitiiviset. Syynä oli mm. se, että monet tarkkeelliset
kirjaimet oli haluttu saada aikaan AltGr-näppäimen avulla tavallisista
näppäimistä eikä tarkenäppäinperiaatteella. Erinäisten vaiheiden kautta
päädyttiin siihen, että on kaksi aivan eri näppäinasettelua mutta ne merkit,
joille tehdään lisäkaiverrukset, ovat samoilla paikoilla. Näin ollen
asettelut ovat "laitetasolla yhteensopivia".

Asiassa on pidetty yhteyttä laajemmin Unicode-konsortion piirissä, jossa
suomalaista lähestymistapaa on myös esitelty tapana käsitellä
monikielisyyden vaatimuksia.
Post by Pekka Peura
Ymmärtääkseni nykyisten PC-laitteistojen näppäimistökaiverrukset ovat
identisiä Suomen ja Ruotsin markkinoilla, eli laitevalmistajille tästä
koituu selvää etua suuruuden ekonomian kautta.
Kaiverrukset tulevat olemaan samat. Kovin suureen suuruuden ekonomiaan tässä
ei päästä, mutta tietysti se helpottaa asioita.
--
Jukka K. Korpela ("Yucca")
http://www.cs.tut.fi/~jkorpela/
Teemu Likonen
2006-08-23 05:06:05 UTC
Permalink
Post by Jukka K. Korpela
Post by Teemu Likonen
Mitä tarkoittaa tämä laajennettu suomalainen näppäimistö?
http://www.cs.tut.fi/~jkorpela/uusinappis.html
No mutta! Kohtahan suomalaisella näppäimistöllä voi kirjoittaa jopa
suomea! :)

Näyttäisi siltä, että X-ikkunoinnin suomalaisella näppäimistöllä (layout
"fi", variant "basic") ja Compose-näppäimellä saadaan jo nyt tuotettua
kaikki nämä merkit lukuun ottamatta ezh-kirjainta ja sen eri
tarkkeellisia versioita. Eipä silti, ei täällä Linux-maailmassa
välttämättä ole varaa henkselien paukutteluun. Yksittäisessä koneessa
asiat voivat kenties toimia hyvinkin, mutta yleisesti täällä vaivaavat
vielä pitkään erilaiset merkistösotkut ennen kuin UTF-8 vakiintuu
lokaaleihin ja asetukset opitaan sen osalta laittamaan kohdalleen.

Joka tapauksessa tämä suomalainen monikielinen näppäimistö on erittäin
tervetullut myös X-ikkunointiin. Monet tarpeelliset merkit saadaan sen
avulla tuotettua entistä helpommin, koska Compose-näppäintä ei tarvita
juuri lainkaan. Sivullasi olevan linkin takaa löytyi ohjeet
X-ikkunointia varten. Muokkasin ne sellaiseen muotoon, että asettamiseen
ei tarvita pääkäyttäjän oikeuksia eikä X:n asetustiedostojen
muokkaamista. Mielestäni tämä on mukavampi tapa siihen saakka, kunnes
näppäinasettelu saadaan virallisesti X:ään. Voin lähettää
kiinnostuneille ohjeet vaikkapa sähköpostitse.

Näppäimistöasettelun kuvauksesta jäi mietityttämään "erillistila", jossa
voidaan perusmerkkiin liittää erillisiä yhdistyviä tarkkeita. Tiedän
mitä yhdistyvät tarkkeet tarkoittavat, mutta epäselväksi jäi, miten tämä
erillistila toteutetaan. Onko se vain ohjelmiston tasolla toteutettava
asia? "Klikkaa tästä vaihtaaksesi 'erillistilaan'"?
Jukka K. Korpela
2006-08-23 20:50:51 UTC
Permalink
Post by Teemu Likonen
Näppäimistöasettelun kuvauksesta jäi mietityttämään "erillistila",
jossa voidaan perusmerkkiin liittää erillisiä yhdistyviä tarkkeita.
Tiedän mitä yhdistyvät tarkkeet tarkoittavat, mutta epäselväksi jäi,
miten tämä erillistila toteutetaan.
Toteutus on muillekin epäselvä. Käsittääkseni sen periaatteellinen
toteutettavuus on kuitenkin varmistettu, ja koko erillistilaan päädyttiin
paljolti juuri siksi, että monitarkkeisten merkkien kirjoittamisen tuki
olisi muuten hankala toteuttaa. Toisaalta erillistila on minusta hyvä asia
senkin takia, että se _mahdollistaa_ luonnollisemman kirjoitusjärjestyksen
(é kirjoitetaan painamalla e ja ´ eikä ´ ja e) niiden käyttöön, jotka sitä
haluavat. Toteutuksella ei toisaalta pidetä kiirettä, koska tarve on
suhteellisen pieni. (Monitarkkeisia merkkejä esiintyy mm. vietnamissa ja
harvinaisina balttilaisissa kielissä. Toisaalta Suomessa nykyisin
kirjoitetaan vietnamilaiset nimet ilmeisesti lähes aina ilman _mitään_
tarkkeita, ja tämänkin kanssa on eletty.)

Jos tarkoitat erillistilaan ja siitä pois vaihtamisen käyttöliittymää, niin
sekin on auki, mutta eräs luonnollinen ratkaisu olisi mielestäni se, että
erillistila on omana näppäimistöasettelunaan, joka valitaan käyttöön samalla
tavoin kuin näppäimistöasettelu yleensäkin.
Post by Teemu Likonen
Onko se vain ohjelmiston tasolla
toteutettava asia? "Klikkaa tästä vaihtaaksesi 'erillistilaan'"?
Sovellusohjelmakohtaisesti sitä tuskin kannattaa tehdä. Lähtökohtana on,
että erillistilaa käyttävät vain harvat, ja heidän edellytetään opettelevan,
miten tila otetaan käyttöön käyttöjärjestelmän tasolla.
--
Jukka K. Korpela ("Yucca")
http://www.cs.tut.fi/~jkorpela/
H. Markus Lang
2006-08-22 13:09:10 UTC
Permalink
Post by Jukka K. Korpela
Pitää olla "Prière à Notre-Dame". Nykyisen standardin mukaan pyritään
vieraissa sanoissa säilyttämään kaikki niihin kuuluvat tarkkeet.
Säveltäjän nimi on Léon Boëllmann. Lisätty tänne:
<http://www.elisanet.fi/markus.lang/strip.html>.
markus_fin
2006-08-22 22:16:59 UTC
Permalink
Post by H. Markus Lang
Pitää olla "Prière à Notre-Dame"..
<http://www.elisanet.fi/markus.lang/strip.html>.
Olisiko mahdollista nussia niitä risuaitoja jossain yksityisellä klubilla?
Suomessa ja suomen kielessä niitä ei tarvita, eikä niitä pidä käyttää edes
ulkomaisten nimien yhteydessä. Kuka saatana osaa, ja miksi pitäisi osata,
kirjoittaa, latoa ja lukea jotain sanotaan esimerkiksi Puolan risuaitoja
Suomessa jos kysymyksessä on suomenkielinen teksti? Korpelan maininta
"Nykyisen standardin mukaan pyritään vieraissa sanoissa säilyttämään kaikki
niihin kuuluvat tarkkeet" on, jos pitää paikkansa, aivan mieletön. Ei
missään muualla maailmassa varmaan päästä samaan pölhöilyn asteeseen.

m_f
H. Markus Lang
2006-08-23 12:05:12 UTC
Permalink
Post by markus_fin
Suomessa ja suomen kielessä niitä ei tarvita, eikä niitä pidä
käyttää edes ulkomaisten nimien yhteydessä. [...]
Korpelan maininta "Nykyisen standardin mukaan pyritään vieraissa
sanoissa säilyttämään kaikki niihin kuuluvat tarkkeet" on, jos pitää
paikkansa, aivan mieletön.
Maininta on peräisin standardista SFS 4175 (kohta 4.27), jossa todetaan
mm. seuraava:

"Suomen kielen kirjoitusjärjestelmään kuuluvat myös hattu-s š ja hattu-z
ž. Niitä ei tule korvata sh:lla ja zh:lla muutoin kuin pakkotilanteessa
eli silloin, kun š ja ž eivät kuulu käytettävissä olevaan merkistöön.
Vieraissa sanoissa pyritään säilyttämään kaikki niihin kuuluvat tarkkeet."

Ryhtynet riitelemään asiasta Suomen Standardisoimisliiton kanssa.
Post by markus_fin
Ei missään muualla maailmassa varmaan päästä
samaan pölhöilyn asteeseen.
Rohkenisin uskoa, että useimmissa sivistyskielissä (lukuun ottamatta
englantia) menetellään nykyisin samoin kuin meillä.

(Harvoin näkee, että aksentit aiheuttavat pienelle äijälle psykiatrisia
"episodeja".)

-----------------------------
***@elisanet.fi
http://www.elisanet.fi/mlang/
rj
2006-08-24 10:00:28 UTC
Permalink
Post by H. Markus Lang
Ryhtynet riitelemään asiasta Suomen Standardisoimisliiton kanssa.
Onneksi se ei ole pystynyt, eikä pysty, standardisoimaan Suomea, ainoastaan
muutamien yksilöiden ajatusradat. Siksipä riitelykin olisi turhaa ajan
hukkaa.

- k
George Saraiste Jr.
2006-08-23 23:03:11 UTC
Permalink
Post by markus_fin
Olisiko mahdollista nussia niitä risuaitoja jossain yksityisellä klubilla?
Sivistyneesti sanottu, etten sanoisi.
Post by markus_fin
...Korpelan maininta "Nykyisen standardin mukaan pyritään
vieraissa sanoissa säilyttämään kaikki niihin kuuluvat tarkkeet"
on, jos pitää paikkansa, aivan mieletön.
Ymmärtääksemme, kaikki muukin "Korpelan mainitsema" on mielestäsi
ollut jo kauan sitten mieltä vailla.

Vai olemmeko ymmärtäneet väärin?
Jukka K. Korpela
2006-08-24 07:38:48 UTC
Permalink
Sub titulo "Re: Notre Dame"
Post by H. Markus Lang
Säveltäjän nimi on Léon Boëllmann.
Tuostapa tuli mieleen muuan nyrkkisääntö:

Pelkkä "oe" on ranskalaisissa nimissä aina väärin.

Joissakin tapauksissa pitää olla "oë", jolloin treema (kaksi pistettä)
osoittavat sitä mitä ranskassa yleensäkin eli sitä, että vokaali ääntyy
erillisenä, siis "o" ja "e" ääntyvät erikseen.

Muissa tapauksissa taas pitää olla oe-kirjain ("ligature oe", U+0153), joka
on ranskassa oma kirjaimensa ja kuvaa ö:n tapaista äännettä. Sen
kirjoittamista ei voi vaatia sfnetissä, koska se ei kuulu Latin
1 -merkistöön, mutta painoteksteissä ja tekstinkäsittelyssä sen vaatiminen
on oikein ja kohtuullista. Suomalaisella monikielisellä näppäimistöllä sen
kirjoittaminen on helppoa (AltGr o).

Tietysti jos alkutekstissä tai lähdeaineistossa on ranskalaisessa nimessä
"oe", tarvitaan työtä sen selvittämiseksi, kumpi tapauksista on kyseessä.
Tämä ei toisaalta ole kohtuuton vaatimus: jos kirjoittaa jostakusta tai
jostakin, on syytä selvittää nimen oikea asu.

(Jatkot rajattu kieliryhmään.)
--
Jukka K. Korpela ("Yucca")
http://www.cs.tut.fi/~jkorpela/
eki
2006-08-24 10:11:41 UTC
Permalink
Thu, 24 Aug 2006 10:38:48 +0300, "Jukka K. Korpela"
Post by Jukka K. Korpela
Sub titulo "Re: Notre Dame"
Post by H. Markus Lang
Säveltäjän nimi on Léon Boëllmann.
Pelkkä "oe" on ranskalaisissa nimissä aina väärin.
Joissakin tapauksissa pitää olla "oë", jolloin treema (kaksi pistettä)
osoittavat
Minusta tuntuisi paremmalta "jolloin treema (kaksi pistettä)
osoittaa..."
Post by Jukka K. Korpela
sitä mitä ranskassa yleensäkin eli sitä, että vokaali ääntyy
erillisenä, siis "o" ja "e" ääntyvät erikseen.
H. Markus Lang
2006-08-24 12:46:02 UTC
Permalink
Post by eki
Post by Jukka K. Korpela
Joissakin tapauksissa pitää olla "oë", jolloin treema (kaksi pistettä)
osoittavat
Minusta tuntuisi paremmalta "jolloin treema (kaksi pistettä)
osoittaa..."
Tässä olisikin aihetta jännittävään jatko-osaan: "Onko treema ne?"
(Vrt. <http://www.cs.tut.fi/~jkorpela/kielikello/kansahe.html>.)

-----------------------------
***@elisanet.fi Le bœuf sur l'internet.
http://www.elisanet.fi/mlang/
Jani Rivinoja
2006-08-24 17:37:29 UTC
Permalink
Post by Jukka K. Korpela
Pelkkä "oe" on ranskalaisissa nimissä aina väärin.
Tuosta tulikin mieleeni ranskalainen rallin maailmanmestari Sébastien
Loeb, jonka sukunimen olin tähän mennessä nähnyt vain muodossa "Loeb".
Post by Jukka K. Korpela
Muissa tapauksissa taas pitää olla oe-kirjain ("ligature oe", U+0153), joka
on ranskassa oma kirjaimensa ja kuvaa ö:n tapaista äännettä.
Lausumisen "löb" perusteella nimessä olisi siis oe-kirjain. Googlellakin
löytyy muutama osuma, jotka ranskaa osaamattomalle näyttävät varsin
luotettavilta.
Post by Jukka K. Korpela
Tämä ei toisaalta ole kohtuuton vaatimus: jos kirjoittaa jostakusta tai
jostakin, on syytä selvittää nimen oikea asu.
Näinhän se on. Turhan helposti vain luottaa siihen, että kun nimi on
lähes joka paikassa kirjoitettu yhdellä tavalla eikä missään törmää
muihin kirjoitusasuihin, niin se on oikein. Varsinkin nimen haltijan
omilla ja tämän kotimaan sivustoilla olevaa asua ei hevillä usko
vääräksi. Pitää nähtävästi kyseenalaistaa henkilöiden nimien
kirjoitusasut useamminkin.

Esimerkiksi venäläisissä ja kreikkalaisissa nimissä asia on sikäli
yksinkertaisempi, että vallitsevan kirjoitusasun voi aika huoletta
olettaa vääräksi ja ryhtyä selvittämään oikeaa.

Kun selvittelin Loebin nimen kirjoitusasua Googlella, huomasin
kummallisuuksia kahdella hakulauseella:
"Sébastien Loeb"
Sébastien "Loeb"

Molemmissa käytin oe-kirjainta. Ensimmäisessä haussa Google palautti
myös ne esiintymät, joissa oli yhdistelmä "oe", mutta toisen haun
tuloksissa oli nimi vain oe-kirjaimen kanssa.
--
F1-ruutu: http://koti.mbnet.fi/janir/
Outgun: http://koti.mbnet.fi/outgun/
H. Markus Lang
2006-08-24 20:43:35 UTC
Permalink
Post by Jani Rivinoja
Post by Jukka K. Korpela
Pelkkä "oe" on ranskalaisissa nimissä aina väärin.
Tuosta tulikin mieleeni ranskalainen rallin maailmanmestari Sébastien
Loeb, jonka sukunimen olin tähän mennessä nähnyt vain muodossa "Loeb".
Onko se varmasti _ranskalainen_ nimi niin kuin vaikkapa Ricœur?
Post by Jani Rivinoja
Lausumisen "löb" perusteella nimessä olisi siis oe-kirjain. Googlellakin
löytyy muutama osuma, jotka ranskaa osaamattomalle näyttävät varsin
luotettavilta.
Samoin kyllä äännettäisiin esimerkiksi saksalainenkin nimi.
Jean-Wolfgang de Gœthe? :-) (No, itse asiassa muutama Gœthe löytyi.)
Post by Jani Rivinoja
Näinhän se on. Turhan helposti vain luottaa siihen, että kun nimi on
lähes joka paikassa kirjoitettu yhdellä tavalla eikä missään törmää
muihin kirjoitusasuihin, niin se on oikein.
Väärästä kirjoitusasusta voi tulla itseään ylläpitävä varjototuus.
Varjototuuksien purkaminen kuuluu yhteiskuntatieteiden tehtäviin.
Post by Jani Rivinoja
Varsinkin nimen haltijan
omilla ja tämän kotimaan sivustoilla olevaa asua ei hevillä usko
vääräksi. Pitää nähtävästi kyseenalaistaa henkilöiden nimien
kirjoitusasut useamminkin.
Niin, kuten <http://www.sebastienloeb.com/>. Tosin siellä kyllä lukee
myös: "Plat préféré: La côte de boeuf" (eikä bœuf).
Post by Jani Rivinoja
Esimerkiksi venäläisissä ja kreikkalaisissa nimissä asia on sikäli
yksinkertaisempi, että vallitsevan kirjoitusasun voi aika huoletta
olettaa vääräksi ja ryhtyä selvittämään oikeaa.
Niin, esimerkiksi ystävämme Iosif Vissarionovitš Džugašvili. Ei tuota
nimeä ikinä näe oikein kirjoitettuna.

Mainostetaan jälleen hyödyllistä lähdettä:
<http://www.elisanet.fi/mlang/oops.html>.

-----------------------------
***@elisanet.fi
http://www.elisanet.fi/mlang/
Jani Rivinoja
2006-08-24 21:55:21 UTC
Permalink
Post by H. Markus Lang
Post by Jani Rivinoja
Tuosta tulikin mieleeni ranskalainen rallin maailmanmestari Sébastien
Loeb, jonka sukunimen olin tähän mennessä nähnyt vain muodossa "Loeb".
Onko se varmasti _ranskalainen_ nimi niin kuin vaikkapa Ricœur?
Enpä todellakaan tiedä. Voisihan se olla alkujaan saksalainenkin nimi
(varmaankin sitten Löb). Jos se on ranskalaistunut muotoon "Loeb", niin
kai sitä sitten voi pitää oikeana. Eipä siis pidä tehdä hätiköityjä
johtopäätöksiä, kuten olin jo melkein tekemässä.
Post by H. Markus Lang
Post by Jani Rivinoja
Varsinkin nimen haltijan omilla ja tämän kotimaan sivustoilla olevaa
asua ei hevillä usko vääräksi.
Niin, kuten <http://www.sebastienloeb.com/>. Tosin siellä kyllä lukee
myös: "Plat préféré: La côte de boeuf" (eikä bœuf).
Epäselvyyttä lisää sekin, että on vaikea sanoa, milloin œ-kirjaimen
puuttuminen johtuu teknisistä seikoista, milloin väärästä ja milloin
oikeasta asusta.

Lähetinpä paremman puutteessa tuolle sivustolle kysymyksen Sébastienin
sukunimen kirjoitusasusta (toivottavasti siellä ymmärretään englantia).
Saapa nähdä, tuleeko vastausta. Tässä vaiheessa vaaka kyllä kallistuu
taas Loebin puolelle.
Post by H. Markus Lang
<http://www.elisanet.fi/mlang/oops.html>.
Tuosta ja ennen kaikkea tästä
http://www.elisanet.fi/mlang/strip.html
muistinkin, että jostain kumman syystä "Kimi Raïkkönen" esiintyy
yllättävänkin monella sivustolla. Jopa "Kïmï Räïkkönën" löytyy, mutta
kai siinä missä toiset poistavat kaikki aksentit, toiset lisäävät niitä,
jotta määrä pysyisi keskimäärin oikeana.
--
F1-ruutu: http://koti.mbnet.fi/janir/
Outgun: http://koti.mbnet.fi/outgun/
Jukka K. Korpela
2006-08-25 08:11:26 UTC
Permalink
Post by H. Markus Lang
Post by Jani Rivinoja
Tuosta tulikin mieleeni ranskalainen rallin maailmanmestari Sébastien
Loeb, jonka sukunimen olin tähän mennessä nähnyt vain muodossa "Loeb".
Onko se varmasti _ranskalainen_ nimi niin kuin vaikkapa Ricœur?
Veikkaisin, ettei se ole ainakaan alkuperältään ranskalainen nimi. Nimi
kuulostaisi saksan- tai hollanninkieliseltä. Tietosanakirjani tuntee
henkilön nimeltä Jacques Loeb, joka oli saksalais-yhdysvaltalainen biologi,
ja ääntämisohjeena on [lø:p].

Näyttäisi vähän siltä, että "Loeb" on alkujaan saksanjuutalaisten käyttämä
sukunimi, joka esiintyy myös asussa "Löb" ja on peräisin jostakin saksan tai
jiddišin kielen muodosta ja tarkoittaa alkujaan leijonaa (nykysaksan
yleiskielen Löwe). Ymmärrettävistä syistä nimestä käytettiin muilla
kielialueilla kirjoitusasua "Loeb".

Ranskalaisilla on kyllä taipumus mukauttaa vieraita nimiä kieleensä joskus
hassusti, kuten Citroën, jossa o ja e ääntyvät erikseen vaikka
alkuperäisessä hollanninkielisessä nimessä ne ääntyvät pitkänä u:na.

Mutta selvää on, että ranskan kannalta asu Loeb on epäselvä, joten
pyrkimykset selventää ääntämystä ovat ymmärrettäviä. Vähemmän ymmärrettävää
on, että "selvennyksissä" asu Loëb näyttäisi olevan yleisempi kuin Lœb! Tämä
jopa viittaisi siihen, että nimi saatetaan ääntää molemmilla tavoilla.
--
Jukka K. Korpela ("Yucca")
http://www.cs.tut.fi/~jkorpela/
Timo Salmi
2006-08-27 00:47:37 UTC
Permalink
Niin, esimerkiksi ystävämme Iosif Vissarionovit¨ D¸uga¨vili. Ei
tuota nimeä ikinä näe oikein kirjoitettuna.
Enkä nähnyt nytkään Mozillalla ennenkuin arvoin viestin lähdekoodista
käytetyn Content-Type: text/plain; charset=ISO-8859-15; format=flowed
koodituksen.

Arpokaa halutessanne jatkot.

All the best, Timo
--
Prof. Timo Salmi ftp & http://garbo.uwasa.fi/ archives 193.166.120.5
Department of Accounting and Business Finance ; University of Vaasa
mailto:***@uwasa.fi <http://www.uwasa.fi/~ts/> ; FIN-65101, Finland
Timo's FAQ materials at http://www.uwasa.fi/~ts/http/tsfaq.html
Jukka K. Korpela
2006-08-27 06:10:23 UTC
Permalink
Post by Timo Salmi
Niin, esimerkiksi ystävämme Iosif Vissarionovit¨ D¸uga¨vili. Ei tuota
nimeä ikinä näe oikein kirjoitettuna.
Enkä nähnyt nytkään Mozillalla ennenkuin
Yksikön ensimmäisen persoonan käyttö on tällaisessa yhteydessä outoa,
kun liitepartikkeli (konjunktio) -kä ja sana "nytkään" liittävät
virkkeen aiempaan tekstiin. Jos on tarkoitus viitata Långin
Niin-huomautukseen, yksikön ensimmäinen persoona tarkoittaisi, että
pidät itseäsi siinä mainittuna henkilönä eli Stalinina.

Jos taas on tarkoitus viitat virkkeeseen "Ei tuota nimeä ikinä näe
oikein kirjoitettuna", syntyy lähinnä kielenvastainen viittaus:
virkkeessä on yksikön 3. persoona ilman subjektia, siis luonteeltaan
yleinen ilmaus, jossa loogiseksi subjektiksi ajatellaan lähinnä kuka
hyvänsä. Ilmaus on yhtä kielenvastainen tai ainakin kummallinen kuin
seuraava ilmaus olisi: Metsästä ei tänä vuonna löydä sieniä. Enkä
löytänyt nytkään, kun kävin pitkällä retkellä. (Koska yleistävästä
yksikön 3. persoonasta vaihdetaan kirjoittajan omaan persoonaan, pitäisi
-kään-liitepartikkelilla osoittaa lähinnä tämä muutos, esimerkiksi näin:
Enkä minäkään löytänyt nyt - -)
Post by Timo Salmi
arvoin viestin lähdekoodista
käytetyn Content-Type: text/plain; charset=ISO-8859-15; format=flowed
koodituksen.
Etkä senkään jälkeen saanut koodausta oikein omassa viestissäsi, vaan
sen koodaus on ISO-8859-1, jolloin lainauksesi Långin tekstistä on
vääristynyt olennaiselta osin.

Kuten olen aiemmin useasti esittänyt, ISO-8859-15:lle ei juuri ole
järkevää käyttöä. Oman viestini, joka aloitti keskustelun tämän haaran
(siis otsikon "Yhdistelmä oe ranskalaisissa nimissä" alla käytävän
keskustelun), kirjoitin ISO-8859-1:llä, käyttämättä oe-kirjainta, vaikka
asia koski paljolti juuri tätä merkkiä. En kuitenkaan ruvennut
vaihtamaan koodausta vastatessani viestiin, joka oli
ISO-8859-15-koodattu. Sellainenhan olisi lähinnä lisännyt sekaannusta,
ja ne lukijat, jotka selvisivät yhdestä ISO-8859-15-viestistä,
selvinnevät toisestakin.

Erikoisinta asiassa on, että tässä tapauksessa Mozillaksi itseään
kutsuvat ohjelmat eivät ymmärrä edes toisiaan. Lång lähetti
ISO-8859-15-koodatun viestin Mozillalla, ja sinä kerrot, ettei sinun
Mozillasi näyttänyt sitä oikein, ennen kuin erikseen vaihdoit koodauksen.

Kun katson Långin viestiä kolmannella Mozillalla (Mozilla Thunderbird ,
se näkyy aivan oikein. Saisin Mozillan kyllä näyttämään sen väärinkin ja
myös vastaamaan ISO-8859-15-viestiin ISO-8859-1:tä käyttäen mitään
sanomatta. Tämän Mozillan asetuksessa on kohdassa Tools/Options/Fonts
(siis epäloogisessa kohdassa, fonteistahan ei ole kyse) valikot, joista
voidaan valita oletuskoodaus tuleville ja lähteville viesteille
erikseen, ja sitten kaksi valittavissa olevaa kohtaa:

[ ] Apply default to all messages (ignore character encoding specified
by MIME header)
[ ] Always use the default character encoding in replies. (When
unchecked, only new messages use the default.)

Joissakin Mozilloissa nuo saattavat olla oletusarvoisesti valittuina,
mikä on varsin kyseenalaista. On kyseenalaista, pitäisikö tuollaista
voida edes erikseen asettaa. Joka tapauksessa valinnat on syytä poistaa,
jos Mozillaa käyttää.

Jos ensimmäinen on valittuna, Mozilla näyttää viestin esimerkiksi
ISO-8859-1:n mukaisena, vaikka viestissä itsessään selvästi ja
protokollan mukaan ilmoitetaan muuta - siis esimerkiksi hattu-s:n
tilalla näkyy treema. Jos toinen on valittuna, Mozilla lähettää
vastauksen esimerkiksi ISO-8859-1:n mukaisena, vaikka kommentoitavan
viestin koodaus olisi jotain muuta ja siitä olisi lainattu sisältöä,
joka vääristyy, kun koodaus vaihdetaan - esimerkiksi hattu-s muuttuu
treemaksi.

Kirjoitin ISO-8859-1:stä, vaikka sitä käytettäessä Mozilla käytännössä
soveltaa Windows Latin 1 -koodausta, windows-1252. Viestien
näyttämisessä tämä onkin luonnollista. Jos Mozillaan on asetettu
oletuskoodaukseksi ISO-8859-1, se kuitenkin _lähettää_ viestin
windows-1252:n mukaisena ja ilmoittaa tämän myös otsakkeissa, jos
viestiin on kirjoitettu merkkejä, jotka eivät kuulu ISO-8859-1:een mutta
kuuluvat Windows Latin 1:een, kuten hattu-s.

Täten Mozilla siis saattaa hiljaisesti vaihtaa koodauksen toiseksi kuin
käyttäjä on asettanut oletusarvoksi. Tämän se tekee, vaikka edellä
mainitut kohdat olisivat valittuina eli vaikka asetukset näyttävät
sellaisilta, että Mozilla lähettää ISO-8859-1 kaikissa tilanteissa.

Vasta jos viestissä on Windows Latin 1:eenkin kuulumattomia merkkejä,
kuten hattu-c, Mozilla huomauttaa asiasta ja kysyy, lähetettäisiinkö
UTF-8:na vai miten.
Timo Salmi
2006-08-27 08:02:20 UTC
Permalink
Post by Jukka K. Korpela
Post by Timo Salmi
Niin, esimerkiksi ystävämme Iosif Vissarionovit¨ D¸uga¨vili. Ei tuota
Enkä nähnyt nytkään Mozillalla ennenkuin
Yksikön ensimmäisen persoonan käyttö on tällaisessa yhteydessä outoa,
Etkö sinä hyväkäs ikinä opi. Minä valitsen miten kirjoitan, enkä ole
vedettävissä mukaan tuohon ainaiseen epäoleellisuuspeliisi, jolla
yrität osoittaa jotain paremmuuttasi. Mutta annetaan sen olla ja
mennään rauhassa varsinaiseen asiaan.
Post by Jukka K. Korpela
Etkä senkään jälkeen saanut koodausta oikein omassa viestissäsi, vaan
sen koodaus on ISO-8859-1, jolloin lainauksesi Långin tekstistä on
vääristynyt olennaiselta osin.
Juuri niin. Sehän on asian pointti. Eli eri käyttäjien käytännöt ja
asetukset saavat aikaan näillä ohjelmissa melkoisen koodaussotkun.
Post by Jukka K. Korpela
Kuten olen aiemmin useasti esittänyt, ISO-8859-15:lle ei juuri ole
järkevää käyttöä.
Tässä näkemyksemme ovat samat.
Post by Jukka K. Korpela
asia koski paljolti juuri tätä merkkiä. En kuitenkaan ruvennut
vaihtamaan koodausta vastatessani viestiin, joka oli
ISO-8859-15-koodattu. Sellainenhan olisi lähinnä lisännyt sekaannusta,
Aivan. Perusteltu valinta.
Post by Jukka K. Korpela
Erikoisinta asiassa on, että tässä tapauksessa Mozillaksi itseään
kutsuvat ohjelmat eivät ymmärrä edes toisiaan.
Ja nyyssejä käsitellään sotkun lisäämiseksi vielä muillakin
ohjelmilla.
Post by Jukka K. Korpela
Lång lähetti ISO-8859-15-koodatun viestin Mozillalla, ja sinä
kerrot, ettei sinun Mozillasi näyttänyt sitä oikein, ennen kuin
erikseen vaihdoit koodauksen.
Mozillana 1.7.12. Thunderbirdiä 1.5.0.6 en pääse tällä hetkellä
katsomaan.
Post by Jukka K. Korpela
[ ] Apply default to all messages
[ ] Always use the default character encoding in replies.
Joissakin Mozilloissa nuo saattavat olla oletusarvoisesti valittuina,
mikä on varsin kyseenalaista. On kyseenalaista, pitäisikö tuollaista
voida edes erikseen asettaa. Joka tapauksessa valinnat on syytä poistaa,
jos Mozillaa käyttää.
(jne)

Hyvä neuvo. Otetaan varteen. Ja kiitos hyvästä koodauksen ja
vaihtoehtojen analyysistä.

All the best, Timo
--
Prof. Timo Salmi ftp & http://garbo.uwasa.fi/ archives 193.166.120.5
Department of Accounting and Business Finance ; University of Vaasa
mailto:***@uwasa.fi <http://www.uwasa.fi/~ts/> ; FIN-65101, Finland
Timo's FAQ materials at http://www.uwasa.fi/~ts/http/tsfaq.html
Jukka K. Korpela
2006-08-27 08:18:27 UTC
Permalink
Post by Timo Salmi
Etkö sinä hyväkäs ikinä opi. Minä valitsen miten kirjoitan, enkä ole
vedettävissä mukaan tuohon ainaiseen epäoleellisuuspeliisi, jolla
yrität osoittaa jotain paremmuuttasi.
Toivottavasti en todellakaan ikinä opi sinun tavallasi hyökkäilemään
henkilökohtaisesti ja kantamaan kaunaa ihmisille, jotka huomauttavat
virheistäni. Jos sinusta kieliasioihin puuttuminen on epäolennaista, jopa
epäoleellisuuspeliä, et ehkä muista, missä ryhmässä ollaan. Itse asiassa
huomautukseni, josta taisit vetää nenääsi oikein kapallisen herneitä, oli
enemmän kieliasiaa kuin koodauskysymykset ovat.
Post by Timo Salmi
Mutta annetaan sen olla
Et antanut "sen" olla, mitä sitten lienetkin varsinaisesti tarkoittanut
se-sanalla.
Post by Timo Salmi
Post by Jukka K. Korpela
Etkä senkään jälkeen saanut koodausta oikein omassa viestissäsi, vaan
sen koodaus on ISO-8859-1, jolloin lainauksesi Långin tekstistä on
vääristynyt olennaiselta osin.
Juuri niin. Sehän on asian pointti. Eli eri käyttäjien käytännöt ja
asetukset saavat aikaan näillä ohjelmissa melkoisen koodaussotkun.
Etenkin virheelliset asetukset. Tämä oli _minun_ pointtini.
Post by Timo Salmi
Post by Jukka K. Korpela
asia koski paljolti juuri tätä merkkiä. En kuitenkaan ruvennut
vaihtamaan koodausta vastatessani viestiin, joka oli
ISO-8859-15-koodattu. Sellainenhan olisi lähinnä lisännyt
sekaannusta,
Aivan. Perusteltu valinta.
Mutta kuitenkin itse teit toisin. Tosin on hyvin mahdollista, ettei se ollut
valinta lainkaan vaan johtui tietämättömyydestä, joka on sinänsä hyvin
ymmärrettävää, koska Mozilla siis toimii oudosti ja sekavasti. (Kaiken
sotkun takaa hahmottuu kyllä _jonkinlainen_ logiikka, mutta ei
hyväksyttävä.)

Mozilla Thunderbirdissä voi muuten viestinkirjoitustilassa (muistaakseni
komennolla View/Encoding) katsoa, mitä koodausta se aikoo käyttää viestiä
lähettäessään, ja myös vaihtaa koodauksen.
--
Jukka K. Korpela ("Yucca")
http://www.cs.tut.fi/~jkorpela/
Timo Salmi
2006-08-27 08:30:37 UTC
Permalink
Post by Jukka K. Korpela
Post by Timo Salmi
Etkö sinä hyväkäs ikinä opi.
Toivottavasti en todellakaan ikinä opi sinun tavallasi
hyökkäilemään henkilökohtaisesti ja kantamaan kaunaa ihmisille,
jotka huomauttavat virheistäni. Jos sinusta kieliasioihin
puuttuminen on epäolennaista, ...
On vaikea uskoa, että olet sosiaalisesti todellakin niin sokea kuin
mitä kirjoituksesi heijastavat. Harmi, koska sinulla on mahtavasti
hyvää triviatietoa, josta tällä kertaa minäkin toivottavasti hyödyin
varsinaisessa asiassa. Kiitos siitä.

Jatkoja mieluiten ei ollenkaan.

All the best, Timo
--
Prof. Timo Salmi ftp & http://garbo.uwasa.fi/ archives 193.166.120.5
Department of Accounting and Business Finance ; University of Vaasa
mailto:***@uwasa.fi <http://www.uwasa.fi/~ts/> ; FIN-65101, Finland
Timo's FAQ materials at http://www.uwasa.fi/~ts/http/tsfaq.html
Jukka K. Korpela
2006-08-25 08:23:19 UTC
Permalink
Post by Jani Rivinoja
Kun selvittelin Loebin nimen kirjoitusasua Googlella, huomasin
"Sébastien Loeb"
Sébastien "Loeb"
Molemmissa käytin oe-kirjainta. Ensimmäisessä haussa Google palautti
myös ne esiintymät, joissa oli yhdistelmä "oe", mutta toisen haun
tuloksissa oli nimi vain oe-kirjaimen kanssa.
Googlessa on todellakin kummallisuuksia latinalaisen merkistön
lisäkirjainten käsittelyssä, samoin tarkkeiden käsittelyssä. Toiminta tuntuu
myös vaihtelevan. Joskus asia tuntuu yksinkertaiselta: plusmerkki sanan
edessä tarkoittaa tarkkaa vertailua, niin että
+Sébastien
löytää vain ne sivut, joilla nimi on asussa, jossa ensimmäisen e:n päällä on
akuutti, kun taas
Sébastien
löytää myös ne, joilla nimi on vain akuutittomana. Mutta yllättäen
Sebastien
löytää vielä vähän (900 000) enemmän. En ole keksinyt, miten voisi tutkia,
mitä.

Haku
"Sébastien"
tuntuu tarkoittavan samaa kuin
+Sébastien
mutta olen törmännyt myös tilanteisiin, joissa lainausmerkeillä ei ole samaa
vaikutusta kuin edessä olevalla plussalla.

Lainausmerkit kahden tai useamman sanan ympärillä tarkoittavat tunnetusti
ns. fraasihakua eli haetaan sivuja, joilla sanat esiintyvät peräkkäin
kyseisessä järjestyksessä.

Jos haluttaisiin etsiä sivuja, joilla vaikkapa nimi "Sébastien Loëb"
esiintyy juuri tässä asussa (pois lukien versaalin ja gemenan vaihtelu ja
välilyöntien tai välimerkkien esiintyminen sanojen välissä), pitäisi
Googlelle kai sanoa
"+Sébastien +Loëb"
--
Jukka K. Korpela ("Yucca")
http://www.cs.tut.fi/~jkorpela/
Pekka Peura
2006-08-25 09:02:43 UTC
Permalink
Post by Jukka K. Korpela
Googlessa on todellakin kummallisuuksia latinalaisen merkistön
lisäkirjainten käsittelyssä, samoin tarkkeiden käsittelyssä. Toiminta tuntuu
myös vaihtelevan. Joskus asia tuntuu yksinkertaiselta: plusmerkki sanan
Ja kummallisuudet eivät rajoitu pelkästään Googlen-hakuihin. Myöskään
Google Groups ei osaa näyttää oikein ISO Latin-1 ulkopuolisia merkkejä.
(tai ainakaan tämän ryhmän keskustelussa viime aikoina yleistyneitä
hattu-s, oe jne...).
Huomasin tuon, kun alkoi tökkiä joidenkin threadien luku slrn:llä, ja
koitin katsella niitä Googlen kautta, mutta yllätyksekseni ko. merkit
näyttivät yhtä vääriltä selaimella, kuin slrn:n näytössä.

Mutta kieliryhmähän oli vapautettu netiketin (ISO Latin-1)
noudattamisesta? Vai kuinka se menikään Jukka :-)

Pekka
Teemu Likonen
2006-08-25 10:28:35 UTC
Permalink
Myöskään Google Groups ei osaa näyttää oikein ISO Latin-1 ulkopuolisia
merkkejä. (tai ainakaan tämän ryhmän keskustelussa viime aikoina
yleistyneitä hattu-s, oe jne...).
Google Groups osaa näyttää myös Latin 1:n (ISO-8859-1) ulkopuolisia
merkkejä, mikäli viestissä on käytetty UTF-8-koodausta. Teit silti
tavallaan oikeanlaisen huomion. Todellakin näyttää siltä, että
ISO-8859-15-merkistöllä kirjoitetut viestit näytetään ISO-8859-1:nä,
vaikka Content-Type-otsakkeessa merkistö lukisi ihan oikein.

Googlen näkökulmasta ISO-8859-15 on siis huonompi vaihtoehto kuin
ISO-8859-1 tai UTF-8. Teknisesti ISO-8859-1:tä ja -15:tä ei oikein
kunnolla voi erottaa toisistaan (ts. automaattisesti tunnistaa). UTF-8
sen sijaan on helppo tunnistaa. Johtuisikohan ongelma tästä (?).
Jukka K. Korpela
2006-08-25 19:43:32 UTC
Permalink
Post by Teemu Likonen
Todellakin näyttää siltä, että
ISO-8859-15-merkistöllä kirjoitetut viestit näytetään ISO-8859-1:nä,
vaikka Content-Type-otsakkeessa merkistö lukisi ihan oikein.
Googlen softa on tunnettua siitä, että se jättää huomiotta protokollan
mukaisia määrittelyjä ja soveltaa omaa hataraa päättelyään ja arvailuaan
(sivistyssanalla sanoen: heuristiikkaa). Tämä on aika käsittämätöntä
Content-Type-tiedon osalta, mutta aika ymmärrettävää esimerkiksi
verkkosivujen kielimerkkauksen (lang-määritteiden osalta) - niitä
määritteitähän esiintyy aika harvoin, ja niissä on usein väärää tietoa. Sen
sijaan Content-Type on useimmiten mukana ja useimmiten sisältää oikean
tiedon.
Post by Teemu Likonen
Googlen näkökulmasta ISO-8859-15 on siis huonompi vaihtoehto kuin
ISO-8859-1 tai UTF-8.
ISO-8859-15 eli Latin 9 on lähinnä turhuuksien turhuus, mutta siinä on
sentään se siedettävä puoli, että ISO-8859-1:n mukaan tulkittuna se ei
yleensä muutu täysin käsittämättömäksi.
Post by Teemu Likonen
Teknisesti ISO-8859-1:tä ja -15:tä ei oikein
kunnolla voi erottaa toisistaan (ts. automaattisesti tunnistaa).
Ei ainakaan millään yksinkertaisella merkkien analysoinnilla eikä juuri
muutenkaan. Käytännössä ne koodit, joissa on eroja, ovat kyllä sellaisia,
että ISO-8859-1:n kyseisiä merkkejä käytetään varsin harvoin - tavallisimmin
ehkä akuuttia aksenttia ´ (ja sitäkin lähes aina väärin, heittomerkin
sijasta). Näiden koodien esiintyminen ylipäänsä on siis melko vahva vihje
siitä, että data on ISO-8859-15:n eikä ISO-8859-1:n mukaista, jos nämä ovat
vaihtoehdot. Eri asia on, miten voidaan päätellä, että kyse on
jommastakummasta näistä.
Post by Teemu Likonen
UTF-8 sen sijaan on helppo tunnistaa.
Riippuu tilanteesta. Jos oletetaan, että sisältö on jotain länsimaista
kieltä, tunnistaminen onnistuu melko helpolla heuristiikalla, ja sitten
voidaan vielä varmuuden vuoksi tehdä muototarkistus.
Post by Teemu Likonen
Johtuisikohan ongelma tästä (?).
Veikkaisin, että Google ei pidä ISO-8859-15:tä niin merkittävänä, että sitä
kannattaisi yrittääkään käsitellä.
--
Jukka K. Korpela ("Yucca")
http://www.cs.tut.fi/~jkorpela/
Sofiane elHadji
2006-08-22 22:33:54 UTC
Permalink
Post by Jukka K. Korpela
Mutta vaikuttaa ilmeiseltä, että tässä "Notre Dame" (tai oikeammin kai
"Notre-Dame") tarkoittaa meidän rouvaamme eli Neitsyt Mariaa eikä
(jotakin) hänen kunniakseen nimettyä kirkkorakennusta.
Nykyranskan mukaan "Notre Dame" (ilman väliviivaa) on kyllä "meidän
rouvastamme" puhuttaessa oikeampi muoto. Kirkkojen nimissä käytetään kyllä
väliviivaa.
--
- sofiane.
Jukka K. Korpela
2006-08-23 05:13:46 UTC
Permalink
Post by Sofiane elHadji
Post by Jukka K. Korpela
Mutta vaikuttaa ilmeiseltä, että tässä "Notre Dame" (tai oikeammin
kai "Notre-Dame") tarkoittaa meidän rouvaamme eli Neitsyt Mariaa eikä
(jotakin) hänen kunniakseen nimettyä kirkkorakennusta.
Nykyranskan mukaan "Notre Dame" (ilman väliviivaa) on kyllä "meidän
rouvastamme" puhuttaessa oikeampi muoto. Kirkkojen nimissä käytetään
kyllä väliviivaa.
Juuri näin. Anteeksi sekoiluni. _Tarkoitukseni_ oli kirjoittaa, että
alkutekstin ilmauksen "Notre Dame" yhdysmerkittömyys on osaltaan vihje
siitä, että tarkoitetaan Neitsyt Mariaa eikä kirkkorakennusta.
--
Jukka K. Korpela ("Yucca")
http://www.cs.tut.fi/~jkorpela/
Eero Mäki
2006-08-23 09:26:49 UTC
Permalink
Post by Jukka K. Korpela
Post by Sofiane elHadji
Post by Jukka K. Korpela
Mutta vaikuttaa ilmeiseltä, että tässä "Notre Dame" (tai oikeammin
kai "Notre-Dame") tarkoittaa meidän rouvaamme eli Neitsyt Mariaa eikä
(jotakin) hänen kunniakseen nimettyä kirkkorakennusta.
Nykyranskan mukaan "Notre Dame" (ilman väliviivaa) on kyllä "meidän
rouvastamme" puhuttaessa oikeampi muoto. Kirkkojen nimissä käytetään
kyllä väliviivaa.
Juuri näin. Anteeksi sekoiluni. _Tarkoitukseni_ oli kirjoittaa, että
alkutekstin ilmauksen "Notre Dame" yhdysmerkittömyys on osaltaan vihje
siitä, että tarkoitetaan Neitsyt Mariaa eikä kirkkorakennusta.
Nuottijulkaisussa (ensipainos vuodelta 1895) on juuri niin kuin
kirjoitin edellä Priere a Notre Dame ilman yhdysmerkkiä. Ensimmäinen e
sanassa priere on ilman aksenttia. Merkinneekö se paljoakaan?
Säveltäjällä ei myöskään ollut etunimeä - vain etukirjain L.

Muuten huomasitteko juttuani Ranskalainen Sibelius, jossa totesin, että
kirjantekijän Marc Vignalin mukaan Turun Tuomiokirkko on ranskaksi
L'eglise Notre Dame de Turku.

Eero
Sofiane elHadji
2006-08-23 14:29:46 UTC
Permalink
Post by Eero Mäki
Nuottijulkaisussa (ensipainos vuodelta 1895) on juuri niin kuin
kirjoitin edellä Priere a Notre Dame ilman yhdysmerkkiä. Ensimmäinen e
sanassa priere on ilman aksenttia. Merkinneekö se paljoakaan?
Merkitsee suurin piirtein yhtä paljon kuin ä:n ja ö:n pisteiden jättäminen
pois suomenkielisessä tekstissä. Eli jos sana "priere" olisi olemassa, niin
se lausuttaisiin eri tavalla kuin prière.

Myöskään "a" ei ole ranskan kielessä oikea sana, vaan se on à.
--
- sofiane.
H. Markus Lang
2006-08-23 15:08:31 UTC
Permalink
Post by Sofiane elHadji
Myöskään "a" ei ole ranskan kielessä oikea sana, vaan se on à.
"A" on avoir-verbin taivutusmuoto. Il y a beaucoup de choses dans ma
chambre.
Post by Sofiane elHadji
Aksenttien jättäminen pois suuraakkosten päältä on ranskassa melko
tavallista.
...mutta vastoin Ranskan akatemian suositusta. (Kukahan löytäisi sen
linkin?)

-----------------------------
***@elisanet.fi
http://www.elisanet.fi/mlang/
Jukka K. Korpela
2006-08-23 17:18:05 UTC
Permalink
Post by H. Markus Lang
Post by Jukka Kohonen
Aksenttien jättäminen pois suuraakkosten päältä on ranskassa melko
tavallista.
...mutta vastoin Ranskan akatemian suositusta. (Kukahan löytäisi sen
linkin?)
http://www.academie-francaise.fr/langue/questions.html#accentuation


Espanjan kielen osalta vastaava kannanotto sisältyy espanjan kielen
akatemioiden liiton dokumenttiin "Ortografía de la lengua española", joka
löytyy sivun
http://www.rae.es/
kautta.
--
Jukka K. Korpela ("Yucca")
http://www.cs.tut.fi/~jkorpela/
Jukka Kohonen
2006-08-23 14:55:51 UTC
Permalink
Post by Eero Mäki
Nuottijulkaisussa (ensipainos vuodelta 1895) on juuri niin kuin
kirjoitin edellä Priere a Notre Dame ilman yhdysmerkkiä. Ensimmäinen e
sanassa priere on ilman aksenttia.
Onko nimi kirjoitettu juuri noin (isot alkukirjaimet, muuten pienellä)
vai ehkä kokonaan suuraakkosin ("PRIERE A NOTRE DAME")?

Aksenttien jättäminen pois suuraakkosten päältä on ranskassa melko
tavallista.
--
***@iki.fi
* Tiesitkö? Iskender-kebabin kehitteli herra Iskender Bursan kaupungista.
Loading...