Project Runeberg,
During a failed system upgrade yesterday, parts of our website was
unavailable for some hours. Our wiki and the PDF links are still
broken.
The work with the Unicode (UTF-8) conversion continues, as you can
read on our front page, http://runeberg.org/
--
Lars Aronsson (lars(a)aronsson.se)
Project Runeberg - free Nordic literature - http://runeberg.org/
Lars,
Runeberg-list messages are usually difficult for me to read, because of
an encoding-conflict issue. All the Norse characters (ä, æ, œ, ö, ø, å,
etc.) appear strangely in my email reader. I think, at some point,
that a computer is set to send out US-ASCII-encoded text, although the
original article is sent to the list-server in UTF-8. I don't, of
course, know all the issues involved, but I think it would help if both
the originating author's computer and the Listserver were set to UTF-8.
My email program is set to send out UTF-8, so with your indulgence,
here are some characters from a few different languages' character
sets, just to test how they will appear to you all:
भारत आनन्द (bhārat ānanda) þriðjungur söngljóð ЖЙЃЭЩБЯ
אכשמ صخيإو P⋃Q ∃ ἀβδ Λἕὥἧδξϑ hjælpe mig et øjeblik
∫ ∛27≠ π; ⅗ = 1⅘ ≃ 2. ĉĝĥĵŝŭ タㇰゴㇾㇱエㇴプ
blåögd svärdotter ⼢夏夌她婞
If the ListServer is set to transmit Unicode characters, all of the
above should show up fine in the corresponding character sets of
Devanagari, roman transliteration, Icelandic, Russian, Arabic, Hebrew,
logic symbols, Greek, Danish, mathematics, Esperanto, Japanese, Swedish
and Chinese, respectively. (I don't know most of these languages, so
the words formed will often make no sense, but the characters should be
reasonable.)
Med venlig hilsen,
Erik Pedersen
----------------------------------------------------------------------
From: runeberg-request(a)lists.lysator.liu.se
Subject: Runeberg Digest, Vol 12, Issue 2
Date: March 16, 2006 3:00:12 AM PST
To: runeberg(a)lists.lysator.liu.se
Mime-Version: 1.0
Content-Type: text/plain; charset=us-ascii
Content-Transfer-Encoding: 8BIT
----------------------------------------------------------------------
> Message: 1
> Date: Wed, 15 Mar 2006 21:43:17 +0100 (CET)
> From: Lars Aronsson <lars(a)aronsson.se>
> Subject: [Runeberg] Specialtecken och trasiga tecken
> To: runeberg(a)lists.lysator.liu.se
> Message-ID: <Pine.LNX.4.61.0603152129060.18174(a)sara.aronsson.se>
> Content-Type: TEXT/PLAIN; charset=utf-8
>
>
> Jag har nu börjat omvandlingen av våra äldre böcker till UTF-8,
> som är den vanligaste varianten av Unicode. Vad är det? Jo, det
> är en annan kodning av bokstäverna, som gör att det även går att
> återge grekiska, hebreiska, arabiska, kyrilliska (ryska),
> kinesiska, japanska, fonetiska och andra specialtecken.
>
> Sedan starten 1992 har Projekt Runeberg använt en äldre kodning
> som heter ISO 8859-1 och som är anpassad till språken i norra och
> västra Europa. Detta har fungerat hjälpligt för oss, med svenska
> åäö, danska æø, tyska ü och isländska ðþýó.
> --
> Lars Aronsson (lars(a)aronsson.se)
> Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
Jag har nu börjat omvandlingen av våra äldre böcker till UTF-8,
som är den vanligaste varianten av Unicode. Vad är det? Jo, det
är en annan kodning av bokstäverna, som gör att det även går att
återge grekiska, hebreiska, arabiska, kyrilliska (ryska),
kinesiska, japanska, fonetiska och andra specialtecken.
Sedan starten 1992 har Projekt Runeberg använt en äldre kodning
som heter ISO 8859-1 och som är anpassad till språken i norra och
västra Europa. Detta har fungerat hjälpligt för oss, med svenska
åäö, danska æø, tyska ü och isländska ðÐþÞ.° Men inte minst
matematiska skrifter brukar ju ha ekvationer med grekiska
bokstäver. Jag omvandlar nu en bok i taget, och det kommer att ta
tid innan allt är överfört till den nya kodningen.
Nu finns det en risk att det uppstår problem för en del av er.
Kanske blir det bara frågetecken eller ihåliga kvadrater där de
speciella tecknen borde stå. Kanske dyker det upp helt andra
tecken än de som borde stå där. Jag tänkte skriva en instruktiv
sida om detta, som vi kan hänvisa till. Men för det behöver jag
hjälp med skärmbilder på hur problemen kan yttra sig.
Har du sett några missbildade tecken på Projekt Runebergs
webbsidor? Har du möjlighet att ta en skärmdump / screenshot av
det? Jag vore tacksam om du kan maila sådana bilder till mig.
___________________________________________________________________________
────────────────────────────────-──────────────────────────────────────────
Om du nu har möjligheten att skriva alla dessa olika tecken, varför ser då
alla meijl, som kommer från Projekt Runeberg, ut som nedan?
ö = C6, å = C%, ä = C$ osv.
Hälsningar Sven Luckmann
───────────────────────────────────────────────────────────────────────────
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
-----Ursprüngliche Nachricht-----
Von: runeberg-bounces(a)lists.lysator.liu.se [mailto:runeberg-bounces@lists.lysator.liu.se] Im Auftrag von runeberg-request(a)lists.lysator.liu.se
Gesendet: Donnerstag, 16. März 2006 12:00
An: runeberg(a)lists.lysator.liu.se
Betreff: Runeberg Digest, Vol 12, Issue 2
Send Runeberg mailing list submissions to
runeberg(a)lists.lysator.liu.se
To subscribe or unsubscribe via the World Wide Web, visit
http://lists.lysator.liu.se/mailman/listinfo/runeberg
or, via email, send a message with subject or body 'help' to
runeberg-request(a)lists.lysator.liu.se
You can reach the person managing the list at
runeberg-owner(a)lists.lysator.liu.se
When replying, please edit your Subject line so it is more specific
than "Re: Contents of Runeberg digest..."
Today's Topics:
1. Specialtecken och trasiga tecken (Lars Aronsson)
----------------------------------------------------------------------
Message: 1
Date: Wed, 15 Mar 2006 21:43:17 +0100 (CET)
From: Lars Aronsson <lars(a)aronsson.se>
Subject: [Runeberg] Specialtecken och trasiga tecken
To: runeberg(a)lists.lysator.liu.se
Message-ID: <Pine.LNX.4.61.0603152129060.18174(a)sara.aronsson.se>
Content-Type: TEXT/PLAIN; charset=utf-8
Projekt Runeberg,
Jag har nu bC6rjat omvandlingen av vC%ra C$ldre bC6cker till UTF-8,
som C$r den vanligaste varianten av Unicode. Vad C$r det? Jo, det
C$r en annan kodning av bokstC$verna, som gC6r att det C$ven gC%r att
C%terge grekiska, hebreiska, arabiska, kyrilliska (ryska),
kinesiska, japanska, fonetiska och andra specialtecken.
Sedan starten 1992 har Projekt Runeberg anvC$nt en C$ldre kodning
som heter ISO 8859-1 och som C$r anpassad till sprC%ken i norra och
vC$stra Europa. Detta har fungerat hjC$lpligt fC6r oss, med svenska
C%C$C6, danska C&C8, tyska C< och islC$ndska C0C>C=C3. Men inte minst
matematiska skrifter brukar ju ha ekvationer med grekiska
bokstC$ver. Jag omvandlar nu en bok i taget, och det kommer att ta
tid innan allt C$r C6verfC6rt till den nya kodningen.
Nu finns det en risk att det uppstC%r problem fC6r en del av er.
Kanske blir det bara frC%getecken eller ihC%liga kvadrater dC$r de
speciella tecknen borde stC%. Kanske dyker det upp helt andra
tecken C$n de som borde stC% dC$r. Jag tC$nkte skriva en instruktiv
sida om detta, som vi kan hC$nvisa till. Men fC6r det behC6ver jag
hjC$lp med skC$rmbilder pC% hur problemen kan yttra sig.
Har du sett nC%gra missbildade tecken pC% Projekt Runebergs
webbsidor? Har du mC6jlighet att ta en skC$rmdump / screenshot av
det? Jag vore tacksam om du kan maila sC%dana bilder till mig.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
------------------------------
_______________________________________________
Runeberg mailing list
Runeberg(a)lists.lysator.liu.se
http://lists.lysator.liu.se/mailman/listinfo/runeberg
End of Runeberg Digest, Vol 12, Issue 2
***************************************
Projekt Runeberg,
Jag har nu börjat omvandlingen av våra äldre böcker till UTF-8,
som är den vanligaste varianten av Unicode. Vad är det? Jo, det
är en annan kodning av bokstäverna, som gör att det även går att
återge grekiska, hebreiska, arabiska, kyrilliska (ryska),
kinesiska, japanska, fonetiska och andra specialtecken.
Sedan starten 1992 har Projekt Runeberg använt en äldre kodning
som heter ISO 8859-1 och som är anpassad till språken i norra och
västra Europa. Detta har fungerat hjälpligt för oss, med svenska
åäö, danska æø, tyska ü och isländska ðþýó. Men inte minst
matematiska skrifter brukar ju ha ekvationer med grekiska
bokstäver. Jag omvandlar nu en bok i taget, och det kommer att ta
tid innan allt är överfört till den nya kodningen.
Nu finns det en risk att det uppstår problem för en del av er.
Kanske blir det bara frågetecken eller ihåliga kvadrater där de
speciella tecknen borde stå. Kanske dyker det upp helt andra
tecken än de som borde stå där. Jag tänkte skriva en instruktiv
sida om detta, som vi kan hänvisa till. Men för det behöver jag
hjälp med skärmbilder på hur problemen kan yttra sig.
Har du sett några missbildade tecken på Projekt Runebergs
webbsidor? Har du möjlighet att ta en skärmdump / screenshot av
det? Jag vore tacksam om du kan maila sådana bilder till mig.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Project Runeberg,
We're no longer alone in digitizing old literature. New projects
seem to be popping up every month or so. Google Book Search has
been running for little more than a year. Yahoo and Microsoft are
partnering with the Internet Archive to build the Open Content
Alliance. The European Union has said it wants to digitize six
million books before the end of 2007. Litteraturbanken.se is a
Swedish website that was launched this autumn. And now Sweden's
national library is using extra funding to hire unemployed
librarians (since elections are due in September) to start a new
digitization project.
This week I wish I could visit the CeBIT expo in Hanover, Germany,
and at the same time attend a two-day seminar in Michigan, USA.
I can do neither of those, but now I learned that the seminar is
going to be webcasted for free and for everybody. Perhaps you
will find it interesting to learn what people from Google and
the publisher O'Reilly think about "mass digitization", with a
panel discussing the implications for libraries and public sector.
The University of Michigan is one of Google's partner libraries.
Details about the schedule and speakers,
http://lib.umich.edu/mdp/symposium/
Instructions for viewing the Webcast,
http://lib.umich.edu/mdp/symposium/webcast.html
I suppose the times are in Eastern Standard Time (EST), which is
5 hours west of Greenwich and 6 hours west of central Europe.
Here are some highlights from the program:
Friday, March 10, 2006
9:10-10:00 am: Keynote Speaker
Tim O'Reilly, Founder & CEO, O'Reilly Media
5:00-5:30 pm: Adam Smith, Google
That should mean the keynote speech starts at 15:10 Swedish time,
but the first welcome speaker is on already at 14:30. Adam Smith
should be speaking at 23:00 Swedish time.
--
Lars Aronsson (lars(a)aronsson.se)
Project Runeberg - free Nordic literature - http://runeberg.org/