runeberg-request(a)lists.lysator.liu.se wrote:
> Av publiken fordrar detta en viss anpassning, vilket kan upplevas
> som lite jobbigt, men man blir snart van vid det nya.
R{tt kn|ligt, m}ste jag v{l p}st}.
Nog {r v{l svenska tecken b{st som ISO 646-SE sett genom ASCII-
|gon? Dvs. just s} h{r? Klassiskt och enkelt.
Som en annan poet en g}ng sade: 'Falsette glossan kar!'
--
Anders Thulin ath*algonet.se http://www.algonet.se/~ath
Project Runeberg,
During a failed system upgrade yesterday, parts of our website was
unavailable for some hours. Our wiki and the PDF links are still
broken.
The work with the Unicode (UTF-8) conversion continues, as you can
read on our front page, http://runeberg.org/
--
Lars Aronsson (lars(a)aronsson.se)
Project Runeberg - free Nordic literature - http://runeberg.org/
Lars,
Runeberg-list messages are usually difficult for me to read, because of
an encoding-conflict issue. All the Norse characters (ä, æ, œ, ö, ø, å,
etc.) appear strangely in my email reader. I think, at some point,
that a computer is set to send out US-ASCII-encoded text, although the
original article is sent to the list-server in UTF-8. I don't, of
course, know all the issues involved, but I think it would help if both
the originating author's computer and the Listserver were set to UTF-8.
My email program is set to send out UTF-8, so with your indulgence,
here are some characters from a few different languages' character
sets, just to test how they will appear to you all:
भारत आनन्द (bhārat ānanda) þriðjungur söngljóð ЖЙЃЭЩБЯ
אכשמ صخيإو P⋃Q ∃ ἀβδ Λἕὥἧδξϑ hjælpe mig et øjeblik
∫ ∛27≠ π; ⅗ = 1⅘ ≃ 2. ĉĝĥĵŝŭ タㇰゴㇾㇱエㇴプ
blåögd svärdotter ⼢夏夌她婞
If the ListServer is set to transmit Unicode characters, all of the
above should show up fine in the corresponding character sets of
Devanagari, roman transliteration, Icelandic, Russian, Arabic, Hebrew,
logic symbols, Greek, Danish, mathematics, Esperanto, Japanese, Swedish
and Chinese, respectively. (I don't know most of these languages, so
the words formed will often make no sense, but the characters should be
reasonable.)
Med venlig hilsen,
Erik Pedersen
----------------------------------------------------------------------
From: runeberg-request(a)lists.lysator.liu.se
Subject: Runeberg Digest, Vol 12, Issue 2
Date: March 16, 2006 3:00:12 AM PST
To: runeberg(a)lists.lysator.liu.se
Mime-Version: 1.0
Content-Type: text/plain; charset=us-ascii
Content-Transfer-Encoding: 8BIT
----------------------------------------------------------------------
> Message: 1
> Date: Wed, 15 Mar 2006 21:43:17 +0100 (CET)
> From: Lars Aronsson <lars(a)aronsson.se>
> Subject: [Runeberg] Specialtecken och trasiga tecken
> To: runeberg(a)lists.lysator.liu.se
> Message-ID: <Pine.LNX.4.61.0603152129060.18174(a)sara.aronsson.se>
> Content-Type: TEXT/PLAIN; charset=utf-8
>
>
> Jag har nu börjat omvandlingen av våra äldre böcker till UTF-8,
> som är den vanligaste varianten av Unicode. Vad är det? Jo, det
> är en annan kodning av bokstäverna, som gör att det även går att
> återge grekiska, hebreiska, arabiska, kyrilliska (ryska),
> kinesiska, japanska, fonetiska och andra specialtecken.
>
> Sedan starten 1992 har Projekt Runeberg använt en äldre kodning
> som heter ISO 8859-1 och som är anpassad till språken i norra och
> västra Europa. Detta har fungerat hjälpligt för oss, med svenska
> åäö, danska æø, tyska ü och isländska ðþýó.
> --
> Lars Aronsson (lars(a)aronsson.se)
> Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
Jag har nu börjat omvandlingen av våra äldre böcker till UTF-8,
som är den vanligaste varianten av Unicode. Vad är det? Jo, det
är en annan kodning av bokstäverna, som gör att det även går att
återge grekiska, hebreiska, arabiska, kyrilliska (ryska),
kinesiska, japanska, fonetiska och andra specialtecken.
Sedan starten 1992 har Projekt Runeberg använt en äldre kodning
som heter ISO 8859-1 och som är anpassad till språken i norra och
västra Europa. Detta har fungerat hjälpligt för oss, med svenska
åäö, danska æø, tyska ü och isländska ðÐþÞ.° Men inte minst
matematiska skrifter brukar ju ha ekvationer med grekiska
bokstäver. Jag omvandlar nu en bok i taget, och det kommer att ta
tid innan allt är överfört till den nya kodningen.
Nu finns det en risk att det uppstår problem för en del av er.
Kanske blir det bara frågetecken eller ihåliga kvadrater där de
speciella tecknen borde stå. Kanske dyker det upp helt andra
tecken än de som borde stå där. Jag tänkte skriva en instruktiv
sida om detta, som vi kan hänvisa till. Men för det behöver jag
hjälp med skärmbilder på hur problemen kan yttra sig.
Har du sett några missbildade tecken på Projekt Runebergs
webbsidor? Har du möjlighet att ta en skärmdump / screenshot av
det? Jag vore tacksam om du kan maila sådana bilder till mig.
___________________________________________________________________________
────────────────────────────────-──────────────────────────────────────────
Om du nu har möjligheten att skriva alla dessa olika tecken, varför ser då
alla meijl, som kommer från Projekt Runeberg, ut som nedan?
ö = C6, å = C%, ä = C$ osv.
Hälsningar Sven Luckmann
───────────────────────────────────────────────────────────────────────────
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
-----Ursprüngliche Nachricht-----
Von: runeberg-bounces(a)lists.lysator.liu.se [mailto:runeberg-bounces@lists.lysator.liu.se] Im Auftrag von runeberg-request(a)lists.lysator.liu.se
Gesendet: Donnerstag, 16. März 2006 12:00
An: runeberg(a)lists.lysator.liu.se
Betreff: Runeberg Digest, Vol 12, Issue 2
Send Runeberg mailing list submissions to
runeberg(a)lists.lysator.liu.se
To subscribe or unsubscribe via the World Wide Web, visit
http://lists.lysator.liu.se/mailman/listinfo/runeberg
or, via email, send a message with subject or body 'help' to
runeberg-request(a)lists.lysator.liu.se
You can reach the person managing the list at
runeberg-owner(a)lists.lysator.liu.se
When replying, please edit your Subject line so it is more specific
than "Re: Contents of Runeberg digest..."
Today's Topics:
1. Specialtecken och trasiga tecken (Lars Aronsson)
----------------------------------------------------------------------
Message: 1
Date: Wed, 15 Mar 2006 21:43:17 +0100 (CET)
From: Lars Aronsson <lars(a)aronsson.se>
Subject: [Runeberg] Specialtecken och trasiga tecken
To: runeberg(a)lists.lysator.liu.se
Message-ID: <Pine.LNX.4.61.0603152129060.18174(a)sara.aronsson.se>
Content-Type: TEXT/PLAIN; charset=utf-8
Projekt Runeberg,
Jag har nu bC6rjat omvandlingen av vC%ra C$ldre bC6cker till UTF-8,
som C$r den vanligaste varianten av Unicode. Vad C$r det? Jo, det
C$r en annan kodning av bokstC$verna, som gC6r att det C$ven gC%r att
C%terge grekiska, hebreiska, arabiska, kyrilliska (ryska),
kinesiska, japanska, fonetiska och andra specialtecken.
Sedan starten 1992 har Projekt Runeberg anvC$nt en C$ldre kodning
som heter ISO 8859-1 och som C$r anpassad till sprC%ken i norra och
vC$stra Europa. Detta har fungerat hjC$lpligt fC6r oss, med svenska
C%C$C6, danska C&C8, tyska C< och islC$ndska C0C>C=C3. Men inte minst
matematiska skrifter brukar ju ha ekvationer med grekiska
bokstC$ver. Jag omvandlar nu en bok i taget, och det kommer att ta
tid innan allt C$r C6verfC6rt till den nya kodningen.
Nu finns det en risk att det uppstC%r problem fC6r en del av er.
Kanske blir det bara frC%getecken eller ihC%liga kvadrater dC$r de
speciella tecknen borde stC%. Kanske dyker det upp helt andra
tecken C$n de som borde stC% dC$r. Jag tC$nkte skriva en instruktiv
sida om detta, som vi kan hC$nvisa till. Men fC6r det behC6ver jag
hjC$lp med skC$rmbilder pC% hur problemen kan yttra sig.
Har du sett nC%gra missbildade tecken pC% Projekt Runebergs
webbsidor? Har du mC6jlighet att ta en skC$rmdump / screenshot av
det? Jag vore tacksam om du kan maila sC%dana bilder till mig.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
------------------------------
_______________________________________________
Runeberg mailing list
Runeberg(a)lists.lysator.liu.se
http://lists.lysator.liu.se/mailman/listinfo/runeberg
End of Runeberg Digest, Vol 12, Issue 2
***************************************
Projekt Runeberg,
Jag har nu börjat omvandlingen av våra äldre böcker till UTF-8,
som är den vanligaste varianten av Unicode. Vad är det? Jo, det
är en annan kodning av bokstäverna, som gör att det även går att
återge grekiska, hebreiska, arabiska, kyrilliska (ryska),
kinesiska, japanska, fonetiska och andra specialtecken.
Sedan starten 1992 har Projekt Runeberg använt en äldre kodning
som heter ISO 8859-1 och som är anpassad till språken i norra och
västra Europa. Detta har fungerat hjälpligt för oss, med svenska
åäö, danska æø, tyska ü och isländska ðþýó. Men inte minst
matematiska skrifter brukar ju ha ekvationer med grekiska
bokstäver. Jag omvandlar nu en bok i taget, och det kommer att ta
tid innan allt är överfört till den nya kodningen.
Nu finns det en risk att det uppstår problem för en del av er.
Kanske blir det bara frågetecken eller ihåliga kvadrater där de
speciella tecknen borde stå. Kanske dyker det upp helt andra
tecken än de som borde stå där. Jag tänkte skriva en instruktiv
sida om detta, som vi kan hänvisa till. Men för det behöver jag
hjälp med skärmbilder på hur problemen kan yttra sig.
Har du sett några missbildade tecken på Projekt Runebergs
webbsidor? Har du möjlighet att ta en skärmdump / screenshot av
det? Jag vore tacksam om du kan maila sådana bilder till mig.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Project Runeberg,
We're no longer alone in digitizing old literature. New projects
seem to be popping up every month or so. Google Book Search has
been running for little more than a year. Yahoo and Microsoft are
partnering with the Internet Archive to build the Open Content
Alliance. The European Union has said it wants to digitize six
million books before the end of 2007. Litteraturbanken.se is a
Swedish website that was launched this autumn. And now Sweden's
national library is using extra funding to hire unemployed
librarians (since elections are due in September) to start a new
digitization project.
This week I wish I could visit the CeBIT expo in Hanover, Germany,
and at the same time attend a two-day seminar in Michigan, USA.
I can do neither of those, but now I learned that the seminar is
going to be webcasted for free and for everybody. Perhaps you
will find it interesting to learn what people from Google and
the publisher O'Reilly think about "mass digitization", with a
panel discussing the implications for libraries and public sector.
The University of Michigan is one of Google's partner libraries.
Details about the schedule and speakers,
http://lib.umich.edu/mdp/symposium/
Instructions for viewing the Webcast,
http://lib.umich.edu/mdp/symposium/webcast.html
I suppose the times are in Eastern Standard Time (EST), which is
5 hours west of Greenwich and 6 hours west of central Europe.
Here are some highlights from the program:
Friday, March 10, 2006
9:10-10:00 am: Keynote Speaker
Tim O'Reilly, Founder & CEO, O'Reilly Media
5:00-5:30 pm: Adam Smith, Google
That should mean the keynote speech starts at 15:10 Swedish time,
but the first welcome speaker is on already at 14:30. Adam Smith
should be speaking at 23:00 Swedish time.
--
Lars Aronsson (lars(a)aronsson.se)
Project Runeberg - free Nordic literature - http://runeberg.org/
Project Runeberg,
Our catalog of published works has a few news in the left column.
Have a look at http://runeberg.org/katalog.html
The first little icon indicates the type of work: normal book,
music, painting, periodical (the letter "P"), or administrative (a
yellow star). This icon was there yesterday too, but it was just
a normal book for most of our titles. It has now been updated.
Second is a new orange "MARC" icon. For the titles where it is
defined, this is a link to bibliographic information in the online
catalog "Libris" of the Royal Library in Stockholm. MARC is the
name of a file format defined in the 1960s for "MAchine-Readable
Cataloging", which is used internally in library catalogs. You
don't need to be a librarian to understand and appreciate the MARC
link. But librarians are perhaps the only ones who immediately
recognize the name MARC.
This orange MARC icon also shows in the pages of that work, at
least on the front page. In some cases, there are separate
bibliographic records for each part of a multivolume work, and we
do our best to link to them.
Linking to existing bibliographic records is our easy alternative
to creating our own. Some (librarians) have asked us to include
more kinds of information in our own catalog, especially subject
classification, to help users find books about topics like zoology
or electrical engineering. The current MARC links doesn't help
with these kinds of searches. But in theory we could now import
the classification found in existing MARC records. This still
requires some programming, for which we have no time plan. But
for this to be useful, we need to find the right links, the
existing bibliographic records for each of our published titles.
We currently have MARC links for 59 of the 555 titles in our
catalog, so there is some work to do...
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Runebergare,
I Projekt Runebergs in-kö <http://runeberg.org/upload.pl?mode=ocrlist>
ligger just nu 54 volymer. 10 av dem är klara att köra OCR på (de där
det finns länkar i kolumnen "ladda ner bilder"). För den som har ett
OCR-program och är sugen att hjälpa till är det bara att ladda hem något
och köra, och sedan ladda upp resultatet med hjälp av "ladda upp
OCR"-länken.
För de övriga 44 verken i samma lista behöver någon titta igenom att
alla de scannade bilderna ser bra ut innan det går att köra OCR. Det kan
också vem som helst göra.
För ett fåtal av verken har detta redan gjorts och det har upptäckts fel
i scanningen. Det betyder att den som har boken måste göra om scanningen
av ett par sidor. När det är gjort blir även de böckerna klara för OCR.
Hans
--
+---------------------------------------------------------------------+
| Hans Persson http://www.lysator.liu.se/~unicorn/ |
| unicorn(a)lysator.liu.se http://pinkunicornblog.blogspot.com |
+---------------------------------------------------------------------+
Om jag förstått lagstiftningen rätt så upphör upphovsrätten 70 år
efter upphovsmannens död.
Hur fungerar det med t ex ett lexikon?
Det måste vara många medförfattare till ett lexikon och därmed smått
när omöjligt att säkerställa att verket är fritt från upphovsrätt om
det är från i början av 1900-talet.
Ett närbesläktat exempel:
På
http://runeberg.org/tektid/1934m/0002.html
listas ca 25 st medförfattare.
Det låter inte troligt att alla medförfattare avlidit senast 1935
eftersom tidskriften är ifrån 1934. Hur går resonemangen i sådana här
fall?
mvh,
Erik Sjölund
Dear Runeberg,
Tack och gatt nytt ar (my computer won't do the Swedish character on e-mail).
Your list is very valuable to my work. I wish you every success in the new year and continued good works.
Arthur A. Jones