Sidan http://www.lysator.liu.se/runeberg/status.html är oerhört tung att
läsa in, åtminstone med mina 500 kbit. (Det är ju inte alla som sitter
uppkopplade med 100 Mbit!). Datorn blir praktiskt taget blockerad i
flera minuter.
Skulle man inte kunna dela upp den lite, så att varje bokverk får en
egen sida? Eller åtminstone partitionera den?
Bernhard Johanson
Projekt Runeberg,
De senaste dagarna har jag tagit om hand den sista tidens inkomna
bidrag i indexeringen av uggleupplagan av Nordisk familjebok. De 38
banden omfattar tillsammans 29226 sidor och av dessa är nu 15567 sidor
eller 53 procent indexerade. Vi har alltså passerat hälften...
http://runeberg.org/nf/http://runeberg.org/wiki/Indexering_av_uggleupplagan
Bara 857 av sidorna (3 procent) är korrekturlästa. Visst är det
mycket att korrekturläsa, men man kan ju välja ut några sidor och
artiklar om intressanta ämnen, t.ex. Archimedes eller Ryssläder.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - ditt digitala bibliotek - http://runeberg.org/
Till Tommy Riboe m. fl.
Det finnas faktiskt ett undantag till, nämligen om nästa rad börjar med en
versal, typ Schleswig-Holstein
Sedan är väl frågan om indrag av rad ska avlägsnas, vilket jag tycker.
I gamla OCR, åtminstone, återfinns tabbar och mångdubbla spaces. Kanske även
de bör sållas bort, allt för att underlätta korrekturläsningen.
Vänl.
Bernhard Johanson
----- Original Message -----
From: <runeberg-request(a)lists.lysator.liu.se>
To: <runeberg(a)lists.lysator.liu.se>
Sent: Wednesday, January 28, 2004 11:00 AM
Subject: Runeberg digest, Vol 1 #49 - 5 msgs
> Send Runeberg mailing list submissions to
> runeberg(a)lists.lysator.liu.se
>
> To subscribe or unsubscribe via the World Wide Web, visit
> http://lists.lysator.liu.se/mailman/listinfo/runeberg
> or, via email, send a message with subject or body 'help' to
> runeberg-request(a)lists.lysator.liu.se
>
> You can reach the person managing the list at
> runeberg-admin(a)lists.lysator.liu.se
>
> When replying, please edit your Subject line so it is more specific
> than "Re: Contents of Runeberg digest..."
>
>
> Today's Topics:
>
> 1.
=?iso-8859-1?Q?SV:_=5BRuneberg=5D_Vill_du_hj=E4lpa_Projekt_Runeberg_progr?=
> =?iso-8859-1?Q?ammera=3F?= (Tommy Riboe (E-mail 2))
> 2.
=?iso-8859-1?Q?SV:_=5BRuneberg=5D_Vill_du_hj=E4lpa_Projekt_Runeberg_progr?=
> =?iso-8859-1?Q?ammera=3F?= (Tommy Riboe)
> 3. =?windows-1252?Q? RE: [Runeberg] Vill du hj=E4lpa Projekt Runeberg
progr ammera??= (Ketil Firing Hanssen )
>
> --__--__--
>
> Message: 1
> Reply-To: <tommy.riboe(a)bbab.se>
> From: "Tommy Riboe (E-mail 2)" <tommy.riboe(a)swipnet.se>
> To: <runeberg(a)lists.lysator.liu.se>
> Date: Wed, 28 Jan 2004 00:48:02 +0100
> Subject: [Runeberg]
=?iso-8859-1?Q?SV:_=5BRuneberg=5D_Vill_du_hj=E4lpa_Projekt_Runeberg_progr?=
> =?iso-8859-1?Q?ammera=3F?=
>
> *** omsändning med av listan godkänd mejladress ***
>
> Jag byggde vidare på regexp-exemplet från Bengt och kan nu erbjuda
> nedanstående förslag. Eftersom jag är så gott som nybörjare på Perl så
> skall mitt exempel tas som ett algoritmförslag och kompletteras med
> felhantering och liknande. Dessutom har jag säkert missat något
> undantagsfall. Det verkar i alla fall fungera med den medföljande
> texten utökad med enstaka instanser av mina undantag.
>
> mvh
> Tommy Riboe
>
> #============================================
> #!/bin/perl
> #
> # huvudregel:
> # a) rader vars sista ord slutar med '-' bryts före avstavat ord
> # b) avstavat ord sammanfogas på nästa rad
> # c) indrag bibehålles
> #
> # undantag:
> # a) rad som slutar med tankstreck (ensamt '-')
> # b) rad som slutar med förled i upprepade sammansatta ord
> # c) avstavning i sidans sista rad
> #
> # vid undantag b) flyttas förledet till följande rad
>
>
> seek(STDIN, 0, SEEK_SET);
> $line= "";
> $nextline= "";
> $spill = "";
>
> #if (<STDIN>) {
> # läs in första raden
> $line = <STDIN>;
> {
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> }
> print $line;
>
> while (<STDIN>) {
>
> # testa om nästa rad börjar med "och", "eller"
> # (bör mer naturligt placeras efter nästa sats
> # och använda sig av $nextline)
> if (/^\s*(och|eller).*$/) {
> $spill = $spill . "- ";
> }
>
> # förbered nästa rad
> $nextline = $_;
>
> # sätt ihop marginal + spill + nästa_rad
> $nextline =~ s/(\s*)(.+?)$/$1$spill$2/;
>
> # gör nästa rad till aktuell rad
> $line = $nextline;
>
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> print $line;
> }
> #}
> print "\n(till nästa sida: " . $spill . ")\n";
> #============================================
>
> > -----Ursprungligt meddelande-----
> > Från: runeberg-admin(a)lists.lysator.liu.se
> > [mailto:runeberg-admin@lists.lysator.liu.se]För Bengt J. Olsson
> > Skickat: den 27 januari 2004 00:00
> > Till: runeberg(a)lists.lysator.liu.se; Hans Persson
> > Ämne: [Runeberg] Re: [Runeberg] Vill du hjälpa Projekt Runeberg
> > programmera?
> >
> >
> > Har inte något färdigt program men har följande brott-stycke
> > av ett sånt program;
> >
> > <för varje rad>
> >
> > $line =~ s/(.*) (.+?)-$/$1/;
> >
> > <matchar om sista tecknet på raden är "-";
> > allt utom det avstavade ordet finns kvar i $1;
> > första delen av det avstavade ordet finns i $2>
> >
> > <nästa rad om matchningen lyckades>
> >
> > $line = $2 . $line;
> >
> > <konkatenerar början av det avstavade ordet med nästa rad>
> >
> > M v h Bengt
> >
> > ---
> > Bengt J. Olsson
> > bengt(a)blafs.com
> > http://blafs.com
> >
> >
>
>
> --__--__--
>
> Message: 2
> Reply-To: <tommy.riboe(a)bbab.se>
> From: "Tommy Riboe" <tommy.riboe(a)bbab.se>
> To: <runeberg(a)lists.lysator.liu.se>
> Date: Wed, 28 Jan 2004 00:37:13 +0100
> Subject: [Runeberg]
=?iso-8859-1?Q?SV:_=5BRuneberg=5D_Vill_du_hj=E4lpa_Projekt_Runeberg_progr?=
> =?iso-8859-1?Q?ammera=3F?=
>
> Jag byggde vidare på regexp-exemplet från Bengt och kan nu erbjuda
> nedanstående förslag. Eftersom jag är så gott som nybörjare på Perl så
> skall mitt exempel tas som ett algoritmförslag och kompletteras med
> felhantering och liknande. Dessutom har jag säkert missat något
> undantagsfall. Det verkar i alla fall fungera med den medföljande
> texten utökad med enstaka instanser av mina undantag.
>
> mvh
> Tommy Riboe
>
> #============================================
> #!/bin/perl
> #
> # huvudregel:
> # a) rader vars sista ord slutar med '-' bryts före avstavat ord
> # b) avstavat ord sammanfogas på nästa rad
> # c) indrag bibehålles
> #
> # undantag:
> # a) rad som slutar med tankstreck (ensamt '-')
> # b) rad som slutar med förled i upprepade sammansatta ord
> # c) avstavning i sidans sista rad
> #
> # vid undantag b) flyttas förledet till följande rad
>
>
> seek(STDIN, 0, SEEK_SET);
> $line= "";
> $nextline= "";
> $spill = "";
>
> #if (<STDIN>) {
> # läs in första raden
> $line = <STDIN>;
> {
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> }
> print $line;
>
> while (<STDIN>) {
>
> # testa om nästa rad börjar med "och", "eller"
> # (bör mer naturligt placeras efter nästa sats
> # och använda sig av $nextline)
> if (/^\s*(och|eller).*$/) {
> $spill = $spill . "- ";
> }
>
> # förbered nästa rad
> $nextline = $_;
>
> # sätt ihop marginal + spill + nästa_rad
> $nextline =~ s/(\s*)(.+?)$/$1$spill$2/;
>
> # gör nästa rad till aktuell rad
> $line = $nextline;
>
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> print $line;
> }
> #}
> print "\n(till nästa sida: " . $spill . ")\n";
> #============================================
>
> > -----Ursprungligt meddelande-----
> > Från: runeberg-admin(a)lists.lysator.liu.se
> > [mailto:runeberg-admin@lists.lysator.liu.se]För Bengt J. Olsson
> > Skickat: den 27 januari 2004 00:00
> > Till: runeberg(a)lists.lysator.liu.se; Hans Persson
> > Ämne: [Runeberg] Re: [Runeberg] Vill du hjälpa Projekt Runeberg
> > programmera?
> >
> >
> > Har inte något färdigt program men har följande brott-stycke
> > av ett sånt program;
> >
> > <för varje rad>
> >
> > $line =~ s/(.*) (.+?)-$/$1/;
> >
> > <matchar om sista tecknet på raden är "-";
> > allt utom det avstavade ordet finns kvar i $1;
> > första delen av det avstavade ordet finns i $2>
> >
> > <nästa rad om matchningen lyckades>
> >
> > $line = $2 . $line;
> >
> > <konkatenerar början av det avstavade ordet med nästa rad>
> >
> > M v h Bengt
> >
> > ---
> > Bengt J. Olsson
> > bengt(a)blafs.com
> > http://blafs.com
> >
> >
>
>
> --__--__--
>
> Message: 3
> From: "Ketil Firing Hanssen " <firing(a)spray.no>
> To: runeberg(a)lists.lysator.liu.se
> Subject: =?windows-1252?Q? RE: [Runeberg] Vill du hj=E4lpa Projekt
Runeberg progr ammera??=
> Date: Wed, 28 Jan 2004 08:28:34 +0100
>
> This message is in MIME format. Since your mail reader does not understand
> this format, some or all of this message may not be legible.
>
> --=_NextPart_Lycos_0221701075278514_ID
> Content-Type: text/plain; charset="us-ascii"
> Content-Transfer-Encoding: 7bit
>
> Følgende unntak bør tas hånd om:
>
> Vest-
> Tyskland
>
> Regelen er at neste rad begynner med stor bokstav (evt. unntak hvis hele
ordet er
> skrevet med store bokstaver)
>
> Denne blir vel verre:
>
> romersk-
> katolsk
>
>
> mvh
>
> Ketil F. Hanssen
>
> > ------- Original Message -------
> >
> > From : Tommy Riboe <tommy.riboe(a)bbab.se>
> > Date : Wed, 28 Jan 2004 00:37:13 +0100
> >
> >Jag byggde vidare på regexp-exemplet från Bengt och kan nu erbjuda
> nedanstående förslag. Eftersom jag är så gott som nybörjare på Perl så
> skall mitt exempel tas som ett algoritmförslag och kompletteras med
> felhantering och liknande. Dessutom har jag säkert missat något
> undantagsfall. Det verkar i alla fall fungera med den medföljande
> texten utökad med enstaka instanser av mina undantag.
>
> mvh
> Tommy Riboe
>
> #============================================
> #!/bin/perl
> #
> # huvudregel:
> # a) rader vars sista ord slutar med '-' bryts före avstavat ord
> # b) avstavat ord sammanfogas på nästa rad
> # c) indrag bibehålles
> #
> # undantag:
> # a) rad som slutar med tankstreck (ensamt '-')
> # b) rad som slutar med förled i upprepade sammansatta ord
> # c) avstavning i sidans sista rad
> #
> # vid undantag b) flyttas förledet till följande rad
>
>
> seek(STDIN, 0, SEEK_SET);
> $line= "";
> $nextline= "";
> $spill = "";
>
> #if () {
> # läs in första raden
> $line = ;
> {
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> }
> print $line;
>
> while () {
>
> # testa om nästa rad börjar med "och", "eller"
> # (bör mer naturligt placeras efter nästa sats
> # och använda sig av $nextline)
> if (/^\s*(och|eller).*$/) {
> $spill = $spill . "- ";
> }
>
> # förbered nästa rad
> $nextline = $_;
>
> # sätt ihop marginal + spill + nästa_rad
> $nextline =~ s/(\s*)(.+?)$/$1$spill$2/;
>
> # gör nästa rad till aktuell rad
> $line = $nextline;
>
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> print $line;
> }
> #}
> print "\n(till nästa sida: " . $spill . ")\n";
> #============================================
>
> > -----Ursprungligt meddelande-----
> > Från: runeberg-admin(a)lists.lysator.liu.se
> > [mailto:runeberg-admin@lists.lysator.liu.se]För Bengt J. Olsson
> > Skickat: den 27 januari 2004 00:00
> > Till: runeberg(a)lists.lysator.liu.se; Hans Persson
> > Ämne: [Runeberg] Re: [Runeberg] Vill du hjälpa Projekt Runeberg
> > programmera?
> >
> >
> > Har inte något färdigt program men har följande brott-stycke
> > av ett sånt program;
> >
> >
> >
> > $line =~ s/(.*) (.+?)-$/$1/;
> >
> > allt utom det avstavade ordet finns kvar i $1;
> > första delen av det avstavade ordet finns i $2>
> >
> >
> >
> > $line = $2 . $line;
> >
> >
> >
> > M v h Bengt
> >
> > ---
> > Bengt J. Olsson
> > bengt(a)blafs.com
> > http://blafs.com
> >
> >
>
> _______________________________________________
> Runeberg mailing list
> Runeberg(a)lists.lysator.liu.se
> http://lists.lysator.liu.se/mailman/listinfo/runeberg
>
>
> _________________________________________________________
> Finn dine gamle klassekamerater på
http://klassekamerater.nettavisen.no
>
>
>
> --=_NextPart_Lycos_0221701075278514_ID
> Content-Type: message/rfc822
> Content-Transfer-Encoding: 7bit
> Content-Disposition: inline
>
> Return-Path: <runeberg-admin(a)lists.lysator.liu.se>
> Received: from mail.lysator.liu.se (mail.lysator.liu.se [130.236.254.3])
> by lmin04.st1.spray.net (Postfix) with ESMTP id 6BA036F792
> for <firing(a)spray.no>; Wed, 28 Jan 2004 02:37:22 +0100 (MET)
> Received: from tokaimura.lysator.liu.se (localhost [127.0.0.1])
> by mail.lysator.liu.se (Postfix) with ESMTP
> id 09426D9126; Wed, 28 Jan 2004 02:34:04 +0100 (MET)
> Delivered-To: mailmanalias-post+runeberg(a)lysator.liu.se
> Received: by mail.lysator.liu.se (Postfix, from userid 1646)
> id BC9BED7C9A; Wed, 28 Jan 2004 00:37:32 +0100 (MET)
> Received: from amsfep14-int.chello.nl (amsfep14-int.chello.nl
[213.46.243.22])
> by mail.lysator.liu.se (Postfix) with ESMTP id 9889FD7A72
> for <runeberg(a)lists.lysator.liu.se>; Wed, 28 Jan 2004 00:37:19 +0100 (MET)
> Received: from bbabw2kp2 ([213.89.102.233]) by amsfep14-int.chello.nl
> (InterMail vM.6.00.05.02 201-2115-109-103-20031105) with SMTP
> id <20040127233715.HAEL18174.amsfep14-int.chello.nl@bbabw2kp2>
> for <runeberg(a)lists.lysator.liu.se>;
> Wed, 28 Jan 2004 00:37:15 +0100
> Reply-To: <tommy.riboe(a)bbab.se>
> From: "Tommy Riboe" <tommy.riboe(a)bbab.se>
> To: <runeberg(a)lists.lysator.liu.se>
> Message-ID: <048001c3e52e$7e853020$6f00a8c0(a)bbab.local>
> MIME-Version: 1.0
> Content-Type: text/plain;
> charset="iso-8859-1"
> Content-Transfer-Encoding: 8bit
> X-Priority: 3 (Normal)
> X-MSMail-Priority: Normal
> X-Mailer: Microsoft Outlook CWS, Build 9.0.6604 (9.0.2911.0)
> In-Reply-To: <000a01c3e460$161a1fb0$bd7ba8c0@OPUS>
> X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2800.1165
> Importance: Normal
> X-Spam-Checker-Version: SpamAssassin 2.61-lysator_fetto_1.1
> (1.212.2.1-2003-12-09-exp) on fetto.lysator.liu.se
> X-Spam-Level:
> X-Spam-Status: No, hits=0.2 required=5.0
tests=AWL,RCVD_IN_RFCI,RCVD_IN_SORBS
> autolearn=no version=2.61-lysator_fetto_1.1
> Subject: [Runeberg]
=?iso-8859-1?Q?SV:_=5BRuneberg=5D_Vill_du_hj=E4lpa_Projekt_Runeberg_progr?=
> =?iso-8859-1?Q?ammera=3F?=
> Sender: runeberg-admin(a)lists.lysator.liu.se
> Errors-To: runeberg-admin(a)lists.lysator.liu.se
> X-BeenThere: runeberg(a)lists.lysator.liu.se
> X-Mailman-Version: 2.0.13
> Precedence: bulk
> List-Unsubscribe: <http://lists.lysator.liu.se/mailman/listinfo/runeberg>,
> <mailto:runeberg-request@lists.lysator.liu.se?subject=unsubscribe>
> List-Id: Projekt Runeberg <runeberg.lists.lysator.liu.se>
> List-Post: <mailto:runeberg@lists.lysator.liu.se>
> List-Help: <mailto:runeberg-request@lists.lysator.liu.se?subject=help>
> List-Subscribe: <http://lists.lysator.liu.se/mailman/listinfo/runeberg>,
> <mailto:runeberg-request@lists.lysator.liu.se?subject=subscribe>
> List-Archive: <http://lists.lysator.liu.se/pipermail/runeberg/>
> Date: Wed, 28 Jan 2004 00:37:13 +0100
>
> Jag byggde vidare på regexp-exemplet från Bengt och kan nu erbjuda
> nedanstående förslag. Eftersom jag är så gott som nybörjare på Perl så
> skall mitt exempel tas som ett algoritmförslag och kompletteras med
> felhantering och liknande. Dessutom har jag säkert missat något
> undantagsfall. Det verkar i alla fall fungera med den medföljande
> texten utökad med enstaka instanser av mina undantag.
>
> mvh
> Tommy Riboe
>
> #============================================
> #!/bin/perl
> #
> # huvudregel:
> # a) rader vars sista ord slutar med '-' bryts före avstavat ord
> # b) avstavat ord sammanfogas på nästa rad
> # c) indrag bibehålles
> #
> # undantag:
> # a) rad som slutar med tankstreck (ensamt '-')
> # b) rad som slutar med förled i upprepade sammansatta ord
> # c) avstavning i sidans sista rad
> #
> # vid undantag b) flyttas förledet till följande rad
>
>
> seek(STDIN, 0, SEEK_SET);
> $line= "";
> $nextline= "";
> $spill = "";
>
> #if (<STDIN>) {
> # läs in första raden
> $line = <STDIN>;
> {
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> }
> print $line;
>
> while (<STDIN>) {
>
> # testa om nästa rad börjar med "och", "eller"
> # (bör mer naturligt placeras efter nästa sats
> # och använda sig av $nextline)
> if (/^\s*(och|eller).*$/) {
> $spill = $spill . "- ";
> }
>
> # förbered nästa rad
> $nextline = $_;
>
> # sätt ihop marginal + spill + nästa_rad
> $nextline =~ s/(\s*)(.+?)$/$1$spill$2/;
>
> # gör nästa rad till aktuell rad
> $line = $nextline;
>
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> print $line;
> }
> #}
> print "\n(till nästa sida: " . $spill . ")\n";
> #============================================
>
> > -----Ursprungligt meddelande-----
> > Från: runeberg-admin(a)lists.lysator.liu.se
> > [mailto:runeberg-admin@lists.lysator.liu.se]För Bengt J. Olsson
> > Skickat: den 27 januari 2004 00:00
> > Till: runeberg(a)lists.lysator.liu.se; Hans Persson
> > Ämne: [Runeberg] Re: [Runeberg] Vill du hjälpa Projekt Runeberg
> > programmera?
> >
> >
> > Har inte något färdigt program men har följande brott-stycke
> > av ett sånt program;
> >
> > <för varje rad>
> >
> > $line =~ s/(.*) (.+?)-$/$1/;
> >
> > <matchar om sista tecknet på raden är "-";
> > allt utom det avstavade ordet finns kvar i $1;
> > första delen av det avstavade ordet finns i $2>
> >
> > <nästa rad om matchningen lyckades>
> >
> > $line = $2 . $line;
> >
> > <konkatenerar början av det avstavade ordet med nästa rad>
> >
> > M v h Bengt
> >
> > ---
> > Bengt J. Olsson
> > bengt(a)blafs.com
> > http://blafs.com
> >
> >
>
> _______________________________________________
> Runeberg mailing list
> Runeberg(a)lists.lysator.liu.se
> http://lists.lysator.liu.se/mailman/listinfo/runeberg
>
>
>
> --=_NextPart_Lycos_0221701075278514_ID--
>
>
>
> --__--__--
>
> _______________________________________________
> Runeberg mailing list
> Runeberg(a)lists.lysator.liu.se
> http://lists.lysator.liu.se/mailman/listinfo/runeberg
>
>
> End of Runeberg Digest
F�lgende unntak b�r tas h�nd om:
Vest-
Tyskland
Regelen er at neste rad begynner med stor bokstav (evt. unntak hvis hele ordet er
skrevet med store bokstaver)
Denne blir vel verre:
romersk-
katolsk
mvh
Ketil F. Hanssen
> ------- Original Message -------
>
> From : Tommy Riboe <tommy.riboe(a)bbab.se>
> Date : Wed, 28 Jan 2004 00:37:13 +0100
>
>Jag byggde vidare p� regexp-exemplet fr�n Bengt och kan nu erbjuda
nedanst�ende f�rslag. Eftersom jag �r s� gott som nyb�rjare p� Perl s�
skall mitt exempel tas som ett algoritmf�rslag och kompletteras med
felhantering och liknande. Dessutom har jag s�kert missat n�got
undantagsfall. Det verkar i alla fall fungera med den medf�ljande
texten ut�kad med enstaka instanser av mina undantag.
mvh
Tommy Riboe
#============================================
#!/bin/perl
#
# huvudregel:
# a) rader vars sista ord slutar med '-' bryts f�re avstavat ord
# b) avstavat ord sammanfogas p� n�sta rad
# c) indrag bibeh�lles
#
# undantag:
# a) rad som slutar med tankstreck (ensamt '-')
# b) rad som slutar med f�rled i upprepade sammansatta ord
# c) avstavning i sidans sista rad
#
# vid undantag b) flyttas f�rledet till f�ljande rad
seek(STDIN, 0, SEEK_SET);
$line= "";
$nextline= "";
$spill = "";
#if () {
# l�s in f�rsta raden
$line = ;
{
# avl�gsna ord som slutar med bindestreck fr�n
# slutet av raden, med undantag f�r ensamma
# bindestreck, placera avl�gsnad text i $spill
$line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
$spill = $4;
}
print $line;
while () {
# testa om n�sta rad b�rjar med "och", "eller"
# (b�r mer naturligt placeras efter n�sta sats
# och anv�nda sig av $nextline)
if (/^\s*(och|eller).*$/) {
$spill = $spill . "- ";
}
# f�rbered n�sta rad
$nextline = $_;
# s�tt ihop marginal + spill + n�sta_rad
$nextline =~ s/(\s*)(.+?)$/$1$spill$2/;
# g�r n�sta rad till aktuell rad
$line = $nextline;
# avl�gsna ord som slutar med bindestreck fr�n
# slutet av raden, med undantag f�r ensamma
# bindestreck, placera avl�gsnad text i $spill
$line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
$spill = $4;
print $line;
}
#}
print "\n(till n�sta sida: " . $spill . ")\n";
#============================================
> -----Ursprungligt meddelande-----
> Fr�n: runeberg-admin(a)lists.lysator.liu.se
> [mailto:runeberg-admin@lists.lysator.liu.se]F�r Bengt J. Olsson
> Skickat: den 27 januari 2004 00:00
> Till: runeberg(a)lists.lysator.liu.se; Hans Persson
> �mne: [Runeberg] Re: [Runeberg] Vill du hj�lpa Projekt Runeberg
> programmera?
>
>
> Har inte n�got f�rdigt program men har f�ljande brott-stycke
> av ett s�nt program;
>
>
>
> $line =~ s/(.*) (.+?)-$/$1/;
>
> allt utom det avstavade ordet finns kvar i $1;
> f�rsta delen av det avstavade ordet finns i $2>
>
>
>
> $line = $2 . $line;
>
>
>
> M v h Bengt
>
> ---
> Bengt J. Olsson
> bengt(a)blafs.com
> http://blafs.com
>
>
_______________________________________________
Runeberg mailing list
Runeberg(a)lists.lysator.liu.se
http://lists.lysator.liu.se/mailman/listinfo/runeberg
_________________________________________________________
Finn dine gamle klassekamerater på http://klassekamerater.nettavisen.no
Project Runeberg,
The regular log files for proofreading during November and December
2003 seem to be lost. I hope I will find them later, but all I can do
for now is to reconstruct some data from other log files.
The stats for October 2003 were posted to this list on November 1,
http://lists.lysator.liu.se/pipermail/runeberg/2003-November/000035.html
telling that 5690 contributions were received from 62 identified
volunteers. Edits were made to 4434 different pages in 112 works.
My new reconstructed logfile for October indicates 5861 contributions
(close enough) were received, but the contributor could only be
identified in 4787 or 80% of these cases. The relative order among
the top contributors (agneta, farbror.mats, anders.thapper) is the
same, however.
During November 2003, no less than 9001 contributions were received
with the most active proofreaders being farbror.mats, sebastjan60,
and anders.thapper. The most actively proofread works were ildalihi,
uppfinn, aktamaka, and robotgud.
During December 2003, 6665 contributions were received, with
sebastjan60, steen.roennow, and farbror.mats topping the list. Most
proofread works were dbl, dagligt, ildalihi, and stf.
Perhaps people are using proofreading as a way to keep depression away
during the darkness of November and January?
Month: Contributions:
May 2003 3585 *******
Jun 2003 2354 ****
Jul 2003 1641 ***
Aug 2003 4622 *********
Sep 2003 5417 **********
Oct 2003 5690 ***********
Nov 2003 9001 (1) ******************
Dec 2003 6665 (1) *************
Jan 2004 8793 *****************
Feb 2004 5503 ***********
Mar 2004 4989 *********
(1: based on reconstructed logfiles)
Every asterisk represents 500 contributions.
--
Lars Aronsson (lars(a)aronsson.se)
Project Runeberg - your digital library - http://runeberg.org/
Project Runeberg,
These are the proofreading statistics for March 2004:
A total of 4989 contributions were received from 62 identified
volunteers. The following volunteers were the most active:
Edits Signature
----- ---------
1032 agneta (+ ag)
744 Steen.Roennow
570 fh
471 robro2
415 anders.thapper
323 sven
215 lars
162 fm
150 bernhard.johanson
138 bertil.ohrman
106 rolsav
106 hartwig.alpers
50 john.munkholm
37 christer.romson
33 jens.christian.berlin
16 bernhard (= bernhard johanson?)
14 esoj
13 ejvind
Edits were made to 4384 different pages in 126 different works.
Most edits were made to the following works:
Edits Work Title
----- -------- -----
781 dbl Dansk biografisk Lexikon
523 nf Nordisk familjebok
450 runeberg Samlade skrifter
334 geohist Geografiens och de geografiska upptäckternas historia
311 famijour Svenska Familj-Journalen
274 krig1905 Kriget Norge-Ryssland
221 strindbg Samlade skrifter av August Strindberg
182 snoildik Samlade dikter
180 engsprak Engelsk språklära för skolor
170 sbh Svenskt biografiskt handlexikon
144 lusitani Amerikas hämnd för Lusitania
132 sqvinnor Anteckningar om svenska qvinnor
131 warkonst Från vår konstverld
129 folklynn Det svenska folklynnet
86 salmonsen Salmonsens konversationsleksikon
82 palmtrip Ögonblicksbilder från en tripp till Amerika
80 vintgron Vintergrønt
70 hvar8dag Hvar 8 dag
64 ildalihi Illustreret dansk Litteraturhistorie
52 tiphyche Tidsskrift for Physik og Chemi
43 svetym Svensk etymologisk ordbok
37 hagberg Shakspeare's dramatiska arbeten
36 pht Personhistorisk tidskrift
33 akrell Minnen från Carl XIV:s, Oscar I:s och Carl XV:s dagar
32 svungdom Tal till Sverges ungdom
32 norge80 Norge. Uddrag af ældre og nyere Forfatteres Skrifter
31 abarn Andras barn
--
Lars Aronsson (lars(a)aronsson.se)
Classic Nordic Literature online since 1992 - http://runeberg.org/
Project Runeberg,
The statistics for February 2004:
A total of 5503 contributions were received from 87 identified
volunteers.
The following volunteers were the most active:
Edits Signature
----- ---------
1189 Steen.Roennow
1140 agneta (+ ag)
839 fm (= farbror.mats?)
375 sven
311 fh
278 anders.thapper
138 bertil.ohrman
136 bernhard.johanson
95 jens.christian.berlin
85 lars
71 f95lean
69 hartwig.alpers
53 h.l.bay
52 robro2
50 kj
46 sebastjan60
43 dainis.millers
39 hans
38 tommy.riboe
25 christer.romson
22 rob314159
21 esoj
17 unicorn
15 farbror.mats
14 lagerberg
Edits were made to 4551 different pages in 95 different works. Most
edits were made to the following works:
Edits Work Title
----- -------- -----
1401 dbl Dansk biografisk Lexikon
640 runeberg Samlade skrifter
527 svfldagb En svensk flickas dagbok under krigsfångenskap i Ryssland 1808-1809
382 geohist Geografiens och de geografiska upptäckternas historia
373 cfd Samlade skrifter
337 nf Nordisk familjebok
295 famijour Svenska Familj-Journalen
233 krig1905 Kriget Norge-Ryssland
142 sbh Svenskt biografiskt handlexikon
140 runius Dikter i urval
102 akrell Minnen från Carl XIV:s, Oscar I:s och Carl XV:s dagar
90 topnovel Noveller
87 oxygen Oxygen och Aromasia
65 palmtrip Ögonblicksbilder från en tripp till Amerika
64 husmans Husmanskost
63 univers Universum. Det oändligt stora och det oändligt lilla
59 dagligt Dagligt Liv i Norden
56 engsprak Engelsk språklära för skolor
35 stf Svenska Turistföreningens årsskrift
32 hagberg Shakspeare's dramatiska arbeten
31 scheelch Chemische Abhandlung von der Luft und dem Feuer
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - freie nordische Literatur - http://runeberg.org/
Projekt Runeberg,
Message in English follows.
Glad världsbokdag på er allesammans! Jag vet inte när jag skickade ut
någon statistik över korrekturläsningen senast, så jag gör det nu.
Här kommer statistiken för januari 2004. Nästa månad följer i nästa
brev.
Happy World Book Day, everybody! It was some time since I last
posted statistics on how our proofreaders are doing, so here comes.
These are the statistics for January 2004. Following months are
posted in separate messages.
A total of 8793 contributions were received from 98 identified
volunteers. The following volunteers were the most active:
Edits Signature
----- ---------
1633 agneta
1352 Steen.Roennow (+ steen.roennow)
819 fh
755 sebastjan60
470 fm (= farbror.mats?)
462 lars
348 anders.thapper
282 jens.christian.berlin
263 farbror.mats
256 tommy.riboe
235 sandvikfam
232 unicorn
188 maggieandersson
139 bernhard.johanson
137 christer.romson
131 bertil.ohrman
94 rolsav
58 hartwig.alpers
51 f95lean
46 Ejvind
36 bengt
31 bjorn.b.jonsson
21 soluckmann
21 robro2
19 klaxis
15 nd
14 westerlind
14 tarja.iso-kamula
13 agbeta
12 sandvik (= sandvikfam?)
12 olleolleolle
12 dainis.millers
Edits were made to 7480 different pages in 130 different works.
Most edits were made to the following works:
Edits Work Title
----- -------- -----
1535 dbl Dansk biografisk Lexikon
1069 cfd Samlade skrifter
887 dagligt Dagligt Liv i Norden
581 stf Svenska Turistföreningens årsskrift
534 nf Nordisk familjebok
395 fribyt Fribytaren på Östersjön
267 runeberg Samlade skrifter
249 akrell Minnen från Carl XIV:s, Oscar I:s och Carl XV:s dagar
231 hvarfor Hvarför och derför
216 pht Personhistorisk tidskrift
202 arbherra Arbetets Herravälde
158 famijour Svenska Familj-Journalen
144 hagberg Shakspeare's dramatiska arbeten
142 sbh Svenskt biografiskt handlexikon
138 svungdom Tal till Sverges ungdom
131 ildalihi Illustreret dansk Litteraturhistorie
120 krig1905 Kriget Norge-Ryssland
98 palmtrip Ögonblicksbilder från en tripp till Amerika
98 frostmo Barnen ifrån Frostmofjället
97 hvar8dag Hvar 8 dag
94 wiesminn Bilder och minnen
86 salmonsen Salmonsens konversationsleksikon
86 ljungars Ljungars saga
81 tiphyche Tidsskrift for Physik og Chemi
69 faglarna Svenska fåglarna
66 robotgud Robotarnas gud
66 magi Medeltidens magi
62 uppfinn Uppfinningarnas bok
60 oxygen Oxygen och Aromasia
57 scheelch Chemische Abhandlung von der Luft und dem Feuer
55 topnovel Noveller
51 liwing Dawid Liwingstone, hans person och missionsverksamhet
51 bremlett America of the Fifties: Letters of Fredrika Bremer
41 dalihist Den danske Literaturs Historie fra dens Begyndelse til vore Dage
38 faltskar Fältskärns berättelser
37 sverhist Berättelser ur svenska historien
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg firar världsbokdagen (23 april) och vårens ankomst
med att digitalisera L. Helweg, "Nordisk illustreret
Havebrugsleksikon", 3. udgave, 1920-1921. Detta klassiska danska
uppslagsverk om trädgårdsodlingen innehåller även uppslagsord på
svenska och norska och gör gott skäl för namnet "nordiskt".
http://runeberg.org/havebrug/
Min egen favorit är bilderna på alla "haveredskaber", som börjar på
sidan http://runeberg.org/havebrug/1/0426.html
På vår startsida ( http://runeberg.org/ ) beder vi om pengar för inköp
av ny utrustning till Projekt Runeberg. Vi har fått frågan om hur man
kan donera pengar från Danmark och andra länder, och rätt svar är
banksystemet SWIFT. Datorföreningen LYSATOR har ett konto hos banken
Nordea med SWIFT-koden (BIC) "NDEASESS" och kontonumret (IBAN)
"SE59 9500 0099 6042 0885 6692".
Dessa uppgifter står även på startsidan.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - dit digitale bibliotek - http://runeberg.org/
Projekt Runeberg,
Tydligen var jag för optimistisk när jag klockan 20 tyckte att allting
fungerade, för strax därefter fungerade ingenting längre på Projekt
Runebergs webbplats. Vi hoppas nu att detta kan lösas under måndagen.
För närvarande är det så att sajten i någon mån fungerar, men det tar
ungefär två minuter för varje sida att visas. Trögflytande var ordet.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - ditt digitala bibliotek - http://runeberg.org/