Till Tommy Riboe m. fl.
Det finnas faktiskt ett undantag till, nämligen om nästa rad börjar med en
versal, typ Schleswig-Holstein
Sedan är väl frågan om indrag av rad ska avlägsnas, vilket jag tycker.
I gamla OCR, åtminstone, återfinns tabbar och mångdubbla spaces. Kanske även
de bör sållas bort, allt för att underlätta korrekturläsningen.
Vänl.
Bernhard Johanson
----- Original Message -----
From: <runeberg-request(a)lists.lysator.liu.se>
To: <runeberg(a)lists.lysator.liu.se>
Sent: Wednesday, January 28, 2004 11:00 AM
Subject: Runeberg digest, Vol 1 #49 - 5 msgs
> Send Runeberg mailing list submissions to
> runeberg(a)lists.lysator.liu.se
>
> To subscribe or unsubscribe via the World Wide Web, visit
> http://lists.lysator.liu.se/mailman/listinfo/runeberg
> or, via email, send a message with subject or body 'help' to
> runeberg-request(a)lists.lysator.liu.se
>
> You can reach the person managing the list at
> runeberg-admin(a)lists.lysator.liu.se
>
> When replying, please edit your Subject line so it is more specific
> than "Re: Contents of Runeberg digest..."
>
>
> Today's Topics:
>
> 1.
=?iso-8859-1?Q?SV:_=5BRuneberg=5D_Vill_du_hj=E4lpa_Projekt_Runeberg_progr?=
> =?iso-8859-1?Q?ammera=3F?= (Tommy Riboe (E-mail 2))
> 2.
=?iso-8859-1?Q?SV:_=5BRuneberg=5D_Vill_du_hj=E4lpa_Projekt_Runeberg_progr?=
> =?iso-8859-1?Q?ammera=3F?= (Tommy Riboe)
> 3. =?windows-1252?Q? RE: [Runeberg] Vill du hj=E4lpa Projekt Runeberg
progr ammera??= (Ketil Firing Hanssen )
>
> --__--__--
>
> Message: 1
> Reply-To: <tommy.riboe(a)bbab.se>
> From: "Tommy Riboe (E-mail 2)" <tommy.riboe(a)swipnet.se>
> To: <runeberg(a)lists.lysator.liu.se>
> Date: Wed, 28 Jan 2004 00:48:02 +0100
> Subject: [Runeberg]
=?iso-8859-1?Q?SV:_=5BRuneberg=5D_Vill_du_hj=E4lpa_Projekt_Runeberg_progr?=
> =?iso-8859-1?Q?ammera=3F?=
>
> *** omsändning med av listan godkänd mejladress ***
>
> Jag byggde vidare på regexp-exemplet från Bengt och kan nu erbjuda
> nedanstående förslag. Eftersom jag är så gott som nybörjare på Perl så
> skall mitt exempel tas som ett algoritmförslag och kompletteras med
> felhantering och liknande. Dessutom har jag säkert missat något
> undantagsfall. Det verkar i alla fall fungera med den medföljande
> texten utökad med enstaka instanser av mina undantag.
>
> mvh
> Tommy Riboe
>
> #============================================
> #!/bin/perl
> #
> # huvudregel:
> # a) rader vars sista ord slutar med '-' bryts före avstavat ord
> # b) avstavat ord sammanfogas på nästa rad
> # c) indrag bibehålles
> #
> # undantag:
> # a) rad som slutar med tankstreck (ensamt '-')
> # b) rad som slutar med förled i upprepade sammansatta ord
> # c) avstavning i sidans sista rad
> #
> # vid undantag b) flyttas förledet till följande rad
>
>
> seek(STDIN, 0, SEEK_SET);
> $line= "";
> $nextline= "";
> $spill = "";
>
> #if (<STDIN>) {
> # läs in första raden
> $line = <STDIN>;
> {
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> }
> print $line;
>
> while (<STDIN>) {
>
> # testa om nästa rad börjar med "och", "eller"
> # (bör mer naturligt placeras efter nästa sats
> # och använda sig av $nextline)
> if (/^\s*(och|eller).*$/) {
> $spill = $spill . "- ";
> }
>
> # förbered nästa rad
> $nextline = $_;
>
> # sätt ihop marginal + spill + nästa_rad
> $nextline =~ s/(\s*)(.+?)$/$1$spill$2/;
>
> # gör nästa rad till aktuell rad
> $line = $nextline;
>
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> print $line;
> }
> #}
> print "\n(till nästa sida: " . $spill . ")\n";
> #============================================
>
> > -----Ursprungligt meddelande-----
> > Från: runeberg-admin(a)lists.lysator.liu.se
> > [mailto:runeberg-admin@lists.lysator.liu.se]För Bengt J. Olsson
> > Skickat: den 27 januari 2004 00:00
> > Till: runeberg(a)lists.lysator.liu.se; Hans Persson
> > Ämne: [Runeberg] Re: [Runeberg] Vill du hjälpa Projekt Runeberg
> > programmera?
> >
> >
> > Har inte något färdigt program men har följande brott-stycke
> > av ett sånt program;
> >
> > <för varje rad>
> >
> > $line =~ s/(.*) (.+?)-$/$1/;
> >
> > <matchar om sista tecknet på raden är "-";
> > allt utom det avstavade ordet finns kvar i $1;
> > första delen av det avstavade ordet finns i $2>
> >
> > <nästa rad om matchningen lyckades>
> >
> > $line = $2 . $line;
> >
> > <konkatenerar början av det avstavade ordet med nästa rad>
> >
> > M v h Bengt
> >
> > ---
> > Bengt J. Olsson
> > bengt(a)blafs.com
> > http://blafs.com
> >
> >
>
>
> --__--__--
>
> Message: 2
> Reply-To: <tommy.riboe(a)bbab.se>
> From: "Tommy Riboe" <tommy.riboe(a)bbab.se>
> To: <runeberg(a)lists.lysator.liu.se>
> Date: Wed, 28 Jan 2004 00:37:13 +0100
> Subject: [Runeberg]
=?iso-8859-1?Q?SV:_=5BRuneberg=5D_Vill_du_hj=E4lpa_Projekt_Runeberg_progr?=
> =?iso-8859-1?Q?ammera=3F?=
>
> Jag byggde vidare på regexp-exemplet från Bengt och kan nu erbjuda
> nedanstående förslag. Eftersom jag är så gott som nybörjare på Perl så
> skall mitt exempel tas som ett algoritmförslag och kompletteras med
> felhantering och liknande. Dessutom har jag säkert missat något
> undantagsfall. Det verkar i alla fall fungera med den medföljande
> texten utökad med enstaka instanser av mina undantag.
>
> mvh
> Tommy Riboe
>
> #============================================
> #!/bin/perl
> #
> # huvudregel:
> # a) rader vars sista ord slutar med '-' bryts före avstavat ord
> # b) avstavat ord sammanfogas på nästa rad
> # c) indrag bibehålles
> #
> # undantag:
> # a) rad som slutar med tankstreck (ensamt '-')
> # b) rad som slutar med förled i upprepade sammansatta ord
> # c) avstavning i sidans sista rad
> #
> # vid undantag b) flyttas förledet till följande rad
>
>
> seek(STDIN, 0, SEEK_SET);
> $line= "";
> $nextline= "";
> $spill = "";
>
> #if (<STDIN>) {
> # läs in första raden
> $line = <STDIN>;
> {
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> }
> print $line;
>
> while (<STDIN>) {
>
> # testa om nästa rad börjar med "och", "eller"
> # (bör mer naturligt placeras efter nästa sats
> # och använda sig av $nextline)
> if (/^\s*(och|eller).*$/) {
> $spill = $spill . "- ";
> }
>
> # förbered nästa rad
> $nextline = $_;
>
> # sätt ihop marginal + spill + nästa_rad
> $nextline =~ s/(\s*)(.+?)$/$1$spill$2/;
>
> # gör nästa rad till aktuell rad
> $line = $nextline;
>
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> print $line;
> }
> #}
> print "\n(till nästa sida: " . $spill . ")\n";
> #============================================
>
> > -----Ursprungligt meddelande-----
> > Från: runeberg-admin(a)lists.lysator.liu.se
> > [mailto:runeberg-admin@lists.lysator.liu.se]För Bengt J. Olsson
> > Skickat: den 27 januari 2004 00:00
> > Till: runeberg(a)lists.lysator.liu.se; Hans Persson
> > Ämne: [Runeberg] Re: [Runeberg] Vill du hjälpa Projekt Runeberg
> > programmera?
> >
> >
> > Har inte något färdigt program men har följande brott-stycke
> > av ett sånt program;
> >
> > <för varje rad>
> >
> > $line =~ s/(.*) (.+?)-$/$1/;
> >
> > <matchar om sista tecknet på raden är "-";
> > allt utom det avstavade ordet finns kvar i $1;
> > första delen av det avstavade ordet finns i $2>
> >
> > <nästa rad om matchningen lyckades>
> >
> > $line = $2 . $line;
> >
> > <konkatenerar början av det avstavade ordet med nästa rad>
> >
> > M v h Bengt
> >
> > ---
> > Bengt J. Olsson
> > bengt(a)blafs.com
> > http://blafs.com
> >
> >
>
>
> --__--__--
>
> Message: 3
> From: "Ketil Firing Hanssen " <firing(a)spray.no>
> To: runeberg(a)lists.lysator.liu.se
> Subject: =?windows-1252?Q? RE: [Runeberg] Vill du hj=E4lpa Projekt
Runeberg progr ammera??=
> Date: Wed, 28 Jan 2004 08:28:34 +0100
>
> This message is in MIME format. Since your mail reader does not understand
> this format, some or all of this message may not be legible.
>
> --=_NextPart_Lycos_0221701075278514_ID
> Content-Type: text/plain; charset="us-ascii"
> Content-Transfer-Encoding: 7bit
>
> Følgende unntak bør tas hånd om:
>
> Vest-
> Tyskland
>
> Regelen er at neste rad begynner med stor bokstav (evt. unntak hvis hele
ordet er
> skrevet med store bokstaver)
>
> Denne blir vel verre:
>
> romersk-
> katolsk
>
>
> mvh
>
> Ketil F. Hanssen
>
> > ------- Original Message -------
> >
> > From : Tommy Riboe <tommy.riboe(a)bbab.se>
> > Date : Wed, 28 Jan 2004 00:37:13 +0100
> >
> >Jag byggde vidare på regexp-exemplet från Bengt och kan nu erbjuda
> nedanstående förslag. Eftersom jag är så gott som nybörjare på Perl så
> skall mitt exempel tas som ett algoritmförslag och kompletteras med
> felhantering och liknande. Dessutom har jag säkert missat något
> undantagsfall. Det verkar i alla fall fungera med den medföljande
> texten utökad med enstaka instanser av mina undantag.
>
> mvh
> Tommy Riboe
>
> #============================================
> #!/bin/perl
> #
> # huvudregel:
> # a) rader vars sista ord slutar med '-' bryts före avstavat ord
> # b) avstavat ord sammanfogas på nästa rad
> # c) indrag bibehålles
> #
> # undantag:
> # a) rad som slutar med tankstreck (ensamt '-')
> # b) rad som slutar med förled i upprepade sammansatta ord
> # c) avstavning i sidans sista rad
> #
> # vid undantag b) flyttas förledet till följande rad
>
>
> seek(STDIN, 0, SEEK_SET);
> $line= "";
> $nextline= "";
> $spill = "";
>
> #if () {
> # läs in första raden
> $line = ;
> {
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> }
> print $line;
>
> while () {
>
> # testa om nästa rad börjar med "och", "eller"
> # (bör mer naturligt placeras efter nästa sats
> # och använda sig av $nextline)
> if (/^\s*(och|eller).*$/) {
> $spill = $spill . "- ";
> }
>
> # förbered nästa rad
> $nextline = $_;
>
> # sätt ihop marginal + spill + nästa_rad
> $nextline =~ s/(\s*)(.+?)$/$1$spill$2/;
>
> # gör nästa rad till aktuell rad
> $line = $nextline;
>
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> print $line;
> }
> #}
> print "\n(till nästa sida: " . $spill . ")\n";
> #============================================
>
> > -----Ursprungligt meddelande-----
> > Från: runeberg-admin(a)lists.lysator.liu.se
> > [mailto:runeberg-admin@lists.lysator.liu.se]För Bengt J. Olsson
> > Skickat: den 27 januari 2004 00:00
> > Till: runeberg(a)lists.lysator.liu.se; Hans Persson
> > Ämne: [Runeberg] Re: [Runeberg] Vill du hjälpa Projekt Runeberg
> > programmera?
> >
> >
> > Har inte något färdigt program men har följande brott-stycke
> > av ett sånt program;
> >
> >
> >
> > $line =~ s/(.*) (.+?)-$/$1/;
> >
> > allt utom det avstavade ordet finns kvar i $1;
> > första delen av det avstavade ordet finns i $2>
> >
> >
> >
> > $line = $2 . $line;
> >
> >
> >
> > M v h Bengt
> >
> > ---
> > Bengt J. Olsson
> > bengt(a)blafs.com
> > http://blafs.com
> >
> >
>
> _______________________________________________
> Runeberg mailing list
> Runeberg(a)lists.lysator.liu.se
> http://lists.lysator.liu.se/mailman/listinfo/runeberg
>
>
> _________________________________________________________
> Finn dine gamle klassekamerater på
http://klassekamerater.nettavisen.no
>
>
>
> --=_NextPart_Lycos_0221701075278514_ID
> Content-Type: message/rfc822
> Content-Transfer-Encoding: 7bit
> Content-Disposition: inline
>
> Return-Path: <runeberg-admin(a)lists.lysator.liu.se>
> Received: from mail.lysator.liu.se (mail.lysator.liu.se [130.236.254.3])
> by lmin04.st1.spray.net (Postfix) with ESMTP id 6BA036F792
> for <firing(a)spray.no>; Wed, 28 Jan 2004 02:37:22 +0100 (MET)
> Received: from tokaimura.lysator.liu.se (localhost [127.0.0.1])
> by mail.lysator.liu.se (Postfix) with ESMTP
> id 09426D9126; Wed, 28 Jan 2004 02:34:04 +0100 (MET)
> Delivered-To: mailmanalias-post+runeberg(a)lysator.liu.se
> Received: by mail.lysator.liu.se (Postfix, from userid 1646)
> id BC9BED7C9A; Wed, 28 Jan 2004 00:37:32 +0100 (MET)
> Received: from amsfep14-int.chello.nl (amsfep14-int.chello.nl
[213.46.243.22])
> by mail.lysator.liu.se (Postfix) with ESMTP id 9889FD7A72
> for <runeberg(a)lists.lysator.liu.se>; Wed, 28 Jan 2004 00:37:19 +0100 (MET)
> Received: from bbabw2kp2 ([213.89.102.233]) by amsfep14-int.chello.nl
> (InterMail vM.6.00.05.02 201-2115-109-103-20031105) with SMTP
> id <20040127233715.HAEL18174.amsfep14-int.chello.nl@bbabw2kp2>
> for <runeberg(a)lists.lysator.liu.se>;
> Wed, 28 Jan 2004 00:37:15 +0100
> Reply-To: <tommy.riboe(a)bbab.se>
> From: "Tommy Riboe" <tommy.riboe(a)bbab.se>
> To: <runeberg(a)lists.lysator.liu.se>
> Message-ID: <048001c3e52e$7e853020$6f00a8c0(a)bbab.local>
> MIME-Version: 1.0
> Content-Type: text/plain;
> charset="iso-8859-1"
> Content-Transfer-Encoding: 8bit
> X-Priority: 3 (Normal)
> X-MSMail-Priority: Normal
> X-Mailer: Microsoft Outlook CWS, Build 9.0.6604 (9.0.2911.0)
> In-Reply-To: <000a01c3e460$161a1fb0$bd7ba8c0@OPUS>
> X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2800.1165
> Importance: Normal
> X-Spam-Checker-Version: SpamAssassin 2.61-lysator_fetto_1.1
> (1.212.2.1-2003-12-09-exp) on fetto.lysator.liu.se
> X-Spam-Level:
> X-Spam-Status: No, hits=0.2 required=5.0
tests=AWL,RCVD_IN_RFCI,RCVD_IN_SORBS
> autolearn=no version=2.61-lysator_fetto_1.1
> Subject: [Runeberg]
=?iso-8859-1?Q?SV:_=5BRuneberg=5D_Vill_du_hj=E4lpa_Projekt_Runeberg_progr?=
> =?iso-8859-1?Q?ammera=3F?=
> Sender: runeberg-admin(a)lists.lysator.liu.se
> Errors-To: runeberg-admin(a)lists.lysator.liu.se
> X-BeenThere: runeberg(a)lists.lysator.liu.se
> X-Mailman-Version: 2.0.13
> Precedence: bulk
> List-Unsubscribe: <http://lists.lysator.liu.se/mailman/listinfo/runeberg>,
> <mailto:runeberg-request@lists.lysator.liu.se?subject=unsubscribe>
> List-Id: Projekt Runeberg <runeberg.lists.lysator.liu.se>
> List-Post: <mailto:runeberg@lists.lysator.liu.se>
> List-Help: <mailto:runeberg-request@lists.lysator.liu.se?subject=help>
> List-Subscribe: <http://lists.lysator.liu.se/mailman/listinfo/runeberg>,
> <mailto:runeberg-request@lists.lysator.liu.se?subject=subscribe>
> List-Archive: <http://lists.lysator.liu.se/pipermail/runeberg/>
> Date: Wed, 28 Jan 2004 00:37:13 +0100
>
> Jag byggde vidare på regexp-exemplet från Bengt och kan nu erbjuda
> nedanstående förslag. Eftersom jag är så gott som nybörjare på Perl så
> skall mitt exempel tas som ett algoritmförslag och kompletteras med
> felhantering och liknande. Dessutom har jag säkert missat något
> undantagsfall. Det verkar i alla fall fungera med den medföljande
> texten utökad med enstaka instanser av mina undantag.
>
> mvh
> Tommy Riboe
>
> #============================================
> #!/bin/perl
> #
> # huvudregel:
> # a) rader vars sista ord slutar med '-' bryts före avstavat ord
> # b) avstavat ord sammanfogas på nästa rad
> # c) indrag bibehålles
> #
> # undantag:
> # a) rad som slutar med tankstreck (ensamt '-')
> # b) rad som slutar med förled i upprepade sammansatta ord
> # c) avstavning i sidans sista rad
> #
> # vid undantag b) flyttas förledet till följande rad
>
>
> seek(STDIN, 0, SEEK_SET);
> $line= "";
> $nextline= "";
> $spill = "";
>
> #if (<STDIN>) {
> # läs in första raden
> $line = <STDIN>;
> {
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> }
> print $line;
>
> while (<STDIN>) {
>
> # testa om nästa rad börjar med "och", "eller"
> # (bör mer naturligt placeras efter nästa sats
> # och använda sig av $nextline)
> if (/^\s*(och|eller).*$/) {
> $spill = $spill . "- ";
> }
>
> # förbered nästa rad
> $nextline = $_;
>
> # sätt ihop marginal + spill + nästa_rad
> $nextline =~ s/(\s*)(.+?)$/$1$spill$2/;
>
> # gör nästa rad till aktuell rad
> $line = $nextline;
>
> # avlägsna ord som slutar med bindestreck från
> # slutet av raden, med undantag för ensamma
> # bindestreck, placera avlägsnad text i $spill
> $line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
> $spill = $4;
> print $line;
> }
> #}
> print "\n(till nästa sida: " . $spill . ")\n";
> #============================================
>
> > -----Ursprungligt meddelande-----
> > Från: runeberg-admin(a)lists.lysator.liu.se
> > [mailto:runeberg-admin@lists.lysator.liu.se]För Bengt J. Olsson
> > Skickat: den 27 januari 2004 00:00
> > Till: runeberg(a)lists.lysator.liu.se; Hans Persson
> > Ämne: [Runeberg] Re: [Runeberg] Vill du hjälpa Projekt Runeberg
> > programmera?
> >
> >
> > Har inte något färdigt program men har följande brott-stycke
> > av ett sånt program;
> >
> > <för varje rad>
> >
> > $line =~ s/(.*) (.+?)-$/$1/;
> >
> > <matchar om sista tecknet på raden är "-";
> > allt utom det avstavade ordet finns kvar i $1;
> > första delen av det avstavade ordet finns i $2>
> >
> > <nästa rad om matchningen lyckades>
> >
> > $line = $2 . $line;
> >
> > <konkatenerar början av det avstavade ordet med nästa rad>
> >
> > M v h Bengt
> >
> > ---
> > Bengt J. Olsson
> > bengt(a)blafs.com
> > http://blafs.com
> >
> >
>
> _______________________________________________
> Runeberg mailing list
> Runeberg(a)lists.lysator.liu.se
> http://lists.lysator.liu.se/mailman/listinfo/runeberg
>
>
>
> --=_NextPart_Lycos_0221701075278514_ID--
>
>
>
> --__--__--
>
> _______________________________________________
> Runeberg mailing list
> Runeberg(a)lists.lysator.liu.se
> http://lists.lysator.liu.se/mailman/listinfo/runeberg
>
>
> End of Runeberg Digest
F�lgende unntak b�r tas h�nd om:
Vest-
Tyskland
Regelen er at neste rad begynner med stor bokstav (evt. unntak hvis hele ordet er
skrevet med store bokstaver)
Denne blir vel verre:
romersk-
katolsk
mvh
Ketil F. Hanssen
> ------- Original Message -------
>
> From : Tommy Riboe <tommy.riboe(a)bbab.se>
> Date : Wed, 28 Jan 2004 00:37:13 +0100
>
>Jag byggde vidare p� regexp-exemplet fr�n Bengt och kan nu erbjuda
nedanst�ende f�rslag. Eftersom jag �r s� gott som nyb�rjare p� Perl s�
skall mitt exempel tas som ett algoritmf�rslag och kompletteras med
felhantering och liknande. Dessutom har jag s�kert missat n�got
undantagsfall. Det verkar i alla fall fungera med den medf�ljande
texten ut�kad med enstaka instanser av mina undantag.
mvh
Tommy Riboe
#============================================
#!/bin/perl
#
# huvudregel:
# a) rader vars sista ord slutar med '-' bryts f�re avstavat ord
# b) avstavat ord sammanfogas p� n�sta rad
# c) indrag bibeh�lles
#
# undantag:
# a) rad som slutar med tankstreck (ensamt '-')
# b) rad som slutar med f�rled i upprepade sammansatta ord
# c) avstavning i sidans sista rad
#
# vid undantag b) flyttas f�rledet till f�ljande rad
seek(STDIN, 0, SEEK_SET);
$line= "";
$nextline= "";
$spill = "";
#if () {
# l�s in f�rsta raden
$line = ;
{
# avl�gsna ord som slutar med bindestreck fr�n
# slutet av raden, med undantag f�r ensamma
# bindestreck, placera avl�gsnad text i $spill
$line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
$spill = $4;
}
print $line;
while () {
# testa om n�sta rad b�rjar med "och", "eller"
# (b�r mer naturligt placeras efter n�sta sats
# och anv�nda sig av $nextline)
if (/^\s*(och|eller).*$/) {
$spill = $spill . "- ";
}
# f�rbered n�sta rad
$nextline = $_;
# s�tt ihop marginal + spill + n�sta_rad
$nextline =~ s/(\s*)(.+?)$/$1$spill$2/;
# g�r n�sta rad till aktuell rad
$line = $nextline;
# avl�gsna ord som slutar med bindestreck fr�n
# slutet av raden, med undantag f�r ensamma
# bindestreck, placera avl�gsnad text i $spill
$line =~ s/(\s*)(.*)( +?)(\S+?)-$/\1\2/;
$spill = $4;
print $line;
}
#}
print "\n(till n�sta sida: " . $spill . ")\n";
#============================================
> -----Ursprungligt meddelande-----
> Fr�n: runeberg-admin(a)lists.lysator.liu.se
> [mailto:runeberg-admin@lists.lysator.liu.se]F�r Bengt J. Olsson
> Skickat: den 27 januari 2004 00:00
> Till: runeberg(a)lists.lysator.liu.se; Hans Persson
> �mne: [Runeberg] Re: [Runeberg] Vill du hj�lpa Projekt Runeberg
> programmera?
>
>
> Har inte n�got f�rdigt program men har f�ljande brott-stycke
> av ett s�nt program;
>
>
>
> $line =~ s/(.*) (.+?)-$/$1/;
>
> allt utom det avstavade ordet finns kvar i $1;
> f�rsta delen av det avstavade ordet finns i $2>
>
>
>
> $line = $2 . $line;
>
>
>
> M v h Bengt
>
> ---
> Bengt J. Olsson
> bengt(a)blafs.com
> http://blafs.com
>
>
_______________________________________________
Runeberg mailing list
Runeberg(a)lists.lysator.liu.se
http://lists.lysator.liu.se/mailman/listinfo/runeberg
_________________________________________________________
Finn dine gamle klassekamerater på http://klassekamerater.nettavisen.no
Projekt Runeberg,
Jag sitter och läser svenska Kungliga Bibliotekets regler för
rättstavning av författarnamn, eller "auktoriserade namnformer" som
det heter. En bok kan ju vara skriven av Tjeckov, Tjechov eller
Tschechow och hur vet man egentligen att man hittar vad man söker?
Nordisk familjebok (1912) berättar om Karl von Linné med K,
Nationalencyklopedin stavar detta Carl med C, medan engelskspråkiga
källor som Wikipedia talar om Carolus Linnaeus.
För Projekt Runebergs del handlar detta om den förteckning eller
"databas" som ligger till grund för våra författarpresentationer.
Förteckningen är en textfil med namn, levnadsår, nationalitet och yrke
för i dagsläget 25000 författare, konstnärer och andra personer. Den
stavning av författarnamnen som finns i denna förteckning är den som
används i vår katalog och i sidhuvudet på författarens verk.
Nu kunde man tro att Kungliga Biblioteket har det enkelt, eftersom de
bara behöver ansluta sig till nutida svensk standard, och alltså kan
strunta i hur utlänningar brukar göra (tyskarna skriver Michail
Gorbatschow, engelsmännen Mikhail Gorbachev) och hur man gjorde förr
(ingen stavar Carl von Linné med K idag). Men just när det gäller
ryska och slaviska namn, har de svenska forskningsbiblioteken tydligen
som tradition att transkribera bokstavstroget medan folkbiblioteken
oftare använder en försvenskad stavning. Nationalencyklopedin verkar
ligga närmare folkbiblioteken och skriver Pusjkin, medan Kungliga
Biblioteket stavar den ryske nationalpoeten Puskin.
När man går in i KB:s katalog Libris webbsök och tittar på någon av de
senare årens Pusjkin-utgåvor och granskar MARC-posten, så hittar man
massvis med stavningsvarianter i fält 900, se t.ex.
http://websok.libris.kb.se/websearch/search?SEARCH_ONR=9174968
och klicka MARC uppe till höger. Här syns att den engelska tryckta
titeln stavar namnet Alexander Pushkin, men den svenska "författare: "
anger Puskin, Aleksandr Sergeevic, 1799-1837.
Nationalencyklopedin är annars en ofta anlitad referens. När man
går till http://ne.se och söker på engelska stavningen Pushkin kommer
man automatiskt rätt. Men söker man på KB:s stavning Puskin, så
undrar söksystemet om man menade Aleksandr Pusjkin eller Augustus
Pugin. Märk att NE stavar Aleksandr med ks och utan e på slutet.
Denna stavning används också av Nordisk familjebok (1915).
Nu kan det tyckas onödigt att bråka om hur ryska författare stavas.
Projekt Runeberg ska ju syssla med nordisk litteratur. Men ofta har
man nytta av att reda ut hur man ska hantera de jobbiga fallen, för då
skaffar man sig principer som håller för alla andra fall man möter.
Och inget hindrar att vi publicerar nordiska översättningar av
ryska författare. Vi har ju svenska översättningen av Bibeln.
Jag skrev idag en kort presentationssida om Aleksandr Pusjkin på
http://www.lysator.liu.se/runeberg/authors/pusjkale.html
Den säger väldigt lite om författaren, men desto mer om hans namn.
Länkarna till Wikipedia och andra källor visar hur olika hans namn kan
stavas på olika språk.
Jag lämnar frågan öppen om vi borde använda engelska eller svenska
eller kanske danska namnformer i Projekt Runebergs förteckning. För
närvarande är det nog lite blandat.
Kungliga Bibliotekets riktlinjer hittar man hos BUS -- enheten för
bibliografisk utveckling och samordning, http://www.kb.se/bus/
under rubriken "auktoriserade namnformer", http://www.kb.se/bus/namn/
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
Från ungefär klockan 16 igår (8 februari) till ungefär klockan 16 idag
(9 februari) var vår korrekturläsning ur funktion. Nu är den tillbaks.
Vi beklagar det inträffade och hoppas det ska fungera bra framöver.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
----- Vidarebefordrat meddelande från segfault(a)chello.se -----
Datum: Wed, 4 Feb 2004 14:40:44 +0100
Från: segfault(a)chello.se
Svar till: segfault(a)chello.se
Ämne: Re: Re: [Runeberg] SV: [Runeberg] Vill du hjälpa Projekt
Runeberg programmera?
Till: Ulf Härnhammar <Ulf.Harnhammar.9485(a)student.uu.se>
> \w ska ju vara den typ av tecken som förekommer i ord. Du kanske måste ställa
in
> någon miljövariabel så att \w passar in på rätt tecken? Annars kan man ju
skriva
> [A-Za-zÅÄÖÉÜåäöéü] i stället för \w.
Ursäkta om någon har svarat på detta förut, men i bash skriver du:
export LANG="sv_SE"
och i perl programmet:
use locale;
då komemr åäö att fungera
----- Slut på vidarebefordrat meddelande -----
--
Ulf Härnhammar
student, Uppsala universitet
redaktör, idiosynkratisk ( http://labben.abm.uu.se/~ulha9485/idiosynkratisk/ )
Ett sådant program finns redan, men skulle behöva förbättringar för att fungera bra med svenska regler. Själv använder jag mig utav en kraftigt nerbantad variant
Steves GUI:
http://mywebpages.comcast.net/thundergnat/guiprep.html
Mitt fulhack:
http://bok.nu/~erik/dl/pgdp_hyphen.tar
Jag tror säkert att ni kan förbättra detta mycket och kanske ge Steve förbättringarna så att de kan köras in i programmet, eftersom 200 böcker/månad använder detta program så är ju alla förbättringar varmt välkomna.
Ursäkta att jag inte har mailat här innan, men läser inte ofta här.
MvH Erik Johansson
Project Runeberg,
On Feburary 5, we celebrate the 200th anniversary of the birth of
Johan Ludvig Runeberg. Project Runeberg's front page has been updated
to remind everybody about this, http://runeberg.org/
If you live in Finland, where "J.L." has the status of national poet,
you can buy "Runeberg's cupcakes", a special kind of pastry at cafes.
If you cannot get this, I suggest you try to find the some replacement
cake or cookies, and have a look at the official celebration website
at http://www.runeberg.net/
Or you can bake your own. Here is the recipe in English,
http://www.dlc.fi/~marianna/gourmet/15_21.htm
--
Lars Aronsson (lars(a)aronsson.se)
Project Runeberg - free Nordic literature - http://runeberg.org/
Projekt Runeberg,
Redan nu verkar den nya servern vara igång. Det kan ta några timmar
innan DNS-systemet* hinner uppdateras. Om man inte får något svar på
www.lysator... så kan man prova att ändra i adressfältet till
sherman.lysator... i stället, t.ex.
http://sherman.lysator.liu.se/runeberg/muslex/0017.html
Detta gäller alltså om man nödvändigt måste titta på en sida idag.
Ändra **inte** länkarna till "sherman" i några webbsidor.
Korrekturläsning, "Recent changes" och liknande som drivs av scripts,
fungerar för närvarande inte, men kommer förhoppningsvis igång snart.
*) DNS eller Domain Name System är Internets infrastruktur för
översättning av domännamn (www.lysator.liu.se) till numeriska
IP-adresser (130.236.254.42). Hittills har "www.lysator" översatts
till Lenins adress (...25) och nu ändras detta till Sherman (...42).
Det tar emellertid några timmar (eller dygn) innan en sådan ändring
hinner slå igenom överallt. Varje Internet-operatör har sin egen
kopia av delar av översättningsdatabasen, som uppdateras med en viss
eftersläpning.
Frågan är nu om vi måste bygga ett mausoleum när Lenin dödförklaras...
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
English summary below.
Idag söndag 1 februari skall Lysator byta webbserver. Detta kan
innebära att Projekt Runeberg (www.lysator.liu.se/runeberg) kan vara
otillgängligt under en tid och att vissa "scripts" (t.ex.
korrekturläsning) kan sluta fungera.
Bytet har varit planerat en längre tid, men fördröjts av olika skäl.
Nu har den gamla servern ("Lenin") emellertid fått hårdvaruproblem,
varför bytet till Lysators nya server ("Sherman") påskyndas.
Projekt Runebergs wiki (http://runeberg.org/wiki/) påverkas inte av
ändringen. Wikin kör nämligen redan på Projekt Runebergs egen server
("Fatabur"), dit vi kommer att flytta hela vårt projekt. Det handlar
alltså om två olika flyttar.
ENGLISH SUMMARY: Project Runeberg expects web server problems today,
Sunday February 1, and possibly the next few days. Scripts such as
the one for proofreading might stop to work, and the whole website
might be unavailable at times. This is because a long planned move
from one webserver ("Lenin") to another ("Sherman") has been speeded
up because of hardware problems. Project Runeberg's wiki
(http://runeberg.org/wiki/) is not affected by this, since it runs on
Project Runeberg's own new server ("Fatabur"), to which we hope to
move our entire project in the near future.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/