Jag har funderat på ett par saker när det gäller indexering av böcker hos Projekt Runeberg. När en bok har innehållsförteckning, som t.ex. Brehm's Djurens lif, antar jag att ni i redaktionen kan använda texten på de sidorna för att skapa ett index för boken. Finns det något sätt som vi andra kan hjälpa till för att underlätta denna process (förutom att korrläsa rakt av), typ någon form av taggar som man kan lägga till? Jag tycker personligen att det blir lite långtråkigt att klicka igenom hela verket och sätta ut <chapter></chapter> och om ni ändå kan använda innehållsförteckningen så känns det dessutom helt onödigt.
I övrigt undrar jag också om det är möjligt att sätta <i> eller <b> eller kombinationer av de två i en <chapter name=""> eller om det bara blir problem eller är onödigt.
Anders Thapper
Anders Thapper skrev:
Jag har funderat på ett par saker när det gäller indexering av böcker hos Projekt Runeberg. När en bok har innehållsförteckning, som t.ex. Brehm's Djurens lif, antar jag att ni i redaktionen kan använda texten på de sidorna f ör att skapa ett index för boken.
Ja, ibland är detta möjligt, åtminstone för böcker med enkel struktur, som romaner. Det är tveksamt om det fungerar hela vägen för Brehms Djurens lif, men det kan åtminstone fungera som en början. En förutsättning är dock att hela innehållsförteckningen är korrekturläst, så det bör vara första steget.
Finns det något sätt som vi andra kan hjälpa till för att underlätta denna process (förutom att korrläsa rakt av), typ någon form av taggar som man kan lägga till? Jag tycker personligen att det blir lite långtråkigt att klicka igenom hela verket och sätta ut <chapter></chapter> och om ni ändå kan använda innehållsförteckningen så känns det dessutom helt onödigt.
Jag skrev nu sidan http://runeberg.org/wiki/Indexering för att förklara hur det fungerar idag. Jag tror det är viktigt att fler blir delaktiga i diskussionen om vad vi egentligen ska ha de här inscannade böckerna till, så att ni inte inbillar er att vi i redaktionen har en färdig generalplan som ger alla svar. Samtidigt har vi de erfarenheter och existerande utgåvor som vi har från över tio års verksamhet, så förslag bör vara någorlunda förankrade.
I övrigt undrar jag också om det är möjligt att sätta <i> eller <b> eller kombinationer av de två i en <chapter name=""> eller om det bara blir problem eller är onödigt.
Detta har vi hittills inte kunnat hantera, men det är en brist som vi borde åtgärda. Jag vet dock inte vad XML säger om taggar i attributvärden. Kanske borde name vara en tagg i stället för ett attribut?
lör 2004-11-27 klockan 18.31 skrev Lars Aronsson:
Jag skrev nu sidan http://runeberg.org/wiki/Indexering för att förklara hur det fungerar idag. Jag tror det är viktigt att fler blir delaktiga i diskussionen om vad vi egentligen ska ha de här inscannade böckerna till, så att ni inte inbillar er att vi i redaktionen har en färdig generalplan som ger alla svar. Samtidigt har vi de erfarenheter och existerande utgåvor som vi har från över tio års verksamhet, så förslag bör vara någorlunda förankrade.
Den sidan verkar i princip bra. Texten innan den första bilden skulle må bra av en viss omstrukturering.
I övrigt undrar jag också om det är möjligt att sätta <i> eller <b> eller kombinationer av de två i en <chapter name=""> eller om det bara blir problem eller är onödigt.
Detta har vi hittills inte kunnat hantera, men det är en brist som vi borde åtgärda. Jag vet dock inte vad XML säger om taggar i attributvärden. Kanske borde name vara en tagg i stället för ett attribut?
Jag vet inte om det strikt sett är tillåtet eller inte, men däremot är jag rätt säker på att mina script kommer att gå sönder om man gör så idag. Ett sätt att ta sig runt det kan ju vara att skriva något i stil med
<chapter name="Ett [i]betonat[/i] ord.">
och sedan konvertera [] till <> i samband med övrig konvertering. Det är lätt att införa, fast inte speciellt snyggt.
Hans
Hans Persson skrev:
<chapter name="Ett [i]betonat[/i] ord.">
Bättre är förmodligen att, eftersom rubriken brukar återfinnas strax nedanför i texten, omringa den med en särskild tagg, så här:
<chapter> <title>Ett <i>betonat</i> ord</title> av <author>Sven Dufva</author>
text text text </chapter>
Men TEI eller någon annan existerande DTD kanske redan har en lösning för detta, som vi borde införa i stället för att uppfinna vår egen standard?