Hej!
2005-03-11 kl. 00.55 skrev Christer Romson:
Om proof.pl-scriptet kan hantera olika encodings spelar det väl ingen roll vilken encoding man arbetar i?
Så länge proof.pl kan tolka just den encoding som jag jobbar med, så spelar det ingen roll. Om jag hittar på en egen encoding, låt oss kalla den utf-Christer, publicera en specifikation för den och får utf-Christer registrerat som en charset hos IANA, så är den en officiell encoding. Men fram tills dess att någon programmerar om proof.pl till att hantera utf-Christer så funkar det inte att skicka data i det formatet.
Jag tittade igenom min dokumentation till BSD Unix (Mac OS X) och såg att stödet för att kontrollera textkodningar är väldigt dåligt. Så jag gjorde ett litet "DOS-program" som konverterar textfiler till önskad textkodning. En körning ser t.ex. ut så här
naturoch/gotland> reencode -encode:macintosh:iso-8859-1 ocr/ 0001.txt ändrad från macintosh till iso-8859-1 0002.txt ändrad från macintosh till iso-8859-1 ... 314 filer ändrade. naturoch/gotland>
Hursomhelst, just nu funkar det bara till Mac OS och knappt utanför min dator eftersom det var ett snabbhack. Men jag kollade mig runt lite och det finns nog möjlighet att göra detta enkla verktyg oberoende av OS, om det skulle behövas.
/Roger