|
Zeilenumbrüche
in Textdateien werden je nach verwendetem Betriebssystem oder
zugrundeliegender Hardwareplattform unterschiedlich codiert.
Wenn Sie eine Textdatei betrachten, dann werden Sie
feststellen, dass diese aus einer oder mehreren einzelnen Zeilen
besteht. Das ist nun sicherlich keine weltbewegende Neuigkeit.
Wichtig ist aber, sich zu vergegenwärtigen, dass eine Datei
aus Sicht des Betriebssystems nichts weiter als eine
Aneinanderreihung von einzelnen Zeichen ist. Zeilen entstehen
erst, wenn ein ganz bestimmtes Zeichen (oder auch eine
Kombination aus mehreren Zeichen) dieser Schlange als
Zeilenumbruch interpretiert wird. Es gibt also ein
Trennzeichen, das die einzelnen Zeilen voneinander separiert.
Dieses Zeichen oder die Zeichenkombination nennt man Newline.
Dabei ist es zunächst zweitrangig, welches Zeichen das
konkret ist, Hauptsache ist, man kann die Zeilen voneinander
unterscheiden. Doch da entstehen Probleme: Soll eine Software
die Zeichenschlange einer Textdatei korrekt in Zeilen
auftrennen, müssen natürlich alle dasselbe Zeichen als
Newline betrachten. Das ist aber in der Praxis so ganz und gar
nicht der Fall!
Normalerweise
wird auf einer Betriebssystem-Klasse immer die selbe
Zeichenkombination verwendet. Für die verbreitetsten Systeme
heißt das im speziellen:
|
Betriebssystemklasse |
Zeichenkombination |
ASCII-Repräsentation |
|
dezimal
|
oktal
|
hexadezimal
|
|
meiste Unix-Derivate incl.
Linux
|
LF
|
10
|
012
|
0x0A
|
|
MS-DOS, alle
Windows-Varianten
|
CR LF
|
13 10
|
015 012
|
0x0D 0x0A
|
|
Mac-OS
|
CR
|
13
|
015
|
0x0D
|
|
Mit
dieser ActiveX Dll konvertieren Sie problemlos Textdateien aus
den drei benannten Betriebssystemen in ein gewünschtes
Zeichenformat. Folgende Konvertierungen sind möglich:
|
Betriebssystemklasse |
nach DOS |
nach MAC-OS |
nach UNIX |
|
von DOS |
- |
x |
x |
|
von MAC-OS |
x |
- |
x |
|
von Unix |
x |
x |
- |
|
|