diff options
author | DongHun Kwak <dh0128.kwak@samsung.com> | 2016-10-20 13:29:18 +0900 |
---|---|---|
committer | DongHun Kwak <dh0128.kwak@samsung.com> | 2016-10-20 13:29:23 +0900 |
commit | 988f99500ba83724242b161936adaa960b677653 (patch) | |
tree | 4ccd4f309dbe7b257491aeee59fed54b5013bd52 /man/nl/man1/dos2unix.pod | |
parent | 7ca016ae3ac8042e2eee9829f6d9d3b644527f4f (diff) | |
download | dos2unix-988f99500ba83724242b161936adaa960b677653.tar.gz dos2unix-988f99500ba83724242b161936adaa960b677653.tar.bz2 dos2unix-988f99500ba83724242b161936adaa960b677653.zip |
Imported Upstream version 7.3
Change-Id: I3e22ad31361a5edb8914c1a43b858bab188368e4
Signed-off-by: DongHun Kwak <dh0128.kwak@samsung.com>
Diffstat (limited to 'man/nl/man1/dos2unix.pod')
-rw-r--r-- | man/nl/man1/dos2unix.pod | 104 |
1 files changed, 94 insertions, 10 deletions
diff --git a/man/nl/man1/dos2unix.pod b/man/nl/man1/dos2unix.pod index 7b346fc..a920c11 100644 --- a/man/nl/man1/dos2unix.pod +++ b/man/nl/man1/dos2unix.pod @@ -86,7 +86,7 @@ Alleen regeleindes converteren. Dit is de standaardconversiemodus. =item B<-iso> Conversie tussen de tekensets DOS en ISO-8859-1. Zie ook de sectie -CONVERSIEMODI. +B<CONVERSIEMODI>. =item B<-1252> @@ -128,6 +128,73 @@ standaardgedrag bij conversie naar DOS. Zie ook optie C<-r>. De te gebruiken conversiemodus. CONVERSIEMODUS kan zijn: I<ascii>, I<7bit>, I<iso>, of I<mac>, waarbij ascii de standaardinstelling is. +=item B<-D>, B<--display-enc CODERING> + +De te gebruiken tekencodering voor weergegeven tekst. CODERING kan zijn: +I<ansii>, I<unicode>, of I<utf8>, waarbij ansi de standaardinstelling is. + +Deze optie is alleen beschikbaar in dos2unix voor Windows met +Unicode-bestandsnaam-ondersteuning. Deze optie heeft geen effect op de +gelezen en geschreven bestandsnamen, maar alleen op hoe deze weergegeven +worden. + +There are several methods for displaying text in a Windows console based on +the encoding of the text. They all have their own advantages and +disadvantages. + + + +=over 4 + +=item B<ansi> + +Dos2unix's default method is to use ANSI encoded text. The advantage is that +it is backwards compatible. It works with raster and TrueType fonts. In some +regions you may need to change the active DOS OEM code page to the Windows +system ANSI code page using the C<chcp> command, because dos2unix uses the +Windows system code page. + +The disadvantage of ansi is that international file names with characters +not inside the system default code page are not displayed properly. You will +see a question mark, or a wrong symbol instead. When you don't work with +foreign file names this method is OK. + +=item B<unicode> + +The advantage of unicode (the Windows name for UTF-16) encoding is that text +is usually properly displayed. There is no need to change the active code +page. You may need to set the console's font to a TrueType font to have +international characters displayed properly. When a character is not +included in the TrueType font you usually see a small square, sometimes with +a question mark in it. + +When you use the ConEmu console all text is displayed properly, because +ConEmu automatically selects a good font. + +The disadvantage of unicode is that it is not compatible with ASCII. The +output is not easy to handle when you redirect it to another program or a +file. Redirection to a file does not give a correct UTF-16 file. + +=item B<utf8> + +The advantage of utf8 is that it is compatible with ASCII and when you +redirect it to a file you get a proper UTF-8 file. You need to set the +console's font to a TrueType font. With a TrueType font the text is +displayed similar as with the C<unicode> encoding. + +The disadvantage is that when you use the default raster font all non-ASCII +characters are displayed wrong. Not only unicode file names, but also +translated messages become unreadable. On Windows configured for an +East-Asian region you may see a lot of flickering of the console when the +messages are displayed. + +In a ConEmu console the utf8 encoding method works well. + +=back + +The default encoding can be changed with environment variable +DOS2UNIX_DISPLAY_ENC by setting it to C<unicode> or C<utf8>. + =item B<-f>, B<--force> Conversie van binaire bestanden afdwingen. @@ -246,8 +313,8 @@ wordt een UTF-8-BOM geschreven. Als het invoerbestand in UTF-16 is, en de optie C<-u> is gegeven, dan wordt een UTF-16-BOM geschreven. -Gebruik deze optie nooit als de codering van het uitvoerbestand niet UTF-8 -of UTF-16 is. Zie ook de sectie UNICODE. +Gebruik deze optie nooit als de codering van het uitvoerbestand niet UTF-8, +UTF-16, of GB18030 is. Zie ook de sectie B<UNICODE>. @@ -281,7 +348,7 @@ lees/schrijf-rechten wordt alleen ondersteund op Unix. =item B<-q>, B<--quiet> -Stille werking. Alle waarschuwingen onderdrukken. De aflsuitwaarde is nul, +Stille werking. Alle waarschuwingen onderdrukken. De afsluitwaarde is nul, behalve wanneer verkeerde opties worden gegeven. =item B<-r>, B<--remove-bom> @@ -506,6 +573,20 @@ invoerbestand een BOM bevat. Gebruik optie C<-r> om de BOM te verwijderen. Dos2unix en unix2dos schrijven altijd een BOM wanneer optie C<-m> gebruikt wordt. +=head2 Unicode-bestandsnamen op Windows + +Dos2unix heeft optionele ondersteuning voor het lezen en schrijven van +Unicode-bestandsnamen in de Windows Opdrachtprompt. Dit betekent dat +dos2unix bestanden kan openen waarvan de naam tekens bevat die niet +voorkomen in de standaard ANSI-codetabel. Om te zien of dos2unix voor +Windows gecompileerd werd met ondersteuning voor Unicode-bestandsnamen, typt +u C<dos2unix -V>. + +Er zijn enige problemen met het weergeven van Unicode-bestandsnamen in een +Windows-console; zie bij optie C<-D>, C<--display-enc>. De bestandsnamen +kunnen verkeerd weergegeven worden, maar de bestanden zullen geschreven +worden met de correcte naam. + =head2 Unicode-voorbeelden Omzetten van Windows UTF-16 (met BOM) naar Unix UTF-8: @@ -535,11 +616,10 @@ Unicodetransformatie beschouwd worden. Net als UTF-8 is GB18030 compatibel met ASCII. GB18030 is ook compatibel met Windows-codetabel 936 (ook wel GBK genoemd). -Op Unix/Linux worden UTF-16-bestanden alleen naar GB18030 geconverteerd -wanneer de taalregio op China ingesteld is en de codering op GB18030. -Bijvoorbeeld, met de Britse taalregio-instelling C<en_GB.GB18030> zal -conversie van UTF-16 naar GB18030 niet werken, maar met de Chinese -instelling C<zh_CN.GB18030> wel. +Op Unix/Linux worden UTF-16-bestanden naar GB18030 geconverteerd wanneer de +taalregio-codering GB18030 is. Merk op dat dit alleen werkt als deze +taalregio-instelling door het systeem ondersteund wordt. Gebruik het +commando C<locale -a> voor een overzicht van de beschikbare taalregio's. Op Windows dient u de optie C<-gb> te gebruiken om UTF-16-bestanden naar GB18030 te converteren. @@ -611,7 +691,11 @@ om tekstbestanden in een mappenboom recursief om te zetten. Bijvoorbeeld om alle .txt-bestanden in de mappenboom onder de huidige map te converteren, typt u: - find . -name *.txt |xargs dos2unix + find . -name '*.txt' | xargs dos2unix + +In een Windows Opdrachtprompt kan de volgende opdracht gebruikt worden: + + for /R %G in (*.txt) do dos2unix "%G" =head1 LOKALISATIE |