summaryrefslogtreecommitdiff
path: root/man/nl/man1/dos2unix.pod
diff options
context:
space:
mode:
authorDongHun Kwak <dh0128.kwak@samsung.com>2016-10-20 13:29:18 +0900
committerDongHun Kwak <dh0128.kwak@samsung.com>2016-10-20 13:29:23 +0900
commit988f99500ba83724242b161936adaa960b677653 (patch)
tree4ccd4f309dbe7b257491aeee59fed54b5013bd52 /man/nl/man1/dos2unix.pod
parent7ca016ae3ac8042e2eee9829f6d9d3b644527f4f (diff)
downloaddos2unix-988f99500ba83724242b161936adaa960b677653.tar.gz
dos2unix-988f99500ba83724242b161936adaa960b677653.tar.bz2
dos2unix-988f99500ba83724242b161936adaa960b677653.zip
Imported Upstream version 7.3
Change-Id: I3e22ad31361a5edb8914c1a43b858bab188368e4 Signed-off-by: DongHun Kwak <dh0128.kwak@samsung.com>
Diffstat (limited to 'man/nl/man1/dos2unix.pod')
-rw-r--r--man/nl/man1/dos2unix.pod104
1 files changed, 94 insertions, 10 deletions
diff --git a/man/nl/man1/dos2unix.pod b/man/nl/man1/dos2unix.pod
index 7b346fc..a920c11 100644
--- a/man/nl/man1/dos2unix.pod
+++ b/man/nl/man1/dos2unix.pod
@@ -86,7 +86,7 @@ Alleen regeleindes converteren. Dit is de standaardconversiemodus.
=item B<-iso>
Conversie tussen de tekensets DOS en ISO-8859-1. Zie ook de sectie
-CONVERSIEMODI.
+B<CONVERSIEMODI>.
=item B<-1252>
@@ -128,6 +128,73 @@ standaardgedrag bij conversie naar DOS. Zie ook optie C<-r>.
De te gebruiken conversiemodus. CONVERSIEMODUS kan zijn: I<ascii>, I<7bit>,
I<iso>, of I<mac>, waarbij ascii de standaardinstelling is.
+=item B<-D>, B<--display-enc CODERING>
+
+De te gebruiken tekencodering voor weergegeven tekst. CODERING kan zijn:
+I<ansii>, I<unicode>, of I<utf8>, waarbij ansi de standaardinstelling is.
+
+Deze optie is alleen beschikbaar in dos2unix voor Windows met
+Unicode-bestandsnaam-ondersteuning. Deze optie heeft geen effect op de
+gelezen en geschreven bestandsnamen, maar alleen op hoe deze weergegeven
+worden.
+
+There are several methods for displaying text in a Windows console based on
+the encoding of the text. They all have their own advantages and
+disadvantages.
+
+
+
+=over 4
+
+=item B<ansi>
+
+Dos2unix's default method is to use ANSI encoded text. The advantage is that
+it is backwards compatible. It works with raster and TrueType fonts. In some
+regions you may need to change the active DOS OEM code page to the Windows
+system ANSI code page using the C<chcp> command, because dos2unix uses the
+Windows system code page.
+
+The disadvantage of ansi is that international file names with characters
+not inside the system default code page are not displayed properly. You will
+see a question mark, or a wrong symbol instead. When you don't work with
+foreign file names this method is OK.
+
+=item B<unicode>
+
+The advantage of unicode (the Windows name for UTF-16) encoding is that text
+is usually properly displayed. There is no need to change the active code
+page. You may need to set the console's font to a TrueType font to have
+international characters displayed properly. When a character is not
+included in the TrueType font you usually see a small square, sometimes with
+a question mark in it.
+
+When you use the ConEmu console all text is displayed properly, because
+ConEmu automatically selects a good font.
+
+The disadvantage of unicode is that it is not compatible with ASCII. The
+output is not easy to handle when you redirect it to another program or a
+file. Redirection to a file does not give a correct UTF-16 file.
+
+=item B<utf8>
+
+The advantage of utf8 is that it is compatible with ASCII and when you
+redirect it to a file you get a proper UTF-8 file. You need to set the
+console's font to a TrueType font. With a TrueType font the text is
+displayed similar as with the C<unicode> encoding.
+
+The disadvantage is that when you use the default raster font all non-ASCII
+characters are displayed wrong. Not only unicode file names, but also
+translated messages become unreadable. On Windows configured for an
+East-Asian region you may see a lot of flickering of the console when the
+messages are displayed.
+
+In a ConEmu console the utf8 encoding method works well.
+
+=back
+
+The default encoding can be changed with environment variable
+DOS2UNIX_DISPLAY_ENC by setting it to C<unicode> or C<utf8>.
+
=item B<-f>, B<--force>
Conversie van binaire bestanden afdwingen.
@@ -246,8 +313,8 @@ wordt een UTF-8-BOM geschreven.
Als het invoerbestand in UTF-16 is, en de optie C<-u> is gegeven, dan wordt
een UTF-16-BOM geschreven.
-Gebruik deze optie nooit als de codering van het uitvoerbestand niet UTF-8
-of UTF-16 is. Zie ook de sectie UNICODE.
+Gebruik deze optie nooit als de codering van het uitvoerbestand niet UTF-8,
+UTF-16, of GB18030 is. Zie ook de sectie B<UNICODE>.
@@ -281,7 +348,7 @@ lees/schrijf-rechten wordt alleen ondersteund op Unix.
=item B<-q>, B<--quiet>
-Stille werking. Alle waarschuwingen onderdrukken. De aflsuitwaarde is nul,
+Stille werking. Alle waarschuwingen onderdrukken. De afsluitwaarde is nul,
behalve wanneer verkeerde opties worden gegeven.
=item B<-r>, B<--remove-bom>
@@ -506,6 +573,20 @@ invoerbestand een BOM bevat. Gebruik optie C<-r> om de BOM te verwijderen.
Dos2unix en unix2dos schrijven altijd een BOM wanneer optie C<-m> gebruikt
wordt.
+=head2 Unicode-bestandsnamen op Windows
+
+Dos2unix heeft optionele ondersteuning voor het lezen en schrijven van
+Unicode-bestandsnamen in de Windows Opdrachtprompt. Dit betekent dat
+dos2unix bestanden kan openen waarvan de naam tekens bevat die niet
+voorkomen in de standaard ANSI-codetabel. Om te zien of dos2unix voor
+Windows gecompileerd werd met ondersteuning voor Unicode-bestandsnamen, typt
+u C<dos2unix -V>.
+
+Er zijn enige problemen met het weergeven van Unicode-bestandsnamen in een
+Windows-console; zie bij optie C<-D>, C<--display-enc>. De bestandsnamen
+kunnen verkeerd weergegeven worden, maar de bestanden zullen geschreven
+worden met de correcte naam.
+
=head2 Unicode-voorbeelden
Omzetten van Windows UTF-16 (met BOM) naar Unix UTF-8:
@@ -535,11 +616,10 @@ Unicodetransformatie beschouwd worden. Net als UTF-8 is GB18030 compatibel
met ASCII. GB18030 is ook compatibel met Windows-codetabel 936 (ook wel GBK
genoemd).
-Op Unix/Linux worden UTF-16-bestanden alleen naar GB18030 geconverteerd
-wanneer de taalregio op China ingesteld is en de codering op GB18030.
-Bijvoorbeeld, met de Britse taalregio-instelling C<en_GB.GB18030> zal
-conversie van UTF-16 naar GB18030 niet werken, maar met de Chinese
-instelling C<zh_CN.GB18030> wel.
+Op Unix/Linux worden UTF-16-bestanden naar GB18030 geconverteerd wanneer de
+taalregio-codering GB18030 is. Merk op dat dit alleen werkt als deze
+taalregio-instelling door het systeem ondersteund wordt. Gebruik het
+commando C<locale -a> voor een overzicht van de beschikbare taalregio's.
Op Windows dient u de optie C<-gb> te gebruiken om UTF-16-bestanden naar
GB18030 te converteren.
@@ -611,7 +691,11 @@ om tekstbestanden in een mappenboom recursief om te zetten. Bijvoorbeeld om
alle .txt-bestanden in de mappenboom onder de huidige map te converteren,
typt u:
- find . -name *.txt |xargs dos2unix
+ find . -name '*.txt' | xargs dos2unix
+
+In een Windows Opdrachtprompt kan de volgende opdracht gebruikt worden:
+
+ for /R %G in (*.txt) do dos2unix "%G"
=head1 LOKALISATIE