1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
|
*****************************************************
* GENERATED FILE, DO NOT EDIT *
* THIS IS NO SOURCE FILE, BUT RESULT OF COMPILATION *
*****************************************************
This file was generated by po4a(7). Do not store it (in VCS, for example),
but store the PO file used as source file by po4a-translate.
In fact, consider this as a binary, and the PO file as a regular .c file:
If the PO get lost, keeping this translation up-to-date will be harder.
=pod
=encoding UTF-8
=head1 NOMBRE
dos2unix - Convertidor de archivos de texto de formato DOS/Mac a Unix y
viceversa
=head1 SINOPSIS
dos2unix [parámetros] [ARCHIVO ...] [-n ARCHIVO_DE_ENTRADA ARCHIVO_DE_SALIDA ...]
unix2dos [parámetros] [ARCHIVO ...] [-n ARCHIVO_DE_ENTRADA ARCHIVO_DE_SALIDA ...]
=head1 DESCRIPCIÓN
El paquete Dos2unix incluye las herramientas C<dos2unix> y C<unix2dos> para
convertir archivos de texto plano en formato DOS o Mac a formato Unix y
viceversa.
En archivos de texto DOS/Windows, un salto de línea, también conocido como
nueva línea, es una combinación de dos caracteres: un retorno de carro (CR)
seguido por un salto de línea (LF). En archivos de texto Unix, un salto de
línea es solamente un carácter: el salto de línea (LF). En archivos de texto
Mac, antes de Mac OS X, un salto de línea era sólo un carácter retorno de
carro (CR). Actualmente, Mac OS usa el estilo Unix de saltos de línea (LF).
Además de saltos de línea, Dos2unix puede también convertir la codificación
de archivos. Unas cuantas páginas de códigos DOS pueden ser convertidas a
Unix Latin-1. Y archivos Unicode de Windows (UTF-16) pueden ser convertidos
a archivos Unicode de Unix (UTF-8).
Los archivos binarios son ignorados automáticamente, a menos que se fuerce
su conversión.
Los archivos no regulares, tales como directorios y FIFO, son ignorados
automáticamente.
Los enlaces simbólicos y sus destinos no son modificados por defecto. Los
enlaces simbólicos pueden opcionalmente ser reemplazados, o la salida puede
ser escrita al destino simbólico del enlace. En Windows no está soportada la
escritura a enlaces simbólicos.
Dos2unix fue modelado después de dos2unix bajo SunOS/Solaris. Hay una
importante diferencia respecto a la versión original SunOS/Solaris. Esta
versión hace, por defecto, la conversión en el mismo archivo (modo de
archivo antiguo), mientras que la versión original de SunOS/Solaris sólo es
compatible con la conversión en archivo emparejado (modo de archivo
nuevo). Véanse las opciones C<-o> y C<-n>.
=head1 PARÁMETROS
=over 4
=item B<-->
Todos los parámetros siguientes son tratados como nombres de archivo. Use
este parámetro si desea convertir archivos cuyos nombres inician con un
guión. Por ejemplo para convertir un archivoo llamado "-foo", use este
comando:
dos2unix -- -foo
O en modo de archivo nuevo:
dos2unix -n -- -foo out.txt
=item B<-ascii>
Sólo convierte los salto de línea. Éste es el modo de conversión por
defecto.
=item B<-iso>
Conversión entre el conjunto de caracteres DOS e ISO-8859-1. Véase también
la sección MODOS DE CONVERSIÓN.
=item B<-1252>
Usa la página de códigos Windows 1252 (Europa Occidental).
=item B<-437>
Usa la página de códigos DOS 437 (EE. UU.). Está es la página de códigos
usada por defecto para conversión ISO.
=item B<-850>
Usa la página de códigos DOS 850 (Europa Occidental).
=item B<-860>
Usa la página de códigos DOS 860 (Portugués).
=item B<-863>
Usa la página de códigos DOS 863 (Francocanadiense).
=item B<-865>
Usa la página de códigos DOS 865 (Nórdico).
=item B<-7>
Convierte caracteres de 8 bits al espacio de 7 bits.
=item B<-b, --keep-bom>
Mantiene la Marca de Orden de Byte (BOM). Cuando el archivo de entrada
tiene BOM, escribe BOM en el archivo de salida. Este es el comportamiento
por defecto en la conversión a saltos de línea DOS. Vea también la opción
C<-r>.
=item B<-c, --convmode CONVMODE>
Establece el modo de conversión, Donde CONVMODE puede ser: I<ascii>,
I<7bit>, I<iso>, I<mac> siendo ascii el valor por defecto.
=item B<-D, --display-enc ENCODING>
Set encoding of displayed text. Where ENCODING is one of: I<ansi>,
I<unicode>, I<utf8> with ansi being the default.
This option is only available in dos2unix for Windows with Unicode file name
support. This option has no effect on the actual file names read and
written, only on how they are displayed.
There are several methods for displaying text in a Windows console based on
the encoding of the text. They all have their own advantages and
disadvantages.
=over 4
=item B<ansi>
Dos2unix's default method is to use ANSI encoded text. The advantage is that
it is backwards compatible. It works with raster and TrueType fonts. In some
regions you may need to change the active DOS OEM code page to the Windows
system ANSI code page using the C<chcp> command, because dos2unix uses the
Windows system code page.
The disadvantage of ansi is that international file names with characters
not inside the system default code page are not displayed properly. You will
see a question mark, or a wrong symbol instead. When you don't work with
foreign file names this method is OK.
=item B<unicode>
The advantage of unicode (the Windows name for UTF-16) encoding is that text
is usually properly displayed. There is no need to change the active code
page. You may need to set the console's font to a TrueType font to have
international characters displayed properly. When a character is not
included in the TrueType font you usually see a small square, sometimes with
a question mark in it.
When you use the ConEmu console all text is displayed properly, because
ConEmu automatically selects a good font.
The disadvantage of unicode is that it is not compatible with ASCII. The
output is not easy to handle when you redirect it to another program or a
file. Redirection to a file does not give a correct UTF-16 file.
=item B<utf8>
The advantage of utf8 is that it is compatible with ASCII and when you
redirect it to a file you get a proper UTF-8 file. You need to set the
console's font to a TrueType font. With a TrueType font the text is
displayed similar as with the C<unicode> encoding.
The disadvantage is that when you use the default raster font all non-ASCII
characters are displayed wrong. Not only unicode file names, but also
translated messages become unreadable. On Windows configured for an
East-Asian region you may see a lot of flickering of the console when the
messages are displayed.
In a ConEmu console the utf8 encoding method works well.
=back
The default encoding can be changed with environment variable
DOS2UNIX_DISPLAY_ENC by setting it to C<unicode> or C<utf8>.
=item B<-f, --force>
Fuerza la conversión de archivos binarios.
=item B<-gb, --gb18030>
En Windows los archivos UTF-16 se convierten por defecto a UTF-8, sin tener
en cuenta la configuración local. Use esta opción para convertir archivos
UTF-16 a GB18030. Esta opción sólo está disponible en Windows.l Véase
también la sección GB18030.
=item B<-h, --help>
Despiega la ayuda y termina el programa.
=item B<-i[MARCAS], --info[= MARCAS] ARCHIVO ...>
Muestra la información del archivo. No se realiza ninguna conversión.
Se muestra la siguiente información, en este orden: número de saltos de
línea DOS, número de saltos de línea Unix, número de saltos de línea Mac,
Marca de Orden de Byte, de texto o binario, nombre del archivo.
Ejemplo de salida:
6 0 0 no_bom text dos.txt
0 6 0 no_bom text unix.txt
0 0 6 no_bom text mac.txt
6 6 6 no_bom text mixed.txt
50 0 0 UTF-16LE text utf16le.txt
0 50 0 no_bom text utf8unix.txt
50 0 0 UTF-8 text utf8dos.txt
2 418 219 no_bom binary dos2unix.exe
Se pueden utilizar marcas extras opcionales para modificar la salida. Se
pueden añadir una o más marcas.
=over 4
=item B<d>
Muestra el número de saltos de línea DOS.
=item B<u>
Muestra el número de saltos de línea Unix.
=item B<m>
Muestra el número de saltos de línea Mac.
=item B<b>
Muestra la Marca de Orden de Byte.
=item B<t>
Muestra si el archivo es de texto o binario.
=item B<c>
Muestra sólo los archivos que pueden ser convertidos.
Con la marca C<c> dos2unix sólo mostrará los archivos que contengan saltos
de línea DOS, unix2dos sólo mostrará los nombres de archivo que tengan
saltos de línea Unix.
=back
Ejemplos:
Muestra información para todos los archivos *.txt:
dos2unix -i *.txt
Muestra sólo el número de saltos de línea de DOS y de Unix:
dos2unix -idu *.txt
Muestra sólo la Marca de Orden de Byte.
dos2unix --info=b *.txt
Muestra los archivos que tienen saltos de línea DOS:
dos2unix -ic *.txt
Muestra los archivos que tienen saltos de línea Unix:
unix2dos -ic *.txt
Convert only files that have DOS line breaks and leave the other files
untouched:
dos2unix -ic *.txt | xargs dos2unix
Find text files that have DOS line breaks:
find -name '*.txt' | xargs dos2unix -ic
=item B<-k, --keepdate>
Mantiene la fecha del archivo de salida igual a la del archivo de entrada.
=item B<-L, --license>
Muestra la licencia del programa.
=item B<-l, --newline>
Añade salto de línea adicional.
B<dos2unix>: Sólo los saltos de línea DOS son cambiados por dos saltos de
línea Unix. En modo Mac sólo los saltos de línea Mac son cambiados por dos
saltos de línea Unix.
B<unix2dos>: Sólo los saltos de línea Unix son cambiados por dos saltos de
línea DOS. En modo Mac los saltos de línea Unix son cambiados por dos saltos
de línea Mac.
=item B<-m, --add-bom>
Escribe una Marca de Orden de Bytes (BOM) en el archivo de salida. Por
defecto se escribe una BOM UTF-8.
Cuando el archivo de entrada es UTF-16 y se usa la opción C<-u>, se
escribirá un BOM UTF-16.
No utilice esta opción cuando la codificación de salida sea distinta de
UTF-8, UTF-16 o GB18030. Véase también la sección UNICODE.
=item B<-n, --newfile ARCHIVO_DE_ENTRADA ARCHIVO_DE_SALIDA ...>
Modo de archivo nuevo. Convierte el archivo ARCHIVO_DE_ENTRADA y escribe la
salida al archivo ARCHIVO_DE_SALIDA. Los nombres de archivo deben ser dados
en pares y los comodines I<no> deben ser usados o I<perderá> sus archivos.
La persona que inicia la conversión en el modo de archivo nuevo (emparejado)
será el propietario del archivo convertido. Los permisos de
lectura/escritura del archivo nuevo serán los permisos del archivo original
menos la umask(1) de la persona que ejecute la conversión.
=item B<-o, --oldfile ARCHIVO ...>
Modo de archivo antiguo. Convierte el archivo ARCHIVO y lo sobrescribe con
la salida. El programa por defecto se ejecuta en este modo. Se pueden
emplear comodines.
En modo de archivo antiguo (in situ), el archivo convertido tiene el mismo
propietario, grupo y permisos de lectura/escritura que el archivo original.
Lo mismo aplica cuando el archivo es convertido por otro usuario que tiene
permiso de lectura en el archivo (p.e. usuario root). La conversión será
abortada cuando no sea posible preservar los valores originales. Cambiar el
propietario implicaría que el propietario original ya no podrá leer el
archivo. Cambiar el grupo podría ser un riesgo de seguridad, ya que el
archivo podría ser accesible a personas inadecuadas. La preservación del
propietario, grupo, y permisos de lectura/escritura sólo está soportada bajo
Unix.
=item B<-q, --quiet>
Modo silencioso. Suprime todas las advertencias y mensajes. El valor
retornado es cero. Excepto cuando se emplean parámetros incorrectos.
=item B<-r, --remove-bom>
Elimina la Marca de Orden de Byte (BOM). No escribe el BOM en el archivo de
salida. Este es el comportamiento por defecto al convertir a saltos de línea
Unix. Vea también la opción C<-b>.
=item B<-s, --safe>
Ignora los archivos binarios (por defecto).
=item B<-u, --keep-utf16>
Mantiene la codificación original UTF-16 en el archivo de entrada. El
archivo de salida se escribirá con la misma codificación UTF-16, little o
big endian, como el archivo de entrada. Esto impide la transformación a
UTF-8. En consecuencia se escribirá un BOM UTF-16. Esta opción se puede
desactivar con la opción C<-ascii>.
=item B<-ul, --assume-utf16le>
Se asume que el formato de archivo de entrada es UTF-16LE.
Cuando existe una Marca de Orden de Bytes (BOM) en el archivo de entrada, la
BOM tiene prioridad sobre esta opción.
Cuando se hace una suposición incorrecta (el archivo de entrada no estaba en
formato UTF-16LE) y la conversión tiene éxito, obtendrá un archivo UTF-8 de
salida con el texto erróneo. La conversión errónea puede deshacerse con
iconv(1) convirtiendo el archivo UTF-8 de salida de vuelta a UTF-16LE. Esto
restaurará el archivo original.
El supuesto de UTF-16LE funciona como un I<modo de conversión>. Al cambiar
al modo por defecto I<ascii> el supuesto UTF-16LE es deshabilitado.
=item B<-ub, --assume-utf16be>
Se asume que el formato del archivo de entrada es UTF-16BE.
Esta opción funciona igual que la opción C<-ul>.
=item B<-v, --verbose>
Mostrar mensajes detallados. Se muestra información extra acerca de Marcas
de Orden de Bytes (BOM) y el número de saltos de línea convertidos.
=item B<-F, --follow-symlink>
Sigue los enlaces simbólicos y convierte los destinos.
=item B<-R, --replace-symlink>
Reemplaza los enlaces simbólicos con los archivos convertidos (los archivos
destino originales no se alteran).
=item B<-S, --skip-symlink>
No altera los enlaces simbólicos ni sus destinos (por defecto).
=item B<-V, --version>
Despiega la información de la versión y termina el programa.
=back
=head1 MODO MAC
En modo normal los saltos de línea son convertidos de DOS a Unix y
viceversa. Los saltos de línea Mac no son convertidos.
En modo Mac los saltos de línea son convertidos de Mac a Unix y
viceversa. Los saltos de línea DOS no son modificados.
Para ejecutar en modo Mac use el modificador C<-c mac> o use los comandos
C<mac2unix> o C<unix2mac>.
=head1 MODOS DE CONVERSIÓN
=over 4
=item B<ascii>
En modo C<ascii> sólo los saltos de línea son convertidos. Éste es el modo
de conversión por defecto.
Aunque el nombre de este modo es ASCII, que es un estándar de 7 bits, éste
emplea 8 bits. Siempre use este modo cuando convierta archivos Unicode
UTF-8.
=item B<7bit>
En este modo todos los caracteres no ASCII de 8 bits (con valores de 128 a
255) son convertidos al espacio de 7 bits.
=item B<iso>
Los caracteres son convertidos entre un conjunto de caracteres DOS (página
de códigos) y el conjunto de caracteres ISO-8859-1 (Latín-1) de Unix. Los
caracteres DOS sin equivalente ISO-8859-1, para los cuales la conversión es
imposible, son convertidos en un punto. Lo mismo se aplica para caracteres
ISO-8859-1 sin contraparte DOS.
Cuando sólo se emplea el parámetro C<-iso>, dos2unix intentará determinar la
página de códigos activa. Cuando esto no sea posible, dos2unix utilizará la
página de códigos 437 por defecto, la cual es empleada principalmente en
EE. UU. Para forzar una página de códigos específica emplee los parámetros
C<-437> (EE. UU.), C<-850> (Europa Occidental), C<-860> (Portugués), C<-863>
(Francocanadiense), o C<-865> (Nórdico). La página de códigos Windows 1252
(Europa Occidental) también está soportada con el parámetro C<-1252>. Para
acceder a otras páginas de códigos use dos2unix en combinación con
iconv(1). Iconv puede convertir entre una larga lista de codificaciones de
caracteres.
No use la conversión ISO en archivos de texto Unicode. Esto corrompería los
archivos codificados como UTF-8.
Algunos ejemplos:
Convierte de la página de códigos por defecto de DOS a Latín-1 de Unix:
dos2unix -iso -n in.txt out.txt
Convierte de DOS CP850 a Unix Latín-1:
dos2unix -850 -n in.txt out.txt
Convierte de Windows CP1252 a Unix Latin-1:
dos2unix -1252 -n in.txt out.txt
Convierte de Windows CP1252 a Unix UTF-8 (Unicode).
iconv -f CP1252 -t UTF-8 in.txt | dos2unix > out.txt
Convierte de Unix Latin-1 a la página de códigos por defecto de DOS:
unix2dos -iso -n in.txt out.txt
Convierte de Unix Latin-1 a DOS CP850:
unix2dos -850 -n in.txt out.txt
Convierte de Unix Latin-1 a Windows CP1252.
unix2dos -1252 -n in.txt out.txt
Convierte de Unix UTF-8 (Unicode) a Windows CP1252:
unix2dos < in.txt | iconv -f UTF-8 -t CP1252 > out.txt
Véase también L<http://czyborra.com/charsets/codepages.html> y
L<http://czyborra.com/charsets/iso8859.html>.
=back
=head1 UNICODE
=head2 Codificaciones
Existen diferentes codificaciones Unicode. En Unix y Linux los archivos
Unicode son codificados comúnmente en UTF-8. En Windows los archivos de
texto Unicode pueden estar codificados en UTF-8, UTF-16, o UTF-16 big
endian, pero en general son codificados en formato UTF-16.
=head2 Conversion
Los archivos de texto Unicode pueden tener saltos de línea DOS, Unix o Mac,
como cualquier archivo de texto.
Todas las versiones de dos2unix y unix2dos pueden convertir archivos
codificados como UTF-8, debido a que UTF-8 fue diseñado para
retro-compatibilidad con ASCII.
Dos2unix y unix2dos con soporte Unicode UTF-16, pueden leer archivos de
texto codificados como UTF-16 little y big endian. Para ver si dos2unix fue
compilado con soporte UTF-16 escriba C<dos2unix -V>.
En Unix/Linux los archivos codificados con UTF-16 se convierten a la
codificación de caracteres local. Use el comando locale(1) para averiguar la
codificación de caracteres local. Cuando no se puede hacer la conversión se
obtendrá un error de conversión y se omitirá el archivo.
En Windows los archivos UTF-16 se convierten por defecto a UTF-8. Los
archivos de texto forrajeados con UTF-8 están soportados tanto en Windows
como en Unix/Linux.
Las codificaciones UTF-16 y UTF-8 son totalmente compatibles, no se perderá
ningún texto en la conversión. Cuando ocurre un error de conversión de
UTF-16 a UTF-8, por ejemplo cuando el archivo de entrada UTF-16 contiene un
error, se omitirá el archivo.
Cuando se usa la opción C<-u>, el archivo de salida se escribirá en la misma
codificación UTF-16 que el archivo de entrada. La opción C<-u> previene la
conversión a UTF-8.
Dos2unix y unix2dos no tienen la opción de convertir archivos UTF-8 a
UTF-16.
La conversión en modos ISO y 7-bit no funciona en archivos UTF-16.
=head2 Marca de orden de bytes
En Windows los archivos de texto Unicode típicamente tienen una Marca de
Orden de Bytes (BOM), debido a que muchos programas de Windows (incluyendo
el Bloc de Notas) añaden una BOM por defecto. Véase también
L<http://es.wikipedia.org/wiki/Marca_de_orden_de_bytes_%28BOM%29>.
En Unix los archivos Unicode no suelen tener BOM. Se supone que los archivos
de texto son codificados en la codificación local de caracteres.
Dos2unix sólo puede detectar si un archivo está en formato UTF-16 si el
archivo tiene una BOM. Cuando un archivo UTF-16 no tiene una BOM, dos2unix
tratará el archivo como un archivo binario.
Use la opción C<-ul> o C<-ub> para convertir un archivo UTF-16 sin BOM.
Dos2Unix, por defecto, no escribe BOM en el archivo de salida. Con la opción
C<-b> Dos2unix escribe el BOM cuando el archivo de entrada tiene BOM.
Unix2dos escribe BOM en el archivo de salida cuando el archivo de entrada
tiene BOM. Use la opción C<-r> para eliminar la BOM.
Dos2unix y unix2dos escriben siempre BOM cuando se usa la opción C<-m>.
=head2 Unicode file names on Windows
Dos2unix has optional support for reading and writing Unicode file names in
the Windows Command Prompt. That means that dos2unix can open files that
have characters in the name that are not part of the default system ANSI
code page. To see if dos2unix for Windows was built with Unicode file name
support type C<dos2unix -V>.
There are some issues with displaying Unicode file names in a Windows
console. See option C<-D>, C<--display-enc>. The file names may be
displayed wrongly in the console, but the files will be written with the
correct name.
=head2 Ejemplos Unicode
Convertir de Windows UTF-16 (con una BOM) a Unix UTF-8:
dos2unix -n in.txt out.txt
Convertir de Windows UTF-16LE (sin una BOM) a Unix UTF-8:
dos2unix -ul -n in.txt out.txt
Convertir de Unix UTF-8 a Windows UTF-8 sin una BOM:
unix2dos -m -n in.txt out.txt
Convertir de Unix UTF-8 a Windows UTF-16:
unix2dos < in.txt | iconv -f UTF-8 -t UTF-16 > out.txt
=head1 GB18030
GB18030 es un estándar del gobierno chino. Todo producto software vendido en
China está obligado por ley a contener un subconjunto del GB18030
estándar. Véase L<http://en.wikipedia.org/wiki/GB_18030>.
GB18030 es totalmente compatible con Unicode y puede considerarse como
formato de transformación Unicode. Como ocurre con UTF-8, GB18030 es
compatible con ASCII. GB18030 también es compatible con la página de códigos
de Windows 936, también conocida como GBK.
En Unix/Linux los archivos UTF-16 se convierten a GB18030 cuando la
codificación local se establece en GB18030. Tenga en cuenta que esto sólo
funcionará si la configuración local es soportada por el sistema. Utilice
C<locale -a> para obtener el listado de configuraciones regionales
admitidas.
Use la opción C<-ul> o C<-ub> para convertir un archivo UTF-16 sin BOM.
Los archivos codificados como GB18030 pueden tener una Marca de Orden de
Bytes, como ocurre con los archivos Unicode.
=head1 EJEMPLOS
Lee la entrada desde 'stdin' y escribe la salida a 'stdout':
dos2unix
dos2unix -l -c mac
Convierte y reemplaza a.txt. Convierte y reemplaza b.txt:
dos2unix a.txt b.txt
dos2unix -o a.txt b.txt
Convierte y reemplaza a.txt empleando modo de conversión ascii:
dos2unix a.txt
Convierte y reemplaza a.txt empleando modo de conversión ascii, convierte y
reemplaza b.txt empleando modo de conversión de 7bits:
dos2unix a.txt -c 7bit b.txt
dos2unix -c ascii a.txt -c 7bit b.txt
dos2unix -ascii a.txt -7 b.txt
Convierte a.txt del formato de Mac a Unix:
dos2unix -c mac a.txt
mac2unix a.txt
Convierte a.txt del formato de Unix a Mac:
unix2dos -c mac a.txt
unix2mac a.txt
Convierte y reemplaza a.txt manteniendo la fecha del archivo original:
dos2unix -k a.txt
dos2unix -k -o a.txt
Convierte a.txt y escribe la salida en e.txt:
dos2unix -n a.txt e.txt
Convierte a.txt y escribe la salida en e.txt, manteniendo la fecha de e.txt
igual a la de a.txt:
dos2unix -k -n a.txt e.txt
Convierte y reemplaza a.txt, convierte b.txt y escribe en e.txt:
dos2unix a.txt -n b.txt e.txt
dos2unix -o a.txt -n b.txt e.txt
Convierte c.txt y escribe en e.txt, convierte y reemplaza a.txt, convierte y
reemplaza b.txt, convierte d.txt y escribe en f.txt:
dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt
=head1 CONVERSIÓN RECURSIVA
Use dos2unix en combinación con los comandos find(1) y xargs(1) para
convertir recursivamente archivos de texto contenidos en un árbol de
directorios. Por ejemplo para convertir todos los archivos .txt en el árbol
de directorios debajo del directorio actual escriba:
find . -name '*.txt' |xargs dos2unix
In a Windows Command Prompt the following command can be used:
for /R %G in (*.txt) do dos2unix "%G"
=head1 INTERNACIONALIZACIÓN
=over 4
=item B<LANG>
El idioma principal se selecciona con la variable de entorno LANG. La
variable LANG consiste de varias partes. La primer parte es el código del
idioma en minúsculas. La segunda es opcional y es el código del país en
mayúsculas, precedido por un guión bajo. Existe también una tercera parte
opcional: la codificación de caracteres, precedida por un punto. Unos
cuantos ejemplos para intérpretes de comandos tipo POSIX estándar:
export LANG=nl Neerlandés
export LANG=nl_NL Neerlandés, Países Bajos
export LANG=nl_BE Neerlandés, Bélgica
export LANG=es_ES Español, España
export LANG=es_MX Español, México
export LANG=en_US.iso88591 Ingles, EE. UU., codificación Latín-1
export LANG=en_GB.UTF-8 Ingles, Reino Unido, codificación UTF-8
Para obtener una lista completa de códigos de idioma y país véase el manual
de gettext:
L<http://www.gnu.org/software/gettext/manual/html_node/Usual-Language-Codes.html>
En sistemas Unix puede emplear el comando locale(1) para obtener información
específica de locale.
=item B<LANGUAGE>
Con la variable de entorno LANGUAGE puede especificar una lista de prioridad
de los idiomas, separados por dos puntos. Dos2unix da preferencia a LANGUAGE
sobre LANG. Por ejemplo, primero neerlandés y entonces alemán:
C<LANGUAGE=nl:de>. Para usar una lista de prioridad de idiomas a través de
la variable LANGUAGE tiene que habilitar antes la internacionalización,
asignando un valor distinto de "C" a LANG (o LC_ALL). Véase también el
manual de gettext:
L<http://www.gnu.org/software/gettext/manual/html_node/The-LANGUAGE-variable.html>
Si selecciona un idioma que no está disponible el programa funcionará en
ingles.
=item B<DOS2UNIX_LOCALEDIR>
Con la variable de entorno DOS2UNIX_LOCALEDIR el LOCALEDIR asignado durante
la compilación puede ser modificado. LOCALEDIR es usado para encontrar los
archivos de idioma. El valor por defecto de GNU es
C</usr/local/share/locale>. El parámetro B<--version> mostrará el LOCALEDIR
en uso.
Ejemplo (intérprete de comandos POSIX):
export DOS2UNIX_LOCALEDIR=$HOME/share/locale
=back
=head1 VALOR DE RETORNO
Se regresa cero cuando el programa termina exitosamente. Cuando ocurre un
error del sistema se regresará el último número de error del sistema. Para
otros errores se regresa 1.
El valor de retorno es siempre cero en modo silencioso, excepto cuando se
emplean parámetros incorrectos.
=head1 ESTÁNDARES
L<http://es.wikipedia.org/wiki/Documento_de_texto>
L<http://es.wikipedia.org/wiki/Retorno_de_carro>
L<http://es.wikipedia.org/wiki/Nueva_l%C3%ADnea>
L<http://es.wikipedia.org/wiki/Unicode>
=head1 AUTORES
Benjamin Lin - <blin@socs.uts.edu.au>, Bernd Johannes Wuebben (mac2unix
mode) - <wuebben@kde.org>, Christian Wurll (add extra newline) -
<wurll@ira.uka.de>, Erwin Waterlander - <waterlan@xs4all.nl> (maintainer)
Página del proyecto: L<http://waterlan.home.xs4all.nl/dos2unix.html>
Página de SourceForge: L<http://sourceforge.net/projects/dos2unix/>
=head1 VÉASE TAMBIÉN
file(1) find(1) iconv(1) locale(1) xargs(1)
|