unicode – coreutils que son conscientes de utf?
Pregunta: Cuando usé cut hoy, descubrí que no trata un carácter UTF-8 como un carácter, sino 3 caracteres porque tiene 3 bytes de longitud. Esto parece ser cierto en general para muchas herramientas. ¿Hay versiones de coreutils que sean compatibles con UTF-8? Mi salida de locale : LANG=en_US.UTF-8 LC_CTYPE=”en_US.UTF-8″ LC_NUMERIC=”en_US.UTF-8″ LC_TIME=”en_US.UTF-8″ LC_COLLATE=”en_US.UTF-8″ LC_MONETARY=”en_US.UTF-8″ LC_MESSAGES=”en_US.UTF-8″ LC_PAPER=”en_US.UTF-8″ …