sort – Obtenga el recuento de ocurrencias de palabras en archivos de texto de todas las palabras y la salida de impresión ordenada

Pregunta:

Tenía un comando que funcionaba a través de un archivo de texto, contaba todas las apariciones de las palabras y las imprimía así:

user@box $˜ magic-command-i-forgot | with grep | and awk | sort ./textfile.txt
66: the
54: and
32: I
16: unix
12: bash
5:  internet
3:  sh
1: GNU/Linux

Por lo tanto, no busca línea por línea, sino palabra por palabra, y lo hace para todas las palabras, no solo para 1 palabra. Lo encontré en algún lugar de Internet hace mucho tiempo, pero no puedo encontrarlo ni recordarlo …

Respuesta:

tr lugar de awk :

echo "Lorem ipsum dolor sit sit amet et cetera." | tr '[:space:]' '[\n*]' | grep -v "^\s*$" | sort | uniq -c | sort -bnr
  • tr simplemente reemplaza espacios con nuevas líneas
  • grep -v "^\s*$" recorta las líneas vacías
  • sort para preparar como entrada para uniq
  • uniq -c para contar ocurrencias
  • sort -bnr ordena en orden numérico inverso sin tener en cuenta los espacios en blanco

Guau. resultó ser un gran comando para contar palabrotas

encontrar . -nombre "* .py" -exec cat {} \; | tr '[: espacio:]' '[\ n *]' | grep -v "^ \ s * $" | ordenar | uniq -c | sort -bnr | grep mierda

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top

web tasarım