2009年5月5日

テキストの中の単語数を調べる

テキストファイルにある単語の数を調べるコマンド。
「入門Unix for Mac OS X」から。
tr -cs "[:alpha:]" "\n" < sometext.txt | tr "[:upper:]" "[:lower:]" | sort | uniq | wc -l

考え方としては
 1. 改行を取り除く(?)
 2. 大文字を小文字に変換する
 3. アルファベット順に整列して、単語の重複を排除
 4. 行数カウント