Shoeisha Technology Media

CodeZine(コードジン)

記事種別から探す

wc

ファイルのバイト数/単語数/行数を出力する
2015/05/20 08:00

対応OS: linux , freebsd, solaris
wc [-c] [-l] [-w] [-L] [FILE...]

 wcコマンドは、FILE...に指定したファイルのバイト数/単語数/行数を出力します。オプションを省略した場合は、行数、単語数、バイト数、ファイル名の順に出力します。

オプション
① -c
FILE...に指定したファイルの総バイト数を出力します。改行コードやタブコードなどの制御コードも1バイトとします。
② -l
FILE...に指定したファイルの総行数を出力します。
③ -w
FILE...に指定したファイルの総単語数を出力します。
④ -L
FILE...に指定したファイルの内容で、もっとも長い行のバイト数を出力します。改行コードのバイト数は含みません。
注意

 全角文字は、1文字2バイトでカウントされます

単語

 「wc」は「Word Count」の略です。つまり単語の数をカウントすることを表します。この時、wcコマンドでカウントする単語とは、スペース、タブまたは改行で区切られた文字列と定義されています。ですから、単語としての意味の有無は、そのカウントには関係ありません。日本語には、単語と単語の間をスペースを入れるという習慣はありませんから、wcコマンドで日本語テキストの単語数を正しくカウントすることはできません

引数
① FILE...
バイト数/単語数/行数を出力するファイルをスペースで区切って指定します。ワイルドカードによる指定も可能です。省略時には、標準入力からの入力となります。
ファイルのバイト数/単語数/行数を表示する
[takeda]$ cat wc01 
I am Takeda. I am using UNIX.
私は武田です。
私はUNIXを使っています。
ファイル「wc01」の内容
[takeda]$ wc wc01
3 9 70 wc01
行数、単語数、バイト数、ファイル名の順に表示
日本語の単語数は正しくカウントされない
[takeda]$
ファイルのバイト数を表示する
[takeda]$ wc -c wc01 
オプション「-c」のみを指定して、バイト数とファイル名を表示
70 wc01
[takeda]$
ファイルの単語数を表示する
[takeda]$ wc -w wc01 
オプション「-w」のみを指定して、単語数とファイル名を表示
9 wc01
[takeda]$
ファイルの行数を表示する
[takeda]$ wc -l wc01 
オプション「-l」のみを指定して、行数とファイル名を表示
3 wc01
[takeda]$
ファイル内容の中から、もっとも長い行のバイト数を表示する
[takeda]$ cat wc01 
I am Takeda. I am using UNIX.
もっとも長い行
私は武田です。
私はUNIXを使っています。
[takeda]$ wc -L wc01
オプション「-L」を指定して、もっとも長い行のバイト数を表示
29 wc01
[takeda]$
HINT!

 catコマンド

関連タグ

UNIXコマンド辞典トップページに戻る

All contents copyright © 2005-2017 Shoeisha Co., Ltd. All rights reserved. ver.1.5