Manpages

名 前

glob − パ ス 名 を glob す る

説 明

昔 々 UNIX V6 で は 、 ワ イ ル ド カ ー ド パ タ ー ン を 展 開 す る /etc/glob と 言 う プ ロ グ ラ ム が あ っ た 。 そ の 後 す ぐ に 、 こ の 機 能 は シ ェ ル に 組 み 込 ま れ る よ う に な っ た 。 今 日 で は 、 こ の 機 能 を ユ ー ザ ー プ ロ グ ラ ム か ら も 実 行 で き る よ う 、 glob(3) と い う ラ イ ブ ラ リ ル ー チ ン も 存 在 し て い る 。

glob の 規 則 を 以 下 に 述 べ る (POSIX.2 3.13)。 ワ イ ル ド カ ー ド マ ッ チ 文 字 列 に '?', '*', '[' が 含 ま れ て い る と 、 そ れ は ワ イ ル ド カ ー ド パ タ ー ン と み な さ れ る 。 「 glob す る 」 と い う の は 、 ワ イ ル ド カ ー ド パ タ ー ン を 展 開 し て 、 そ の パ タ ー ン に マ ッ チ す る パ ス 名 の リ ス ト を 得 る こ と で あ る 。 マ ッ チ は 以 下 の よ う に 定 義 さ れ る 。

(ブ ラ ケ ッ ト 外 部 の ) '?' は あ ら ゆ る 単 一 の 文 字 に マ ッ チ す る 。

(ブ ラ ケ ッ ト 外 部 の ) '*' は あ ら ゆ る 文 字 列 に マ ッ チ す る 。 空 文 字 列 (empty string) に も マ ッ チ す る 。 文 字 ク ラ ス (character class)

"[...]" と 言 う 表 記 は 、 先 頭 の '[' に 続 く 最 初 の 文 字 が '!' で な け れ ば 、 ブ ラ ケ ッ ト の 中 に 含 ま れ て い る 文 字 の ど れ か 一 つ に マ ッ チ す る 。 ブ ラ ケ ッ ト の 内 部 に 含 ま れ る 文 字 列 は 空 で あ っ て は な ら な い 。 し た が っ て ']' も 最 初 の 文 字 に 指 定 す れ ば ブ ラ ケ ッ ト の 内 部 に 含 め る こ と が で き る (つ ま り "[][!]" は '[', ']', '!' の 3 文 字 の ど れ か に マ ッ チ す る )。 領 域 指 定 (range) 特 殊 な 表 記 法 が 一 つ 存 在 す る 。 '−' を 挟 む 二 つ の 文 字 は 領 域 指 定 と な る 。 (つ ま り "[A−Fa−f0−9]" は "[ABCDEFabcdef0123456789]" と 等 価 と な る 。 ) '−' 文 字 そ の も の を 入 れ た い 場 合 は 、 ブ ラ ケ ッ ト の 先 頭 ま た は 最 後 の 文 字 に 指 定 す れ ば よ い 。 (つ ま り "[]−]" は 二 つ の 文 字 ']' と '−' に マ ッ チ し 、 "[−−0]" は '−', '.', '0' の 3 文 字 に マ ッ チ す る 。 こ の 間 の '/' に は マ ッ チ し な い 。 後 述 を 参 照 。 ) 補 集 合 (complementation)

"[!...]" と 言 う 表 記 は 、 ブ ラ ケ ッ ト の 内 部 に 含 ま れ な い 単 一 の 文 字 に マ ッ チ す る (た だ し 先 頭 に あ る '!' は 除 外 )。 (つ ま り "[!]a−]" は ']', 'a', '−' 以 外 の す べ て の 文 字 の 、 ど れ か 一 つ に マ ッ チ す る 。 ) バ ッ ク ス ラ ッ シ ュ '\' を 前 置 す れ ば 、 '?', '*', '[' は 通 常 の 文 字 と し て 扱 わ れ る 。 ま た は シ ェ ル の コ マ ン ド ラ イ ン の 一 部 に 指 定 す る 場 合 は 、 ク ォ ー ト で 囲 っ て も 同 じ 効 果 が 得 ら れ る 。 ブ ラ ケ ッ ト の 内 部 で は 、 こ れ ら の 文 字 は そ の 文 字 自 身 だ け を 意 味 す る 。 す な わ ち "[[?*\]" は '[', '?', '*', '\' の ど れ か 一 文 字 に マ ッ チ す る 。 パ ス 名 (pathname)
glob 動 作 は 、 パ ス 名 の そ れ ぞ れ の 部 分 に 独 立 に 適 用 さ れ る 。 パ ス 名 に 存 在 す る '/' は '?' や '*' ワ イ ル ド カ ー ド に は マ ッ チ し な い 。 ま た "[.−0]" の よ う な 領 域 指 定 に も マ ッ チ し な い 。 領 域 指 定 は 陽 に '/' 文 字 を 含 む こ と は で き な い 。 こ れ は 文 法 エ ラ ー と な る 。

'.' で 始 ま る パ ス 名 で は 、 こ の 文 字 は 陽 に マ ッ チ さ せ な け れ ば な ら な い 。 (つ ま り rm * は .profile を 削 除 し な い 。 ま た tar c * で は す べ て の フ ァ イ ル は ア ー カ イ ブ さ れ な い 。 tar c . の 方 が 良 い 。 ) 空 の リ ス ト 先 に 与 え た 、 わ か り や す く 簡 単 な ル ー ル 、 「 ワ イ ル ド カ ー ド パ タ ー ン を マ ッ チ し た パ ス 名 の リ ス ト に 展 開 す る 」 と 言 う の は 、 オ リ ジ ナ ル の UNIX に お け る 定 義 で あ っ た 。 こ れ は パ タ ー ン が 空 の リ ス ト に 展 開 さ れ る こ と も 許 可 さ れ て い た 。 例 え ば

xv −wait 0 *.gif *.jpg に お い て 、 *.gif フ ァ イ ル が 全 く な い 場 合 で も 、 こ れ は 空 の リ ス ト に 展 開 さ れ る た め 、 エ ラ ー に な ら な い 。 し か し POSIX で は 、 文 法 的 に 正 し く な い パ タ ー ン や 、 マ ッ チ が な か っ た パ タ ー ン は 、 そ の ま ま 変 更 さ れ ず に 残 さ れ る こ と に な っ て い る 。 bash で は 、 次 の コ マ ン ド で 昔 か ら の 振 る 舞 い に 設 定 す る こ と が で き る 。

shopt −s nullglob

(同 様 の 問 題 は 別 の と こ ろ で も 起 こ っ て い る 。 例 え ば 、 古 い ス ク リ プ ト に お け る

rm `find . −name "*~"` の よ う な 記 述 は 、 新 し い ス ク リ プ ト で は

rm −f nosuchfile `find . −name "*~"` の よ う に し な け れ ば な ら な い 。 さ も な い と rm を 引 き 数 リ ス ト な し で 呼 び 出 す 可 能 性 が あ り 、 エ ラ ー メ ッ セ ー ジ が 出 て し ま う 。 )

注 意

正 規 表 現 ワ イ ル ド カ ー ド パ タ ー ン は 正 規 表 現 と 多 少 似 て い る が 、 し か し こ の 両 者 は 異 な る 。 ま ず 第 一 に 、 前 者 が フ ァ イ ル 名 に マ ッ チ す る の に 対 し て 、 後 者 は テ キ ス ト に マ ッ チ す る 。 第 二 に 、 ル ー ル も 同 じ で は な い 。 例 え ば 正 規 表 現 に お け る '*' は 、 前 置 さ れ た 文 字 の 0 以 上 の 繰 り 返 し を 表 す 。 正 規 表 現 に も ブ ラ ケ ッ ト 表 現 は あ る が 、 否 定 は '^' で な さ れ る 。 POSIX で は ワ イ ル ド カ ー ド パ タ ー ン に お け る "[^...]" を 未 定 義 で あ る と し て い る 。 文 字 ク ラ ス と 国 際 化 領 域 指 定 は 、 も と も と は も ち ろ ん ASCII に お け る 順 序 並 び を 意 味 し て い た 。 し た が っ て "[ −%]" は "[ !"#$%]" の 意 味 で あ り 、 "[a−z]" は 「 す べ て の 小 文 字 」 の 意 味 で あ っ た 。 UNIX の 実 装 の 中 に は 、 こ れ を 拡 張 し た も の が 存 在 し 、 そ こ で は X−Y と い う 領 域 指 定 は 、 X の コ ー ド と Y の コ ー ド に 挟 ま れ た コ ー ド を 持 つ 文 字 す べ て を 表 す よ う に な っ て い た 。 し か し 、 こ れ に は ユ ー ザ ー が ロ ー カ ル な シ ス テ ム に お け る 文 字 コ ー ド を 知 ら な け れ ば な ら ず 、 さ ら に ロ ー カ ル な ア ル フ ァ ベ ッ ト に 対 す る 照 合 順 序 (collating sequence) が 文 字 コ ー ド の 順 序 と 異 な っ て い る 場 合 に は 不 便 で あ っ た 。 (訳 注 : collating sequence に 関 し て は regex(7) を 参 照 し て 下 さ い 。 ) し た が っ て POSIX で は 、 ワ イ ル ド カ ー ド パ タ ー ン と 正 規 表 現 の 双 方 に お い て 、 ブ ラ ケ ッ ト 表 記 を 大 幅 に 拡 張 し て い る 。 こ れ ま で 我 々 は 、 ブ ラ ケ ッ ト 表 記 に は 三 つ の 要 素 が 含 ま れ う る こ と を 見 て き た 。 す な わ ち (i) 否 定 、 (ii) 単 一 の 文 字 、 (iii) 領 域 指 定 、 の 三 つ で あ る 。 POSIX で は 、 領 域 指 定 を よ り 国 際 化 に 便 利 な よ う に 定 義 し て お り 、 ま た 三 つ の タ イ プ を ブ ラ ケ ッ ト 表 記 の 要 素 と し て 追 加 し て い る 。

(iii) 領 域 指 定 X−Y は X と Y に 挟 ま れ た (両 端 含 む ) す べ て の 文 字 を 意 味 す る 。 こ の と き 、 カ レ ン ト ロ ケ ー ル (current locale) の LC_COLLATE カ テ ゴ リ ー で 定 義 さ れ て い る 照 合 順 序 が 用 い ら れ る 。

(iv) 名 前 付 き 文 字 ク ラ ス : 以 下 の よ う な も の で あ る 。

[:alnum:] [:alpha:] [:blank:] [:cntrl:]
[:digit:] [:graph:] [:lower:] [:print:]
[:punct:] [:space:] [:upper:] [:xdigit:] こ れ を 用 い れ ば "[a−z]" の 代 わ り に "[[:lower:]]" の よ う な 指 定 が で き る 。 ま た デ ン マ ー ク の よ う に 、 ア ル フ ァ ベ ッ ト の 'z' 以 降 に 3 つ の 文 字 が 存 在 す る よ う な 場 合 で も 、 同 じ よ う な 動 作 が 期 待 で き る 。 こ れ ら の 文 字 ク ラ ス は カ レ ン ト ロ ケ ー ル の LC_CTYPE カ テ ゴ リ ー で 定 義 さ れ て い る 。

(v) 照 合 順 序 に お け る シ ン ボ ル : "[.ch.]" や "[.a−acute.]" の よ う に "[." と ".]" で 挟 ま れ た 文 字 列 は 、 カ レ ン ト ロ ケ ー ル で 定 義 さ れ た 照 合 順 序 の 要 素 と な る 。 あ る 一 つ の 要 素 が 複 数 の 文 字 か ら な る 場 合 も あ り う る こ と に 注 意 。

(vi) 等 価 ク ラ ス 表 現 (equivalence class expressions): "[=a=]" の よ う に "[=" と "=]" と で 挟 ま れ た 文 字 列 で あ り 、 カ レ ン ト ロ ケ ー ル で 定 義 さ れ た 等 価 ク ラ ス の メ ン バ ー で あ る 照 合 要 素 の い ず れ か を 表 す 。 例 え ば 、 "[[=a=]]" は "[aáàäâ]"、 つ ま り "[a[.a−acute.][.a−grave.][.a−umlaut.][.a−circumflex.]]" と 等 価 に な る 。

関 連 項 目

sh(1), fnmatch(3), glob(3), locale(7), regex(7)

こ の 文 書 に つ い て

こ の man ペ ー ジ は Linux man−pages プ ロ ジ ェ ク ト の リ リ ー ス 3.79 の 一 部 で あ る 。 プ ロ ジ ェ ク ト の 説 明 と バ グ 報 告 に 関 す る 情 報 は http://www.kernel.org/doc/man−pages/ に 書 か れ て い る 。