NAME
glob - 形 成 路 徑 名 稱
描 述 (DESCRIPTION)
很 久 以 前 在 UNIX V6 版 中 有 一 個 程 序 /etc/glob 用 來 展 開 通 配 符 模 板 . 不 久 以 後 它 成 爲 shell 內 建 功 能 . 現 在 人 們 開 發 了 類 似 的 庫 函 數 glob(3), 讓 用 戶 程 序 實 現 同 樣 的 功 能 . 此 規 則 遵 循 (POSIX 1003.2, 3.13).
通 配 符 匹 配 (WILDCARD MATCHING)
包 含 ’?’, ’*’ 或 ’[’ 字 符 的 字 符 串 稱 爲 通 配 符 模 板 (wildcard pattern). 形 成 路 徑 名 (globbing) 指 一 種 操 作 , 把 通 配 符 模 板 展 開 爲 匹 配 該 串 的 路 徑 名 . 匹 配 定 義 爲 : 不 在 方 括 弧 中 的 ’?’ 匹 配 任 意 單 個 字 符 . 不 在 方 括 弧 中 的 ’*’ 匹 配 任 意 字 符 串 , 包 括 空 串 . 字 符 集 (Character classes) 對 於 表 達 式 ’[...]’, 如 果 在 第 一 個 ’[’符 後 面 出 現 的 第 一 個 字 符 不 是 ’!’, 則 該 表 達 式 匹 配 任 意 一 個 在 ’[...]’內 出 現 的 字 符 . 方 括 弧 內 不 能 有 空 串 , 因 此 ’]’ 可 以 作 爲 第 一 個 字 符 出 現 在 方 括 弧 內 . (像 這 樣 , ’[][!]’ 匹 配 下 列 三 個 字 符 中 的 任 意 一 個 , ’[’, ’]’ 和 ’!’.) 範 圍 集 (Ranges) 字 符 集 有 一 個 特 例 : 用 ’-’ 分 開 的 兩 個 字 符 表 示 一 個 範 圍 集 . (像 這 樣 , ’[A-Fa-f0-9]’ 等 於 ’[ABCDEFabcdef0123456789]’.) 把 ’-’ 放 到 方 括 弧 內 的 開 頭 或 最 後 可 以 獲 得 它 的 本 意 . (像 這 樣 , ’[]-]’ 匹 配 ’]’和 ’-’ 中 任 意 一 個 . 而 ’[--/]’ 匹 配 ’-’, ’.’ 和 ’/’中 任 意 一 個 .) 補 集 (Complementation) 表 達 式 ’[!...]’ 表 示 一 個 字 符 , 該 字 符 不 匹 配 方 括 弧 內 去 掉 開 頭 ’!’ 後 的 表 達 式 . (像 這 樣 , ’[!]a-]’ 匹 配 除 了 ’]’, ’a’ 和 ’-’ 的 任 意 一 個 字 符 .) 要 去 掉 ’?’, ’*’ 和 ’[’ 的 特 殊 含 義 , 可 以 通 過 前 面 加 一 個 反 斜 槓 ; 或 者 在 shell 命 令 行 中 , 通 過 引 號 來 引 用 這 些 字 符 . 在 方 括 弧 內 這 些 字 符 顯 露 出 本 意 , 所 以 , ’[[?*\]’ 匹 配 這 四 個 字 符 中 的 一 個 : ’[’, ’?’, ’*’, ’\’.
路 徑 名 (PATHNAME)
形 成 路 徑 名 功 能 應 用 於 路 徑 中 的 每 一 個 成 員 部 分 . 路 徑 中 的 ’/’ 不 能 被 通 配 符 ’?’ 或 ’*’, 或 範 圍 集 如 ’[.-0]’ 匹 配 . 範 圍 集 不 能 直 接 包 含 ’/’, 否 則 導 致 語 法 錯 誤 . 如 果 待 匹 配 的 文 件 名 以 ’.’開 頭 , 那 麼 這 個 ’.’ 字 符 必 須 直 接 給 出 . (比 如 說 , ´rm *’ 不 會 刪 除 ’.profile’ 文 件 , ’tar c *’ 不 會 打 包 你 的 所 有 文 件 ; 用 ’tar c .’ 會 更 好 .)
空 列 表 (EMPTY LISTS)
上 述 的 簡 單 優 雅 規 則 , 把 通 配 符 模 板 展 開 爲 匹 配 的 路 徑 名 , 來 源 於 最 初 的 UNIX 定 義 . 它 允 許 展 開 出 空 串 , 例 如
xv -wait 0 *.gif *.jpg 這 裏 可 能 沒 有 *.gif 文 件 (而 且 不 算 錯 誤 ). 然 而 , POSIX 要 求 句 法 錯 誤 或 路 徑 名 列 表 爲 空 時 , 保 留 通 配 符 模 板 不 變 . (譯 註 : 即 不 展 開 .) 在 bash 中 可 以 通 過 設 置 allow_null_glob_expansion=true 把 它 強 置 爲 傳 統 的 風 格 . (其 他 地 方 也 有 類 似 的 問 題 , 例 如 , 老 式 的 語 句 是 | ||
rm ’find . -name "*~"’ 新 的 寫 法 爲 | ||
rm -f nosuchfile ’find . -name "*~"’ 以 避 免 由 於 空 參 數 調 用 rm 而 產 生 錯 誤 信 息 .) |
注 意 (NOTES)
正 規 表 達 式 (Regular expressions) 注 意 , 通 配 符 模 板 不 是 正 規 表 達 式 , 儘 管 它 們 有 點 象 . 首 先 , 它 匹 配 文 件 名 , 而 不 是 正 文 ; 其 次 , 規 則 不 一 樣 , 例 如 正 規 表 達 式 裏 的 ’*’ 代 表 零 個 或 多 個 前 面 內 容 的 重 複 . 正 規 表 達 式 的 方 括 弧 表 達 式 用 ’^’ 引 導 取 反 操 作 , (而 不 是 ’[!...]’). POSIX 聲 明 , 在 通 配 符 模 板 中 , ’[^...]’ 未 做 定 義 . 字 符 集 和 國 際 化 (Character classes and Internationalization ) 當 然 , 範 圍 集 最 初 指 ASCII的 範 圍 , 因 此 ’[ -%]’ 意 思 是 ’[ !"#$%]’,’[a-z]’ 指 所 有 小 寫 字 符 . 一 些 UNIX實 現 把 這 個 歸 納 爲 : 範 圍 X-Y 指 X的 編 碼 到 Y的 編 碼 之 間 的 編 碼 字 符 . 可 是 , 這 要 求 用 戶 知 道 他 們 本 地 系 統 的 字 符 編 碼 , 此 外 , 如 果 本 地 的 字 母 表 順 序 和 字 符 集 順 序 不 對 應 , 那 就 更 不 方 便 了 . 因 此 , POSIX 對 通 配 符 模 板 和 正 規 表 達 式 的 方 括 弧 表 達 法 作 了 重 大 擴 展 , 上 面 我 們 知 道 了 方 括 弧 表 達 式 中 的 三 個 類 型 , 它 們 是 (i) 取 補 集 (ii) 直 接 列 出 的 單 個 字 符 和 (iii) 範 圍 集 .
POSIX 對 範 圍 集 在 國 際 化 方 面 作 了 更 有 力 的 說 明 , 並 且 增 加 了 三 個 類 型 :
(iii) 範 圍 X-Y 由 X 和 Y 之 間 所 有 的 字 符 組 成 (包 括 X和 Y), X 和 Y 的 當 前 編 碼 序 列 由 當 前 場 合 的 LC_COLLATE 分 類 定 義 .
(iv) 命
名 字 符 集 , 象
[:alnum:] [:alpha:] [:blank:] [:cntrl:]
[:digit:] [:graph:] [:lower:] [:print:]
[:punct:] [:space:] [:upper:] [:xdigit:] 因 此
可 以 用 ’[[:lower:]]’
代 替 ’[a-z]’, 它 在
丹 麥 語 裏 同 樣
有 效 , 雖 然 丹 麥
的 字 母 表 裏 ’z’
後 面 還 有 三 個
字 母 . 這 些 字 符
集 由 當 前 場 合
的 LC_CTYPE 分 類 定 義 .
(v) 符 號 對 映 , 象 ’[.ch.]’ 或 ’[.a-acute.]’, 在 ’[.’ 和 ’.]’ 之 間 的 字 符 串 是 定 義 在 當 前 場 合 的 對 映 元 素 . 注 意 這 可 以 是 多 字 符 元 素 .
(vi) 等 類 表 達 式 , 象 ’[=a=]’, 在 ’[=’ 和 ’=]’ 之 間 的 字 符 串 是 任 意 等 類 中 的 對 映 元 素 , 它 定 義 在 當 前 場 合 . 例 如 , ’[[=a=]]’ 可 以 等 同 於 ’[a徉 溻 ]’ (警 告 : 這 裏 有 Latin-1 字 符 ), 也 就 是 ’[a[.a-acute.][.a-grave.][.a-umlaut.][.a-circumflex.]]’.
SEE ALSO
sh(1), glob(3), fnmatch(3), locale(7), regex(7)
[中 文 版 維 護 人 ]
徐 明 <xuming [AT] iname.com>
[中 文 版 最 新 更 新 ]
2000/10/15
第 一 版
2001/11/17 第 一 次 修
訂
《 中 國 Linux論 壇 man手 冊 頁 翻 譯 計 劃 》
跋
本 頁 面 中 文 版 由 中 文 man 手 冊 頁 計 劃 提 供 。 中 文 man 手 冊 頁 計 劃 : https://github.com/man-pages-zh/manpages-zh