Manpages

NAME

glob - 形 成 路 径 名 称

描 述 (DESCRIPTION)

很 久 以 前 在 UNIX V6 版 中 有 一 个 程 序 /etc/glob 用 来 展 开 通 配 符 模 板 . 不 久 以 后 它 成 为 shell 内 建 功 能 . 现 在 人 们 开 发 了 类 似 的 库 函 数 glob(3), 让 用 户 程 序 实 现 同 样 的 功 能 . 此 规 则 遵 循 (POSIX 1003.2, 3.13).

通 配 符 匹 配 (WILDCARD MATCHING)

包 含 ’?’, ’*’ 或 ’[’ 字 符 的 字 符 串 称 为 通 配 符 模 板 (wildcard pattern). 形 成 路 径 名 (globbing) 指 一 种 操 作 , 把 通 配 符 模 板 展 开 为 匹 配 该 串 的 路 径 名 . 匹 配 定 义 为 : 不 在 方 括 弧 中 的 ’?’ 匹 配 任 意 单 个 字 符 . 不 在 方 括 弧 中 的 ’*’ 匹 配 任 意 字 符 串 , 包 括 空 串 . 字 符 集 (Character classes) 对 于 表 达 式 ’[...]’, 如 果 在 第 一 个 ’[’符 后 面 出 现 的 第 一 个 字 符 不 是 ’!’, 则 该 表 达 式 匹 配 任 意 一 个 在 ’[...]’内 出 现 的 字 符 . 方 括 弧 内 不 能 有 空 串 , 因 此 ’]’ 可 以 作 为 第 一 个 字 符 出 现 在 方 括 弧 内 . (像 这 样 , ’[][!]’ 匹 配 下 列 三 个 字 符 中 的 任 意 一 个 , ’[’, ’]’ 和 ’!’.) 范 围 集 (Ranges) 字 符 集 有 一 个 特 例 : 用 ’-’ 分 开 的 两 个 字 符 表 示 一 个 范 围 集 . (像 这 样 , ’[A-Fa-f0-9]’ 等 于 ’[ABCDEFabcdef0123456789]’.) 把 ’-’ 放 到 方 括 弧 内 的 开 头 或 最 后 可 以 获 得 它 的 本 意 . (像 这 样 , ’[]-]’ 匹 配 ’]’和 ’-’ 中 任 意 一 个 . 而 ’[--/]’ 匹 配 ’-’, ’.’ 和 ’/’中 任 意 一 个 .) 补 集 (Complementation) 表 达 式 ’[!...]’ 表 示 一 个 字 符 , 该 字 符 不 匹 配 方 括 弧 内 去 掉 开 头 ’!’ 后 的 表 达 式 . (像 这 样 , ’[!]a-]’ 匹 配 除 了 ’]’, ’a’ 和 ’-’ 的 任 意 一 个 字 符 .) 要 去 掉 ’?’, ’*’ 和 ’[’ 的 特 殊 含 义 , 可 以 通 过 前 面 加 一 个 反 斜 杠 ; 或 者 在 shell 命 令 行 中 , 通 过 引 号 来 引 用 这 些 字 符 . 在 方 括 弧 内 这 些 字 符 显 露 出 本 意 , 所 以 , ’[[?*\]’ 匹 配 这 四 个 字 符 中 的 一 个 : ’[’, ’?’, ’*’, ’\’.

路 径 名 (PATHNAME)

形 成 路 径 名 功 能 应 用 于 路 径 中 的 每 一 个 成 员 部 分 . 路 径 中 的 ’/’ 不 能 被 通 配 符 ’?’ 或 ’*’, 或 范 围 集 如 ’[.-0]’ 匹 配 . 范 围 集 不 能 直 接 包 含 ’/’, 否 则 导 致 语 法 错 误 . 如 果 待 匹 配 的 文 件 名 以 ’.’开 头 , 那 么 这 个 ’.’ 字 符 必 须 直 接 给 出 . (比 如 说 , ´rm *’ 不 会 删 除 ’.profile’ 文 件 , ’tar c *’ 不 会 打 包 你 的 所 有 文 件 ; 用 ’tar c .’ 会 更 好 .)

空 列 表 (EMPTY LISTS)

上 述 的 简 单 优 雅 规 则 , 把 通 配 符 模 板 展 开 为 匹 配 的 路 径 名 , 来 源 于 最 初 的 UNIX 定 义 . 它 允 许 展 开 出 空 串 , 例 如

xv -wait 0 *.gif *.jpg 这 里 可 能 没 有 *.gif 文 件 (而 且 不 算 错 误 ). 然 而 , POSIX 要 求 句 法 错 误 或 路 径 名 列 表 为 空 时 , 保 留 通 配 符 模 板 不 变 . (译 注 : 即 不 展 开 .) 在 bash 中 可 以 通 过 设 置 allow_null_glob_expansion=true 把 它 强 置 为 传 统 的 风 格 . (其 他 地 方 也 有 类 似 的 问 题 , 例 如 , 老 式 的 语 句 是

rm ’find . -name "*~"’ 新 的 写 法 为

rm -f nosuchfile ’find . -name "*~"’ 以 避 免 由 于 空 参 数 调 用 rm 而 产 生 错 误 信 息 .)

注 意 (NOTES)

正 规 表 达 式 (Regular expressions) 注 意 , 通 配 符 模 板 不 是 正 规 表 达 式 , 尽 管 它 们 有 点 象 . 首 先 , 它 匹 配 文 件 名 , 而 不 是 正 文 ; 其 次 , 规 则 不 一 样 , 例 如 正 规 表 达 式 里 的 ’*’ 代 表 零 个 或 多 个 前 面 内 容 的 重 复 . 正 规 表 达 式 的 方 括 弧 表 达 式 用 ’^’ 引 导 取 反 操 作 , (而 不 是 ’[!...]’). POSIX 声 明 , 在 通 配 符 模 板 中 , ’[^...]’ 未 做 定 义 . 字 符 集 和 国 际 化 (Character classes and Internationalization ) 当 然 , 范 围 集 最 初 指 ASCII的 范 围 , 因 此 ’[ -%]’ 意 思 是 ’[ !"#$%]’,’[a-z]’ 指 所 有 小 写 字 符 . 一 些 UNIX实 现 把 这 个 归 纳 为 : 范 围 X-Y 指 X的 编 码 到 Y的 编 码 之 间 的 编 码 字 符 . 可 是 , 这 要 求 用 户 知 道 他 们 本 地 系 统 的 字 符 编 码 , 此 外 , 如 果 本 地 的 字 母 表 顺 序 和 字 符 集 顺 序 不 对 应 , 那 就 更 不 方 便 了 . 因 此 , POSIX 对 通 配 符 模 板 和 正 规 表 达 式 的 方 括 弧 表 达 法 作 了 重 大 扩 展 , 上 面 我 们 知 道 了 方 括 弧 表 达 式 中 的 三 个 类 型 , 它 们 是 (i) 取 补 集 (ii) 直 接 列 出 的 单 个 字 符 和 (iii) 范 围 集 .

POSIX 对 范 围 集 在 国 际 化 方 面 作 了 更 有 力 的 说 明 , 并 且 增 加 了 三 个 类 型 :

(iii) 范 围 X-Y 由 X 和 Y 之 间 所 有 的 字 符 组 成 (包 括 X和 Y), X 和 Y 的 当 前 编 码 序 列 由 当 前 场 合 的 LC_COLLATE 分 类 定 义 .

(iv) 命 名 字 符 集 , 象
[:alnum:] [:alpha:] [:blank:] [:cntrl:]
[:digit:] [:graph:] [:lower:] [:print:]
[:punct:] [:space:] [:upper:] [:xdigit:] 因 此 可 以 用 ’[[:lower:]]’ 代 替 ’[a-z]’, 它 在 丹 麦 语 里 同 样 有 效 , 虽 然 丹 麦 的 字 母 表 里 ’z’ 后 面 还 有 三 个 字 母 . 这 些 字 符 集 由 当 前 场 合 的 LC_CTYPE 分 类 定 义 .

(v) 符 号 对 映 , 象 ’[.ch.]’ 或 ’[.a-acute.]’, 在 ’[.’ 和 ’.]’ 之 间 的 字 符 串 是 定 义 在 当 前 场 合 的 对 映 元 素 . 注 意 这 可 以 是 多 字 符 元 素 .

(vi) 等 类 表 达 式 , 象 ’[=a=]’, 在 ’[=’ 和 ’=]’ 之 间 的 字 符 串 是 任 意 等 类 中 的 对 映 元 素 , 它 定 义 在 当 前 场 合 . 例 如 , ’[[=a=]]’ 可 以 等 同 于 ’[a徉 溻 ]’ (警 告 : 这 里 有 Latin-1 字 符 ), 也 就 是 ’[a[.a-acute.][.a-grave.][.a-umlaut.][.a-circumflex.]]’.

SEE ALSO

sh(1), glob(3), fnmatch(3), locale(7), regex(7)

[中 文 版 维 护 人 ]

徐 明 <xuming [AT] iname.com>

[中 文 版 最 新 更 新 ]

2000/10/15 第 一 版
2001/11/17
第 一 次 修 订

《 中 国 Linux论 坛 man手 册 页 翻 译 计 划 》

http://cmpp.linuxforum.net

本 页 面 中 文 版 由 中 文 man 手 册 页 计 划 提 供 。 中 文 man 手 册 页 计 划 : https://github.com/man-pages-zh/manpages-zh