逸出字元

大部分重要的規則運算式語言運算子是不可逸出的單一字元。逸出字元 \ (單一反斜線) 會對規則運算式剖析器信號通知,表示跟在反斜線之後的字元不是運算子。例如,剖析器會把星號 (*) 當成重複的數量詞,而星號後接反斜線 (\*) 則會被當成 Unicode 字元 002A。

以下表格所列的逸出字元在規則運算式和取代模式中會被辨識出來。

逸出字元 說明

普通字元

自我符合且為 .$ ^ { [ ( | ) * + ? \ 以外的字元。

\a

符合鬧鐘 (警示) \u0007。

\b

如果是在 [] 字元類別中則符合退格鍵 \u0008,否則,請參閱本表格下方的注意事項。

\t

符合定位點 \u0009。

\r

符合歸位字元 \u000D。

\v

符合垂直定位點 \u000B。

\f

符合換頁字元 \u000C。

\n

符合新行字元 \u000A。

\e

符合逸出字元 \u001B。

\040

符合八進位的 ASCII 字元 (最多三個數字);如果前置字元不為零的編號只有一個數字,或是對應到擷取的群組編號,則為反向參考(如需詳細資訊,請參閱反向參考)。例如,字元 \040 表示空格。

\x20

符合使用十六進位表示的 ASCII 字元 (剛好兩個數字)。

\cC

符合 ASCII 控制字元;例如,\cC 為 control-C。

\u0020

符合使用十六進位表示的 Unicode 字元 (剛好四個數字)。

Note注意事項

.NET Framework 不支援用來指定 Unicode 的 Perl 5 逸出字元。Perl 5 逸出字元的格式是 \x{####…},其中 ####… 是一連串的十六進位數字。請改用這一行所述的 .NET Framework 逸出字元。

\

如果無法識別後面所接的字元為逸出字元,則符合該字元。例如,\*\x2A 相同。

Note注意事項

逸出字元 \b 是特殊案例。在規則運算式中,\b 代表除了 [] 字元類別外的字緣 (介於 \w\W 字元間),其中 \b 表示退格鍵 (Backspace)。在取代模式中,\b 永遠代表退格鍵 (Backspace)。

請參閱

其他資源

規則運算式語言項目