summaryrefslogtreecommitdiff
path: root/doc/RE.ja
diff options
context:
space:
mode:
Diffstat (limited to 'doc/RE.ja')
-rw-r--r--doc/RE.ja47
1 files changed, 30 insertions, 17 deletions
diff --git a/doc/RE.ja b/doc/RE.ja
index 2156d93..6eacc8d 100644
--- a/doc/RE.ja
+++ b/doc/RE.ja
@@ -1,4 +1,4 @@
-鬼車 正規表現 Version 6.9.4 2019/10/31
+鬼車 正規表現 Version 6.9.5 2020/04/09
使用文法: ONIG_SYNTAX_ONIGURUMA (既定値)
@@ -21,19 +21,28 @@
\f 改頁 (0x0C)
\a 鐘 (0x07)
\e 退避修飾 (0x1B)
- \nnn 八進数表現 符号化バイト値
- \o{17777777777} 拡張八進数表現 コードポイント値
- \uHHHH 拡張十六進数表現 コードポイント値
- \xHH 十六進数表現 符号化バイト値
- \x{7HHHHHHH} 拡張十六進数表現 コードポイント値
- \cx 制御文字表現 コードポイント値
- \C-x 制御文字表現 コードポイント値
- \M-x 超 (x|0x80) コードポイント値
- \M-\C-x 超 + 制御文字表現 コードポイント値
+ \nnn 八進数表現 符号化バイト値
+ \xHH 十六進数表現 符号化バイト値
+ \x{7HHHHHHH} (1-8桁) 拡張十六進数表現 コードポイント値
+ \o{17777777777} (1-11桁) 拡張八進数表現 コードポイント値
+ \uHHHH 拡張十六進数表現 コードポイント値
+ \cx 制御文字表現 コードポイント値
+ \C-x 制御文字表現 コードポイント値
+ \M-x 超 (x|0x80) コードポイント値
+ \M-\C-x 超 + 制御文字表現 コードポイント値
※ \bは、文字集合内でのみ有効
+2.1 コードポイント連続表記
+
+ 十六進数表現コードポイント (1-8桁)
+ \x{7HHHHHHH 7HHHHHHH ... 7HHHHHHH}
+
+ 八進数表現コードポイント (1-11桁)
+ \o{17777777777 17777777777 ... 17777777777}
+
+
3. 文字種
. 任意文字 (改行を除く: オプションに依存)
@@ -131,6 +140,7 @@
{,n} 零回以上n回以下 ({0,n})
{n} n回
+
無欲
?? 零回または一回
@@ -140,6 +150,11 @@
{n,}? n回以上
{,n}? 零回以上n回以下 (== {0,n}?)
+ {n}? はONIG_SYNTAX_JAVAとONIG_SYNTAX_PERLでのみ無欲な指定子
+ (その場合には、態々そう書く意味はないが)
+ デフォルトの文法では、/a{n}?/ === /(?:a{n})?/
+
+
強欲 (欲張りで、繰り返しに成功した後は回数を減らすような後退再試行をしない)
?+ 一回または零回
@@ -147,7 +162,8 @@
++ 一回以上
{n,m} (n > m) m回以上 かつ n回以下
- {n,m}+, {n,}+, {n}+ は、ONIG_SYNTAX_JAVAとONIG_SYNTAX_PERLでのみ強欲な指定子
+ {n,m}+, {n,}+, {n}+ は、ONIG_SYNTAX_JAVAとONIG_SYNTAX_PERLでのみ
+ 強欲な指定子
例. /a*+/ === /(?>a*)/
@@ -274,15 +290,12 @@
(?=式) 先読み
(?!式) 否定先読み
+
(?<=式) 戻り読み
(?<!式) 否定戻り読み
- 戻り読みの式は固定文字長でなければならない。
- しかし、最上位の選択子だけは異なった文字長が許される。
- 例. (?<=a|bc) は許可. (?<=aaa(?:b|cd)) は不許可
-
- 否定戻り読みでは、捕獲式集合は許されないが、
- 非捕獲式集合は許される。
+ * 戻り読み、否定戻り読みの式の中では、不在停止演算子
+ (?~|expr)と範囲消去演算子(?~|)を使用することはできない
* 戻り読み、否定戻り読みの中では、ignore-caseオプションの
対応が制限される。一文字と一文字の間の変換しか対応しない。