ここでは、正規表現における文字集合[]について解説しています。
この記事の対象
文字集合の表現「[…]」
文字集合の表現は「[…]」となります。
例えば、「[xyz]」とすると、「xyz」のいずれかの文字となります。
連続した数値の場合は[0-9]、アルファベットの場合は[a-z]と表現できます。
「…」を用いた使用例
import re
#1---任意の数値指定
note = re.compile(r"^[0-9]{3}\-[0-9]{4}$")
#2---出力探索
note.search("108-0071")
#<_sre.SRE_Match object; span=(0, 8), match='108-0071'>
上記がプログラムになります。
それでは解説していきます。
#1---任意の数値指定
note = re.compile(r"^[0-9]{3}\-[0-9]{4}$")
1の部分では、「[0-9]」の数字のいずれかを指定しています。
#2---出力探索
note.search("108-0071")
2の部分では、出力する内容を指定してます。
最後に結果としては、「<_sre.SRE_Match object; span=(0, 8), match=’108-0071′>」となります。
補足-良く使用するパターン-
項目 | 内容 |
\b | 単語の境界 |
\d | 数字 |
\D | 数字以外 |
\w | Unicode文字 |
\W | Unicode文字列以外 |
\s | 空白文字 |
\S | 空白文字意外 |
上記は、文字、数値の指定パターンになります。「\d」は「[0-9]」のことです。使用頻度が高いので覚えておくと便利です。