※このページではアフィリエイト広告を利用しています

【Python入門】正規表現における文字集合[]とは?

Python

ここでは、正規表現における文字集合[]について解説しています。

この記事の対象

  • []の使用方法を知りたい方
  • 連続した文字の指定方法を知りたい方
  • 良く使用するパターンを知りたい方
スポンサーリンク
スポンサーリンク

文字集合の表現「[…]」

文字集合の表現は「[…]」となります。

例えば、「[xyz]」とすると、「xyz」のいずれかの文字となります。

連続した数値の場合は[0-9]、アルファベットの場合は[a-z]と表現できます。

「…」を用いた使用例

import re
#1---任意の数値指定
note = re.compile(r"^[0-9]{3}\-[0-9]{4}$")
#2---出力探索
note.search("108-0071")
#<_sre.SRE_Match object; span=(0, 8), match='108-0071'>

上記がプログラムになります。

それでは解説していきます。

#1---任意の数値指定
note = re.compile(r"^[0-9]{3}\-[0-9]{4}$")

1の部分では、「[0-9]」の数字のいずれかを指定しています。

#2---出力探索
note.search("108-0071")

2の部分では、出力する内容を指定してます。

最後に結果としては、「<_sre.SRE_Match object; span=(0, 8), match=’108-0071′>」となります。

補足-良く使用するパターン-

項目内容
\b単語の境界
\d数字
\D数字以外
\wUnicode文字
\WUnicode文字列以外
\s空白文字
\S空白文字意外

上記は、文字、数値の指定パターンになります。「\d」は「[0-9]」のことです。使用頻度が高いので覚えておくと便利です。

タイトルとURLをコピーしました