IT学習日記

Python正規表現

こんにちは、hokkyokunです。
Pythonを学習中ですが、モジュールもたくさんあり、
できることがVBAよりはるかに多いため、できることの整理がつかなくなってきました。

Pythonを使ってできることをまとめていき、備忘録として記録していきます。
正規表現に関する記事となります。
私は基本的にWindows使いなので、Windows使用を前提としています。
Mac使いの方は仕様に差がある場合もあるかもしれませんので、ご注意ください。

正規表現とは

正規表現(せいきひょうげん、: regular expression)は、文字列の集合を一つの文字列で表現する方法の一つである。正則表現せいそくひょうげんとも呼ばれ、形式言語理論の分野では比較的こちらの訳語の方が使われる。まれに正規式せいきしきと呼ばれることもある

Wikipedia

難しい表現ですが、
要はある文字列から特定の文字、キーワードを取得するための約束事みたいな感じです。

備忘録

数値を取り出す方法

# モジュールをインポートする
import re

# 一番目の引数に正規表現。二番目は変換する文字列=""にすることで文字列を削除できる。三番目の引数が処理する前の文字列
s=re.sub("\D","","14日前")

# 戻り値は文字列
print(s,type(s))
>> 14 <class 'str'>

# int型に直す
i=int(s)
print(i,type(i))
>> 14 <class 'int'>