Python | 文字列にHTMLタグが含まれているかどうか判定する方法
Pythonで文字列にHTMLタグが含まれているかどうか判定する方法とサンプルコードを紹介しています。
確認環境
Windows11 ローカル
Python python-3.11.1
文字列にHTMLタグが含まれているかどうか判別する
Pythonで文字列にHTMLタグが含まれているかどうかを判定するには、正規表現を利用可能にする「re」モジュールを使ってmatch()
メソッドでパターンマッチを実装します。
HTMLにパターンマッチする条件は以下の通りとしています。
- 「<」と「>」に囲われた部分があるかどうか
以下は文字列にHTMLが含まれているかどうかを判別するサンプル関数です。
import re
def hasHtmlTags(text):
pattern = r"<[^>]*>"
return re.search(pattern, text) is not None
上記の関数hasHtmlTags()
を例えば、if
文で呼び出してメールアドレスかどうかを判別します。
if hasHtmlTags('<p>Halo World</p>'):
print('HTMLタグが含まれています。')
else:
print('HTMLタグは含まれていません。')
# HTMLタグが含まれています。
ディスカッション
コメント一覧
まだ、コメントがありません