Python | 文字列にHTMLタグが含まれているかどうか判定する方法

Python 判別・判定,Python

Python | 文字列にHTMLタグが含まれているかどうか判定する方法

Pythonで文字列にHTMLタグが含まれているかどうか判定する方法とサンプルコードを紹介しています。

確認環境

Windows11 ローカル
Python python-3.11.1

文字列にHTMLタグが含まれているかどうか判別する

Pythonで文字列にHTMLタグが含まれているかどうかを判定するには、正規表現を利用可能にする「re」モジュールを使ってmatch()メソッドでパターンマッチを実装します。

HTMLにパターンマッチする条件は以下の通りとしています。

  • 「<」と「>」に囲われた部分があるかどうか

以下は文字列にHTMLが含まれているかどうかを判別するサンプル関数です。

import re

def hasHtmlTags(text):
	pattern = r"<[^>]*>"
	return re.search(pattern, text) is not None

上記の関数hasHtmlTags()を例えば、if文で呼び出してメールアドレスかどうかを判別します。

if hasHtmlTags('<p>Halo World</p>'):
	print('HTMLタグが含まれています。')
else:
	print('HTMLタグは含まれていません。')

# HTMLタグが含まれています。