파이썬 정규식 사용 방법

STOCK/자기계발|2023. 1. 8. 15:48

정규식을 사용하기 위해서는 우선 모듈 re를 실행해야 합니다.

import re

 

파이썬 정규식 기호의 의미

정규식 방식으로 검색을 할 떄 사용되는 문자, 기호, 패턴이며 기본적으로 외워야 하는 부분입니다.

문법 설명
. 임의의 한 문자가 존재
? 바로 앞의 문자가 존재하거나 존재하지 않음
* 바로 앞의 문자가 존재하지 않거나 무한대로 존재
+ 바로 앞의 문자가 한 번 이상 존재
^ 바로 뒤의 문자로 문자열이 시작
$ 바로 앞의 문자로 문자열이 끝남
{숫자} 숫자만큼 반복
{숫자.} 숫자 이상만큼 반복
(문자열) 문자나 문자열을 묶음
[문자1, 문자2] 대괄호 안에 있는 문자들이 존재하는지 검색
[^ ] '^' 기호 바로 뒤에 문자가 존재하지 않음
[:alpha] 알파벳만 검색
[:digit:] 숫자만 검색
\\ \ 글자 자체를 검색
/d 모든 숫자를 검색
/D 숫자를 제외한 모든 문자를 검색
/s 공백을 검색
/S 공백이 아닌 문자를 검색
/w 숫자 또는 문자를 검색
/W 숫자 또는 문자가 아닌 것을 검색

정규식을 사용하기 위한 기본 문자나 기호 패턴은 위와 같습니다. 관련하여 정규식을 유용하게 사용할 수 있도록 다양한 함수들이 있는데, 정리하면 다음과 같습니다.

주요 함수 설명
complie(pattern[,flags]) 주어진 pattern을 컴파일하여 정규식 객체를 반환
match(pattern, string[,flags]) 주어진 string의 시작부분부터 해당 pattern이 존재하는지 검사하여 match되는 object 반환
search(pattern, string[,flags]) 주어진 string 전체가 주어진 pattern과 동일한지 검사하여 match될 경우 결과를 반환
split(parttern, string[,maxplit=0]) 주어진 pattern을 구분자로 기준 삼아 string을 분리하여 결과값을 리스트로 반환
findall(pattern, string[,flags]) 주어진 string에서 해당 pattern을 만족하는 문자열을 찾아서 리스트로 반환
sub(pattern, repl, string[,count=0]) 주어진 stirng에서 pattern과 일치하는 부분을 주어진 repl 문자로 교체하여 결과 문자열을 반환
subn(pattern, repl, string[,count=0]) sub와 동일하나, 결과를 튜플로 반환
escape(string) 영문자나 숫자를 제외한 문자들을 백슬래쉬로 지정해서 리턴

 

사용해보면, 아래와 같습니다.

import re
r = re.compile("[ab]") #찾고 싶은 글자를 지정하기, a 또는 b
print(r.search("potato")) #해당 글자가 포함된 부분 찾기
print(r.match("potato")) #해당 글자와 동일한 단어를 찾기

 

search를 사용할 경우: <re.Match object; span=(3, 4), match='a'>

match를 사용할 경우: None

'STOCK > 자기계발' 카테고리의 다른 글

[후기] 업드라이브 운전연수 10시간 과정  (2) 2023.06.09

댓글()