파이썬 정규식 사용 방법
STOCK/자기계발2023. 1. 8. 15:48
정규식을 사용하기 위해서는 우선 모듈 re를 실행해야 합니다.
import re
파이썬 정규식 기호의 의미
정규식 방식으로 검색을 할 떄 사용되는 문자, 기호, 패턴이며 기본적으로 외워야 하는 부분입니다.
문법 | 설명 |
. | 임의의 한 문자가 존재 |
? | 바로 앞의 문자가 존재하거나 존재하지 않음 |
* | 바로 앞의 문자가 존재하지 않거나 무한대로 존재 |
+ | 바로 앞의 문자가 한 번 이상 존재 |
^ | 바로 뒤의 문자로 문자열이 시작 |
$ | 바로 앞의 문자로 문자열이 끝남 |
{숫자} | 숫자만큼 반복 |
{숫자.} | 숫자 이상만큼 반복 |
(문자열) | 문자나 문자열을 묶음 |
[문자1, 문자2] | 대괄호 안에 있는 문자들이 존재하는지 검색 |
[^ ] | '^' 기호 바로 뒤에 문자가 존재하지 않음 |
[:alpha] | 알파벳만 검색 |
[:digit:] | 숫자만 검색 |
\\ | \ 글자 자체를 검색 |
/d | 모든 숫자를 검색 |
/D | 숫자를 제외한 모든 문자를 검색 |
/s | 공백을 검색 |
/S | 공백이 아닌 문자를 검색 |
/w | 숫자 또는 문자를 검색 |
/W | 숫자 또는 문자가 아닌 것을 검색 |
정규식을 사용하기 위한 기본 문자나 기호 패턴은 위와 같습니다. 관련하여 정규식을 유용하게 사용할 수 있도록 다양한 함수들이 있는데, 정리하면 다음과 같습니다.
주요 함수 | 설명 |
complie(pattern[,flags]) | 주어진 pattern을 컴파일하여 정규식 객체를 반환 |
match(pattern, string[,flags]) | 주어진 string의 시작부분부터 해당 pattern이 존재하는지 검사하여 match되는 object 반환 |
search(pattern, string[,flags]) | 주어진 string 전체가 주어진 pattern과 동일한지 검사하여 match될 경우 결과를 반환 |
split(parttern, string[,maxplit=0]) | 주어진 pattern을 구분자로 기준 삼아 string을 분리하여 결과값을 리스트로 반환 |
findall(pattern, string[,flags]) | 주어진 string에서 해당 pattern을 만족하는 문자열을 찾아서 리스트로 반환 |
sub(pattern, repl, string[,count=0]) | 주어진 stirng에서 pattern과 일치하는 부분을 주어진 repl 문자로 교체하여 결과 문자열을 반환 |
subn(pattern, repl, string[,count=0]) | sub와 동일하나, 결과를 튜플로 반환 |
escape(string) | 영문자나 숫자를 제외한 문자들을 백슬래쉬로 지정해서 리턴 |
사용해보면, 아래와 같습니다.
import re
r = re.compile("[ab]") #찾고 싶은 글자를 지정하기, a 또는 b
print(r.search("potato")) #해당 글자가 포함된 부분 찾기
print(r.match("potato")) #해당 글자와 동일한 단어를 찾기
search를 사용할 경우: <re.Match object; span=(3, 4), match='a'>
match를 사용할 경우: None
'STOCK > 자기계발' 카테고리의 다른 글
[후기] 업드라이브 운전연수 10시간 과정 (2) | 2023.06.09 |
---|
댓글()