본문 바로가기
개발/자바스크립트

31. RegExp

by Dahna 2022. 7. 27.

정규 표현식이란?

정규 표현식은 일정한 패턴을 가진 문자열의 집합을 표현하기 위해 사용하는 형식 언어다. 정규 표현식은 자바스크립트의 고유 문법이 아니며, 대부분의 프로그래밍 언어와 코드 에디터에 내장되어 있다. 

 

정규 표현식은 문자열을 대상으로 패턴 매칭 기능을 제공한다. 패턴 매칭 기능이란 특정 패턴과 일치하는 문자열을 검색하거나 추출 또는 치환할 수 있는 기능을 말한다.

 

정규 표현식의 생성

정규 표현식 객체(RegExp 객체)를 생성하기 위해서는 정규 표현식 리터럴과 RegExp 생성자 함수를 사용할 수 있다. 정규 표현식 리터럴은 패턴과 플래그로 구성된다. RegExp 생성자 함수를 사용할때는 인수를 (pattern[, flags])와 같은 형태로 전달하여 RegExp 객체를 생성한다. 생성자 함수를 사용하면 변수를 사용해 동적으로 정규식을 생성할 수 있다.

 

RegExp 메서드

RegExp.prototype.exec

인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 배열로 변환한다. 매칭 결과가 없는 경우 null을 반환한다. g 플래그를 지정해도 첫 번째 매칭 결과만 반환한다.

RegExp.prototype.test

인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 불리언 값으로 반환한다.

String.prototype.match

string 표준 빌트인 객체가 제공하는 match 메서드는 대상 문자열과 인수로 전달받은 정규 표현식과의 매칭 결과를 배열로 반환한다. g 플래그가 지정되면 모든 매칭 결과를 배열로 반환한다.

 

플래그

플래그는 정규 표현식의 검색 방식을 설정하기 위해 사용한다. 플래그는 총 6개가 있으며 그 중 자주 쓰이는 3가지를 알아보자. 플래그는 옵션이므로 선택적으로 사용할 수 있으며 여러 개의 플래그를 동시에 설정할 수도 있다.

플래그 의미 설명
i ignore case 대소문자를 구별하지 않고 패턴을 검색한다.
g global 대상 문자열 내에서 패턴과 일치하는 모든 문자열을 전역 검색한다.
m multi line 문자열의 행이 바뀌더라도 패턴 검색을 계속한다.

패턴

정규 표현식은 일정한 규칙을 가진 문자열의 집합을 표현하기 위해 사용하는 형식 언어다. 정규 표현식은 패턴과 플래그로 구성된다. 정규 표현식의 패턴은 문자열의 일정한 규칙을 표현하기 위해 사용하며, 플래그는 검색 방식을 설정하기 위해 사용한다. 

패턴은 /로 열고 닫으며 문자열의 따옴표는 생략한다. 또한 패턴은 특별한 의미를 가지는 메타문자 또는 기호로 표현할 수 있다. 어떤 문자열 내에 패턴과 일치하는 문자열이 존재할 때 정규 표현식과 매치한다고 표현한다. 

문자열 검색

정규 표현식의 패턴에 문자 또는 문자열을 지정하면 검색 대상 문자열에서 패턴으로 지정한 문자 또는 문자열을 검색한다. RegExp 메서드를 사용하여 검색 대상 문자열과 정규 표현식의 매칭 결과를 구하면 검색이 수행된다.

임의의 문자열 검색

.은 임의의 문자 한 개를 의미한다. 문자의 내용은 무엇이든 상관 없다. 

반복 검색

{m,n}은 앞선 패턴이 최소 m번, 최대 n번 반복되는 문자열을 의미한다. {n}은 앞선 패턴이 n번 반복되는 문자열을 의미한다. {n,}은 앞선 패턴이 최소 n번 이상 반복되는 문자열을 의미한다. +는 앞선 패턴이 최소 한번 이상 반복되는 문자열을 의미한다. 즉, +는 {1,}과 같다. ?는 앞선 패턴이 최대 한번 이상 반복되는 문자열을 의미한다. 즉, ?는 {0,1}과 같다. 

// 'A'가 최소 1번, 최대 2번 반복되는 문자열을 전역 검색한다.
const regExp1 = /A{1,2}/g
// 2번 반복되는 문자열을 전역 검색한다.
const regExp2 = /A{2}/g
// 2번 이상 반복되는 문자열을 전역 검색한다.
const regExp3 = /A{2,}/g
// 최소 한 번 이상 반복되는 문자열을 전역 검색한다.
const regExp4 = /A+/g
// 0번 포함 최대 1번 반복되는 문자열을 전역 검색한다.
const regExp5 = /colou?r/g

OR 검색

|은 or의 의미를 갖는다. 분해되지 않은 단어 레벨로 검색하기 위해서는 +를 함께 사용한다. []내의 문자는 or로 동작한다. 그 뒤에 +를 사용하면 앞선 패턴을 한 번 이상 반복한다. 

// 'A'또는 'B'를 전역 검색한다.
const regExp1 = /A|B/g
// 'A'또는 'B'가 한번 이상 반복되는 문자열을 전역 검색한다.
const regExp2 = /A+|B+/g
const regExp3 = /[AB]+/g

범위를 지정하려면 []내에 -를 사용한다.

// 대소문자를 구별하지 않고 알파벳을 검색하는 방법
const regExp1 = /[A-Za-z]+/g
// 숫자를 검색하는 방법
const regExp2 = /[0-9]+/g

\d는 [0-9]와 같다. 즉 숫자를 의미한다. \D는 \d와 반대로 동작한다. 즉, 숫자가 아닌 문자를 의미한다. \w는 알파벳, 숫자, 언더스코어를 의미한다. 즉, [A-Za-z0-9_]와 같다. \W는 \w와 반대로 동작한다. 즉, 알파벳, 숫자, 언더스코어가 아닌 문자를 의미한다.

NOT 검색

괄호 []내의 ^은 not의 의미를 갖는다. 예를 들어 [^0-9]는 숫자를 제외한 문자를 의미한다. 

시작 위치로 검색

괄호 [] 밖의 ^은 문자열의 시작을 의미한다.

마지막 위치로 검색

$는 문자열의 마지막을 의미한다.

공백 검사

\s는 여러 가지 공백 문자(스페이스, 탭 등)을 의미한다. 즉, \s는 [\t\r\n\v\f]와 같은 의미다.

'개발 > 자바스크립트' 카테고리의 다른 글

33. Symbol  (0) 2022.07.28
32. String  (0) 2022.07.28
30. Date  (0) 2022.07.27
29. Math  (0) 2022.07.27
28. Number  (0) 2022.07.27

댓글