REGEXP_REPLACE 함수 - Amazon Redshift

REGEXP_REPLACE 함수

문자열에서 정규 표현식 패턴을 검색한 후 발견되는 모든 패턴을 지정한 문자열로 변경합니다. REGEXP_REPLACE는 REPLACE 함수과 비슷하지만 문자열에서 정규 표현식 패턴을 검색할 수 있습니다. 정규 표현식에 관한 자세한 내용은 POSIX 연산자 단원 및 Wikipedia의 정규 표현식을 참조하세요.

REGEXP_REPLACE는 TRANSLATE 함수REPLACE 함수과 비슷합니다. 단, TRANSLATE는 단일 문자를 여러 차례 변경하고, REPLACE는 전체 문자열 하나를 다른 문자열로 변경하는 반면 REGEXP_REPLACE는 문자열에서 정규 표현식 패턴을 검색할 수 있습니다.

구문

REGEXP_REPLACE( source_string, pattern [, replace_string [ , position [, parameters ] ] ] )

인수

source_string

검색할 열 이름과 같은 CHAR 또는 VARCHAR 문자열 표현식입니다.

패턴

정규 표현식 패턴을 나타내는 UTF-8 문자열 리터럴입니다. 자세한 내용은 POSIX 연산자 단원을 참조하십시오.

replace_string

(선택) 발견되는 패턴을 각각 변경할 CHAR 또는 VARCHAR 문자열 표현식(열 이름 등)입니다. 기본값은 빈 문자열입니다( "" ).

position

(선택) source_string 내에서 검색을 시작할 위치를 나타내는 양의 정수입니다. 이 위치는 바이트가 아닌 문자 수를 기준으로 하기 때문에 멀티바이트 문자도 단일 문자로 계산됩니다. 기본값은 1입니다. position이 1보다 작으면 검색이 source_string의 첫 문자부터 시작됩니다. positionsource_string의 문자 수보다 크면 결과는 source_string이 됩니다.

파라미터

(선택) 함수가 패턴과 일치하는 방법을 나타내는 하나 이상의 문자열 리터럴입니다. 가능한 값은 다음과 같습니다.

  • c - 대/소문자를 구분하여 일치시킵니다. 기본값은 대/소문자 구분 일치를 사용하는 것입니다.

  • i - 대/소문자를 구분하지 않고 일치시킵니다.

  • p – PCRE(Perl Compatible Regular Expression) 방언으로 패턴을 해석합니다. PCRE에 관한 자세한 내용은 Wikipedia의 펄 호환 정규 표현식을 참조하세요.

반환 타입

VARCHAR

pattern 또는 replace_string이 NULL이면 결과도 NULL이 됩니다.

예시

대소문자를 구분하지 않는 일치를 사용하여 값 quick brown fox 내에서 문자열 FOX를 모두 바꾸려면 다음 예제를 사용합니다.

SELECT REGEXP_REPLACE('the fox', 'FOX', 'quick brown fox', 1, 'i'); +---------------------+ | regexp_replace | +---------------------+ | the quick brown fox | +---------------------+

다음 예에서는 PCRE 방언으로 작성된 패턴을 사용하여 하나 이상의 숫자와 하나의 소문자가 포함된 단어를 찾습니다. PCRE에서 특정 미리 보기 의미가 있는 ?= 연산자가 사용됩니다. 해당 단어가 나타날 때마다 값 [hidden]으로 바꾸려면 다음 예제를 사용합니다.

SELECT REGEXP_REPLACE('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', '[hidden]', 1, 'p'); +-------------------------------+ | regexp_replace | +-------------------------------+ | [hidden] plain A1234 [hidden] | +-------------------------------+

다음 예에서는 PCRE 방언으로 작성된 패턴을 사용하여 하나 이상의 숫자와 하나의 소문자가 포함된 단어를 찾습니다. PCRE에서 특정 미리 보기 의미가 있는 ?= 연산자가 사용됩니다. 대소문자를 구분하지 않는 일치를 사용한다는 점에서 이전 예제와 다르지만 이러한 단어의 각 발생을 [hidden] 값으로 바꾸려면 다음 예제를 사용합니다.

SELECT REGEXP_REPLACE('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', '[hidden]', 1, 'ip'); +----------------------------------+ | regexp_replace | +----------------------------------+ | [hidden] plain [hidden] [hidden] | +----------------------------------+

다음 예제에서는 TICKIT 샘플 데이터베이스의 USERS 테이블을 사용합니다. 자세한 내용은 샘플 데이터베이스 단원을 참조하십시오.

이메일 주소에서 @ 및 도메인 주소를 삭제하려면 다음 예제를 사용합니다.

SELECT email, REGEXP_REPLACE(email, '@.*\\.(org|gov|com|edu|ca)$') FROM users ORDER BY userid LIMIT 4; +-----------------------------------------------+-----------------------+ | email | regexp_replace | +-----------------------------------------------+-----------------------+ | Etiam.laoreet.libero@sodalesMaurisblandit.edu | Etiam.laoreet.libero | | Suspendisse.tristique@nonnisiAenean.edu | Suspendisse.tristique | | amet.faucibus.ut@condimentumegetvolutpat.ca | amet.faucibus.ut | | sed@lacusUtnec.ca | sed | +-----------------------------------------------+-----------------------+

이메일 주소의 도메인 이름을 값 internal.company.com으로 바꾸려면 다음 예제를 사용합니다.

SELECT email, REGEXP_REPLACE(email, '@.*\\.[[:alpha:]]{2,3}','@internal.company.com') FROM users ORDER BY userid LIMIT 4; +-----------------------------------------------+--------------------------------------------+ | email | regexp_replace | +-----------------------------------------------+--------------------------------------------+ | Etiam.laoreet.libero@sodalesMaurisblandit.edu | Etiam.laoreet.libero@internal.company.com | | Suspendisse.tristique@nonnisiAenean.edu | Suspendisse.tristique@internal.company.com | | amet.faucibus.ut@condimentumegetvolutpat.ca | amet.faucibus.ut@internal.company.com | | sed@lacusUtnec.ca | sed@internal.company.com | +-----------------------------------------------+--------------------------------------------+