REGEXP_SUBSTR 函數 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

REGEXP_SUBSTR 函數

搜尋規則運算式模式,傳回字串中的字元。REGEXP_SUBSTR 類似於 SUBSTRING 函數函數,但可讓您搜尋字串以取得規則表達模式。如果函數不能比對規則運算式與字串中的任何字元,則傳回一個空字串。如需規則表達式的詳細資訊,請參閱 Wikipedia 中的 POSIX 運算子規則表達式。

語法

REGEXP_SUBSTR( source_string, pattern [, position [, occurrence [, parameters ] ] ] )

引數

source_string

要搜尋的字串運算式。

pattern

代表規則表達式模式的 UTF-8 字串常值。如需詳細資訊,請參閱POSIX 運算子

position

正整數,表示在 source_string 內開始搜尋的位置。位置以字元數為基礎,而不是位元組,所以多位元組字元視為單一字元。預設為 1。如果 position 小於 1,則從 source_string 的第一個字元開始搜尋。如果 position 大於 source_string 中的字元數,則結果為空字串 ("")。

occurrence

正整數,表示要使用哪一個出現的模式。REGEXP_SUBSTR 會略過第一次出現的 -1 個相符項目。預設為 1。如果發生少於 1 個或大於 source_string 中的字元數,則會忽略搜尋,且結果為 NULL。

參數

一或多個字串常值,表示函數如何比對模式。可能值如下:

  • c - 進行區分大小寫比對。預設是使用區分大小寫比對。

  • i - 進行不區分大小寫比對。

  • e - 使用子運算式擷取子字串。

    如果模式包含子運算式,REGEXP_SUBSTR 會使用模式 中的第一個子運算式來比對子字串。子運算式是用括號括起來的模式中的運算式。例如,對於模式 'This is a ',會比對第一個運算式和字串 'This is a (\\w+)' 後跟一個單詞。具有 e 參數的 REGEXP_SUBSTR 不會傳回模式 ,只會傳回子運算式內的字串。

    REGEXP_SUBSTR 僅考慮第一個子運算式;會忽略其他子運算式。如果模式沒有子運算式,REGEXP_SUBSTR 會忽略 'e' 參數。

  • p – 使用 Perl 相容規則運算式 (PCRE) 方言解譯模式。如需 的詳細資訊PCRE,請參閱 Wikipedia 中的 Perl 相容規則運算式

傳回類型

VARCHAR

範例

下列範例傳回電子郵件地址在 @ 和網域域名之間的部分。查詢的 users 資料來自 Amazon Redshift 範例資料。如需詳細資訊,請參閱範本資料庫

SELECT email, regexp_substr(email,'@[^.]*') FROM users ORDER BY userid LIMIT 4; email | regexp_substr -----------------------------------------------+-------------------------- Suspendisse.tristique@nonnisiAenean.edu | @nonnisiAenean amet.faucibus.ut@condimentumegetvolutpat.ca | @condimentumegetvolutpat sed@lacusUtnec.ca | @lacusUtnec Cum@accumsan.com | @accumsan

下列範例會使用不區分大小寫的比對,傳回與第一次出現的字串 FOX 相對應的輸入部分。

SELECT regexp_substr('the fox', 'FOX', 1, 1, 'i'); regexp_substr --------------- fox

下列範例會使用不區分大小寫的比對,傳回與第二次出現的字串 FOX 相對應的輸入部分。結果為 NULL (空),因為沒有第二次出現。

SELECT regexp_substr('the fox', 'FOX', 1, 2, 'i'); regexp_substr ---------------

下列範例會傳回以小寫字母開頭之輸入的第一部分。這在功能上與沒有 c 參數的相同SELECT陳述式相同。

SELECT regexp_substr('THE SECRET CODE IS THE LOWERCASE PART OF 1931abc0EZ.', '[a-z]+', 1, 1, 'c'); regexp_substr --------------- abc

下列範例使用PCRE在方言中寫入的模式來尋找包含至少一個數字和一個小寫字母的單字。它使用 ?=運算子,其在 中具有特定的前瞻性表示法PCRE。此範例會傳回對應於第二個這類字詞的輸入部分。

SELECT regexp_substr('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 2, 'p'); regexp_substr --------------- a1234

下列範例使用PCRE在方言中寫入的模式來尋找包含至少一個數字和一個小寫字母的單字。它使用 ?=運算子,其在 中具有特定的前瞻性表示法PCRE。此範例會傳回與第二個此類字詞對應的輸入部分,但與前一個範例不同,因為它使用不區分大小寫的比對。

SELECT regexp_substr('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 2, 'ip'); regexp_substr --------------- A1234

下列範例會使用子運算式,使用不區分大小寫的比對來尋找符合模式 'this is a (\\w+)' 的第二個字串。它傳回括號內的子運算式。

SELECT regexp_substr( 'This is a cat, this is a dog. This is a mouse.', 'this is a (\\w+)', 1, 2, 'ie'); regexp_substr --------------- dog