REGEXP_INSTR 函數 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

REGEXP_INSTR 函數

在字串中搜尋規則表達式模式,並傳回整數指出相符子字串的開始位置或結尾位置。如果找不到相符項目,則函數會傳回 0。REGEXP_INSTR 類似於 POSITION函數,但可讓您搜尋字串以取得規則表達模式。如需規則表達式的詳細資訊,請參閱 Wikipedia 中的 POSIX 運算子規則表達式。

語法

REGEXP_INSTR( source_string, pattern [, position [, occurrence] [, option [, parameters ] ] ] ] )

引數

source_string

要搜尋的字串表達式,例如欄名。

pattern

代表規則表達式模式的 UTF-8 字串常值。如需詳細資訊,請參閱POSIX 運算子

position

(選用) 正 INTEGER,表示在 source_string 內開始搜尋的位置。位置以字元數為基礎,而不是位元組,所以多位元組字元視為單一字元。預設值為 1。如果 position 小於 1,則從 source_string 的第一個字元開始搜尋。如果 position 大於 source_string 中的字元數,則結果為 0

occurrence

(選用) 正 INTEGER,表示要使用哪一個出現的模式。REGEXP_INSTR 會略過前 個occurrence-1相符項目。預設值為 1。如果 occurrence 小於 1 或大於 source_string 中的字元數,則忽略搜尋,且結果為 0

option

(選用) 此值指出要傳回相符項目第一個字元的位置 (0),還是相符項目後第一個字元的位置 (1)。非零值與 1 相同。預設值為 0

參數

(選用) 一或多個字串常值,表示函數如何比對模式。可能值如下:

  • c - 進行區分大小寫比對。預設是使用區分大小寫比對。

  • i - 進行不區分大小寫比對。

  • e - 使用子運算式擷取子字串。

    如果模式包含子運算式,REGEXP_INSTR 會使用模式 中的第一個子運算式來比對子字串。REGEXP_INSTR 僅考慮第一個子運算式;會忽略其他子運算式。如果模式沒有子運算式,REGEXP_INSTR 會忽略 'e' 參數。

  • p – 使用 Perl 相容規則運算式 (PCRE) 方言解譯模式。如需 的詳細資訊PCRE,請參閱 Wikipedia 中的 Perl 相容規則運算式

傳回類型

Integer

範例

下列範例使用TICKIT範例資料庫中USERS資料表的資料。如需詳細資訊,請參閱範本資料庫

若要搜尋網域名稱開頭的 @ 字元,並傳回第一個相符項目的開始位置,請使用以下範例。

SELECT email, REGEXP_INSTR(email, '@[^.]*') FROM users ORDER BY userid LIMIT 4; +-----------------------------------------------+--------------+ | email | regexp_instr | +-----------------------------------------------+--------------+ | Etiam.laoreet.libero@sodalesMaurisblandit.edu | 21 | | Suspendisse.tristique@nonnisiAenean.edu | 22 | | amet.faucibus.ut@condimentumegetvolutpat.ca | 17 | | sed@lacusUtnec.ca | 4 | +-----------------------------------------------+--------------+

若要搜尋單字 Center 的變體,並傳回第一個相符項目的開始位置,請使用以下範例。

SELECT venuename, REGEXP_INSTR(venuename,'[cC]ent(er|re)$') FROM venue WHERE REGEXP_INSTR(venuename,'[cC]ent(er|re)$') > 0 ORDER BY venueid LIMIT 4; +-----------------------+--------------+ | venuename | regexp_instr | +-----------------------+--------------+ | The Home Depot Center | 16 | | Izod Center | 6 | | Wachovia Center | 10 | | Air Canada Centre | 12 | +-----------------------+--------------+

若要使用不區分大小寫的比對邏輯來尋找字串 FOX 第一次出現的開始位置,請使用下列範例。

SELECT REGEXP_INSTR('the fox', 'FOX', 1, 1, 0, 'i'); +--------------+ | regexp_instr | +--------------+ | 5 | +--------------+

若要使用以PCRE方言形式寫入的模式來尋找包含至少一個數字和一個小寫字母的單字,請使用下列範例。它使用 ?=運算子,其在 中具有特定的前瞻性表示法PCRE。此範例會尋找第二個此類字詞的開始位置。

SELECT REGEXP_INSTR('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 2, 0, 'p'); +--------------+ | regexp_instr | +--------------+ | 21 | +--------------+

若要使用以PCRE方言形式寫入的模式來尋找包含至少一個數字和一個小寫字母的單字,請使用下列範例。它使用 ?=運算子,其在 中具有特定的前瞻性表示法PCRE。此範例會尋找第二個這類字詞的開始位置,但與前一個範例不同,因為它使用不區分大小寫的比對。

SELECT REGEXP_INSTR('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 2, 0, 'ip'); +--------------+ | regexp_instr | +--------------+ | 15 | +--------------+