Función REGEXP_SUBSTR - Amazon Redshift

Función REGEXP_SUBSTR

Devuelve los caracteres de una cadena al buscar un patrón de expresión regular. REGEXP_SUBSTR es similar a la función Función SUBSTRING, pero le permite buscar un patrón de expresión regular en una cadena. Si la función no puede hacer coincidir la expresión regular con ningún carácter de la cadena, devuelve una cadena vacía. Para obtener más información sobre las expresiones regulares, consulte Operadores POSIX y Expresión regular en la Wikipedia.

Sintaxis

REGEXP_SUBSTR( source_string, pattern [, position [, occurrence [, parameters ] ] ] )

Argumentos

source_string

Una expresión de cadena que se va a buscar.

pattern

Un literal de cadena UTF-8 que representa un patrón de expresión regular. Para obtener más información, consulte Operadores POSIX.

position

Valor entero positivo que indica la posición dentro de source_string (cadena_de_origen) para comenzar la búsqueda. La posición se basa en la cantidad de caracteres, no bytes, por lo que los caracteres multibyte se cuentan como caracteres simples. El valor predeterminado de es 1. Si el valor de position (posición) es menor que 1, la búsqueda comienza en el primer carácter de source-string (cadena_de_origen). Si el valor de position (posición) es mayor que el número de caracteres de source-string (cadena_de_origen), el resultado es una cadena vacía ("").

occurrence

Un número entero positivo que indica qué coincidencia del patrón se va a utilizar. REGEXP_SUBSTR omite las primeras coincidencias especificadas por el valor de occurrence menos uno. El valor predeterminado de es 1. Si occurrence es menor que 1 o mayor que el número de caracteres de source_string, la búsqueda se omite y el resultado es NULL.

parameters

Uno o varios literales de cadena que indican el grado de coincidencia de la función con el patrón. Los valores posibles son los siguientes:

  • c: aplica la coincidencia que distingue entre mayúsculas y minúsculas. El comportamiento predeterminado es utilizar la coincidencia que distingue entre mayúsculas y minúsculas.

  • i: aplica la coincidencia que no distingue entre mayúsculas y minúsculas.

  • e: extrae una subcadena mediante una subexpresión.

    Si pattern incluye una subexpresión, REGEXP_SUBSTR realiza la comparación con una subcadena utilizando la primera subexpresión de pattern. Una subexpresión es una expresión dentro del patrón que está entre paréntesis. Por ejemplo, para que el patrón 'This is a (\\w+)' coincida con la primera expresión con la cadena 'This is a ' seguida de una palabra. En lugar de devolver el patrón, REGEXP_SUBSTR con el parámetro e devuelve solo la cadena dentro de la subexpresión.

    REGEXP_SUBSTR solo tiene en cuenta la primera subexpresión; las subexpresiones adicionales se omiten. Si el patrón no incluye una subexpresión, REGEXP_SUBSTR omite el parámetro 'e'.

  • p: interpreta el patrón con el dialecto de expresión regular compatible con Perl (PCRE). Para obtener más información sobre PCRE, consulte Perl Compatible Regular Expressions en la Wikipedia.

Tipo de retorno

VARCHAR

Ejemplos

El siguiente ejemplo devuelve la parte de una dirección de correo electrónico entre el carácter @ y la extensión de dominio. Los datos de users consultados proceden de los datos de muestra de Amazon Redshift. Para obtener más información, consulte Base de datos de muestra.

SELECT email, regexp_substr(email,'@[^.]*') FROM users ORDER BY userid LIMIT 4; email | regexp_substr -----------------------------------------------+-------------------------- Suspendisse.tristique@nonnisiAenean.edu | @nonnisiAenean amet.faucibus.ut@condimentumegetvolutpat.ca | @condimentumegetvolutpat sed@lacusUtnec.ca | @lacusUtnec Cum@accumsan.com | @accumsan

El siguiente ejemplo devuelve la parte de la entrada que corresponde a la primera vez que aparece la cadena FOX con una coincidencia que no distingue entre mayúsculas y minúsculas.

SELECT regexp_substr('the fox', 'FOX', 1, 1, 'i'); regexp_substr --------------- fox

El siguiente ejemplo devuelve la parte de la entrada que corresponde a la segunda vez que aparece la cadena FOX con una coincidencia que no distingue entre mayúsculas y minúsculas. El resultado es NULL (vacío) porque no aparece por segunda vez.

SELECT regexp_substr('the fox', 'FOX', 1, 2, 'i'); regexp_substr ---------------

El ejemplo siguiente devuelve la primera parte de la entrada que comienza en minúscula. Esto es funcionalmente idéntico a la misma instrucción SELECT sin el parámetro c.

SELECT regexp_substr('THE SECRET CODE IS THE LOWERCASE PART OF 1931abc0EZ.', '[a-z]+', 1, 1, 'c'); regexp_substr --------------- abc

En el siguiente ejemplo, se utiliza un patrón escrito en el dialecto de PCRE para localizar palabras que contengan al menos un número y una letra en minúsculas. Se utiliza el operador ?=, que tiene una connotación específica de anticipación en PCRE. En este ejemplo, se devuelve la parte de la entrada que corresponde a la segunda palabra que reúne esas características.

SELECT regexp_substr('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 2, 'p'); regexp_substr --------------- a1234

En el siguiente ejemplo, se utiliza un patrón escrito en el dialecto de PCRE para localizar palabras que contengan al menos un número y una letra en minúsculas. Se utiliza el operador ?=, que tiene una connotación específica de anticipación en PCRE. En este ejemplo, se devuelve la parte de la entrada que corresponde a la segunda palabra que reúne esas características, pero difiere del ejemplo anterior, ya que se utiliza una coincidencia sin distinción entre mayúsculas y minúsculas.

SELECT regexp_substr('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 2, 'ip'); regexp_substr --------------- A1234

En el ejemplo siguiente se utiliza una subexpresión para buscar la segunda cadena que coincida con el patrón 'this is a (\\w+)' con una coincidencia que no distingue entre mayúsculas y minúsculas. Devuelve la subexpresión entre paréntesis.

SELECT regexp_substr( 'This is a cat, this is a dog. This is a mouse.', 'this is a (\\w+)', 1, 2, 'ie'); regexp_substr --------------- dog