R – cuerdas

Cualquier valor escrito entre comillas simples o dobles en R se trata como una cadena. Internamente, R almacena cada cadena entre comillas dobles, incluso si las crea con comillas simples.

Reglas para construir cadenas

  • Las comillas al principio y al final de una línea deben ser dobles o simples. No se pueden mezclar.

  • Se pueden insertar comillas dobles en una cadena que comience y termine con una comilla simple.

  • Se pueden insertar comillas simples en una cadena que comienza y termina con comillas dobles.

  • No se pueden insertar comillas dobles en una cadena que comience y termine con comillas dobles.

  • No se pueden insertar comillas simples en una cadena que comience y termine con una comilla simple.

Ejemplos de cadenas válidas

Los siguientes ejemplos explican las reglas para crear una cadena en R.

a <- 'Start and end with single quote'
print(a)

b <- "Start and end with double quotes"
print(b)

c <- "single quote ' in between double quotes"
print(c)

d <- 'Double quotes " in between single quote'
print(d)

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

[1] "Start and end with single quote"
[1] "Start and end with double quotes"
[1] "single quote ' in between double quote"
[1] "Double quote " in between single quote"

Ejemplos de cadenas inválidas

e <- 'Mixed quotes" 
print(e)

f <- 'Single quote ' inside single quote'
print(f)

g <- "Double quotes " inside double quotes"
print(g)

Cuando ejecutamos el script, no produce los resultados a continuación.

Error: unexpected symbol in:
"print(e)
f <- 'Single"
Execution halted

Manipulación de cuerdas

Concatenación de cadenas – función paste ()

Muchas cadenas en R se concatenan con insertar () función. Puede ser necesario combinar cualquier número de argumentos.

Sintaxis

La sintaxis básica de la función de inserción es:

paste(..., sep = " ", collapse = NULL)

A continuación se muestra la descripción de los parámetros utilizados:

  • representa cualquier número de argumentos concatenados.

  • sep representa cualquier separador entre argumentos. No es obligatorio.

  • choque utilizado para eliminar espacios entre dos líneas. Pero ni un espacio en dos palabras de una línea.

Ejemplo

a <- "Hello"
b <- 'How'
c <- "are you? "

print(paste(a,b,c))

print(paste(a,b,c, sep = "-"))

print(paste(a,b,c, sep = "", collapse = ""))

Cuando ejecutamos el código anterior, da el siguiente resultado:

[1] "Hello How are you? "
[1] "Hello-How-are you? "
[1] "HelloHoware you? "

Formateo de números y cadenas – función format ()

Los números y las cadenas se pueden formatear de acuerdo con un estilo específico usando formato() función.

Sintaxis

La sintaxis básica de la función de formato es:

format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none")) 

A continuación se muestra la descripción de los parámetros utilizados:

  • X – entrada vectorial.

  • números – el número total de dígitos mostrados.

  • nsmall – el número mínimo de dígitos a la derecha del punto decimal.

  • científico ajústelo a TRUE para mostrar la notación exponencial.

  • ancho especifica el ancho mínimo que debe mostrarse con espacios iniciales.

  • justificar muestra la fila a la izquierda, a la derecha o al centro.

Ejemplo

# Total number of digits displayed. Last digit rounded off.
result <- format(23.123456789, digits = 9)
print(result)

# Display numbers in scientific notation.
result <- format(c(6, 13.14521), scientific = TRUE)
print(result)

# The minimum number of digits to the right of the decimal point.
result <- format(23.47, nsmall = 5)
print(result)

# Format treats everything as a string.
result <- format(6)
print(result)

# Numbers are padded with blank in the beginning for width.
result <- format(13.7, width = 6)
print(result)

# Left justify strings.
result <- format("Hello", width = 8, justify = "l")
print(result)

# Justfy string with center.
result <- format("Hello", width = 8, justify = "c")
print(result)

Cuando ejecutamos el código anterior, da el siguiente resultado:

[1] "23.1234568"
[1] "6.000000e+00" "1.314521e+01"
[1] "23.47000"
[1] "6"
[1] "  13.7"
[1] "Hello   "
[1] " Hello  "

Contando el número de caracteres en una cadena – función nchar ()

Esta función cuenta el número de caracteres, incluidos los espacios, en una cadena.

Sintaxis

La sintaxis básica de la función nchar () es –

nchar(x)

A continuación se muestra la descripción de los parámetros utilizados:

  • X – entrada vectorial.

Ejemplo

result <- nchar("Count the number of characters")
print(result)

Cuando ejecutamos el código anterior, da el siguiente resultado:

[1] 30

Cambio de mayúsculas y minúsculas: funciones toupper () y tolower ()

Estas funciones cambian las mayúsculas y minúsculas de los caracteres de una cadena.

Sintaxis

La sintaxis básica para las funciones toupper () y tolower () es

toupper(x)
tolower(x)

A continuación se muestra la descripción de los parámetros utilizados:

  • X – entrada vectorial.

Ejemplo

# Changing to Upper case.
result <- toupper("Changing To Upper")
print(result)

# Changing to lower case.
result <- tolower("Changing To Lower")
print(result)

Cuando ejecutamos el código anterior, da el siguiente resultado:

[1] "CHANGING TO UPPER"
[1] "changing to lower"

Extraer partes de una cadena – función substring ()

Esta función extrae partes de una cadena.

Sintaxis

La sintaxis básica de la función substring () es:

substring(x,first,last)

A continuación se muestra la descripción de los parámetros utilizados:

  • X – entrada de un vector de caracteres.

  • primero – la posición del primer carácter que se va a extraer.

  • último esta es la posición del último carácter que se va a extraer.

Ejemplo

# Extract characters from 5th to 7th position.
result <- substring("Extract", 5, 7)
print(result)

Cuando ejecutamos el código anterior, da el siguiente resultado:

[1] "act"

🚫