Este post fue hecho público como parte del Blogatón de ciencia de datos
Introducción
La cadena de Python es una secuencia de tipos incorporada. Las cadenas se pueden utilizar para manejar datos textuales en Python. Las cadenas de Python son secuencias inmutables de puntos Unicode. La creación de cadenas es la más simple y fácil de utilizar en Python. Para crear una cadena en Python, simplemente encerramos un texto entre comillas simples y dobles. Python trata las declaraciones de comillas simples y dobles de la misma manera. Entonces, en este post, discutiremos algunas funciones importantes y útiles de cadenas en Python para Análisis de los datos y Manipulación de datos, utilizado principalmente en Procesamiento del lenguaje natural (PNL).
Para seguir este post correctamente, supongo que está familiarizado con los conceptos básicos de Python. Si no es así, recomiendo el curso popular a continuación impartido por DataPeaker para comenzar con los conceptos básicos de Python:
Python para la ciencia de datos
Fuente de imagen: Enlace
Funciones de cadenaLas funciones de cadena son herramientas esenciales en la programación y manipulación de datos, utilizadas para transformar, analizar y gestionar textos. Estas funciones permiten realizar operaciones como la concatenación, búsqueda, extracción y modificación de cadenas de caracteres. En lenguajes como Python, Java y C++, las funciones de cadena facilitan la gestión de información textual, mejorando la eficiencia y claridad en el desarrollo de aplicaciones y algoritmos.... de Python
Las funciones de cadena de Python que vamos a discutir en este post son las siguientes:
- función capitalizar ()
- función inferior ()
- función title ()
- función casefold ()
- función superior ()
- función count ()
- función find ()
- función reemplazar ()
- función swapcase ()
- función join"JOIN" es una operación fundamental en bases de datos que permite combinar registros de dos o más tablas basándose en una relación lógica entre ellas. Existen diferentes tipos de JOIN, como INNER JOIN, LEFT JOIN y RIGHT JOIN, cada uno con sus propias características y usos. Esta técnica es esencial para realizar consultas complejas y obtener información más relevante y detallada a partir de múltiples fuentes de datos.... ()
Fuente de imagen: Enlace
función capitalizar ()
La función capitalizar () devuelve una cadena donde el primer carácter es la mayúscula.
Syntax: string.capitalize()
Ejemplo 1: Ponga la primera letra en mayúscula en la oración dada
string = "analytics Vidhya is the Largest data science Community" print(string.capitalize())
Producción:
Analytics vidhya is the largest data science community
Ejemplo 2: WQué sucede si el primer carácter es un número en lugar de un carácter
string = '10 version of Data Science Blogathon by DataPeaker is very good' print(string.capitalize())
Producción:
10 version of data science blogathon by analytics vidhya is very good
más bajo( ) función
La función lower () devuelve una cadena donde todos los caracteres de una cadena dada son minúsculas. Esta función no hace nada con símbolos y números, dicho de otra forma, simplemente ignora estas cosas.
Syntax: string.lower()
Ejemplo 1: minúscula la cadena dada
string = "DataPeaker is the Largest Data Science Community" print(string.lower())
Producción:
analytics vidhya is the largest data science community
Ejemplo 2: ¿Qué sucede si hay un número en lugar de un carácter?
string = '10 version of Data Science Blogathon by DataPeaker is very good' print(string.lower())
Producción:
10 version of data science blogathon by analytics vidhya is very good
título( ) función
La función title () devuelve una cadena donde el primer carácter de cada palabra de la cadena es mayúscula. Es como un encabezado o un título.
Si en una cadena alguna de las palabras contiene un número o un símbolo, esta función convierte la primera letra posterior a mayúscula.
Syntax: string.title()
Ejemplo 1: escriba la primera letra de cada palabra en mayúscula
string = "analytics vidhya is the Largest data science Community" print(string.title())
Producción:
DataPeaker Is The Largest Data Science Community
Ejemplo 2: ¿Qué sucede si hay un número en lugar de un carácter?
string = '10th version of Data Science Blogathon by DataPeaker is very good' print(string.title())
Producción:
10Th Version Of Data Science Blogathon By DataPeaker Is Very Good
casefold () función
La función casefold () devuelve una cadena donde todos los caracteres están en minúsculas.
Esta función es semejante a la función lower (), pero la función casefold () es más fuerte, más agresiva, lo que significa que convertirá más caracteres en minúsculas y encontrará más coincidencias al comparar dos cadenas y ambas se convertirán usando casefold ( ) función.
Syntax: string.casefold()
Ejemplo 1: convertir la cadena dada en minúsculas
string = "DataPeaker is the Largest Data Science Community" print(string.casefold())
Producción:
analytics vidhya is the largest data science community
Ejemplo 2: ¿Qué sucede si hay un número en lugar de un carácter?
string = '10th version of Data Science Blogathon by DataPeaker is very good' print(string.casefold())
Producción:
10th version of data science blogathon by analytics vidhya is very good
superior( ) función
La función upper () devuelve una cadena en la que todos los caracteres de una cadena determinada están en mayúsculas. Esta función no hace nada con símbolos y números, dicho de otra forma, simplemente ignora estas cosas.
Syntax: string.upper()
Ejemplo 1: Mayúsculas de la cadena dada
string = "analytics Vidhya is the Largest Data Science Community" print(string.upper())
Producción:
ANALYTICS VIDHYA IS THE LARGEST DATA SCIENCE COMMUNITY
Ejemplo 2: ¿Qué sucede si hay un número en lugar de un carácter?
string = '10th version of Data Science Blogathon by DataPeaker is very good' print(string.upper())
Producción:
10TH VERSION OF DATA SCIENCE BLOGATHON BY ANALYTICS VIDHYA IS VERY GOOD
contar( ) función
La función count () encuentra el número de veces que un valor especificado (dado por el usuario) aparece en la cadena dada.
Syntax: string.count(value, start, end)
Ejemplo 1: Devuelve el número de veces que aparece el valor «análisis» en la cadena.
string = "analytics Vidhya is the Largest Analytics Community" print(string.count("analytics"))
Producción:
1
Ejemplo 2: Devuelve el número de veces que aparece el valor «análisis» en la cadena de la posición 10 a la 18
string = "analytics Vidhya is the Largest analytics Community" print(string.count("analytics", 10, 18))
Producción:
0
función find ()
La función find () busca la primera aparición del valor especificado. Devuelve -1 si el valor no se encuentra en esa cadena.
La función find () es casi la misma que la función index (), pero la única diferencia es que la función index () genera una excepción si no se encuentra el valor.
Syntax: string.find(value, start, end)
Ejemplo 1: ¿En qué parte del texto aparece la primera aparición de la letra «d»?
string = "analytics vidhya is the Largest data science Community" print(string.find("d"))
Producción:
12
Ejemplo 2: ¿En qué parte del texto aparece la primera aparición de la letra «d» cuando solo busca entre las posiciones 5 y 16?
string = "analytics vidhya is the Largest data science Community" print(string.find("d", 5, 16))
Producción:
12
Ejemplo 3: si no se encuentra el valor, la función find () devuelve -1, pero la función index () generará una excepción
string = "analytics vidhya is the Largest data science Community" print(string.find("d", 5, 10))
Producción:
-1
función reemplazar ()
La función replace () reemplaza una frase especificada con otra frase especificada.
Nota: Todas las apariciones de la frase especificada serán reemplazadas si no se especifica nada más.
Syntax: string.replace(oldvalue, newvalue, count)
Ejemplo 1: Reemplazar todas las apariciones de la palabra «ciencia»
string = "analytics vidhya is the Largest data science Community" print(string.replace("science", "scientists"))
Producción:
analytics vidhya is the Largest data scientists Community
Ejemplo 2: reemplace solo la primera aparición de la palabra «ciencia»
string = "Data science Courses by analytics vidhya are the best courses to learn Data science" print(string.replace("science", "scientists", 1))
Producción:
Data scientists Courses by analytics vidhya are the best courses to learn Data science
función swapcase ()
La función swapcase () devuelve una cadena donde todas las letras mayúsculas son minúsculas y viceversa.
Syntax: string.swapcase()
Ejemplo 1: Convierta las letras minúsculas en mayúsculas y las mayúsculas en minúsculas
string = "analytics vidhya is the Largest data science Community" print(string.swapcase())
Producción:
ANALYTICS VIDHYA IS THE lARGEST DATA SCIENCE cOMMUNITY
Ejemplo 2: ¿Qué sucede si hay un número en lugar de un carácter?
string = '10th version of Data Science Blogathon by DataPeaker is very good' print(string.swapcase())
Producción:
10TH VERSION OF dATA sCIENCE bLOGATHON BY aNALYTICS vIDHYA IS VERY GOOD
función join ()
La función join () toma todos los ítems en un iterable y los une en una cadena. Tenemos que especificar una cadena como separador.
Syntax: string.join(iterable)
Ejemplo 1: una todos los ítems de una tupla determinada en una cadena, usando un carácter # (hashtag) como separador
myTuple = ("Data Scientists", "Machine Learning", "Data Science") x = "#".join(myTuple) print(x)
Producción:
Data Scientists#Machine Learning#Data Science
Ejemplo 2: une todos los ítems de un diccionario determinado en una cadena, usando la palabra «PRUEBA» como separador
myDict = {"name": "DataPeaker", "country": "India", "Technology": "Data Science"} mySeparator = "TEST" x = mySeparator.join(myDict) print(x)
Producción:
nameTESTcountryTESTTechnology
Otras publicaciones de blog mías
Además puede consultar mis publicaciones de blog anteriores.
Publicaciones anteriores del blog de ciencia de datos.
Aquí está mi perfil de Linkedin en caso de que desees conectarte conmigo. Estaré feliz de estar conectado contigo.
Para cualquier consulta, puede enviarme un email al Gmail.
Notas finales
¡Gracias por leer!
Espero que les haya gustado el post. Si te gusta, compártelo con tus amigos además. ¿Algo no mencionado o deseas compartir tus pensamientos? No dude en comentar a continuación y me pondré en contacto con usted. 😉
Los medios que se muestran en este post no son propiedad de DataPeaker y se usan a discreción del autor.