Curso de Programación en Python/RegEx-16

De WikiCabal
Ir a la navegación Ir a la búsqueda

re.split()


Si Queremos obtener una list de los caracteres alfabéticos, unidos por palabra,
sin espacios o caracteres de puntuación, podemos usar el re.split

>>> import re
>>>
>>> Metamorphoses = "OF bodies chang'd to various forms, I sing: \
... Ye Gods, from whom these miracles did spring, Inspire my \
... numbers with coelestial heat;"
>>> 
>>> re.split( "\W+", Metamorphoses )
['OF', 'bodies', 'chang', 'd', 'to', 'various', 'forms', 'I', 'sing', 'Ye', 'Gods', 'from', 'whom', 'these', 'miracles', 'did', 'spring', 'Inspire', 'my', 'numbers', 'with', 'coelestial', 'heat', ]
>>>

Si tienes una lista de personas con sus profesiones y quieres presentarlos: 

Python 3.4.3 (default, Jul  1 2015, 18:38:11) 
[GCC 4.9.2] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import re
>>>
>>> Personas = [ "ApellidoPaterno: Couture, Nombre: Richard, Profesión: ingeniero de redes", "ApellidoPaterno: Ramírez, Nombre: Able, Profesión; Vendedor" ]
>>>
>>> for line in Personas:
...   re.split(",* *\w*: ", line)[1:]
... 
['Couture', 'Richard', 'ingeniero de redes']
['Ramírez', 'Able, Profesión; Vendedor']