0%

【Python】pandas字符串提取、操作

pandas字符串提取、操作

1. 新建一个一维数组

import numpy as np
import pandas as pd
s=pd.Series(list('ABCDEF'))
s

创建一维数组

2. 转化为小写字母

s.str.lower()

转化为小写字母

3. 转化为大写字母

s.str.upper()

转化为大写字母

4. 输出每一个长度

s.str.len()

元素长度

5. 按照空格分割元素

s.str.split(" ")

按照空格分割元素

6. 修改元素

s.str.replace("A","B")  #将A替换为B

修改元素

提取字符串

1. 新建一个一维数组

s2=pd.Series(["a1","a2","a3","a4"])
s2

新建数组

2. 利用正则分离提取字符串信息

s2.str.extract("[ab](\d)")

正则提取字符串

需要提取的字符加“()”

3. 利用正则表达式判断字符串是否存在

3.1 先新生成一个一维数组
s3=pd.Series(['a','b','c','d'])
s3

3.1新生成的数组

3.2 判断是否包含
pattern=r"[a-z]"
s3.str.contains(pattern)

判断是否包含

3.3 判断元素是否匹配
s3.str.match('a')

判断元素是否匹配 2018/1/22 18:45:45