0%

【Python】2-18随记

1. 获取DateFrame中一列中包含的属性(不同的值(去重))

import pandas as pd
import numpy as np
import matplotlib.pyplot as pt
name=["标题","价格","位置","评分","房屋编号","推荐标签","支付标签","简要描述"]
data=pd.read_csv("data_in_need/tujia.csv",encoding="gbk")
df=pd.DataFrame(data=data,columns=name)
df.评分.unique()

格式为

df.列名.unique()
或
df["列名"].unique()

2. DateFrame中的某一列属性的重复次数统计(计数)

df.评分.value_counts()

格式为df.列名.value_counts()

3. 处理特殊字符数据

raw['season']=row['season'].apply(lambda x: int(x.split('-')[0]))

去除年份中间的‘-’,取后面的年份

4. onehot编码

pd.get_dummies(df["评分"],prefix="评分")[:5]