今天,我将与您分享对Python缺少价值观的知识。它也将解释它。如果您可以解决您现在面临的问题,请不要忘记注意此网站。让我们现在开始!
本文目录清单:
1.如何删除python数据框的缺失值2. python填补了缺失值的损失3. Python数据处理:筛选,统计,连续表,拼接,拆卸,拆卸,缺失值处理4. Python检查是否有缺失值1。导入库。
2.生成缺失的data.data = pdataframe({'name':['kite','lily','hanmei','hanmei','danny','bob'],'英语':[92,78,np.nan,23,82],“数学”:[69,87,91,np.nan,90],'centern':[np.nan,78,96,np.nan,75]}),print(data)。
3.检查缺失的值.data.isnull()#view所有缺少的值,data.isnull()。任何()#get包含缺失值的列,data.isnull()。all()#get所有na列。
4.删除缺失的值。此处理方法是更多信息。data2= data.dropna().print(data2)可以看出,删除后,只剩下两行数据。
5.使用Sklearn替换缺失的值。当缺失值是数值数据时,可以更换平均值。
6.使用pandas替换缺陷。data.fillna(0)#缺失值被0代替。
扩展信息
执行Python后,PY文件中的源代码将编译到Python的字节代码(字节码)中,然后执行Python虚拟机(Python Virtual Machine)来执行这些编译的字节代码。与Java一致。
但是,Python虚拟机不同于Java或.NET的虚拟机。Python的虚拟机是一台更高级的虚拟机。
从通常的意义上讲,这里的高级级别并不是说Python的虚拟机比Java或.Net更强大。
与Java或Net相比,Python的虚拟机距离真实机器更远。或者可以说Python的虚拟机是一种具有更高抽象水平的虚拟机。
c python编制的字节码文件通常是pyc格式。此外,python也可以在交互式模式下运行,例如主流操作系统unix/linux,mac和windows可以直接在命令模式下直接运行Python Interactive环境可以发出直接操作说明以实现交互式操作。
Python的设计目标之一是使代码高度可读。它使用标点符号符号和英语单词,这些符号和英语单词通常用其他语言使用,以使代码看起来整洁且美丽。
它不需要像C和Pascal等其他静态语言那样反复编写陈述,也不需要像他们的语法那样经常出现特殊情况和事故。
Python开发人员打算制定违反缩进规则的程序,不能汇编以迫使程序员养成良好的编程习惯。
python语言的开始和退出使用句子块的起点和退出(外部规则),而不是使用括号或某些关键字。插入短语块的开头,减少凹痕表示退出的退出。句子块。扩展已成为语法的一部分。
在大多数情况下,填充方法是最重要的函数。用常数替换为常数值。
填充(值)
参数:值
注意:它用于填充缺少的标量值或字典对象。
#call fillna通过常数
写作方法:df.fillna(0)#use 0替换缺失值
#call fillna通过词典
写作方法:df.fillna({1:0.5,3:-1})
fillna(value,Inplace = true)
参数:Inplote
注意:修改可选对象而不生成副本
#始终返回对填补人的参考
写作方法:df.fillna(0,Inplace = true)
填充(方法= ffill)
参数:方法
注意:插入方法。如果在函数调用时未指定其他参数,则默认值为“ ffill”
那些有效屈光的插值方法也可以用于FillNA:
在[23]中:从numpy导入nan为na
在[21]中:df = dataframe(np.random.randn(6,3))
在[24]中:df.ix [2:1] = na;df.ix [4:,2] = na
在[25]中:DF
出去[25]:
0 1 2
0 -0.863925 1.005127 -0.529901
1 0.701671 -0.501728 -0.617387
2 -0.951060 NAN -0.263626
3 0.810230 NAN -0.277401
4 -0.403899 Nan Nan
5 -0.081091 Nan Nan
在[26]中:df.fillna(方法='ffill')
出去[26]:
0 1 2
0 -0.863925 1.005127 -0.529901
1 0.701671 -0.501728 -0.617387
2 -0.951060 -0.501728 -0.263626
3 0.810230 -0.501728 -0.277401
4 -0.403899 -0.501728 -0.277401
5 -0.081091 -0.501728 -0.277401
填充(限制= 2)
参数:限制
注意:(对于前后),可以连续填充的最大数字
在[27]中:df.fillna(方法='ffill',limit = 2)
出去[27]:
0 1 2
0 -0.863925 1.005127 -0.529901
1 0.701671 -0.501728 -0.617387
2 -0.951060 -0.501728 -0.263626
3 0.810230 -0.501728 -0.277401
4 -0.403899 NAN -0.277401
5 -0.081091 NAN -0.277401
fillna(data.me.me()))
只要您稍微移动大脑,就可以使用FillNA实施许多其他功能。例如,该系列的平均或中位数可以介绍:
在[28]中:data =系列([1,na,3.5,na,7])))))
在[29]中:data.fillna(data.mean())
file1_path ='e:/ users/lenovo/desktop/chine tv/622召回.csv'#源数据
格式:file1 = pd.read_csv(file1_path)
pd.read_csv(file1_path,encoding ='gbk')
pd.read_csv(file1_path,encoding ='gbk',skiprows = [2,3])
pd.read_csv(file1_path,encoding ='gbk',skiprows = lambda x:x%2 == 1)
pd.read_csv(file1_path,encoding ='gbk',keep_default_na = false)
new = pdataframe()
new.new [[0,1,2]]
new.new [0:2]
查询结果与上述相同
new.loc [new ['激活号] 1000]
LOC和ILOC之间的差异:
LOC:纯标签筛选
ILOC:纯数字筛选
#
new = new.loc [:,['phone','收件人名称']]
#1
new.iloc [:,[0,1]]]
使用“ ==”屏幕筛选“ Cui Xu”的人(只能筛选出明确的规格)
#new = file1.loc [(file1 ['收件人名称'] =='cui xu')|(file1 ['收件人名称'] =='cui xia')]]]]]]]
#print(新)
#将loc函数用于屏幕-str.包含函数筛选名称,其中包含“明亮”和“ sea”
#new = file1.loc [file1 ['收件人名称'] .str.Contains('liang | sea')]
#print(新)
#将loc函数用于屏幕-str.contains函数屏幕'cui'姓氏
#new = file1.loc [file1 ['收件人名称'] .str.startswitch('cui')]
#print(新)
df = df [(df ['reade_pay_time_x']。
print(“ ofer_time(number)= 0:”,newdata [newdata ['extry_time(number)'] == 0] .count()
print(“ ofer_time(number)= 1,2,3数字:”,newdata [(newdata ['eccore_time(number)'] 0)(newdata ['ofer_time(number)]。)'])
print(newdata [newdata ['ofer_time(number)'] == 0]
newdata [newdata ['team']。isin(['grand','意大利','俄罗斯']] [['team','射击学院']]]]]
DF。年龄。value_counts()
1.修改指定位置数据的值(修改行0,‘订单的值'列为3836)
new.loc [0,'创建订单'number'] = 3836
2.替换“小敏” - “小”
df.replace({'name':{'xiao ming':'xiaoming'}})
3.批次替换列的值
方法1:df ['gengender'] = df ['gengender'] .map({'男性':“男性','女性':'女性'})
方法两个:df ['gender'] .replace('雌性','女性',Inplace = true)
或df ['性别'] = df ['性别'] .ruplace('女性','women')这是内置的角色
+df ['性别'] .replace('男性','男性',intplace = true)
4.更换索引
df.columns = ['sex','名称','高度','age']
或:df.rename(列= {'性别':'sex','name':'name','height':'height':'height':'height','age':'age'})
5.删除特定列
del DF ['player']
6.删除列(方法2)并删除一行(默认轴= 0删除行,并删除1列)
删除特定列(方法2)
df.drop('性别',轴= 1)
删除一行
DF.Drop(1,轴= 0)
file1 = pd.read_csv(file1_path)
file2 = pd.read_csv(file2_path)
new1 = pd.dataframe()
new1 ['phone'] = file1 ['phone']
new1 ['contact_time'] = file1 ['Contact_time']
new2 = pd.dataframe()
new2 ['phone'] = file2 ['phone']
new2 ['cummission_audit_time'] = file2 ['提交评论时间']
newdata = pd.merge(new1,new2,on ='phone',how ='left')
df = pd.concat([[df1,df2],轴= 0)
4.2.2水平计连接
df = pd.concat([[DF1,df2],轴= 1)
df1 ['region'] .str.split('·,3,展开= true)
DF1:
df1 [['City',“城市区域”,'地址']] = df1 ['region'] .str.split('·,3,Expand = true)
5.1删除
data.dropna(轴= 0,子集
data.dropna(如何='all')#传递此参数后,您只会丢弃所有错过值的行
data.dropna(Axis = 1)#丢弃缺失值列表(通常不这样做,这将删除功能)
data.dropna(轴= 1,how =“ all”)##d d d d d d d d d d d d d d d d d
5.2丢失的值填充:pandas.dataframe.fillna()函数
dataframe.fillna(value = none,method = none,axis = none,innplace = false = false,limit = none,download = none,** kwargs)
功能:使用指定的方法填充Na/Nan值
其中,Invlace = true是直接以原始为基础填充
5.3丢失的价值查询:
查询丢失值的数量:df.isnull()。sum()
缺乏价值线查询:df [df.isnull()。t.any()]
newdata ['ofer_time'] = pd.to_dateTime(newdata ['cubmission_audit_time'])-pd.to_dattime(newdata ['contact_time']))
newdata ['ofer_time(number)'] =(pd.to_dateTime(newdata ['bistion_audit_time'])-pd.to_dattime(newdata ['contact_time'])。
new = pdataframe()
new = newdata [newdata ['extry_time(number)'] == 0]
new.to_csv(save_path,encoding ='utf-8-sig')
拆卸数据并将其存储到不同的CSV文件中:
路径='c:/users/edz/desktop/work/2021.08.19/'
对于我的范围(0,30):
df.loc [[I]。to_csv(路径+str(i)+'。csv',encoding ='gbk')
df = df [['购买日期','周',“社会保险卡号”,“产品编码”,“产品名称”,“销售数量”,“应收款项”,“收入金额”]]]]]]]]]]]]]]]]]]
统计数据中的每一列是否具有空置值:
data.isnull()。任何 ()
统计数据中的每一列的数量:
data.isnull()。任何 ()。sum()
但是有时候,很明显,有空值但不能计算。
最近,我遇到的数据,空值的填充为null。在使用上述功能之前,需要对此进行转换。
data = data.replace('null',np.nan)
然后,您继续使用data.isnull()。任何(),ata.isnull()。任何 ()。sum()很好。
如果这样做,您的问题尚未解决。检查您的缺乏价值被NP.Nan.取代
另一种方法:
np.any(np.isnan(数据))
np.All(np.Iffinite(数据))
让我们谈谈python有多少丢失值。感谢您阅读本网站的内容。有关python有多少丢失值的更多信息,请不要忘记在此站点上找到它。