Python的简短介绍多少钱

时间：2023-03-07 21:43:28 网络应用技术

　　今天，我将与您分享对Python缺少价值观的知识。它也将解释它。如果您可以解决您现在面临的问题，请不要忘记注意此网站。让我们现在开始！

　　本文目录清单：

　　1.如何删除python数据框的缺失值2. python填补了缺失值的损失3. Python数据处理：筛选，统计，连续表，拼接，拆卸，拆卸，缺失值处理4. Python检查是否有缺失值1。导入库。

　　2.生成缺失的data.data = pdataframe（{'name'：['kite'，'lily'，'hanmei'，'hanmei'，'danny'，'bob']，'英语'：[92,78，np.nan，23,82]，“数学”：[69,87,91，np.nan，90]，'centern'：[np.nan，78,96，np.nan，75]}），print（data）。

　　3.检查缺失的值.data.isnull（）#view所有缺少的值，data.isnull（）。任何（）#get包含缺失值的列，data.isnull（）。all（）#get所有na列。

　　4.删除缺失的值。此处理方法是更多信息。data2= data.dropna（）.print（data2）可以看出，删除后，只剩下两行数据。

　　5.使用Sklearn替换缺失的值。当缺失值是数值数据时，可以更换平均值。

　　6.使用pandas替换缺陷。data.fillna（0）＃缺失值被0代替。

　　扩展信息

　　执行Python后，PY文件中的源代码将编译到Python的字节代码（字节码）中，然后执行Python虚拟机（Python Virtual Machine）来执行这些编译的字节代码。与Java一致。

　　但是，Python虚拟机不同于Java或.NET的虚拟机。Python的虚拟机是一台更高级的虚拟机。

　　从通常的意义上讲，这里的高级级别并不是说Python的虚拟机比Java或.Net更强大。

　　与Java或Net相比，Python的虚拟机距离真实机器更远。或者可以说Python的虚拟机是一种具有更高抽象水平的虚拟机。

　　c python编制的字节码文件通常是pyc格式。此外，python也可以在交互式模式下运行，例如主流操作系统unix/linux，mac和windows可以直接在命令模式下直接运行Python Interactive环境可以发出直接操作说明以实现交互式操作。

　　Python的设计目标之一是使代码高度可读。它使用标点符号符号和英语单词，这些符号和英语单词通常用其他语言使用，以使代码看起来整洁且美丽。

　　它不需要像C和Pascal等其他静态语言那样反复编写陈述，也不需要像他们的语法那样经常出现特殊情况和事故。

　　Python开发人员打算制定违反缩进规则的程序，不能汇编以迫使程序员养成良好的编程习惯。

　　python语言的开始和退出使用句子块的起点和退出（外部规则），而不是使用括号或某些关键字。插入短语块的开头，减少凹痕表示退出的退出。句子块。扩展已成为语法的一部分。

　　在大多数情况下，填充方法是最重要的函数。用常数替换为常数值。

　　填充（值）

　　参数：值

　　注意：它用于填充缺少的标量值或字典对象。

　　#call fillna通过常数

　　写作方法：df.fillna（0）#use 0替换缺失值

　　#call fillna通过词典

　　写作方法：df.fillna（{1：0.5，3：-1}）

　　fillna（value，Inplace = true）

　　参数：Inplote

　　注意：修改可选对象而不生成副本

　　＃始终返回对填补人的参考

　　写作方法：df.fillna（0，Inplace = true）

　　填充（方法= ffill）

　　参数：方法

　　注意：插入方法。如果在函数调用时未指定其他参数，则默认值为“ ffill”

　　那些有效屈光的插值方法也可以用于FillNA：

　　在[23]中：从numpy导入nan为na

　　在[21]中：df = dataframe（np.random.randn（6,3））

　　在[24]中：df.ix [2：1] = na;df.ix [4：，2] = na

　　在[25]中：DF

　　出去[25]：

　　0 1 2

　　0 -0.863925 1.005127 -0.529901

　　1 0.701671 -0.501728 -0.617387

　　2 -0.951060 NAN -0.263626

　　3 0.810230 NAN -0.277401

　　4 -0.403899 Nan Nan

　　5 -0.081091 Nan Nan

　　在[26]中：df.fillna（方法='ffill'）

　　出去[26]：

　　0 1 2

　　0 -0.863925 1.005127 -0.529901

　　1 0.701671 -0.501728 -0.617387

　　2 -0.951060 -0.501728 -0.263626

　　3 0.810230 -0.501728 -0.277401

　　4 -0.403899 -0.501728 -0.277401

　　5 -0.081091 -0.501728 -0.277401

　　填充（限制= 2）

　　参数：限制

　　注意：（对于前后），可以连续填充的最大数字

　　在[27]中：df.fillna（方法='ffill'，limit = 2）

　　出去[27]：

　　0 1 2

　　0 -0.863925 1.005127 -0.529901

　　1 0.701671 -0.501728 -0.617387

　　2 -0.951060 -0.501728 -0.263626

　　3 0.810230 -0.501728 -0.277401

　　4 -0.403899 NAN -0.277401

　　5 -0.081091 NAN -0.277401

　　fillna（data.me.me（）））

　　只要您稍微移动大脑，就可以使用FillNA实施许多其他功能。例如，该系列的平均或中位数可以介绍：

　　在[28]中：data =系列（[1，na，3.5，na，7]）））））

　　在[29]中：data.fillna（data.mean（））

　　file1_path ='e：/ users/lenovo/desktop/chine tv/622召回.csv'＃源数据

　　格式：file1 = pd.read_csv（file1_path）

　　pd.read_csv（file1_path，encoding ='gbk'）

　　pd.read_csv（file1_path，encoding ='gbk'，skiprows = [2,3]）

　　pd.read_csv（file1_path，encoding ='gbk'，skiprows = lambda x：x％2 == 1）

　　pd.read_csv（file1_path，encoding ='gbk'，keep_default_na = false）

　　new = pdataframe（）

　　new.new [[0,1,2]]

　　new.new [0：2]

　　查询结果与上述相同

　　new.loc [new ['激活号] 1000]

　　LOC和ILOC之间的差异：

　　LOC：纯标签筛选

　　ILOC：纯数字筛选

　　＃

　　new = new.loc [：，['phone'，'收件人名称']]

　　＃1

　　new.iloc [：，[0,1]]]

　　使用“ ==”屏幕筛选“ Cui Xu”的人（只能筛选出明确的规格）

　　#new = file1.loc [（file1 ['收件人名称'] =='cui xu'）|（file1 ['收件人名称'] =='cui xia'）]]]]]]]

　　#print（新）

　　＃将loc函数用于屏幕-str.包含函数筛选名称，其中包含“明亮”和“ sea”

　　#new = file1.loc [file1 ['收件人名称'] .str.Contains（'liang | sea'）]

　　#print（新）

　　＃将loc函数用于屏幕-str.contains函数屏幕'cui'姓氏

　　#new = file1.loc [file1 ['收件人名称'] .str.startswitch（'cui'）]

　　#print（新）

　　df = df [（df ['reade_pay_time_x']。

　　print（“ ofer_time（number）= 0：”，newdata [newdata ['extry_time（number）'] == 0] .count（）

　　print（“ ofer_time（number）= 1,2,3数字：”，newdata [（newdata ['eccore_time（number）'] 0）（newdata ['ofer_time（number）]。）']）

　　print（newdata [newdata ['ofer_time（number）'] == 0]

　　newdata [newdata ['team']。isin（['grand'，'意大利'，'俄罗斯']] [['team'，'射击学院']]]]]

　　DF。年龄。value_counts（）

　　1.修改指定位置数据的值（修改行0，‘订单的值'列为3836）

　　new.loc [0，'创建订单'number'] = 3836

　　2.替换“小敏” - “小”

　　df.replace（{'name'：{'xiao ming'：'xiaoming'}}）

　　3.批次替换列的值

　　方法1：df ['gengender'] = df ['gengender'] .map（{'男性'：“男性'，'女性'：'女性'}）

　　方法两个：df ['gender'] .replace（'雌性'，'女性'，Inplace = true）

　　或df ['性别'] = df ['性别'] .ruplace（'女性'，'women'）这是内置的角色

　　+df ['性别'] .replace（'男性'，'男性'，intplace = true）

　　4.更换索引

　　df.columns = ['sex'，'名称'，'高度'，'age']

　　或：df.rename（列= {'性别'：'sex'，'name'：'name'，'height'：'height'：'height'：'height'，'age'：'age'}）

　　5.删除特定列

　　del DF ['player']

　　6.删除列（方法2）并删除一行（默认轴= 0删除行，并删除1列）

　　删除特定列（方法2）

　　df.drop（'性别'，轴= 1）

　　删除一行

　　DF.Drop（1，轴= 0）

　　file1 = pd.read_csv（file1_path）

　　file2 = pd.read_csv（file2_path）

　　new1 = pd.dataframe（）

　　new1 ['phone'] = file1 ['phone']

　　new1 ['contact_time'] = file1 ['Contact_time']

　　new2 = pd.dataframe（）

　　new2 ['phone'] = file2 ['phone']

　　new2 ['cummission_audit_time'] = file2 ['提交评论时间']

　　newdata = pd.merge（new1，new2，on ='phone'，how ='left'）

　　df = pd.concat（[[df1，df2]，轴= 0）

　　4.2.2水平计连接

　　df = pd.concat（[[DF1，df2]，轴= 1）

　　df1 ['region'] .str.split（'·，3，展开= true）

　　DF1：

　　df1 [['City'，“城市区域”，'地址']] = df1 ['region'] .str.split（'·，3，Expand = true）

　　5.1删除

　　data.dropna（轴= 0，子集

　　data.dropna（如何='all'）＃传递此参数后，您只会丢弃所有错过值的行

　　data.dropna（Axis = 1）＃丢弃缺失值列表（通常不这样做，这将删除功能）

　　data.dropna（轴= 1，how =“ all”）＃＃d d d d d d d d d d d d d d d d d

　　5.2丢失的值填充：pandas.dataframe.fillna（）函数

　　dataframe.fillna（value = none，method = none，axis = none，innplace = false = false，limit = none，download = none，** kwargs）

　　功能：使用指定的方法填充Na/Nan值

　　其中，Invlace = true是直接以原始为基础填充

　　5.3丢失的价值查询：

　　查询丢失值的数量：df.isnull（）。sum（）

　　缺乏价值线查询：df [df.isnull（）。t.any（）]

　　newdata ['ofer_time'] = pd.to_dateTime（newdata ['cubmission_audit_time']）-pd.to_dattime（newdata ['contact_time']））

　　newdata ['ofer_time（number）'] =（pd.to_dateTime（newdata ['bistion_audit_time']）-pd.to_dattime（newdata ['contact_time']）。

　　new = pdataframe（）

　　new = newdata [newdata ['extry_time（number）'] == 0]

　　new.to_csv（save_path，encoding ='utf-8-sig'）

　　拆卸数据并将其存储到不同的CSV文件中：

　　路径='c：/users/edz/desktop/work/2021.08.19/'

　　对于我的范围（0,30）：

　　df.loc [[I]。to_csv（路径+str（i）+'。csv'，encoding ='gbk'）

　　df = df [['购买日期'，'周'，“社会保险卡号”，“产品编码”，“产品名称”，“销售数量”，“应收款项”，“收入金额”]]]]]]]]]]]]]]]]]]

　　统计数据中的每一列是否具有空置值：

　　data.isnull（）。任何（）

　　统计数据中的每一列的数量：

　　data.isnull（）。任何（）。sum（）

　　但是有时候，很明显，有空值但不能计算。

　　最近，我遇到的数据，空值的填充为null。在使用上述功能之前，需要对此进行转换。

　　data = data.replace（'null'，np.nan）

　　然后，您继续使用data.isnull（）。任何（），ata.isnull（）。任何（）。sum（）很好。

　　如果这样做，您的问题尚未解决。检查您的缺乏价值被NP.Nan.取代

　　另一种方法：

　　np.any（np.isnan（数据））

　　np.All（np.Iffinite（数据））

　　让我们谈谈python有多少丢失值。感谢您阅读本网站的内容。有关python有多少丢失值的更多信息，请不要忘记在此站点上找到它。

上一篇：大数据会返回多长时间？

下一篇：如何管理物联网资源和环境（2023年的最新答案）

Python的简短介绍多少钱相关文章