当前位置：首页 > 网络应用技术

Python阅读了多少行CVS文件（2023年最新共享）

时间：2023-03-08 11:05:56 网络应用技术

　　简介：今天，首席CTO注释将与您分享有关CVS文件的CVS文件的数量。如果您可以解决您现在面临的问题，请不要忘记注意此网站。让我们现在开始！

　　1.打开文件并返回行数。

　　2.返回到列数，返回特定行，返回前几行，返回特定列，返回前几列，然后返回到行的行。

　　3.一一读取CSV以满足条件并返回行号。

　　阅读CSV文件

　　最多

　　简化版本

　　filepath_or_buffer：str，pathlib.str，pathlib.path，py._path.local.local.localpath或任何带有read（）方法的对象

　　它可以是URL，URL类型包括：http，ftp，s3和files.multi -file正在准备

　　阅读本地文件的示例:: //localhost/path/to/table.csv

　　** sep **：str，默认'，’

　　指定分隔符。如果您不指定参数，则将尝试将逗号分开。分离器成长为角色而不是“ s+”，它将使用Python语法分析仪。并忽略数据中的逗号。表达： ' '

　　**定界符**：str，默认没有

　　固定边界，替代部门（如果此参数指定，则SEP参数无效）

　　delim_whitespace：布尔值，默认为false。

　　指定空间（例如'或'''）是否用作分离主义者。它等效于设置sep ='s+'。如果将此参数设置为ture，则定界符参数将失败。

　　在新版本0.18.1中的支持

　　标题：int或int列表，默认的“ ins”

　　指定的行数被用作名称列表，并且数据数启动。如果文件中没有名称，则默认值为0，否则将其设置为无。如果标题= 0明确设置了，则原始存在被替换。Header参数可以是一个列表，例如：[0,1,3]，此列表表明文件中的这些行用作列标题（每列中的多个标题），并且中间的线将被忽略。

　　注意：如果skip_blank_lines = true，则标题参数忽略注释和空行，因此标头= 0表示第一行数据的第一行，而不是文件的第一行。

　　**名称**：类似数组，默认没有

　　结果的名称列表，如果数据文件中没有标题行，则需要在默认列表中执行header = none.no重复，除非设置参数mangle_dupe_cols = true。

　　index_col：int或sequence或false，默认没有

　　对于索引的列号或名称，如果给出了序列，则有多个行索引。

　　如果文件不规则并且尾巴具有分离器，则可以设置index_col = false的pandas不适用于第一列作为行索引。

　　UseCols：类似阵列，默认没有

　　返回数据集，此列表中的值必须对应于文件中位置的位置（数字可以对应于指定的列）或字符传输的名称是文件的名称。例如：有效USERCOL的参数可能为[0,1,2]或['foo'，'bar'，'baz']。使用此参数可以加快加载并减少内存消耗。

　　AS_RECARRAY：布尔值，默认为false

　　不同意使用：将在未来版本中删除此参数。请使用pd.read_csv（...）。to_records（）。

　　返回一个numpy recarlay以替换数据框。如果将参数设置为true。它将首先使用。索引将不再可用，并且索引列将被忽略。

　　**挤压**：布尔，默认为false

　　如果文件值包含列，请返回服务器

　　**前缀**：str，默认没有

　　当没有标题时，将前缀添加到列。例如：添加'x'成为x0，x1，...

　　** mangle_dupe_cols **：布尔值，默认为true

　　重复的列，将“ x” ... x'表示为“ x.0” ...'x.n。如果设置为false，则将覆盖所有重复。

　　dtype：键入colmn -type的名称或dict，默认没有

　　每列的数据类型。例如

　　**引擎**：{‘c’，‘python’}，可选

　　解析器使用。当Python发动机目前更加完整时，C发动机的速度更快。

　　使用的分析引擎。您可以选择C或Python.c引擎很快，但是Python发动机功能更完整。

　　转换器：dict，默认没有

　　转换函数的字典。关键可以是列或列的序列号。

　　true_values：列表，默认没有

　　值为真实的价值观

　　false_values：列表，默认没有

　　值为假的值

　　** skipinitialspace **：布尔值，默认为false

　　分段后忽略空白（默认为false，即不忽略）。

　　跳过：类似列表或整数，默认没有

　　需要忽略的行数（从文件的开头开始）或需要跳过的行号列表（从0开始）。

　　Skipfooter：int，默认值0

　　从文件的末尾开始。（不支持C引擎）

　　skip_footer：int，默认值0

　　不建议这样做：建议使用skipfooter，该功能相同。

　　nrows：int，默认没有

　　需要读取的行数（从文件头开始）。

　　na_values：scalan，str，类似于列表或dict，默认没有

　　一组替换na/nan的值。如果您传递参数，则需要制定特定列的空值。默认值为“ 1.＃ind”，'1.＃qnan'，'n/a'，'na'，'null'，'nan'，'nan'。

　　** keep_default_na **：bool，默认为true

　　如果指定了na_values参数并keep_default_na = false，则将涵盖默认的NAN，否则将其添加。

　　** na_filter **：布尔值，默认为true

　　检查您是否丢失了值（空字符串还是空值）。对于大文件，没有空值，设置na_filter = false可以提高读取速度。

　　冗长：布尔值，默认为false

　　是否打印各种解析器的输出信息，例如：“非价值列中丢失值的数量”等等。

　　skip_blank_lines：布尔值，默认为true

　　如果您是真的，您将跳过空线；否则，它将被记录为Nan。

　　** parse_dates **：布尔值或ints或名称列表或列表或dict的列表，默认为false

　　peash_datetime_format：boolean，默认错误false

　　如果将其设置为True且Parse_dates可用，则PANDAS将尝试将其转换为日期类型。在某些情况下，它将快5-10倍。

　　** keep_date_col **：布尔值，默认为false

　　如果连接多个列，请保持列参与连接。默认值为false。

　　date_parser：函数，默认没有

　　用于分析日期的功能，使用dateutil.parser.parser转换default.pandas尝试使用三种不同的方法来分析，并在遇到问题时使用下一个方法。

　　1.将一个或多个数组（由PARSE_DATES指定）作为参数；

　　2.将指定的多列字符串作为参数连接为列；

　　3.调用date_parser函数一次将一行分析一个或多个字符串（由parse_dates指定）为参数。

　　** dayfirst **：布尔值，默认为false

　　DD/mm格式日期类型

　　**迭代器**：布尔值，默认为false

　　返回textfilereader对象以通过块处理文件。

　　块：int，默认没有

　　文件块的大小，请参阅IO工具文档，以获取有关迭代器和块质量的更多信息。

　　压缩：{{'推断'，gzip'，'bz2'，'zip'，'xz'，none}，默认“ incer”

　　如果您使用推论参数，使用gzip，bz2，zip或用'.gz'，'.bz2'，'.zip'或'xz'是一个是一个，请使用gzip，bz2，zip或'xz'是一个文件，否则不会解压缩。如果您使用zip，则zip软件包中国必须仅包含一个文件。如果没有解压缩，请否。

　　新版本0.18.1版本支持ZIP和XZ减压

　　这和：str，默认没有

　　成千上万的积分划分，例如“”或“”。

　　小数：str，默认为'。’

　　字符中的小数点（例如：欧洲数据使用'，’）。

　　float_precision：字符串，默认没有

　　指定

　　**线粒体**：str（长度1），默认没有

　　线路划分符号仅在C饼干下使用。

　　** quodechar **：str（长度1），可选

　　引号被用作启动和解释的字符，引号中的分割符号将被忽略。

　　引用：int或csv.quote_*实例，默认为0

　　控制CSV中的引号常数。Optionalquote_minimal（0），quote_all（1），quote_nonnumeric（2）或quote_none（3）

　　doublequote：布尔值，默认为真

　　当定义单个引号并且引用参数不是QUOTE_NONE时，使用双引号将引号中的元素表示为元素。

　　Escapechar：str（长度1），默认没有

　　引用是quote_none时，请指定一个字符以实现无限限制。

　　评论：str，默认没有

　　如果字符出现在头部，则该行将被忽略。该参数只能是一个字符，空线的音符（就像skip_blank_lines = true一样）被header and skiprows.for忽略了。示例，如果注释='＃'＃'分析'#empty

　　a，b，c

　　1,2,3'为标题= 0，因此返回结果将基于“ A，B，C'为标头。

　　编码：str，默认没有

　　指定字符集的类型，通常指定为“ UTF-8”。Python标准编码列表

　　方言：str或csv.dialect实例，默认没有

　　如果没有特定的语言，则SEP大于字符，它将被忽略。检查csv.dialect文档

　　tupleize_cols：boolean，默认为false

　　在列上留下一个元组列表

　　error_bad_lines：布尔值，默认为true

　　如果一行包含太多列，则默认情况下不会返回数据框。如果将其设置为false，则将将其删除（仅在C Parster下使用）。

　　warn_bad_lines：布尔值，默认为true

　　如果error_bad_lines = false，并且warn_bad_lines = true，则将输出所有“坏线”（仅在C Parses下使用）。

　　** low_memory **：布尔值，默认为true

　　将块加载到内存，然后在低内存消耗中分析。但是可能存在混淆类型。确保该类型不会混淆并设置为false.或使用dtype参数指定类型。注意使用chunksize或Itererator tyerator或Itererator参数，读取到一个块中会将整个文件读取到数据框中，而忽略该类型（仅在C Parster中有效）

　　** buffer_lines **：int，默认没有

　　不建议，此参数将在未来版本中删除，因为不建议在解析器中使用其价值

　　compact_ints：布尔值，默认为false

　　不建议，此参数将在未来版本中删除

　　如果设置compact_ints = true，则任何整数列都将根据最小整数类型存储。

　　use_unsigned：布尔值，默认为false

　　不建议：将来版本将删除此参数

　　如果整数列被压缩（即compact_ints = true），则指定压缩列是符号还是非符号符号。

　　memory_map：布尔值，默认为false

　　如果存储器中使用的文件，请直接使用映射文件。使用此方法再次避免IO操作。

　　参考：

　　读取CSV文件并使用csv.reader（）的方法。结果是_csv.reader的对象。我们可以遍历此对象以输出每行，一行或特定列。代码显示如下：

　　每行都是列表，然后使用条件来判断

　　结论：以上是首席CTO注释为每个人编制的CVS文件的相关内容的相关内容摘要。希望它对您有所帮助！如果您解决了问题，请与更多关心此问题的朋友分享?

上一篇：公司互联网在做什么（2023年最新的完成）

下一篇：使用Gin和Go-Micro实施微服务注册和发现

Python阅读了多少行CVS文件（2023年最新共享）相关文章