当前位置: 首页 > 科技观察

不要错过!跟踪数据的Python技巧

时间:2023-03-12 12:26:42 科技观察

了解如何使用Python的一些数据对象可以帮助您在处理数据科学项目中的大量数据时保持井井有条并避免错误。在数据科学项目中,有时您希望跟踪数据信息,或者希望灵活地快速轻松地更新新的数据输入。为此,小新整理了这篇文章。在本文中,您将学习到:在循环时跟踪索引更新新的dictionaryitems函数使用可重用对象记录新信息希望这种方法有助于可视化这些工具在代码中的应用位置。1.边执行Loop命令边跟踪假设有一个朋友的名字列表。遍历列表并跟踪计数。怎么做?只需使用枚举。>>>friends=['Ben','Kate','Thinh']>>>fori,iteminenumerate(friends):>>>print(f'{i}:{item}')0:Ben1:Kate2:Thinh或简单地使用dictionarycomprehension>>>{i:friends[i]foriinrange(len(friends))}{0:'Ben',1:'Kate',2:'Thinh'}2.更新DictionaryItems函数来源:Pexels假设您正在使用字典功能来跟踪第一句话中的单词和单词数。sent1={'love':1,'hate':3但是当你到第二句的时候,你想用新的句子更新之前的字典函数。sent2={'love':2,'flower':1}更新后的词包如下:{'love':3,'hate':3,'flower':1}怎么做到的?如果有一些工具可以帮助你,轻松搞定岂不是很好?如果那是您需要的那种工具,那么collections.Counter正是您所需要的。collections.Counter这个类允许集合中存在多个元素fromcollectionsimportCounterbag_words=Counter()sent1={'love':1,'hate':3}bag_words.update(sent1)sent2={'love':2,'flower':1}bag_words.update(sent2)bag_words结果:Counter({'love':3,'hate':3,'flower':1})太棒了!现在,当您从其他句子中收集到更多信息时,可以轻松更新词袋。您可以使用len来找出一个句子中有多少个唯一单词,>>>len(bag_words)3或者,您可以使用sum来计算一个句子中的单词总数,>>>sum(bag_words.values())73。使用Namedtuple定义可以重用对象想要跟踪有关朋友生日的信息列表。由于此时没有可用信息,您首先需要创建一个占位符,稍后您可以在其中输入信息。如果你想记录凯特的生日、最喜欢的食物、肤色以及她是否内向,你可以这样做:>>>Kate=Friend('Feb','cake','pink',True)另外,如果你不要为了她的生日,你可以调用>>>Kate.birthday'Feb'Python中的类对象可以实例化Kate,但是创建一个Friend类来保存简单的信息是比较耗时的。在这种情况下,namedtuple是一个不错的选择。namedtuple允许记录定义一个可重用的对象,确保从集合中使用正确的存档名称True)Ben=Friend('Jan','fish','red',False)显示关于Kate的信息:>>>KateFriend(birthday='Feb',food='cake',color='pink',introvert=True)如果你想知道本(Ben)是内向的还是外向的,你可以调用>>>Ben.introvertFalse来使用nametuples,用户可以很容易地重用同一个对象来实例化新的信息。通过仔细阅读和练习,您将学会使用enumerate、setcomprehension、Counter和namedtuple来跟踪信息。来源:Pexels希望本文能丰富数据科学工具包,为您提供更多有用的知识。