大家好,我是皮皮。
前几天在Python白银交流群【上海新年人】问了一个Pandas数据提取的问题,上一篇中已经给出了代码,粉丝自己可能还没有领悟明白,一用就废,遇到了问题。他的代码照片如下图:
这个代码这么写,最后压根儿就没有得到他自己预期的结果,遂来求助。这里又回归到了他自己最开始的需求澄清!!!论需求表达清晰的重要性!好在他自己还把数据demo发出来了,不然更加难搞。
后来【莫生气】给了一份代码,如下图所示:
本以为顺利地解决了问题,但是粉丝又马上增改需求了,如下图所示:
真的,代码写的,绝对没有他需求改的快。得亏他没去做产品经理,不然危矣!
后来【莫生气】修改后的代码如下所示:
# 创建布尔Series
mask = df['作者'].isin(['留言0117', '留0117言', '0117留言', '留言0117']) # 使用布尔Series来索引DataFrame
result = df[mask]
你已经这就顺利地解决了粉丝的问题了?不,粉丝又觉得这样写不雅。能给你做出来,先实现就不错了,再想着优化的事呗。
后来【莫生气】给了一个正则表达式的写法,总算是贴合了这个粉丝的需求。
如果要结合pandas的话,可以写为下图的代码:
至此,粉丝不再修改需求。总算是告一段落了。
大家好,我是皮皮。这篇文章主要盘点了一个Pandas数据提取的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【上海新年人】提出的问题,感谢【鶏啊鶏。】、【论草莓如何成为冻干莓】、【冯诚】给出的思路,感谢【莫生气】等人参与学习交流。