盘点一个Pandas提取Excel列包含特定关键词的行（下篇）

前端皮皮

发布于 2024-01-04 13:40:05

2060

发布于 2024-01-04 13:40:05

文章被收录于专栏：前端进阶学习交流前端进阶学习交流

大家好，我是皮皮。

一、前言

前几天在Python白银交流群【上海新年人】问了一个Pandas数据提取的问题，上一篇中已经给出了代码，粉丝自己可能还没有领悟明白，一用就废，遇到了问题。他的代码照片如下图：

这个代码这么写，最后压根儿就没有得到他自己预期的结果，遂来求助。这里又回归到了他自己最开始的需求澄清！！！论需求表达清晰的重要性！好在他自己还把数据demo发出来了，不然更加难搞。

二、实现过程

后来【莫生气】给了一份代码，如下图所示：

本以为顺利地解决了问题，但是粉丝又马上增改需求了，如下图所示：

真的，代码写的，绝对没有他需求改的快。得亏他没去做产品经理，不然危矣！

后来【莫生气】修改后的代码如下所示：

# 创建布尔Series 
mask = df['作者'].isin(['留言0117', '留0117言', '0117留言', '留言0117']) # 使用布尔Series来索引DataFrame 
result = df[mask]

你已经这就顺利地解决了粉丝的问题了？不，粉丝又觉得这样写不雅。能给你做出来，先实现就不错了，再想着优化的事呗。

后来【莫生气】给了一个正则表达式的写法，总算是贴合了这个粉丝的需求。

如果要结合pandas的话，可以写为下图的代码：

至此，粉丝不再修改需求。总算是告一段落了。

三、总结

大家好，我是皮皮。这篇文章主要盘点了一个Pandas数据提取的问题，文中针对该问题，给出了具体的解析和代码实现，帮助粉丝顺利解决了问题。

最后感谢粉丝【上海新年人】提出的问题，感谢【鶏啊鶏。】、【论草莓如何成为冻干莓】、【冯诚】给出的思路，感谢【莫生气】等人参与学习交流。

本文参与腾讯云自媒体分享计划，分享自微信公众号。

原始发表：2023-12-31，如有侵权请联系 cloudcommunity@tencent.com 删除

正则表达式

本文分享自 Python共享之家微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体分享计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度