V2EX badacook 的所有回复 第 1 页 / 共 2 页
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX    badacook    全部回复第 1 页 / 共 2 页
回复总数  35
1  2  
2021-04-08 19:26:52 +08:00
回复了 badacook 创建的主题 Python Python schedule task
@clino 看了一下 你的解决方法好像比较接近,思路大概就是在主线程里捕获执行脚本的线程句柄 handle,传入类似 GetExitCodeThread()函数,有点儿回调的意思,不知道这种理解对不对
2021-04-05 19:25:56 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@demo06 非常感谢大神 xpath 语法真的很赞,这个语法我要好好研究一下,本来还觉得学了解 xpath,自惭形秽啊
2021-04-04 14:38:01 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@demo06 http://baostock.com/baostock/index.php/Python_API%E6%96%87%E6%A1%A3
比如这个页面 我想取出 所有的 caption 为返回数据说明的 table,结合 pandas 处理 DataFrame 的能力
我上面 实例 里面的 text = requests.post(url, headers=headers) 就是获取 HTML 页面的 text.text
你也可以直接 打开这个页面 http://baostock.com/baostock/index.php/Python_API%E6%96%87%E6%A1%A3
使用 F12 查看源码
2021-04-04 08:12:27 +08:00
回复了 badacook 创建的主题 Python 动态创建变量名并读取文件
@aijam 非常感谢 globals() 与 vars() 均能实现 setting a string as a variable name,或者说 create variable variables in Python
2021-04-03 20:21:33 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
发现了自己的一个大错误,caption 作为 table 的标题,并不是 table 的属性,而是最近的子元素,那针对 caption 的 table 筛选,何种方法最便捷呢
2021-04-03 16:48:20 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@misaka19000 我感觉 我 xpath 没写错,我有参照 W3C xpath 语法来写,就是取到了 DOM 对象,如何还原表单,后续的处理,我看 pandas 的 read_html 其中带 attrs 参数,参数为字典格式,可获取特定属性的 table,我使用 attrs = {"caption":"返回数据说明"} 不带这个参数能获取所有 table,带了反而报错
2021-04-03 16:08:15 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@demo06 非常感谢 能不能分享一下 python 处理 dom 文档对象的文章,没找到切合的实例
2021-04-03 16:04:08 +08:00
回复了 badacook 创建的主题 Python 爬虫过程中 DOM 对象的处理
@milukun 因为 有多个 caption="返回数据说明" d table,分别是 id="mw-content-text"元素的子元素,且互为不间断的兄弟元素,我有 F12 查看 其中一个元素 xpath 检索 //*[@id="mw-content-text"]/table[26]/caption,我只是在这个基础上改成查找 包含 caption 属性,且值为"返回数据说明" 的 table 元素
2021-04-03 10:06:14 +08:00
回复了 badacook 创建的主题 Python 动态创建变量名并读取文件
@pursuer 你如果有空 能不能试一试,就是一个目录下有几个 csv 文件,还可能有其他类型文件,要做的就是使用 pandas 库,将这些 csv 文件 以文件名变量的形式读进去,变量作用域在整个脚本范围,其中 globals()不是返回的全局字典嘛,作为 python 新手的我 实在有些不理解,其中 exec 函数 提供字符串命令的执行,感觉跟这个需求也有点儿接近,能不能试一试 也是个简单的小实验 我也想通过这个小实验 理解这个过程,谢谢了
2021-04-03 09:02:56 +08:00
回复了 badacook 创建的主题 Python 动态创建变量名并读取文件
@pursuer 那个赋值 加载 csv 在 for 的 if 分支下,而且 想做到变量名与加载的 csv 文件同名,其实作用域是想做到 for 的外层使用,只是想着看看 在 for 的 if 分支 赋值加载时 可以动态,不知道能否实现
2021-04-02 12:09:18 +08:00
回复了 badacook 创建的主题 Python 动态创建变量名并读取文件
@minami
exstr = "'{0}'[:-4] = pd.read_csv({0},encoding='gbk')".format(item)
exec exstr
按照 你说的 生成每个条目 的命令字符串,使用 exec 函数,无法执行 是否 exec 不支持变量字符串
2021-04-02 11:55:15 +08:00
回复了 badacook 创建的主题 Python 动态创建变量名并读取文件
@minami exe 函数执行赋值语句,exec "item[:-4]=pd.read_csv(item,encoding='gbk')" ,其中 item 如何解析为变量啊
2021-04-02 11:08:11 +08:00
回复了 badacook 创建的主题 Python 动态创建变量名并读取文件
@typetraits 为啥 还要转一步 ,能不能就在这个 for 内部 if 语句中完成啊,还要创建字典 再历遍字典啊
2021-03-30 07:07:15 +08:00
回复了 badacook 创建的主题 Python pandas 行筛选
@wanv1171 非常感谢,Series.str.contains(),与 apply lambda 这种方式 这几天都一直在用,就是这几种结合 any 函数没组合使用过,真香啊,感谢感谢,致敬
2021-03-29 22:36:26 +08:00
回复了 badacook 创建的主题 Python pandas 行筛选
@wuwukai007 试过了 完全不对啊
2021-03-29 22:22:30 +08:00
回复了 badacook 创建的主题 Python pandas 行筛选
@imn1
谢谢大神的提点 那篇文章有搜到过 看过一部分
结合这个 问题我想起来了 apply()相关函数 包含多列处理,返回的是 DataFrame,
可以将 DataFrame.T 对所有行变换成列,返回相关列也就是本身的行,只是需要自定义判断函数
之前看到了 DataFrame.query 函数 也是返回 DataFrame 列,就是其中的 boolean expression 感觉到不到效果
再次感谢 大神的 astype 指点。
2021-03-29 19:18:25 +08:00
回复了 badacook 创建的主题 Python DataFrame 内容处理
@HelloViper
@reself
@Gatsbywl
imn1 大神用一行正则 直接实现了,df = df.replace(r'[^()]*\(([^()]+)\)[^()]*', value=r'\1', regex=True)
包含括号,就将内容替换为括号里面的内容,太厉害了
2021-03-29 19:12:25 +08:00
回复了 badacook 创建的主题 Python DataFrame 内容处理
@imn1 猛男啊 虽然我也学过正则,那仅仅是知道,难怪我开始都怀疑 正则能不能实现,非常感谢,致敬
2021-03-29 17:19:56 +08:00
回复了 badacook 创建的主题 Python DataFrame 内容处理
@imn1 这不是 写不出这个正则嘛 字符串,含有()就保留()里面的内容,要是写得出这个正则, 我也提前看过了 那个 replace 函数了 也不会在这里请教大家了
2021-03-29 16:45:55 +08:00
回复了 badacook 创建的主题 Python DataFrame 内容处理
@HelloViper 还有一点 使用最后的 df.applymap() 条件处理时,需要先将 DataFrame 中非字符数据列 全部转换成 字符处理,df = df.applymap(str),这个好像 也只能是这样了,有点儿失真
1  2  
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2666 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 16ms UTC 14:20 PVG 22:20 LAX 06:20 JFK 09:20
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86