去除html标签,获取文本

从网页中获取大段文章时,常常是先获取整个文本处的html标签使用正则处理,但是正则往往只能去除比较规范的前端标签,对于不规范的标签,往往需要多次处理,比较麻烦。 在python中有些库可以实现解...

Python 2019-09-21 1053

python相关迭代操作

由于自己的神操作,导致自己写了很久的2篇笔记被删了,现在写第3篇! 写在前面,当涉及迭代操作时,优先查看itertools库! 1.反向迭代 在python中已经有了内置的reversed函数实...

Python 2019-09-11 1054