博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python爬虫
阅读量:5831 次
发布时间:2019-06-18

本文共 354 字,大约阅读时间需要 1 分钟。

这里使用的是xpath这个第三方python库

使用 from lxml import etree 导入

 

使用:

select = etree.HTML(html)

content = select.xpath()

for each in content:

  print each

 

 

一个简单的demo:

from lxml import etreehtml = '''    
Title xxxx'''select = etree.HTML(html)content = select.xpath("//body/input[@id='name1']/@href")for each in content: print eachprint "end"

 

转载地址:http://zsedx.baihongyu.com/

你可能感兴趣的文章
SpringBoot-Shiro使用
查看>>
iOS 9.0之后NSString encode方法替换
查看>>
解决 ThinkPHP5 无法接收 客户端 Post 传递的 Json 参数
查看>>
ASMFD (ASM Filter Driver) Support on OS Platforms (Certification Matrix). (文档 ID 2034681.1)
查看>>
CRM Transaction处理中的权限控制
查看>>
[转]linux创建链接文件的两种方法
查看>>
python ipaddress模块使用
查看>>
文件权限
查看>>
busybox里的僵尸进程为何那么多
查看>>
python debug
查看>>
java 连接数据库之一个完整的函数
查看>>
mysql脚本
查看>>
OllyDBG 入门系列教学--让你瞬间成为破解高手
查看>>
Dubbo点滴(2)之集群容错
查看>>
检测不到兼容的键盘驱动程序
查看>>
listbox用法
查看>>
冲刺第九天 1.10 THU
查看>>
传值方式:ajax技术和普通传值方式
查看>>
Linux-网络连接-(VMware与CentOS)
查看>>
寻找链表相交节点
查看>>