博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
简爬新浪新闻网
阅读量:5914 次
发布时间:2019-06-19

本文共 559 字,大约阅读时间需要 1 分钟。

需要一个chrome浏览器插件,https://chrome.google.com/webstore/detail/infolite/ipjbadabbpedegielkhgpiekdlmfpgal,安装好后打开,可以看到网页块域的类名称

import requestsfrom bs4 import BeautifulSoupres = requests.get('http://news.sina.com.cn/china/')res.encoding = 'utf-8'soup = BeautifulSoup(res.text,'html.parser')for news in soup.select('.news-item'):    if len(news.select('h2')) > 0:        time = news.select('.time')[0].text        h2 = news.select('h2')[0].text        a = news.select('a')[0]['href']        print(time,h2,a)
结果:

转载于:https://www.cnblogs.com/zhangmingzhao/p/7256638.html

你可能感兴趣的文章
OSChina 周一乱弹 ——程序员跟产品经理撕逼必须掌握的套路
查看>>
Linux系统启动流程详解
查看>>
Magento(CE1.X)自带模块解析五
查看>>
Factory Method模式 (一)
查看>>
组策略无法正常应用
查看>>
代码整洁之道-第9章-单元测试-读书笔记
查看>>
C++ ssd5 12 optional exercise2
查看>>
如何调用带返回值类型的函数
查看>>
Building QT projects from the command line
查看>>
JSP
查看>>
新工作
查看>>
linux网络编程涉及的函数
查看>>
数据表的相关操作
查看>>
SQL 存储过程返回值
查看>>
POJ 2594 Treasure Exploration(最小可相交路径覆盖)题解
查看>>
数据挖掘十大经典算法
查看>>
ArcGIS API for Silverlight 调用GP服务加载等值线图层
查看>>
CentOS系统rsync文件同步 安装配置
查看>>
LogStash配置、使用(三)
查看>>
SpringMVC 学习笔记(二) @RequestMapping、@PathVariable等注解
查看>>