crm开发定制Python 爬虫(抓取网页内容简单实现)

1. crm开发定制首先第一步我们先找到crm开发定制自己抓取的网站网址以及内容

crm开发定制在这里我使用的是

抓取的内容是这个网页下的:

所有的讨论

2. 对这个网页的html进行解析,找到讨论这一栏的html

使用F12对当前页面进行解析:

点击圈起来的部分后,点击讨论中的 “婉卿......”  右边就能自动跳转到这一句的源码了

右键单击源码后点击复制中的 复制

复制出来的是: #group-topics > div:nth-child(2) > table > tbody > tr:nth-child(2) > td.title > a

这个可以理解为这句评论在html中的地址

多复制几个其他的讨论找到规律:

#group-topics > div:nth-child(2) > table > tbody > tr:nth-child(5) > td.title > a

发现后三位主要就是tr:nth-child不一样,那么我们就取 tr td.title a 作为我们想要的选择条件

3. 使用python开始编写代码

  1. from urllib.request import urlopen, Request
  2. from bs4 import BeautifulSoup
  3. import xlwt
  4. url = input('Please enter the URL here:')
  5. headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
  6. ret = Request(url, headers=headers)
  7. res = urlopen(ret)
  8. aa = res.read().decode('utf-8')
  9. soup = BeautifulSoup(aa,'html.parser')
  10. comment = soup.select('tr td.title a')
  11. for i in range(0,len(comment)):
  12. comment[i] = comment[i].get('title')

代码的简单原理就是用你的电脑模拟访问网页并且获得服务器返回的html源码

BeautifulSoup是python使用时的一个包。使用我们刚刚拿到的selector,将整个页面的html代码过滤,得到想要的部分.

我们在刚刚在网页看到的html源码里面可以看到:

这个评论是title底下, 所以使用 get('title') 获得title里面的值。最后comment就是我们想要的评论啦

4. 补充

如果遇到这样的html,怎么获取“小悠哉”这个名字呢?

<a href="https://www.douban.com/people/175925841/?_dtcc=1" class="">小悠哉</a>

同样使用selector拿到这一整片的代码,然后使用 .string 就可以啦

  1. soup = BeautifulSoup(aa,'html.parser')
  2. comment = soup.select('tr td.title a')
  3. for i in range(0,len(comment)):
  4. comment[i] = comment[i].get('title')
  5. author = soup.select('td:nth-child(2) a')
  6. for i in range(0,len(author)):
  7. author[i] = author[i].string
  8. count = soup.select('tr td.r-count')
  9. for i in range(0,len(count)):
  10. count[i] = count[i].string

 

网站建设定制开发 软件系统开发定制 定制软件开发 软件开发定制 定制app开发 app开发定制 app开发定制公司 电商商城定制开发 定制小程序开发 定制开发小程序 客户管理系统开发定制 定制网站 定制开发 crm开发定制 开发公司 小程序开发定制 定制软件 收款定制开发 企业网站定制开发 定制化开发 android系统定制开发 定制小程序开发费用 定制设计 专注app软件定制开发 软件开发定制定制 知名网站建设定制 软件定制开发供应商 应用系统定制开发 软件系统定制开发 企业管理系统定制开发 系统定制开发