您的当前位置:首页 >应用开发 >利用 Python 爬取了 13966 条运维招聘信息,我得出了哪些结论? 正文

利用 Python 爬取了 13966 条运维招聘信息,我得出了哪些结论?

时间:2025-11-05 04:58:04 来源:网络整理编辑:应用开发

核心提示

复制#1、岗位名称 job_name=dom.xpath(//div[@class="dw_table"]/div[@class="el"]//p/span/a[@target=

利用 Python 爬取了 13966 条运维招聘信息,我得出了哪些结论?
复制# 1、利用论岗位名称  job_name = dom.xpath(//div[@class="dw_table"]/div[@class="el"]//p/span/a[@target="_blank"]/@title)  # 2、爬取聘信公司名称  company_name = dom.xpath(//div[@class="dw_table"]/div[@class="el"]/span[@class="t2"]/a[@target="_blank"]/@title)  # 3、条运工作地点  address = dom.xpath(//div[@class="dw_table"]/div[@class="el"]/span[@class="t3"]/text())  # 4、维招工资  salary_mid = dom.xpath(//div[@class="dw_table"]/div[@class="el"]/span[@class="t4"])  salary = [i.text for i in salary_mid]  # 5、出结发布日期  release_time = dom.xpath(//div[@class="dw_table"]/div[@class="el"]/span[@class="t5"]/text())  # 6、服务器托管利用论获取二级网址url  deep_url = dom.xpath(//div[@class="dw_table"]/div[@class="el"]//p/span/a[@target="_blank"]/@href)  # 7、爬取聘信爬取经验、条运学历信息,维招先合在一个字段里面,出结以后再做数据清洗。云南idc服务商利用论命名为random_all  random_all = dom_test.xpath(//div[@class="tHeader tHjob"]//div[@class="cn"]/p[@class="msg ltype"]/text())  # 8、爬取聘信岗位描述信息  job_describe = dom_test.xpath(//div[@class="tBorderTop_box"]//div[@class="bmsg job_msg inbox"]/p/text())  # 9、条运公司类型  company_type = dom_test.xpath(//div[@class="tCompany_sidebar"]//div[@class="com_tag"]/p[1]/@title)  # 10、维招公司规模(人数)  company_size = dom_test.xpath(//div[@class="tCompany_sidebar"]//div[@class="com_tag"]/p[2]/@title)  # 11、出结所属行业(公司)  industry = dom_test.xpath(//div[@class="tCompany_sidebar"]//div[@class="com_tag"]/p[3]/@title)  1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.31.32.33.34.35.36.37.38.39.40.41.42.43.44.45.亿华云计算