Table of Contents
环境
CentOS7,python3
正题:
安装Selenium
pip3 install selenium
安装chrome
添加chrome源
vim /etc/yum.repos.d/google-chrome.repo
[google-chrome]
name=google-chrome
baseurl=http://dl.google.com/linux/chrome/rpm/stable/$basearch
enabled=1
gpgcheck=1
gpgkey=https://dl-ssl.google.com/linux/linux_signing_key.pub
安装chrome
yum install google-chrome-stable --nogpgcheck
下载chromedriver
获取chrome版本
google-chrome --version
查询chromedriver与chrome版本对应关系
http://chromedriver.chromium.org/downloads
下载对应版本的chromedriver
http://chromedriver.storage.googleapis.com/index.html
解压chromedriver_linux64.zip,并赋权
unzip chromedriver_linux64.zip
(找个地方放好)
chmod 755 chromedriver
代码测试安装情况
executable_path尽量用绝对路径!开始用的相对路径,计划任务各种没反应。。。后来发现原来问题在这儿
# -*- coding: utf-8 -*-
from selenium import webdriver
print("开始爬取")
# 创建chrome参数对象
options = webdriver.ChromeOptions()
options.add_argument('--no-sandbox') # 解决DevToolsActivePort文件不存在的报错
options.add_argument('window-size=1600x900') # 指定浏览器分辨率
options.add_argument('--disable-gpu') # 谷歌文档提到需要加上这个属性来规避bug
options.add_argument('--hide-scrollbars') # 隐藏滚动条, 应对一些特殊页面
options.add_argument('blink-settings=imagesEnabled=false') # 不加载图片, 提升速度
options.add_argument('--headless') # 浏览器不提供可视化页面. linux下如果系统不支持可视化不加这条会启动失败
browser = webdriver.Chrome(options=options,executable_path='/XXX/XXX/chromedriver')
browser.get('https://blog.ggan.top')
print(browser.title)
browser.quit()
参考:
https://blog.csdn.net/pengjunlee/article/details/91997908
https://intoli.com/blog/installing-google-chrome-on-centos/