国外LEAD自动化工具Selenium操作指南
关于国外LEAD自动化的事情,其实自动化这个名字听起来很高大上,其实就是一些机械的行为交给了脚本来执行而已,并没有大家想想的那么难,现在很多关于自动化的工具很多,你只需要学习简单的一些语法就可以写出一些自动化的脚本出来。过程并不复杂。
今天我要给大家推荐的一款自动化工具Selenium ,Selenium 是一个包含一系列工具和库的伞形项目,这些工具和库支持和支持 Web 浏览器的自动化。
国外LEAD的工作大部分在浏览器里面做的,所以自动化工具也是跟浏览器有关系的,当然还有个思路也是可以实现的,比如自己开发一个浏览器实现网页读取,网址的载入,解析html,js一些源文件,然后一个一个的自动注册,自动做任务。
Selenium提供了模拟用户与浏览器交互的扩展,一个用于扩展浏览器分配的分发服务器,以及用于实现 W3C WebDriver 规范 这让您可以为所有主要的 Web 浏览器编写可互换的代码。
这个插件是开源免费的,大家都可以参与进来,任何人都可以免费使用它。如果你会写代码也可以针对性的提交你的代码。目前它支持的语言有,java python c# javascrip ruby kotlin 基本涵盖了比较主流的开发语言。
安装也很简单,如果你是java开发的,直接使用Maven管理库来安装Seleium库就性,在你的项目pom.xml种添加seleium-java依赖库就性了。
这个自动化脚本做web开发的应该知道,运用的还是比较出名了,目前它支持的浏览器有
这里我们来写一个音乐播放器自动化
首先我们通过paython语言来解析一个网站,
>>> from selenium.webdriver import Firefox >>> from selenium.webdriver.firefox.options import Options >>> opts = Options() >>> opts.set_headless() >>> assert opts.headless # Operating in headless mode >>> browser = Firefox(options=opts) >>> browser.get('https://duckduckgo.com')
这样我们就解析了一个firefox浏览器并打开了duckduckgo.com网页,并通过options实例传递给了firefox构造器函数来激活,这样页面就加载成功了。
>>> opts = Option() >>> opts.set_headless() >>> browser = Firefox(options=opts) >>> browser.get('https://bandcamp.com') >>> browser.find_element_by_class('playbutton').click()
上面打开了一个音乐网站,然后开始播放音乐
>>> tracks = browser.find_elements_by_class_name('discover-item') >>> len(tracks) # 8 >>> tracks[3].click()
应该播放新曲目!这是使用 Python 探索 bandcamp 的第一步!
探索目录
下面就开始打开音乐的歌曲目录,你会发现每个按钮都带有clsss值item-page,这就是下一步的按钮,也就是这个歌单的分页,可以读出所有歌曲。
>>> next_button = [e for e in browser.find_elements_by_class_name('item-page') if e.text.lower().find('next') > -1] >>> next_button.click()
通过上面简单的例子,可以看出来python+Seleium的能力还是很强大的,只要你想实现的,都是可以通过它自动化来完成,这样你可以创建比较真实的用户交互,达到自动填写表单。