Java+Selenium实现后台截图网页，可运行在树莓派上

前言：最近折腾了一个QQ机器人，突然有个灵感。当用户发送一个网页链接时，我想使用Java对网页进行截图，然后将截图文件发回到QQ上，感觉这个功能很酷炫，于是昨天（2020-10-29）研究了一晚上，下面对截图功能这个部分进行总结。

一. 概述

首先我在网上查询了相关资料（并不多），最常见的两种方案：

使用 Java 自带的 Robot 类，对电脑屏幕进行截图，不建议使用。
使用 Selenium 工具，对游览器进行截图。

由于最后想要运行在树莓派上（ARM 32位），遇到了不少问题。

受限于树莓派zero的性能，生成一张截图可能要30s左右。

二. 准备与安装

方案一：使用Java自带Robot类

只需要 JDK1.6 及以上版本即可。

方案二：使用Selenium

第一步：

安装 chrome 游览器：

1
2
3

# Linux 上建议使用chromium
sudo apt install chromium-browser
# Win和Mac可直接在官网下载

在 chrome 游览器中，或者命令行执行 chromium-browser --version 查看版本号

并在下面的链接中下载相应版本号的 chromedriver，解压后即可使用。

chromedriver下载地址：http://npm.taobao.org/mirrors/chromedriver/

注意：如果你使用的是32位的Linux（例如树莓派）或者没有找到相应的版本号，建议使用命令去安装：

# 安装chromedriver
sudo apt-get install chromium-chromedriver
# 查看chromedriver的安装位置
dpkg -L chromium-chromedriver

第二步：

添加 commons-io 与 selenium 依赖，以 Maven 为例。

<!--selenium-->
<dependency>
    <groupId>org.seleniumhq.selenium</groupId>
    <artifactId>selenium-java</artifactId>
    <version>3.141.59</version>
</dependency>
<!--commons-io-->
<dependency>
    <groupId>commons-io</groupId>
    <artifactId>commons-io</artifactId>
    <version>2.8.0</version>
</dependency>

三. 代码实现

方案一：使用Java自带Robot类

Desktop.getDesktop().browse(new URL(url).toURI());
Robot robot = new Robot();
Dimension d = new Dimension(Toolkit.getDefaultToolkit().getScreenSize());
int width = (int) d.getWidth();
int height = (int) d.getHeight();
// 最大化浏览器
robot.keyRelease(KeyEvent.VK_F11);
Image image = robot.createScreenCapture(new Rectangle(0, 0, width, height));
BufferedImage bi = new BufferedImage(width, height, BufferedImage.TYPE_INT_RGB);
Graphics g = bi.createGraphics();
g.drawImage(image, 0, 0, width, height, null);
// 保存图片 注意替换文件路径
ImageIO.write(bi, "jpg", new File("/Users/ming/Desktop/temp/" + System.currentTimeMillis()+".jpg"));

方案二：使用Selenium

public void screenshot(String url) throws IOException {
    //设置系统参数，第二个参数要指向chromedriver的位置
    System.setProperty("webdriver.chrome.driver", "/usr/bin/chromedriver");
    ChromeOptions options = new ChromeOptions();
    options.addArguments("--headless"); // 无窗口模式
    options.addArguments("--disable-infobars"); // 禁言消息条（就上面经常一条黄色的那个）
    options.addArguments("--disable-extensions"); // 禁用插件
    options.addArguments("--disable-gpu"); // 禁用GPU
    options.addArguments("--no-sandbox"); // 禁用沙盒模式否则会报错
    options.addArguments("--disable-dev-shm-usage");
    options.addArguments("--hide-scrollbars"); // 隐藏滚动条
    options.addArguments("--window-size=375,190"); // 设置开启游览器时的分辨率，如果在树莓派运行建议不要设置此项

    //启动chrome实例
    WebDriver driver = new ChromeDriver(options);

    // 设置游览器打开后调整大小
    // driver.manage().window().setSize(new Dimension(1920, 1080));

    //访问指定url
    driver.get(url);
    //指定了OutputType.FILE做为参数传递给getScreenshotAs()方法，其含义是将截取的屏幕以文件形式返回。
    File srcFile = ((TakesScreenshot)driver).getScreenshotAs(OutputType.FILE);
    //利用FileUtils工具类的copyFile()方法保存getScreenshotAs()返回的文件对象。
    FileUtils.copyFile(srcFile, new File("/home/project/screenshot.png"));
    //关闭浏览器
    driver.quit();
}

注意：如果在树莓派上运行，要按照上面的参数去设置，否则会报一些奇奇怪怪的错误。

如果想对页面的 特定区域 进行截图呢？请往下继续看。

四. Selenium中花里胡哨的操作

元素定位

首先，Selenium提供定位元素的方法：driver.findElement()

方式	示例
根据Id查找	driver.findElement(By.id(“id”))
根据name查找	driver.findElement(By.name(“name”))
根据链接的全部文本查找	driver.findElement(By.linkText(“linkText”))
根据链接的部分文本查找	driver.findElement(By.partialLinkText(“partialLinkText”))
根据ClassName查找	driver.findElement(By.className(“className”))
根据tagName查找	driver.findElement(By.tagName(“tagName”))
根据xpath查找	driver.findElement(By.xpath(“xpath”))

表单输入与提交

除此之外，还可以模拟在游览器中输入表单并提交

1
2
3

driver.findElement(By.name("firstname")).sendKeys("Lei");//输入字串
driver.findElement(By.name("lastname")).sendKeys("Hou");
driver.findElement(By.id("submit")).click();

截图指定区域

下面直接上代码。

public File elementSnapshot(WebElement element) throws Exception {
    //创建全屏截图
    File screen = ((TakesScreenshot) this.driver).getScreenshotAs(OutputType.FILE);

    BufferedImage image = ImageIO.read(screen);

    //获取元素的高度、宽度
    int width = element.getSize().getWidth();
    int height = element.getSize().getHeight();

    //创建一个矩形使用上面的高度，和宽度
    Rectangle rect = new Rectangle(width, height);
    //元素坐标
    Point p = element.getLocation();

    //对前面的矩形进行操作
    //TODO 使用可以截全图的方法（滚动条），暂未找到方式
    int w = rect.width; //指定矩形区域的宽度
    int h = rect.height;//指定矩形区域的高度
    int x = p.getX(); //指定矩形区域左上角的X坐标
    int y = p.getY(); //指定矩形区域左上角的Y坐标

    //driver的分辨率，这里设置1920*1080
    int w_driver = 1920;
    int h_driver = 1080;

    System.out.println("width:" + w);
    System.out.println("height:" + h);
    System.out.println("x:" + x);
    System.out.println("y:" + y);

    System.out.println("y+height:" + (y + h));
    System.out.println("x+width:" + (x + w));

    /**
     * 如果Element的Y坐标值加上高度超过driver的高度
     * 就会报错(y + height) is outside or not
     * 退而求其次，调整图片的宽度和高度, 调整到适合driver的分辨率
     * 此时会截图driver可见的元素区域快照
     * TODO 如果能找到跨滚动条截图的方式，可以不用裁剪
     */
    try {
        if (y + h > h_driver) {
            h = h - (y + h - h_driver); //

            System.out.println("修改后的height:" + h);
            System.out.println("修改后的y+height：" + (y + h));
        }
        //(x + width) is outside or not
        if (x + w > w_driver) {
            w = x - (x + w - w_driver);

            System.out.println("修改后的width：" + w);
            System.out.println("修改后的x+width:" + (x + w));
        }

        BufferedImage img = image.getSubimage(x, y, w, h);
        ImageIO.write(img, "png", screen);
        System.out.println("Screenshot By element success");
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
    return screen;
}

那么传进去的参数： WebElement 怎么获取呢？

// 通过driver获取页面
driver.get(url);
// 定位到class名为pyqBox的标签
WebElement element = driver.findElement(By.className("pyqBox"));

上述代码是通过元素定位的方法来截图，非常方便。