网站后台权限管理怎么做的百度免费优化
1.Jsoup是什么:
是HTML的解析器,可以解析URL地址,HTML的文本内容,可以使用DOM,CSS以及类似Jquery的操作方法来操作数据
2.Jsoup的作用
1.通过URL或者文件或者字符串获取到HTML页面并解析
2.使用DOM或CSS等操作来对数据进行操作
3.可以操作HTML元素
3.通过Jsoup获取文档对象
每一个HTML都是一个文档对象(document对象),里面包含很多元素或者元素集合(Element或者Elements)
1.使用Jsoup进行URL的解析
既然要通过URL进行HTML的获取,那第一步肯定是先通过URL获取到网页内容了,使用parse方法
Document document = Jsoup.parse(new URL("https://www.loyo.cc/xianggangju/wohejiangshiyougeyuehuiguoyudiyibu/2-24.html"),5000);
2.使用Jsoup可以进行html标签代码的解析
也是用parse方法,参数是String类型的html代码,这里使用的是一个文件里面的HTML标签代码
我需要先把文件里面的字符串提取出来,采用FileUtils类的readFileToString方法,参数是文件和编码方式
String content = FileUtils.readFileToString(new File(urlAddress),"utf-8");
Document document = Jsoup.parse(content);
3.使用Jsoup可以进行html文件的解析
还是使用parse方法,第一个参数是文件,第二个参数是编码方式
Document document = Jsoup.parse(new File(urlAddress),"utf-8");
4.为了要操作页面的元素,可以使用Document对象的方法获取到页面某些标签
1.getElementByTag()方法可以根据标签名字来获取标签
这里使用getElementByTag()获取title标签之后选中获取到的这一堆标签里面的第一个标签(.first)然后输出他标签内部的文本内容(.text)
String titleText = document.getElementsByTag("title").first().text();