阿里网站备案站长分析工具
感谢每一个认真阅读我文章的人,看着粉丝一路的上涨和关注,礼尚往来总是要有的:
① 2000多本Python电子书(主流和经典的书籍应该都有了)
② Python标准库资料(最全中文版)
③ 项目源码(四五十个有趣且经典的练手项目及源码)
④ Python基础入门、爬虫、web开发、大数据分析方面的视频(适合小白学习)
⑤ Python学习路线图(告别不入流的学习)
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化学习资料的朋友,可以戳这里获取
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
Elements paragraphs = doc.select("p");
for (Element paragraph : paragraphs) {paragraph.addClass("highlight"); // 添加CSS类paragraph.attr("data-id", "123"); // 设置自定义属性paragraph.text("New text"); // 设置新的文本内容
}
六、处理HTML表单
Jsoup提供了处理HTML表单的支持。您可以使用它来填充表单字段、提交表单和处理表单响应。以下是一个简单的示例:
Connection.Response loginForm = Jsoup.connect("http://example.com/login").method(Connection.Method.GET).execute();Document loginDoc = loginForm.parse();
Element form = loginDoc.select("form").first();// 填充表单字段
form.select("input[name=username]").val("username");
form.select("input[name=password]").val("password");// 提交表单
Connection.Response loginResponse = form.submit().cookies(loginForm.cookies()).execute();Document loggedinDoc = loginResponse.parse();
七、综合案例
1:爬取新闻网站的标题和链接
假设我们想要从一个新闻网站上爬取所有新闻的标题和对应的链接。我们可以使用Jsoup来实现这个功能。以下是一个示例:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;public class NewsCrawler {public static void main(String[] args) {try {// 加载新闻网站的HTML文档Document doc = Jsoup.connect("http://www.example.com/news").get();// 选择新闻标题和链接的元素Elements newsElements = doc.select(".news-item");// 遍历元素并提取标题和链接for (Element newsElement : newsElements) {String title = newsElement.select(".title").text();String link = newsElement.select("a").attr("href");System.out.println("标题:" + title);System.out.println("链接:" + link);}} catch (IOException e) {e.printStackTrace();}}
}
在这个示例中,我们首先使用Jsoup连接到指定的新闻网站,并加载HTML文档。然后,我们使用选择器选择每个新闻元素,并通过选择器提取标题和链接。最后,我们将结果打印出来。
2:爬取图片网站的图片链接和下载图片
假设我们想要从一个图片网站上爬取所有图片的链接,并将图片下载到本地。我们可以使用Jsoup来实现这个功能。以下是一个示例:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.BufferedInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.net.URL;public class ImageCrawler {public static void main(String[] args) {try {// 加载图片网站的HTML文档Document doc = Jsoup.connect("http://www.example.com/images").get();// 选择图片链接的元素Elements imageElements = doc.select(".image-item img");// 遍历元素并提取图片链接for (Element imageElement : imageElements) {String imageUrl = imageElement.attr("src");String fileName = imageUrl.substring(imageUrl.lastIndexOf("/") + 1);// 下载图片并保存到本地URL url = new URL(imageUrl);BufferedInputStream in = new BufferedInputStream(url.openStream());FileOutputStream out = new FileOutputStream("images/" + fileName);byte[] buffer = new byte[1024];int bytesRead;while ((bytesRead = in.read(buffer, 0, 1024)) != -1) {out.write(buffer, 0, bytesRead);}out.close();in.close();System.out.println("图片已下载:" + fileName);}} catch (IOException e) {e.printStackTrace();做了那么多年开发,自学了很多门编程语言,我很明白学习资源对于学一门新语言的重要性,这些年也收藏了不少的Python干货,对我来说这些东西确实已经用不到了,但对于准备自学Python的人来说,或许它就是一个宝藏,可以给你省去很多的时间和精力。别在网上瞎学了,我最近也做了一些资源的更新,只要你是我的粉丝,这期福利你都可拿走。我先来介绍一下这些东西怎么用,文末抱走。* * ***(1)Python所有方向的学习路线(新版)**这是我花了几天的时间去把Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。最近我才对这些路线做了一下新的更新,知识体系更全面了。**(2)Python学习视频**包含了Python入门、爬虫、数据分析和web开发的学习视频,总共100多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。**(3)100多个练手项目**我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。**(4)200多本电子书** 这些年我也收藏了很多电子书,大概200多本,有时候带实体书不方便的话,我就会去打开电子书看看,书籍可不一定比视频教程差,尤其是权威的技术书籍。基本上主流的和经典的都有,这里我就不放图了,版权问题,个人看看是没有问题的。**(5)Python知识点汇总**知识点汇总有点像学习路线,但与学习路线不同的点就在于,知识点汇总更为细致,里面包含了对具体知识点的简单说明,而我们的学习路线则更为抽象和简单,只是为了方便大家只是某个领域你应该学习哪些技术栈。**(6)其他资料**还有其他的一些东西,比如说我自己出的Python入门图文类教程,没有电脑的时候用手机也可以学习知识,学会了理论之后再去敲代码实践验证,还有Python中文版的库资料、MySQL和HTML标签大全等等,这些都是可以送给粉丝们的东西。**这些都不是什么非常值钱的东西,但对于没有资源或者资源不是很好的学习者来说确实很不错,你要是用得到的话都可以直接抱走,关注过我的人都知道,这些都是可以拿到的。****网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。****[需要这份系统化学习资料的朋友,可以戳这里获取](https://bbs.csdn.net/topics/618317507)****一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**