每一朵鲜花的盛开都要经历风霜雨雪,每一把利剑的形成都需要经过千锤百炼。世上没有随随便便的成功,也没有永远的安逸与轻松。不怕辛苦,不畏艰难,用心打磨,你将成就更好的自己。今天是端午节第二天,祝大家每天都开开心心的。
项目背景
相信很多看小说的小伙伴们都会在作家们深恶痛绝的笔趣阁,也就是传说中的盗版小说网站上面看小说。尽管盗版小说不需要出资金,可是,里面的广告也是让读者们十分厌烦的。(盗版小说靠接广告来换取收入,作家靠出售才华来换取收入。大家都不容易,所以有些写的好的小说,个人建议还是为作家的才华付费是值得的。)
网站地址:https://www.23txt.com/files/article/html/0/88/
项目内容:唐家三少的斗罗大陆一小说
项目分析
接手任何一件事情,不是一上来就盲目的上去干,先分析怎么做、确认问题,然后再去做。
先登录网页,看到如下图的一个页面。
在接下去,点击小说的章节,再去查看里面的网址(多点击几个)
观察网址,会发现他们的前面都有一个相同的http://www.23txt.com/。
这个网址代表了这个小说网站的网址,后面跟着的内容就是每一个章节的后续地址。
接下去回到最初的小说页面,鼠标右键点击审查元素,然后点击下图标注出来的东西
然后将鼠标移动到我们需要查看的地方,如下图:
这个时候,就可以发现,它显示出来了我们之前看到的正文的后半部分的网址。
那么,我们接下去就可以将两串网址给拼接起来,取到我们需要的网址了。
代码展示
上面都有些注释,有不明白的小伙伴可以关注公众号,等后续留言功能开通就可以互动了。
效果展示
这些就是我们最后存储打印好的网址。第二篇内容就是将我们整本小说爬取下来用于阅读以及观看了。(爬虫不仅仅能爬小说,还能用于爬取很多有用的数据,未来还会介绍更多更实用的干活,敬请关注期待)
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。