您的位置:首页>学术争鸣 >

网页上看小说怎么样避免广告「怎么爬取小说」

每一朵鲜花的盛开都要经历风霜雨雪,每一把利剑的形成都需要经过千锤百炼。世上没有随随便便的成功,也没有永远的安逸与轻松。不怕辛苦,不畏艰难,用心打磨,你将成就更好的自己。今天是端午节第二天,祝大家每天都开开心心的。

项目背景

相信很多看小说的小伙伴们都会在作家们深恶痛绝的笔趣阁,也就是传说中的盗版小说网站上面看小说。尽管盗版小说不需要出资金,可是,里面的广告也是让读者们十分厌烦的。(盗版小说靠接广告来换取收入,作家靠出售才华来换取收入。大家都不容易,所以有些写的好的小说,个人建议还是为作家的才华付费是值得的。)

网站地址:https://www.23txt.com/files/article/html/0/88/

项目内容:唐家三少的斗罗大陆一小说

项目分析

接手任何一件事情,不是一上来就盲目的上去干,先分析怎么做、确认问题,然后再去做。

先登录网页,看到如下图的一个页面。

在接下去,点击小说的章节,再去查看里面的网址(多点击几个)

观察网址,会发现他们的前面都有一个相同的http://www.23txt.com/。

这个网址代表了这个小说网站的网址,后面跟着的内容就是每一个章节的后续地址。

接下去回到最初的小说页面,鼠标右键点击审查元素,然后点击下图标注出来的东西

然后将鼠标移动到我们需要查看的地方,如下图:

这个时候,就可以发现,它显示出来了我们之前看到的正文的后半部分的网址。

那么,我们接下去就可以将两串网址给拼接起来,取到我们需要的网址了。

代码展示

上面都有些注释,有不明白的小伙伴可以关注公众号,等后续留言功能开通就可以互动了。

效果展示

这些就是我们最后存储打印好的网址。第二篇内容就是将我们整本小说爬取下来用于阅读以及观看了。(爬虫不仅仅能爬小说,还能用于爬取很多有用的数据,未来还会介绍更多更实用的干活,敬请关注期待)

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。
版权声明

推荐文学网部分新闻资讯、展示的图片素材等内容均来自互联网(部分报媒/平媒内容转载自网络合作媒体),仅供学习交流。本文的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们 一经核实,立即删除。并对发布账号进行封禁。


本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。