晶羽科技-解读点评影视小说作品

微信
手机版

python搜电影,python爬取电影并下载

2023-11-28 20:12 作者:岑岑 围观:

首先,写在前面

最近看新闻说SCG倒了,之前BT天堂也倒了,暴风影音也不行。可以说,看一部电影越来越费力,企鹅、爱奇艺等国内厂商最近也出现了一些蛀虫。虽然版权意识越来越强,但是很多资源在这些主流视频网站上还是没有的。我习惯了下载电影再看,所以每次看电影找资源都很麻烦,要花一些时间,所以就有了这个。

第二,目的

输入一部电影的名字,帮我去BT之家看看有没有,有就把下载链接复制给我。

三、设计思路

Python入门其实很简单,但是我们要不断学习。每天坚持学习很难。相信很多人学了一个星期就放弃了。为什么?其实没有好的学习资料让你学习,你很难坚持下去。这是边肖收集的Python入门学习资料。关注一下,转发一下,私信边肖“01”就可以免费领取啦!希望对你有帮助。

本来想直接抓取首页最近上映的电影,然后判断有没有。后来想了一下,为什么不直接用网站的搜索功能呢?

四、启动爬虫4.1。分析网站,打开网站搜索一个结果,发现链接的内容可以直接在URL中修改到达搜索页面,比较容易。

让用户输入电影名称,直接生成链接。

#电影名称输入name = input是必需的(& # 39;\ n & # 39+ '请输入您要搜索的电影:& # 39;)#链接基于网站url的搜索功能= & # 34;http://www.6btbtt.com/search-index-keyword-"+输入名称+& # 34;。htm & # 34接下来看看搜索结果是什么样的。使用review元素可以看到搜索结果中的电影名称和链接将位于一个subject_link thread-old read类型的A标记中。

至此,网站的分析完成。

4.2.开始爬网过程。你刚刚得到了电影名称和网站,那么直接在下面得到搜索结果页面的内容就可以了。使用请求获取内容,然后使用beautifulsoup解析它。解析出来的东西被格式化,以便进行下一步操作。

#获取网页内容,用beautiful soup = beautiful soup(requests)解析。获取(URL)。文本,& # 39;lxml & # 39)#给第一个结果,网站搜索结果是把最新的放在前面,所以一个结果就够了movies = soup . find(& # 39;一& # 39;,'subject_link线程-旧& # 39;但是,现在我们得到的是一段内容,它不仅包含电影标题和链接,还包含其他东西。我们要做的就是分别提取电影片名和链接。

#直接输出电影和链接try:link = movies . get(& # 39;href & # 39)名字=电影。这里使用text # # # Text,因为在标签下有一个标签,但是string不能得到文本内容打印(& # 39;\ n & # 39+ name)打印(link+& # 39;\ n & # 39)除了:打印(& # 34;找不到电影或程序中出现未知错误& # 34;)这里,try和except是用来捕捉程序的反馈的,也就是说,如果获取的内容有问题,程序不会崩溃,所以会执行其他或者下一个操作。

至此,我们已经得到了电影和链接,爬虫的过程也就结束了。

4.3判断抓取结果和用户输入,通常是这样是因为电影片名包含了真实的电影名称、清晰度、年份、格式等等。

五:注意事项5.1。如果导入时发现无法导入模块,可能是缺少c++运行时,下载官方工具安装即可;

5.2网站中看似相同的元素的标签可能不同。比如热门电影的标签和新电影的标签不一样,刚开始抓取的时候总是报错;

5.3必须使用tryexcept以避免事故;

节目可能毫无意义,但生活还在继续。

相关文章