首页 > 技术文章 正文
解决火车头7.6版本无法采集部分https网站处理方法

 2022-02-20 18:35:19

由于现在大多数网站都采用https,导致许多网站无法收集。那哪行,必定得有处理方法,今日就说说关于火车头收集器7.6版别无法收集部分https网站处理方法。火车头7.6版别由于发布时

由于现在大多数网站都采用https,导致许多网站无法收集。那哪行,必定得有处理方法,今日就说说关于火车头收集器7.6版别无法收集部分https网站处理方法。

火车头7.6版别由于发布时间久远,尽管收集器大部分功用都还可以正常运用,但是现在许多网站都从之前的http协议切换到了https协议。

现在怎样处理呢?方法便是经过php进行抓取数据,把文章标签都获取

只需网站目录新建一个接口,例如geturl/index.php

代码附下载,你们下载,放在网站根目录建个文件夹,例如:geturl,调用如下:

在接口后边/geturl/index.php?https://www.yuepc.com/a/153047.html

例如获取数据:/geturl/index.php?https://www.yuepc.com/a/153047.html

获取内容页面便是经过火车头手动提取设置,把链接参加接口提取出来

这样就能获取文章了

好了,这样就完美处理了

 

插件下载地址:http://www.yuepc.com/a/153048.html

 

原文链接:https://www.yuepc.com/info/153049.html

  •  标签: