plugin/fox4k/html结构分析.md
https://www.4kfox.com/search/{关键词}-------------.htmlhttps://www.4kfox.com/video/{ID}.html搜索结果页面的主要内容位于.hl-list-wrap .hl-one-list元素内,每个搜索结果项包含在.hl-list-item元素中。
<div class="hl-list-wrap">
<ul class="hl-one-list hl-theme-by362695000 clearfix">
<li class="hl-list-item hl-col-xs-12">
<!-- 单个搜索结果 -->
</li>
<!-- 更多搜索结果... -->
</ul>
</div>
每个搜索结果包含以下主要元素:
封面图片位于.hl-item-wrap .hl-item-pic元素中:
<div class="hl-item-wrap clearfix">
<div class="hl-item-div">
<div class="hl-item-pic">
<a class="hl-item-thumb hl-lazy" href="/video/61516.html" title="变形金刚:赛博坦之战第二季" data-original="/upload/vod/20250724-17/759cc2eabfa1a13ff498481d1a8f0b36.jpg">
<div class="hl-pic-icon hl-hidden-xs"><i class="iconfont hl-icon-bofang-fill"></i></div>
<div class="hl-pic-text">
<span class="hl-lc-1 remarks">已完结</span>
</div>
</a>
</div>
</div>
</div>
href属性,格式为/video/{ID}.htmldata-original属性.hl-pic-text .remarks元素中的文本(如"已完结"、"HD"等)标题和基本信息位于.hl-item-content元素中:
<div class="hl-item-content">
<div class="hl-item-title hl-text-site hl-lc-2">
<a href="/video/61516.html" title="变形金刚:赛博坦之战第二季">变形金刚:赛博坦之战第二季</a>
</div>
<p class="hl-item-sub hl-lc-1">
<span class="hl-text-conch score">6.9</span> · 2020 · 美国 · 科幻 机战
</p>
<p class="hl-item-sub hl-text-muted hl-lc-1 hl-hidden-xs"></p>
<p class="hl-item-sub hl-text-muted hl-lc-2">
《变形金刚:赛博坦之战 第二季》讲述的是: 《赛博坦之战》推出第二章"地出"!...
</p>
<div class="hl-item-btn">
<a class="hl-btn-border" href="/video/61516.html">查看详情</a>
</div>
</div>
.hl-item-title a的文本内容.hl-text-conch.score的文本内容.hl-item-sub中的信息,以·分隔.hl-item-sub的文本内容分页信息位于.hl-page-wrap元素中:
<ul class="hl-page-wrap hl-text-center cleafix">
<li class="hl-hide-sm"><a href="/search/...----------1---.html" class="hl-disad"><i class="iconfont hl-icon-jiantoushou"></i></a></li>
<li><a href="/search/...----------1---.html" class="hl-disad">上一页</a></li>
<li class="hl-hidden-xs"><a href="javascript:;" class="active">1</a></li>
<li class="hl-hidden-xs"><a href="/search/...----------2---.html">2</a></li>
<li><a href="/search/...----------2---.html">下一页</a></li>
<li class="hl-hide-sm"><a href="/search/...----------2---.html"><i class="iconfont hl-icon-jiantouwei"></i></a></li>
</ul>
详情页面包含更完整的资源信息,特别是磁力链接和播放源等下载信息。
基本信息位于.hl-detail-content元素中:
<div class="hl-detail-content hl-marg-right50 clearfix">
<div class="hl-dc-pic">
<span class="hl-item-thumb hl-lazy" title="变形金刚:赛博坦之战第二季" data-original="/upload/vod/20250724-17/759cc2eabfa1a13ff498481d1a8f0b36.jpg">
<div class="hl-pic-tag">
<span class="douban">6.9</span>
</div>
</span>
</div>
<div class="hl-dc-content">
<div class="hl-dc-headwrap">
<h2 class="hl-dc-title hl-data-menu">变形金刚:赛博坦之战第二季 (2020)</h2>
</div>
</div>
</div>
详细信息位于.hl-vod-data元素中:
<div class="hl-vod-data hl-full-items">
<div class="hl-data-sm hl-full-alert hl-full-x100">
<div class="hl-full-box clearfix">
<ul class="clearfix">
<li class="hl-col-xs-12"><em class="hl-text-muted">类型:</em><a href="/search/----%E7%A7%91%E5%B9%BB---------.html" target="_blank">科幻</a><i>/</i><a href="/search/----%E6%9C%BA%E6%88%98---------.html" target="_blank">机战</a><i>/</i></li>
<li class="hl-col-xs-12"><em class="hl-text-muted">地区:</em>美国</li>
<li class="hl-col-xs-12"><em class="hl-text-muted">语言:</em>英语</li>
<li class="hl-col-xs-12"><em class="hl-text-muted">上映:</em>2020-12-30(美国)</li>
<li class="hl-col-xs-12"><em class="hl-text-muted">时长:</em>30分钟</li>
</ul>
</div>
</div>
</div>
播放列表位于.hl-rb-playlist元素中:
<div class="hl-row-box hl-rb-playlist hl-tabs-item clearfix" id="playlist">
<div class="hl-rb-head clearfix">
<h3 class="hl-rb-title">播放列表</h3>
</div>
<div class="hl-play-source hl-hidden">
<div class="hl-plays-from hl-tabs swiper-wrapper clearfix">
<a class="hl-tabs-btn hl-slide-swiper active" href="javascript:void(0);" alt="天堂源">天堂源</a>
<a class="hl-tabs-btn hl-slide-swiper" href="javascript:void(0);" alt="暴风源">暴风源</a>
<a class="hl-tabs-btn hl-slide-swiper" href="javascript:void(0);" alt="非凡源">非凡源</a>
</div>
<div class="hl-tabs-box hl-fadeIn" style="display: block;">
<div class="hl-list-wrap">
<ul class="hl-plays-list hl-sort-list clearfix" id="hl-plays-list">
<li class="hl-col-xs-4 hl-col-sm-2"><a href="/play/61516-1-1.html">第01集</a></li>
<li class="hl-col-xs-4 hl-col-sm-2"><a href="/play/61516-1-2.html">第02集</a></li>
<!-- 更多集数... -->
</ul>
</div>
</div>
</div>
</div>
下载链接区域位于.hl-rb-downlist元素中:
<div class="hl-row-box hl-rb-downlist hl-tabs-item clearfix" id="downlist">
<div class="hl-rb-head clearfix">
<h3 class="hl-rb-title">磁力&网盘</h3>
</div>
<div class="hl-play-source hl-hidden">
<div class="hl-plays-from hl-tabs swiper-wrapper clearfix">
<a class="hl-tabs-btn hl-slide-swiper active" href="javascript:void(0);" alt="中字720P">中字720P <span>6</span></a>
<a class="hl-tabs-btn hl-slide-swiper" href="javascript:void(0);" alt="中字1080P">中字1080P <span>1</span></a>
</div>
<div class="hl-tabs-box hl-fadeIn" style="display: block;">
<div class="hl-list-wrap">
<ul class="swiper-slide hl-downs-list hl-sort-list clearfix" id="hl-downs-list">
<li>
<div class="hl-downs-box">
<span class="text hl-lc-1">
<a class="down-name" href="magnet:?xt=urn:btih:E18A64B7A04B52891C520427D1565697031A1201" target="_blank">
<em class="filename">变形金刚:赛博坦之战.Transformers.War.For.Cybertron.Trilogy.S02E01.官方中字.WEBrip.720P.mp4[262.49MB]</em>
<em class="filesize"></em>
</a>
</span>
<span class="btns">
<a class="hl-text-white down-copy conch-copy down-xm" href="javascript:void(0)"
data-clipboard-action="copy"
data-clipboard-text="magnet:?xt=urn:btih:E18A64B7A04B52891C520427D1565697031A1201">复制链接</a>
</span>
</div>
</li>
<!-- 更多下载链接... -->
</ul>
</div>
</div>
</div>
</div>
磁力链接位于.down-name元素的href属性中,或者.down-copy元素的data-clipboard-text属性中。
magnet:?xt=urn:btih:....filename元素的文本内容.filesize元素的文本内容(可能为空)剧情简介位于.hl-rb-content元素中:
<div class="hl-row-box hl-rb-content clearfix">
<div class="hl-rb-head clearfix">
<h3 class="hl-rb-title">剧情简介</h3>
</div>
<div class="hl-content-wrap hl-content-hide">
<span class="hl-content-text">
<em>《赛博坦之战》推出第二章"地出"!随着火种源的消失,威震天被迫面对残酷的现实...</em>
</span>
</div>
</div>
定位所有的.hl-list-item元素
对于每个元素:
.hl-item-pic a的href属性提取详情页链接/video/(\d+)\.html).hl-item-title a提取标题.hl-pic-text .remarks提取资源状态.hl-text-conch.score提取评分.hl-item-sub提取年份、地区、类型信息.hl-item-sub提取简介data-original属性提取封面图片URL检查分页:
.hl-page-wrap中提取分页链接,用于继续抓取后续页面获取资源基本信息:
h2.hl-dc-title的文本内容.hl-pic-tag .douban的文本内容.hl-dc-pic .hl-item-thumb的data-original属性提取详细信息:
.hl-vod-data ul li中提取类型、地区、语言、上映日期、时长等信息提取磁力链接:
.hl-rb-downlist区域.hl-tabs-btn获取不同质量版本.hl-downs-list li中提取磁力链接:
.down-name的href属性或.down-copy的data-clipboard-text属性.filename的文本内容.filesize的文本内容提取剧情简介:
.hl-content-wrap .hl-content-text提取剧情简介https://www.4kfox.com/search/{关键词}-------------.html,关键词需要URL编码https://www.4kfox.com/video/{ID}.html.hl-page-wrap中的链接继续抓取data-original属性进行延迟加载/video/(\d+)\.html