plugin/ash/html结构分析.md
https://so.allsharehub.com/s/[关键词].html
示例:
https://so.allsharehub.com/s/%E4%BB%99%E9%80%86.html
参数说明:
- 关键词: URL编码的搜索关键词
- 支持分页: /s/[关键词]-[页码].html
- 支持分类: /s/[关键词]-[页码]-[分类ID].html
搜索结果嵌入在页面JavaScript变量中(本地搜索数据):
var jsonData = '[{"id":987,"source_category_id":0,"title":"仙逆剧场版神临之战4K完整版","is_type":0,"code":null,"url":"https://pan.qualk.cn/s/095628b04e6c","is_time":0,"name":"仙逆剧场版神临之战4K完整版","times":"2025-08-31","category":null}]';
注意:
| 字段 | 类型 | 说明 | 示例 |
|---|---|---|---|
id | number | 资源ID | 987 |
source_category_id | number | 分类ID | 0 |
title | string | 资源标题 | "仙逆剧场版神临之战4K完整版" |
is_type | number | 网盘类型 (0=夸克) | 0 |
code | string/null | 提取码 | null 或 "1234" |
url | string | 网盘链接 | "https://pan.qualk.cn/s/095628b04e6c" |
is_time | number | 时间标记 | 0 |
name | string | 资源名称 | "仙逆剧场版神临之战4K完整版" |
times | string | 发布时间 | "2025-08-31" |
category | string/null | 分类 | null |
.listBox .left .box .list.item (每个搜索结果)<div class="item">
<!-- 标题 -->
<a href="javascript:;" onclick="linkBtn(this)" data-index="0" class="title">
仙逆剧场版神临之战4K完整版
</a>
<!-- 发布时间 -->
<div class="type time">2025-08-31</div>
<!-- 来源 -->
<div class="type">
<span>来源:夸克网盘</span>
</div>
<!-- 操作按钮 -->
<div class="btns">
<div class="btn" @click.stop="copyText(...)">
<i class="iconfont icon-fenxiang1"></i>复制分享
</div>
<a href="/d/987.html" class="btn">
<i class="iconfont icon-fangwen"></i>查看详情
</a>
<a href="javascript:;" onclick="linkBtn(this)" data-index="0" class="btn">
立即访问
</a>
</div>
</div>
页面返回的链接使用错误的域名,必须进行转换:
原始链接: https://pan.qualk.cn/s/095628b04e6c
正确链接: https://pan.quark.cn/s/095628b04e6c
转换规则: 将 "pan.qualk.cn" 替换为 "pan.quark.cn"
// 提取JSON数据
jsonDataRegex := regexp.MustCompile(`var jsonData = '(\[.*?\])';`)
// 清理JSON中的控制字符
jsonData = strings.ReplaceAll(jsonData, "\\/", "/")
jsonData = regexp.MustCompile(`[\x00-\x1F\x7F]`).ReplaceAllString(jsonData, "")
is_type 值映射:
0 -> "quark" (夸克网盘)
2 -> "baidu" (百度网盘)
3 -> "uc" (UC网盘)
4 -> "xunlei" (迅雷网盘)
YYYY-MM-DDtime.Parse("2006-01-02", timeStr)页面支持按分类筛选:
| 数据项 | CSS选择器 | 提取方式 |
|---|---|---|
| 搜索结果列表 | .listBox .left .box .list .item | 遍历所有结果项 |
| 标题 | .item .title | 文本内容 |
| 发布时间 | .item .type.time | 文本内容 |
| 来源类型 | .item .type span | 文本内容 |
| 详情页链接 | .item a[href^="/d/"] | href 属性 |