Co-creation-projects/lh2021739-pixel-Personal_Information_Signaling_System/完整使用流程说明.md
本系统实现了从用户报告中提取维度,并用维度分析来修正YouTube搜索主题(themes)的完整流程。
核心流程:
write_report.py - 报告编写工具
extract_dimensions.py - 维度提取工具
manage_themes.py - 主题管理工具
analyze_dimensions.py - 主分析工具
Personal_Information_Signaling_System/
├── themes.yaml # 用户设置的搜索主题
├── archive/
│ ├── reports/ # 用户报告(Markdown)
│ │ ├── daily/ # 日报
│ │ ├── weekly/ # 周报
│ │ └── monthly/ # 月报
│ ├── dimensions/ # 维度提取结果
│ │ └── YYYY-MM-DD_type_dimensions.json
│ └── dimension_analysis/ # 分析报告
│ └── YYYY-MM-DD_analysis.json
使用 write_report.py 创建报告:
python write_report.py
选择操作:
输入报告内容(自然语言,Markdown格式),系统会自动保存。
或者:直接在 archive/reports/ 目录下创建/编辑 .md 文件:
YYYY-MM-DD.mdYYYY-Www.mdYYYY-MM.md从报告中提取维度:
# 提取所有报告的维度
python extract_dimensions.py
# 只提取日报的维度
python extract_dimensions.py --report-type daily
# 提取单个报告文件的维度
python extract_dimensions.py --report-file archive/reports/daily/2025-12-28.md
提取结果保存在 archive/dimensions/ 目录。
运行主分析工具:
# 基本分析(加载已有提取结果)
python analyze_dimensions.py
# 重新提取维度并分析
python analyze_dimensions.py --extract
# 交互模式(查看并处理建议)
python analyze_dimensions.py --interactive
# 组合使用
python analyze_dimensions.py --extract --interactive
手动管理themes:
# 交互式管理
python manage_themes.py
# 命令行操作
python manage_themes.py --list # 列出所有themes
python manage_themes.py --add "健康" # 添加theme
python manage_themes.py --remove "娱乐" # 删除theme
条件:
条件:
# 1. 每天写日报
python write_report.py
# 选择 1,输入今天的内容
# 2. 每周提取一次维度
python extract_dimensions.py
# 3. 分析并查看建议
python analyze_dimensions.py --extract --interactive
# 1. 设置初始themes(手动编辑themes.yaml或使用工具)
python manage_themes.py
# 2. 写几篇报告
python write_report.py
# 3. 提取维度
python extract_dimensions.py
# 4. 分析并应用建议
python analyze_dimensions.py --extract --interactive
需要在 .env 文件中配置LLM(用于维度提取):
LLM_API_KEY=your-api-key
LLM_MODEL=qwen-plus
LLM_BASE_URL=https://api-inference.modelscope.cn/v1/
LLM_PROVIDER=modelscope
themes.yaml 文件格式:
themes:
- mcp
- agent
- rag
- money
- AI
archive/dimensions/YYYY-MM-DD_type_dimensions.json:
{
"report_date": "2025-12-28",
"report_type": "daily",
"report_file": "archive/reports/daily/2025-12-28.md",
"extracted_dimensions": ["健康", "情绪", "工作"],
"confidence": 0.85,
"extraction_date": "2025-12-28T10:00:00Z"
}
archive/dimension_analysis/YYYY-MM-DD_analysis.json:
包含维度统计、themes匹配分析、修正建议等信息。
extract_dimensions.py 会重新提取,提取结果会覆盖之前的文件.env 文件中的API Key配置