diff --git a/MEMORY.md b/MEMORY.md index e2fa118..11fb988 100644 --- a/MEMORY.md +++ b/MEMORY.md @@ -43,17 +43,29 @@ _这份文件记录持续性项目和重要状态,跨会话保留。_ ### 3. 邮件自动处理系统 **状态**: 运行中 **创建**: 2026-02-27 +**更新**: 2026-03-05(基于学习机制优化) **配置**: - 目录: `~/.openclaw/workspace/scripts/email_processor/` - Cron: 每天 08:30 / 17:00(PST) - Runner: uv + isolated subagent - LLM: Ollama (kamekichi128/qwen3-4b-instruct-2507) +- 置信度阈值: 85%(需要同一发件人+标签组合至少9次一致决策才自动执行) -**功能**: -- 自动扫描未读邮件并用 AI 分类 -- 学习用户决策,逐渐提高自动化率 -- 高置信度邮件自动删除/归档,低置信度进队列 -- 当前处于学习期(1/20 决定) +**工作原理**: +1. **LLM 分类**: 对每个未读邮件,LLM 建议一个操作(delete/archive/keep/mark_read)并分配 3-5 个标签 +2. **置信度计算**: 基于历史决策匹配 `(发件人邮箱, 标签)` 签名,计算该操作的历史一致率 +3. **阈值判断**: + - 置信度 ≥ 85% → 自动执行操作 + - 置信度 < 85% → 加入待处理队列等待人工审核 + +**关键概念**: +- 没有固定的学习期,置信度随历史积累逐步增长 +- 每个匹配历史决策增加 10% 置信度上限(1次匹配=10%,9次=90%) +- 新/未知发件人从 50% 起步 + +**Tag 分类(14个)**: receipt, billing, shipping, promotion, newsletter, security, social, reminder, confirmation, alert, personal, account, subscription, travel + +**今日处理**: 10封邮件,用户决策6次 delete、4次 keep,系统正在学习中 --- diff --git a/TOOLS.md b/TOOLS.md index ef7ee65..2fd3ed5 100644 --- a/TOOLS.md +++ b/TOOLS.md @@ -78,28 +78,38 @@ agent-browser close ### Email Processor 邮件自动处理 **目录**: `~/.openclaw/workspace/scripts/email_processor/` +**文档**: `README.md`(完整使用说明和标签更新流程) **核心用法**: ```bash -./email-processor.sh scan # 扫描未读邮件并自动处理 -./email-processor.sh scan --recent 7 # 扫描最近7天的邮件 -./email-processor.sh scan --dry-run # 只分析不执行(测试用) +./email-processor.sh scan # 扫描未读邮件 +./email-processor.sh scan --recent 7 # 扫描最近7天 +./email-processor.sh scan --dry-run # 测试模式(不执行) ./email-processor.sh review list # 查看待处理队列 -./email-processor.sh review accept # 接受所有AI建议 -./email-processor.sh review 1 delete # 手动处理第1封(删除) -./email-processor.sh stats # 查看处理统计 +./email-processor.sh review accept # 接受所有建议 +./email-processor.sh review 1 delete # 处理第1封(删除) +./email-processor.sh stats # 查看统计 ``` -**工作原理**: -- 使用本地 Ollama (Qwen3) 分析邮件内容 -- 学习用户决策,逐渐提高自动化率 -- 前20个决定为学习期(阈值95%),之后正常阈值75% -- 高置信度邮件自动删除/归档,低置信度进队列等待人工审核 +**置信度机制**: +- **阈值**: 85%(`config.json` 中 `automation.confidence_threshold`) +- **计算方式**: 基于 `(发件人邮箱, 标签)` 签名匹配历史决策 +- **增长规则**: 每个匹配增加 10% 上限(9次一致决策达到85%+) +- **起步**: 新/未知发件人从 50% 开始 + +**标签分类(14个)**: +`receipt, billing, shipping, promotion, newsletter, security, social, reminder, confirmation, alert, personal, account, subscription, travel` + +**何时需要更新标签**: +- 某发件人处理10+次后仍进队列(置信度<85%) +- 同一发件人历史决策不一致(有时删有时留) +- 详见 `README.md` 的 "Refining the Tag Taxonomy" 章节 **重要文件**: -- `data/decision_history.json` — 决策历史(用于学习) +- `config.json` — Ollama 配置和自动化阈值 +- `data/decision_history.json` — 决策历史(学习数据) - `data/pending_emails.json` — 待处理队列 -- `logs/` — 每日处理日志 +- `logs/` — 处理日志 ---