打标系统

注册之后

eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ0b2tlbl90eXBlIjoicmVmcmVzaCIsImV4cCI6ODA4Njk4ODYwNywiaWF0IjoxNzc5Nzg4NjA3LCJqdGkiOiJiNzFjMzg2YWViZGQ0OTQ2YWQyMTUwMTI2YzUxMDc2NCIsInVzZXJfaWQiOiIxIn0.GaIs15D3KOo7ObJLUx5B1n49d4Er4iEFW5EW3iXgTiM


python3 scripts/04_train.py --epochs 100 --batch 8 --device mps
第一次训练100轮:
好消息:
- 气泡检测已经很好(mAP50 > 0.86),核心功能可用
- 表情检测完美(mAP50 = 0.995)
- 只用 30 张图、5 分钟训练就达到了这个效果
需要改进:
- 低频类别(系统消息、时间标记、转账、未发出消息)样本太少(各 1-2 个),模型没学到
- 右侧头像 recall 偏低(0.38),需要更多样本
建议:现在可以用这个模型去预标注剩余图片,你只需要纠错,然后再训练一轮效果会大幅提升。

第二次训练:
训练已启动(150 epochs,batch=8,MPS 加速)。数据量翻倍+150轮训练,预计 10-15 分钟。
关键提升
- 总体 mAP50: 0.49 → 0.702 (+43%)
- 总体 mAP50-95: 0.42 → 0.628 (+50%)
- 右侧头像: 从 0.563 飙升到 0.812 (+44%)
- 时间标记: 从基本不能检测(0.124)到 0.711
- 转账/输入框: 直接到 0.995 完美检测
- 图片消息: 新增检测能力,达到 0.828
仍需改进
- 系统消息: 0.008(仅 7 个训练样本)
- 联系人名: 0.373(仅 19 个样本,需更多)
- 未发出消息: 0(仅 3 个样本)




测试一下: