image

注册之后

image

eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ0b2tlbl90eXBlIjoicmVmcmVzaCIsImV4cCI6ODA4Njk4ODYwNywiaWF0IjoxNzc5Nzg4NjA3LCJqdGkiOiJiNzFjMzg2YWViZGQ0OTQ2YWQyMTUwMTI2YzUxMDc2NCIsInVzZXJfaWQiOiIxIn0.GaIs15D3KOo7ObJLUx5B1n49d4Er4iEFW5EW3iXgTiM

image

image

python3 scripts/04_train.py --epochs 100 --batch 8 --device mps

第一次训练100轮:
好消息:

  • 气泡检测已经很好(mAP50 > 0.86),核心功能可用
  • 表情检测完美(mAP50 = 0.995)
  • 只用 30 张图、5 分钟训练就达到了这个效果

需要改进:

  • 低频类别(系统消息、时间标记、转账、未发出消息)样本太少(各 1-2 个),模型没学到
  • 右侧头像 recall 偏低(0.38),需要更多样本

建议:现在可以用这个模型去预标注剩余图片,你只需要纠错,然后再训练一轮效果会大幅提升。

image

第二次训练:
训练已启动(150 epochs,batch=8,MPS 加速)。数据量翻倍+150轮训练,预计 10-15 分钟。
关键提升

  • 总体 mAP50: 0.49 → 0.702 (+43%)
  • 总体 mAP50-95: 0.42 → 0.628 (+50%)
  • 右侧头像: 从 0.563 飙升到 0.812 (+44%)
  • 时间标记: 从基本不能检测(0.124)到 0.711
  • 转账/输入框: 直接到 0.995 完美检测
  • 图片消息: 新增检测能力,达到 0.828

仍需改进

  • 系统消息: 0.008(仅 7 个训练样本)
  • 联系人名: 0.373(仅 19 个样本,需更多)
  • 未发出消息: 0(仅 3 个样本)

image

image

image

image

测试一下:
image