SmartDigger 是一个基于视觉大模型的 移动应用 自动化任务 执行 异常 诊断中心,
突然弹窗的诊断,智能识别弹窗的关闭按钮坐标,返回关闭操作脚本
- 复制.env.sample 为 .env 文件,并修改参数
VISION_MODEL_API_KEY参数为你的 硅基流动 API Key - 执行 python api_run.py 启动服务
- 执行 python web_run.py 启动 WebUI
- 访问 http://127.0.0.1:5001
- 上传手机屏幕截图,上传 XML层级结构文本(可选),,点击诊断按钮
- URL:
/api/v1/diagnose - Method:
POST - 请求参数 (JSON):
screenshot: Base64 编码的手机屏幕截图xml_file: "string" XML层级结构文本(可选) 这个参数有值则走-方案一逻辑devices_name: "string" 设备名称resolution: "(100,200)" 设备分辨率`(可选) 这个参数有值则走-方案二逻辑
- 返回结果:
msg: 诊断结果消息script: 生成的 ADB 点击脚本(如果诊断为弹窗)template_fie: 匹配或新增的模版弹窗
- 状态:
- 200: 成功
- 500: 失败
{
"msg": "视觉诊断为弹窗,跳过的坐标为:540,1805",
"script": "import subprocess;subprocess.run( ['adb', '-s', 172.25.13.8:5555, 'shell', 'input', 'tap', str(540), str(1805)],check=True)"
}# 部署脚本
nohup sh deploy.sh > logs/run.log 2>&1 &
# 查看python进程
ps aux |grep python
# 停止python进程
kill -9 pid









