SightFlow.dev

Official website： https://sightflow.dev

招募共建开发者

我们相信Agent Computer Use 会是未来10年重要AI革命的基建，如果你也希望参与到这个项目迭代，欢迎联系\

加入Discord

🔑 AI 模型与智能体配置

本项目依赖大语言模型/视觉模型（Vision Language Model）驱动 RPA。桌面端的配置分为两层：

基础配置：填写火山方舟 API Key，用于视觉定位、内置豆包智能体等基础能力。
智能体：选择负责聊天分析和内容生成的 Provider，并维护各自配置。

SK Key 的用途

智能对话回复：由于项目涉及类似微信等的自动抓取，模型会分析聊天界面的截图并生成自然的回复内容（带防止自我循环对话机制）。
VLM 视觉定位引导：基于屏幕截图和特定 Prompt，让模型自动检测屏幕上的 UI 控件，并返回需要点击的坐标，从而驱动纯视觉的 RPA 流程。

如何配置

请前往火山引擎控制台 - 方舟原生接口开通相关服务，并生成/获取你的 API Key。
启动项目后点击主界面右下角的设置按钮，打开独立设置窗口。
在基础配置中填写 API Key。默认 Base URL 为 https://ark.cn-beijing.volces.com/api/v3，通常无需修改。
在智能体中选择当前使用的 Provider。内置默认智能体为豆包 Seed，模型固定为 doubao-seed-2-0-lite-260428。

界面预览

主界面	基础配置	智能体配置

目标应用与框选模式

主界面提供目标应用快捷配置，用来决定桌面端如何测量聊天窗口布局：

微信、企业微信默认使用 VLM 自动识别窗口区域。
钉钉、飞书、Slack、Telegram、其他桌面应用默认使用手动框选。
当目标应用需要框选时，点击开始框选，依次圈出会话列表、聊天内容区、输入框 3 个区域。
框选结果会按目标应用保存到本地；后续启动会复用已保存区域，也可以随时重新框选。

VLM 和框选模式只影响“如何测量布局”。运行时截图、内容分析、生成回复和发送消息会消费同一套布局结果。

智能体 / Provider Hub

SightFlow 桌面端把“截图分析并生成回复”的聊天能力抽象为独立 Provider。Provider 通过 manifest.json 声明配置结构，通过 bundle 入口接收聊天截图并返回 reply_text、skip、error 等事件。

当前应用内置一个简单的 Provider Hub：

默认从 https://sightflow.dev/provider-hub.json 拉取候选 Provider 列表。
Hub 只维护 Provider 的 manifestUrl，UI 展示字段来自各 Provider 的 manifest。
首次加载后会缓存到本地；除非手动点击智能体标题旁的刷新按钮，否则优先使用本地缓存。
本地始终保留内置豆包 Seed作为默认 Provider，避免远端列表不可用时没有可选项。

外部 Provider 接入说明见：聊天 Provider 接入文档。

当前仓库仍保留一个 Doubao / 火山方舟 Provider 示例，供接入文档和本地开发参考：

resources/providers/volcengine-ark/manifest.json
resources/providers/volcengine-ark/provider.bundle.js

🚀 快速开始 (Project Setup)

1. 安装依赖

npm install

2. 本地开发运行

npm run dev

提示：启动后，应用将打开主界面。请先选择目标应用并完成必要的框选，再进入设置窗口填写 API Key、确认当前启用的 Provider。

📦 打包构建 (Build)

# 构建 Windows 版本
npm run build:win

# 构建 macOS 版本
npm run build:mac

开发环境推荐配置

VSCode + ESLint + Prettier

Name		Name	Last commit message	Last commit date
Latest commit History 28 Commits
.vscode		.vscode
build		build
docs		docs
resources		resources
scripts		scripts
skills/sightflow-agent		skills/sightflow-agent
src		src
.editorconfig		.editorconfig
.gitignore		.gitignore
.prettierignore		.prettierignore
.prettierrc.yaml		.prettierrc.yaml
README.md		README.md
electron-builder.yml		electron-builder.yml
electron.vite.config.ts		electron.vite.config.ts
eslint.config.mjs		eslint.config.mjs
package-lock.json		package-lock.json
package.json		package.json
tsconfig.json		tsconfig.json
tsconfig.node.json		tsconfig.node.json
tsconfig.web.json		tsconfig.web.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SightFlow.dev

招募共建开发者

🔑 AI 模型与智能体配置

SK Key 的用途

如何配置

界面预览

目标应用与框选模式

智能体 / Provider Hub

🚀 快速开始 (Project Setup)

1. 安装依赖

2. 本地开发运行

📦 打包构建 (Build)

开发环境推荐配置

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

SightFlow.dev

招募共建开发者

🔑 AI 模型与智能体配置

SK Key 的用途

如何配置

界面预览

目标应用与框选模式

智能体 / Provider Hub

🚀 快速开始 (Project Setup)

1. 安装依赖

2. 本地开发运行

📦 打包构建 (Build)

开发环境推荐配置

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages