跳转到内容

AI 助手

AI 助手 是 Owlfy 的核心功能之一。通过 长按语音键 并描述复杂任务触发,内置强大的 AI 调度引擎,通过编排计划完成复杂任务。

长按语音键,描述你的任务,然后松开。

默认语音键

  • Windows右 Alt 键或 鼠标滚轮
  • macOSFn 键或 鼠标滚轮

可在设置中自定义语音键

AI 助手智能调用大量内置 Skills,处理多样化任务:

  • 图片音视频:转换格式、压缩、裁剪、智能剪辑、提取素材、配音等
  • 文档:编写、总结、翻译、改写、合并、拆分、转换格式等
  • 电脑操作:打开程序、文件管理、系统设置、清理垃圾、关机锁屏等
  • 网络自动化:搜索、提取网页内容、下载资源、自动化操作网页等

对于复杂任务,AI 助手将其拆解为可执行计划,然后通过以下方式逐个击破:

  • 编写并运行代码
  • 执行命令行指令
  • 调用 API
  • 使用 MCP(Model Context Protocol)工具
  • 调用内置 Skills

示例

  • 任务:「总结下载文件夹里所有 PDF 的要点,并生成一份 Word 文档」
  • 执行计划
    1. 扫描下载文件夹中的 PDF 文件
    2. 提取每个 PDF 的文本内容
    3. 总结每个文档的关键要点
    4. 生成包含所有总结的格式化 Word 文档

对于能够在本地完成的任务,如文档处理、图片处理(非 AIGC 类)、音视频处理(非 AIGC 类),AI 助手优先在本地执行。文件不上传云端,充分保障数据安全。

技能说明指令示例
地图导航查询路线、导航指引「导航到中关村」
打车呼叫网约车「帮我叫个车」
火车票查询查询火车票信息「明天北京到上海的高铁」
飞机票查询查询航班信息「下周一北京飞三亚的航班」
A 股股票分析股票行情分析「分析一下贵州茅台」
快递查询查询快递物流「查一下顺丰快递」
天气预报查询天气信息「北京明天天气怎么样」
商品搜索比价比较商品价格「iPhone 15 多少钱」
油价查询查询最新油价「今天油价多少」
尾号限行查询查询车辆限行「今天限号是多少」
汇率转换货币汇率换算「100 美元换多少人民币」
技能说明指令示例
查询 IP 地址获取当前网络 IP「我的 IP 是多少」
网盘资源搜索搜索网盘资源「搜索 xxx 的网盘资源」
生成短链接将长 URL 转为短链接「把这个链接缩短」
B 站视频下载下载 B 站视频「下载这个 B 站视频」
抖音视频下载下载抖音视频「下载这个抖音视频」
搜索视频素材搜索视频素材「找一些美食视频素材」
查询企业信息查询企业工商信息「查一下腾讯公司」
查询企业风险查询企业风险信息「这家公司有风险吗」
技能说明指令示例
打开程序启动指定应用程序「打开微信」
打开网页打开指定网址「打开百度」
打开目录打开指定文件夹「打开工作目录」
搜索使用搜索引擎「百度搜索 xxx」
搜索文件在电脑中搜索文件「找一下合同文件」
更换壁纸更换桌面壁纸「换个好看的壁纸」
管理开机启动项管理开机自启动「关闭 xxx 的开机启动」
批量重命名批量修改文件名「把这些文件改名为 001、002…」
整理目录整理指定文件夹「整理一下下载文件夹」
调节亮度调整屏幕亮度「调亮屏幕」
调节音量调整系统音量「音量调到 50%」
分屏设置窗口分屏「左右分屏」
清理系统垃圾清理垃圾文件「清理一下垃圾」
查看资源占用查看 CPU、内存使用「电脑卡不卡」
管理端口管理网络端口「释放 8080 端口」
技能说明指令示例
AI 画图根据文字描述生成图片「画一只可爱的猫咪」
AI 修改图片AI 编辑修改图片「把这个去掉」
添加美术字为图片添加艺术文字「给图片加上『生日快乐』」
多图融合生图多图融合生成新图「把这两张图合成一下」
AI 配音文字转语音「把这段话读出来」
AI 文生视频根据文字生成视频「生成一个介绍视频」
AI 图生视频根据图片生成视频「让这张图动起来」
AI 作曲生成原创音乐「作一首欢快的曲子」

AI 助手还支持强大的文件处理功能:

  • 压缩、格式转换、抠图
  • 调整分辨率、旋转、裁剪
  • OCR 文字识别
  • 多图转 GIF/PDF
  • 压缩、添加水印
  • 智能剪口播、拼接
  • 格式转换、抽帧
  • 语音识别
  • 合并/拆分 PDF
  • PDF 加水印
  • Markdown 转 PDF/Word
  • AI 生成 PPT
  • 编辑 Excel/Word/PPT

Owlfy 支持安装第三方 MCP(Model Context Protocol)技能,拓展 AI 助手的能力边界。

  1. 在技能广场浏览可用的 MCP 技能
  2. 点击「安装」按钮
  3. 按照提示完成配置
  4. 安装后即可通过语音调用

可以将多个任务组合在一个请求中:

「帮我查一下明天北京到上海的火车,然后找一家附近的酒店」

AI 助手支持上下文理解:

用户:「北京明天天气怎么样?」
AI:「北京明天晴,气温 15-25 度……」
用户:「那上海呢?」
AI:「上海明天多云,气温 18-28 度……」

可以一次选中多个文件进行处理:

选中 10 张图片 → 「把这些图片压缩到 1MB 以内」

决定 AI 助手能在你的电脑上操作到什么范围:

  • 限定工作区:只能访问指定的工作区文件夹
  • 标准模式:可以访问常用用户目录
  • 无限制:完整的系统访问权限(请谨慎使用)

控制 AI 何时需要征求你的确认:

  • 执行高风险操作前
  • 删除文件前
  • 修改系统设置前
  • 基于体力消耗阈值