跳转到内容

语音录入

语音录入 是 Owlfy 的核心功能之一。通过 单击语音键 触发,不仅仅是转写,更是智能化的文字输入体验。

单击语音键 → 开始说话 → 再次点击结束 → Owlfy 根据角色润色 → 在当前光标位置输出。

默认语音键

  • Windows右 Alt 键或 鼠标滚轮
  • macOSFn 键或 鼠标滚轮

可在设置中自定义语音键

单击语音键 → 说话 → 再次单击 → 角色润色应用 → 文字输出

这一流程确保你的口语在录入前被润色,使语音输入适用于专业和正式场景。

可选择多种角色对语音输入进行润色,将口语转化为得体、符合场景的文本。

角色效果示例
口语纠错将口语整理为规范书面语「那个,我觉得咱们应该……」→ 「我认为我们应当考虑……」
职场精英将随口说的话改写为高情商表达「明天有空一起吃晚饭么?」→ 「请问您明天是否方便共进晚餐?」
自定义角色添加专属角色,满足个性化需求根据你的需求定义任意润色规则
  1. 在语音录入界面点击「角色管理」
  2. 点击「添加角色」
  3. 设置角色名称和润色规则
  4. 保存后即可使用

支持指定输出语言,实现边录音边实时翻译。

示例

  • 用中文说:「明天一起开会讨论一下这个方案」
  • 设置输出语言为英文
  • 输出:「Let’s meet tomorrow to discuss this proposal.」

适用场景:

  • 跨语言沟通
  • 会议中的实时口译
  • 快速起草外文消息

支持长文本映射,用短语快速录入长内容。

工作原理

  1. 在设置中配置短语映射,例如:
    • 短语:「收件地址」
    • 完整内容:「北京市海淀区 xxx 路 xxx 号,电话:138xxxx8888」
  2. 语音录入时说:「收件地址」
  3. 完整内容即时录入

常见使用场景

  • 收件/开票地址
  • 公司固定话术
  • 常用邮件签名
  • 标准法律声明
  • 复杂代码片段

隐私保障:智能短语存储在本地,不进行网络传输。

  • 选择当前使用的录音设备
  • 测试麦克风音量
  • 确保音频输入清晰

开启后,开始语音录入时会自动把系统声音静音,结束后恢复,避免录音时被其他声音干扰。

开启后,语音条出现和关闭时会播放提示音,帮助你更清楚地知道录音状态。

说话时可以直接说出标点符号:

「你好逗号请问吃饭了吗问号」→ 「你好,请问吃饭了吗?」
「一二三」→ 「123」
「十二点半」→ 「12:30」

录音过程中可以说出编辑指令:

「删除上一句」
「清空」
「换行」

语音输入内容仅用于实时识别,不做长期保留。你的语音数据:

  • 仅用于当前这一次的识别与处理
  • 不会存储在服务器上
  • 不会用于任何模型训练