软硬件交互

连接百度语音API制作语音交互

本篇文章由知名互联网公司百度为大家分享如何使用ProtoPie连接百度语音API制作语音交互。

ProtoPie

August 21, 2023

连接百度语音API制作语音交互

准备工作

  1. 注册百度智能云 账户,并购买服务
前往百度智能云 创建账户,并购买或确保你可以调用百度的语音API。该案例中我们购买的是语音识别标准版
1
2. 获取API和密钥
参考该视频教程 ,获取到密匙。建议保存密匙到本地,稍后创建Bridge App的时候会用到。
3. 开通语音识别功能
前往控制台页面 > 产品服务(侧边栏)> 语音识别(可以收藏) > 概览 > 服务列表中的语音识别(如下图)> 开启需要的语言和服务 . 如需更详细的内容,可参考此文档
2
4. 安装Node.js
Node.js官网 上下载LTS版本并进行安装。
5. 下载该案例中使用的Bridge App 和Pie文件
关于API接口的说明,请参考百度官方文档

连接Bridge App 和ProtoPie Connect

  1. 修改百度语音key
解压上面的node-bridge-baiduSpeech_v0.2,找到里面的baiduConnest.js,用任何文本编辑器将其打开将YOUR_API_KEYYOUR_SECRET_KEY部分替换成你的密匙,然后保存。注意key一定要输入准确,前后双引号不要修改
3
2. 在终端运行百度 Bridge App
在终端上找到保存有<baiduConnect.js>文件 的目录。如果是Mac可以如下图直接打开终端。
4
复制下面的命令并运行它。 npm install socket.io-client request fs child_process
5
如果命令未能正确安装依赖项,请尝试在开头加上"sudo"(如下所示)。 sudo npm install socket.io-client request fs child_process然后输入下面的命令运行Bridge App。 node baiduConnect.js
6
3. 在ProtoPie Connect打开Pie文件
将Pie文件添加到Connect后在浏览器上打开,注意,此时你需要登录ProtoPie企业版账号才能同bridge app通讯。
7
4. 原型演示
点击下方的麦克风按钮,尝试说出上方案例中的一个语音命令 它将激活与识别文本相对应的选项。识别的文本也会显示在麦克风按钮上方。记得打开麦克风权限
8

交互部分讲解

案例中并未使用语音识别、语音听取、语音朗读等ProtoPie自带的语音功能。而是通过接收和发送完成。recordVoice:当你点击麦克风图标后,PIE会发送该信息给Bridge App,Bridge App中的下列代码部分负责接收该信息后开始识别。
9
RECOGNIZED_TEXT:当百度完成识别后,通过以下代码,发送该信息到ProtoPie,并将识别到的内容传递过去。
10
indexOf(recognizedText, "YOUR_COMMAND_IN_MANDARIN"):在ProtoPie中,通过该表达式识别语音中是否含有指定的关键词,如果有,在表达式结果>=0,如果没有结果为-1
11
VOICERECORD_done:当语音输入结束后(有呼吸停顿时),如果你需要画面上发生一些视觉变化,可以通过下面的代码发送信息给ProtoPie,ProtoPie端通过接收触发相应交互。
12