软硬件交互
连接百度语音API制作语音交互
本篇文章由知名互联网公司百度为大家分享如何使用ProtoPie连接百度语音API制作语音交互。
ProtoPie
August 21, 2023
准备工作
- 注册百度智能云 账户,并购买服务
2. 获取API和密钥
参考该视频教程 ,获取到密匙。建议保存密匙到本地,稍后创建Bridge App的时候会用到。
3. 开通语音识别功能
4. 安装Node.js
在Node.js官网 上下载LTS版本并进行安装。
5. 下载该案例中使用的Bridge App 和Pie文件
关于API接口的说明,请参考百度官方文档 。
连接Bridge App 和ProtoPie Connect
- 修改百度语音key
解压上面的node-bridge-baiduSpeech_v0.2,找到里面的baiduConnest.js,用任何文本编辑器将其打开将
YOUR_API_KEY
和YOUR_SECRET_KEY
部分替换成你的密匙,然后保存。注意key一定要输入准确,前后双引号不要修改 2. 在终端运行百度 Bridge App
在终端上找到保存有<baiduConnect.js>文件 的目录。如果是Mac可以如下图直接打开终端。
复制下面的命令并运行它。
npm install socket.io-client request fs child_process
如果命令未能正确安装依赖项,请尝试在开头加上"sudo"(如下所示)。
sudo npm install socket.io-client request fs child_process
然后输入下面的命令运行Bridge App。 node baiduConnect.js
3. 在ProtoPie Connect打开Pie文件
将Pie文件添加到Connect后在浏览器上打开,注意,此时你需要登录ProtoPie企业版账号才能同bridge app通讯。
4. 原型演示
点击下方的麦克风按钮,尝试说出上方案例中的一个语音命令 它将激活与识别文本相对应的选项。识别的文本也会显示在麦克风按钮上方。记得打开麦克风权限
交互部分讲解
案例中并未使用语音识别、语音听取、语音朗读等ProtoPie自带的语音功能。而是通过接收和发送完成。
recordVoice
:当你点击麦克风图标后,PIE会发送该信息给Bridge App,Bridge App中的下列代码部分负责接收该信息后开始识别。RECOGNIZED_TEXT
:当百度完成识别后,通过以下代码,发送该信息到ProtoPie,并将识别到的内容传递过去。indexOf(recognizedText, "YOUR_COMMAND_IN_MANDARIN")
:在ProtoPie中,通过该表达式识别语音中是否含有指定的关键词,如果有,在表达式结果>=0,如果没有结果为-1VOICERECORD_done
:当语音输入结束后(有呼吸停顿时),如果你需要画面上发生一些视觉变化,可以通过下面的代码发送信息给ProtoPie,ProtoPie端通过接收触发相应交互。