基于Orange Pi Zero的人机交互系统
时间:10-02
整理:3721RD
点击:
引言
作品概述
由Orange Pi Zero开发板、usb声卡、麦克风、扬声器组成。系统上电后,首先进行硬件初始化、进入Armbian操作系统,系统进入等待状态,当麦克风采集到人声时,开启对话模式。语音输入系统后,由系统向服务器解析为文字,接着将文字发送到图灵机器人服务器,返回应答语句,再把应答语句传向服务器转化为语音,由声音播放模块输出。作品实现了人机对话的智能体验。
系统软件设计
(2)接入百度语音、图灵机器人等api,实现强大的语言识别、语言交流功能;
(3)基于嵌入式Linux操作系统,拥有强大的编程接口。
(2)增加声纹识别;
(3)系统指令级优化。
人工智能在二十世纪七十年代以来被称为世界三大尖端技术之一,也被认为是二十一世纪三大尖端技术之一。AI人工智能是一门极富挑战性的科学,涉及计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习、计算机视觉等等。
作品概述
由Orange Pi Zero开发板、usb声卡、麦克风、扬声器组成。系统上电后,首先进行硬件初始化、进入Armbian操作系统,系统进入等待状态,当麦克风采集到人声时,开启对话模式。语音输入系统后,由系统向服务器解析为文字,接着将文字发送到图灵机器人服务器,返回应答语句,再把应答语句传向服务器转化为语音,由声音播放模块输出。作品实现了人机对话的智能体验。
系统软件设计
系统采用The Advanced Linux Sound Architecture (ALSA)这一音频体系结构,采用alsa-lib提供的接口操作系统声卡设备,实现录音与播放的操作。
在系统接收到声音并录音完成之后,将音频文件以POST的形式请求百度语音-语音识别api,实现将声音转化为文字的操作。
得到文字之后,将文字请求到图灵机器人api,将返回对应的应答语句。
得到应答之后,将应答请求到百度语音-语音合成api,将应答转化为声音文件。
最后,利用alsa-lib将声音文件通过扬声器播放出来。
实现功能
(1)人机对话的智能体验;(2)接入百度语音、图灵机器人等api,实现强大的语言识别、语言交流功能;
(3)基于嵌入式Linux操作系统,拥有强大的编程接口。
提升空间
(1)增加摄像头实现人脸识别、心情识别;(2)增加声纹识别;
(3)系统指令级优化。
小编有效果展示的视频嘛?
小编展示的东西呢?
LZ的语音时怎么采集啊?最近要用OrangePi 做个语音识别的小项目,之前是在mini2440上做的,想移过来,语音录不进去,所以想请教lz一些问题