OrangePi AIpro 开箱初体验及语音识别样例

OrangePi AIpro 开箱初体验及语音识别样例

一、 前言

首先非常感谢官方大大给予这次机会,让我有幸参加此次活动。

 

OrangePi AIpro联合华为精心打造,采用昇腾AI技术路线,具体为4核64位处理器+AI处理器,集成图形处理器,支持8TOPS AI算力,拥有8GB/16GB LPDDR4X,可以外接32GB/64GB/128GB/256GB eMMC模块,支持双4K高清输出。并且OrangePi AIpro引用了相当丰富的接口,包括两个HDMI输出、GPIO接口、Type-C电源接口、支持SATA/NVMe SSD 2280的M.2插槽、TF插槽、千兆网口、两个USB3.0、一个USB Type-C 3.0、一个Micro USB(串口打印调试功能)、两个MIPI摄像头、一个MIPI屏等,预留电池接口,可广泛适用于AI边缘计算、深度视觉学习及视频流AI分析、视频图像分析、自然语言处理、智能小车、机械臂、人工智能、无人机、云计算、AR/VR、智能安防、智能家居等领域,覆盖 AIoT各个行业。 Orange Pi AIpro支持Ubuntu、openEuler操作系统,满足大多数AI算法原型验证、推理应用开发的需求,总之是非常的nice。

二、 开发板介绍

1、 接口详情

 

如图所见,我们看到它的功能是十分丰富的,并且还支持接入其他外设接口,扩展非常的方便。

2、 烧录镜像

2.1、事先准备

首先我们需要准备:OrangePi AIpro(包括主板和电源)、SD卡(用于装载镜像运行开发板)、读卡器(这里配置选择USB)、PC(笔记本或台式机)、显示器、双头HDMI线、键盘(可以外接USB)、鼠标(可以外接USB)。

2.2、烧写镜像到SD卡

(1)下载资料

我们打开官方网站,点击下载按钮,下载资料。

 

官方工具和ubuntu镜像都在百度网盘,分别根据页面提示提取文件,并在以下目录中获取文件后,保存在PC机上,烧录工具使用的是balenaEtcher。

 

ubuntu镜像:opiaipro_ubuntu22.04_desktop_aarch64_*.img.xz

 

注:ubuntu镜像我们尽量使用旧版本的,旧版本更稳定,在本人的实际安装中,使用版本为3xx会烧录失败,但在使用旧版本,在本人的亲测下,旧版本的基本不会出现烧录失败的情况,所以下面我所使用的是2xx的。

(2)烧录

将SD卡插入读卡器,再将读卡器插入PC机。

 

然后启动烧录工具balenaEtcher,根据提示,依次“从文件烧录”-》“选择目标磁盘”-》“开始烧录!”,因为之前烧录了,所以我这里就不点了,烧录需要耐心等待下。

 

烧录完成之后需要验证,验证也是自动完成的,我们耐心等待,完成之后显示烧录成功。

 

2.3、启动OrangePi AIpro系统

我们将烧录好的SD卡插入开发板的SD插槽,然后将开发板的电源线接上、两个USB接键盘与鼠标、使用双头HDMI线接显示器,如下图。

 

插入上电完成之后,等待一会,显示器就会显示登录界面了。

 

输入HwHiAiUser用户名登录密码(默认为Mind@123)登录开发板,进入主界面如下图所示,登录后请修改默认密码,并妥善保管新密码。

 

三、运行案例:语音识别

1、准备工作

首先为了操作方便,我们可以进入系统然后连接WIFI,打开终端,输入ifconfig 查看IP地址。

 

 

 

在个人PC 这里打开 FinalShell 工具,使用SSH 连接,填写好名称,主机(这就是IP地址),用户名与密码等参数,点击确定,完成连接。

 

3、 播放音频与录音

2.1、播放音频

准备好3.5mm口的耳机,将耳机插入开发板的3.5mm耳机接口中。

 

然后接下来进入到音频测试程序所在的目录中,打开FinalShell 工具,敲指令。

sudo-i # 切换管理员权限,输入密码进入
cd /opt/opi_test/audio

输入ls 查看目录下的文件,当然 FinalShell 也会已树形文件结构实时同步文件信息。

 

使用下的命令就可以播放测试音频到耳机了。

./sample_audio play 2 qzgy_48k_16_mono_30s.pcm

2.2、效果演示

由于3.5mm耳机外放声音有点小,所以这里就使用音响的方式记录下来。

https://www.bilibili.com/video/BV1nr421L7q9

2.3、录音播放

首先将带MIC功能的耳机插入开发板的3.5mm耳机接口中。

然后进入音频测试程序所在的目录中,执行下面的指令。

sudo -icd /opt/opi_test/audio

然后可以使用下面的命令录制一段5秒钟的音频。

./sample_audio capture test05.pcm

录音完成后会在当前目录下生成一个test05.pcm的录音文件,然后使用下面的命令可以将录制的音频文件播放到耳机。

./sample_audio play 2 test05.pcm

 

2.4、演示视频

https://www.bilibili.com/video/BV12J4m1378V

https://www.bilibili.com/video/BV137421Z711

四、 运行语音识别

在镜像中预装了JupyterLab软件。Jupyter Lab软件是一个基于web的交互式开发环境,集成了代码编辑器、终端、文件管理器等功能,使得开发者可以在一个界面中完成各种任务。并且我们在镜像中也预置了一些可以在JupyterLab软件中运行的AI应用样例。这些样例都是使用Python编写的,并调用了Python版本的AscendCL编程接口。本章节介绍如何登录jupyterlab并在jupyterlab中运行 这些预置的AI应用样例。

1、 启动JupyterLab

首先登录Linux系统桌面,然后打开终端,再切换到保存AI应用样例的目录下。

cd /home/HwHiAiUser/samples/notebooks

然后执行start_notebook.sh脚本启动 Jupyter Lab。

./start_notebook.sh

 

在执行该脚本后,终端会出现如下打印信息,在打印信息中会有登录Jupyter Lab的网址链接。

 

登录Jupyter Lab后的界面如下所示,左侧文件管理器中是9个AI应用样例和 Jupyter Lab 启动脚本。

 

2、启动智能语音识别

首先在Jupyter Lab界面双击“09-speech-recognition”,进入到该目录下,在该目录下有运行该示例的所有资源,其中mian.ipynb是在JupyterLab中运行该样例的文件,双击打开main.ipynb,在右侧窗口中会显示main.ipynb文件中的内容,单击按钮运行样例,在弹出的对话框中单击“Restart”按钮,此时该样例开始运行。

 

若干秒后,在窗口中出现了如下内容。我们可以看到模型对测试语音进行推理, 识别出了语音中的文本信息为“智能语音作为智能时代人机交互的关键接口各行业 爆发式的场景需求驱动行业发展进入黄金期”。

 

测试语音的保存路径如下所示

/home/HwHiAiUser/samples/notebooks/09-speech-recognition/sample.wav

我们可以自己修改音频文件,然后实现语音转文字效果。

至此,演示案例就完成了,在开发板上可以外接一个小型的显示器,当我们需要录音时,自动连接蓝牙点击按钮进行录音,然后将文件保存下来,自动执行转文字效果,实现实时翻译器或在线文字转换功能。

五、 总结

综上所述,我们可以看出OrangePi AIpro是一款非常优秀AI开发板,不仅演示的案例,它的内部还有许多非常实用的功能,例如目标检测、卡通图像生成、人像分割与背景替换等,功能使用是真的强大。

体验下来,开发板真的很不错,无论对于刚毕业的小白新手还是别的某一领域的大牛想学习,都很友好,容易上手,官方的手册也是十分的详细;并且随着未来科技的不断发展,我相信越来越多的领域都会开始向AI靠拢,从制造业到人们的出行,OrangePi AIpro展现出未来带来巨大价值。

剧透一下:后续会把上述的实时翻译器给做出来,以及智能家居联合使用,敬请期待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/333951.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【JavaScript】P3 JavaScipt 注释方法、结束符、输入输出

小结: Js 注释: 单行注释://多行注释:/* */ Js 结束符: 分号; 可以加也可以不加 Js 输入输出: 输入:prompt()输出:document.write() 在页面中打印,console.log() 在控制…

浅谈金融行业数据安全分类分级

数据安全管理是一项从上而下的、多方配合开展的工作。在进行数据安全管理组织架构建设时,需要从上而下建设;从而全面推动数据安全管理工作的执行和落地;以保证数据安全的合法合规、并长效推动业务的发展和稳定运行。 金融行业机构应设立数据…

【Sql Server】随机查询一条表记录,并重重温回顾下存储过程的封装和使用

大家好,我是全栈小5,欢迎来到《小5讲堂》。 这是《Sql Server》系列文章,每篇文章将以博主理解的角度展开讲解。 温馨提示:博主能力有限,理解水平有限,若有不对之处望指正! 目录 前言随机查询语…

自定义CSS属性(@property)解决自定义CSS变量无法实现过渡效果的问题

且看下面的代码&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-width, initial-scale1.0" /><title>demot</title&g…

Python批量docx或doc文档转换pdf

说明&#xff1a; 1、因为项目需要&#xff0c;需要手动将十几个word文档转换成pdf文档 2、python请安装3.9.0以上&#xff0c;否则一些依赖库无法正常用 #! /usr/bin/python3 # -*- coding: utf-8 -*-import os import comtypes.client# 批量将docx文件转换pdf文件 def docx_t…

第十二周 5.21面向对象的三大特性(封装、继承、多态)(二)

三、多态 1.理解: (1)多态:父类型的引用存储不同子类型的对象 父类类名 引用名 new 子类类名(); 引用 对象 父类型 子类型 …

Java面试八股之AQS对资源的共享方式

AQS对资源的共享方式 AQS设计了一套灵活的机制&#xff0c;不仅支持独占&#xff08;Exclusive&#xff09;锁模式&#xff0c;也支持共享&#xff08;Shared&#xff09;锁模式&#xff0c;使得资源可以被一个或者多个线程以不同的方式访问。这两种模式通过控制一个内部的vol…

B站pink老师HTML5基础(一)

文章目录 一、网页1.什么是网页2.什么是HTML二、常用浏览器 三、Web标准四、HTML标签1.HTML基本结构标签 五、快捷键六、常用标签1.标题标签2.段落和换行标签3.文本格式化标签4.div标签和span标签5.图像标签6.图像路径7.超链接标签8.特殊字符 一、网页 1.什么是网页 2.什么是H…

MySQL的SQL语句

SQL1 查询所有列 SELECT * FROM user_profileselect id,device_id,gender,age,university,province from user_profileSQL2 查询多列 题目&#xff1a;现在运营同学想要用户的设备id对应的年龄、性别和学校的数据&#xff0c;请你取出相应数据 SELECT device_id,gender,age,…

【全开源】宇鹿家政系统(FastAdmin+ThinkPHP+原生微信小程序)

&#xff1a;助力家政行业数字化升级 一、引言&#xff1a;家政服务的新篇章 随着移动互联网的普及和人们生活水平的提高&#xff0c;家政服务的需求日益增长。为了满足这一市场需求&#xff0c;并推动家政行业的数字化升级&#xff0c;我们特别推出了家政小程序系统源码。这…

张量 t-product 积(matlab代码)

参考文献&#xff1a;Tensor Robust Principal Component Analysis with a New Tensor Nuclear Norm 首先是文章2.3节中 t-product 的定义&#xff1a; 块循环矩阵&#xff1a; 参考知乎博主的例子及代码&#xff1a;&#xff08;t-product与t-QR分解&#xff0c;另一篇傅里叶对…

【保姆级教程】基于OpenCV+Python的人脸识别上课签到系统

【保姆级教程】基于OpenCVPython的人脸识别上课签到系统 一、软件安装及环境配置1. 安装IDE&#xff1a;PyCharm2. 搭建Python的环境3. 新建项目、安装插件、库 二、源文件编写1. 采集人脸.py2. 训练模型.py3. 生成表格.py4. 识别签到.py5. 创建图形界面.py 三、相关函数分析1.…

【二叉树】非递归实现前中后序遍历

目录 前言 算法思想 非递归实现前序遍历 过程分析 代码 非递归实现中序遍历 过程分析 代码 非递归实现后序遍历 过程分析 代码 前言 1&#xff09;前序&#xff1a;根 左子树 右子树 2&#xff09;中序&#xff1a;左子树 根 右子树 3&#xff09;后序&#xff1…

使用Python类的构造函数和析构函数

1、问题背景 当使用Python类时&#xff0c;可以使用构造函数和析构函数来初始化和清理类实例。构造函数在创建类实例时自动调用&#xff0c;而析构函数在删除类实例时自动调用。 在上面的代码示例中&#xff0c;Person类具有一个构造函数__init__和一个析构函数__del__。构造…

深度学习-序列模型

深度学习-序列模型 1. 定义2. 应用领域3. 典型模型4. 技术细节5. 总结 序列模型是一种处理序列数据的机器学习模型&#xff0c;其输入和/或输出通常为序列形式的数据。以下是关于序列模型的详细解释&#xff1a; 1. 定义 序列模型是输入输出均为序列数据的模型&#xff0c;它…

宝塔:如何在宝塔面板做301重定向

如何在宝塔面板做301重定向?301重定向对于网站来说非常重要。如果你的网站以www开头&#xff0c;我们应该把没有www的域名重定向到有www的域名&#xff0c;反之亦然。 1、我们进入宝塔管理后台 2、登录面板并单击添加站点。既然要把xxx.com 301发到www.xxx.com&#xff0c;我…

R18 NTN中的RACH-less HO

在看R18 38.300时,发现NTN场景 增加了如下黄色字体的内容,R18 NTN支持了RACH-less HO,索性就简单看了看。 NTN RACH less HO相关的描述主要在38.331,38.213和38.321中。38.300中的描述显示:网络侧会通过RRCReconfiguration消息将RACH-less HO相关的配置下发给UE, 其中会包…

迈向F5G-A,开启全光万兆新时代——南通移动完成全市首个50G-PON技术验证

近日&#xff0c;南通移动在崇川区完成全市首个50G-PON万兆技术现网验证&#xff0c;标志着南通成为首批具备F5G-A(The 5th GenerationFixed Network-advanced)的万兆光网城市&#xff0c;使其成为网速最快、覆盖最全、时延最低的城市之一。 作为全光万兆的关键技术&#xff0c…

Linux: network: TCP: zero window size/window full 示例

最近遇到一个问题,当前机器的CPU使用率非常高,然后导致其中一个程序处理socket的数据过慢,然后出现下面的zero的示例。 下面是在接收buff用光的时候,发出的 TCP zeroWindows的消息 这种问题就是内存,CPU,网速之间的性能取舍。具体解决的话,需要看具体的需要是什么样的?…

2024 年 5 个 GO REST API 框架

什么是API&#xff1f; API是一个软件解决方案&#xff0c;作为中介&#xff0c;使两个应用程序能够相互交互。以下一些特征让API变得更加有用和有价值&#xff1a; 遵守REST和HTTP等易于访问、广泛理解和开发人员友好的标准。API不仅仅是几行代码&#xff1b;这些是为移动开…