“智能语音指令解析“ 基于NLP与语音识别的工单关键信息提取

“智能语音指令解析“ 基于NLP与语音识别的工单关键信息提取

    • 1. 背景介绍
      • 1.1 场景痛点
      • 1.2 方案选型
    • 2. 准备开发环境
    • 3. PaddleSpeech 语音识别快速使用
    • 4. PaddleNLP 信息抽取快速使用
    • 5. 语音工单信息抽取核心功能实现
    • 6. 语音工单信息抽取网页应用
      • 6.1 网页前端
      • 6.2 网页后端
      • 6.3 aistudio服务演示
      • 6.4 启动服务
      • 6.5 构造Post请求测试
    • 服务

本文将介绍如何利用 PaddleSpeech 的语音识别技术与 PaddleNLP 的通用信息抽取技术,实现基于智能语音指令解析的关键工单信息提取。我们将通过语音交互的方式,在交通报销场景下实现智能信息抽取,以提高工作效率与质量。

1. 背景介绍

智能语音指令解析集成了语音识别(ASR)与信息抽取(IE)等技术,广泛应用于智能语音填单、语音交互、手机APP语音唤醒等场景,提高人机交互效率。其中,智能语音填单可通过口述记录信息,并利用算法解析口述内容中的关键信息,完成自动信息录入。

1.1 场景痛点

  • 电话分析:边询问边记录,容易遗漏关键信息,例如社区疫情防控信息记录。
  • 工单生成:特定场景下无法完成文字录入,如电力路线巡检工作人员在高空巡检高压电线路。
  • 信息登记:重复性工作效率低易出错,例如汽车售后客服话务员每天接听大量电话。

针对以上场景,利用PaddleSpeech的语音识别技术和PaddleNLP的信息抽取技术,可以自动识别和抽取语音中的关键信息,帮助简化记录流程,提高工作效率和质量。

1.2 方案选型

  • PaddleSpeech语音识别模型:包含多种领先国际水平的语音算法与预训练模型,提供简单易用的语音识别功能。
  • PaddleNLP通用信息抽取模型(UIE):支持实体识别、关系和事件抽取、情感分析等多种信息抽取任务,具有良好的泛化效果。

2. 准备开发环境

安装PaddleSpeech与PaddleNLP:

!pip install paddlespeech
!pip install paddlenlp

下载必要数据包与示例音频,并进行初始化设置。

3. PaddleSpeech 语音识别快速使用

通过PaddleSpeech调用语音识别方法简单易行:

from paddlespeech.cli.asr.infer import ASRExecutor
asr = ASRExecutor()
result = asr(audio_file="ie.wav", force_yes=True)
print(result)

4. PaddleNLP 信息抽取快速使用

利用PaddleNLP提供的信息抽取能力,直接调用Taskflow API进行预测:

from paddlenlp import Taskflowschema = ["时间", "出发地", "目的地", "费用"]
ie = Taskflow("information_extraction", schema=schema, task_path="/home/aistudio/work")ie_result = ie(result)
print(ie_result)

5. 语音工单信息抽取核心功能实现

将语音识别与信息抽取功能进行串联,实现语音工单信息抽取的核心功能模块:

def audio_ie(audio_path):asr_result = asr(audio_file=audio_path, force_yes=True)ie_result = ie(asr_result)return ie_resultaudio_ie("ie.wav")

6. 语音工单信息抽取网页应用

构建网页应用,通过前后端交互实现语音工单信息抽取的服务。

6.1 网页前端

利用Vue框架,结合js-audio-recorder库实现网页前端的录音功能。

6.2 网页后端

利用FastAPI框架搭建后端服务,核心功能为语音信息抽取函数。

6.3 aistudio服务演示

在aistudio中,通过FastAPI搭建网页应用,模拟网页调用语音工单信息提取的后端服务。
在这里插入图片描述

6.4 启动服务

启动FastAPI服务,提供后端服务支持。

6.5 构造Post请求测试

通过requests库构造Post请求,模拟调用语音工单信息提取的后端服务。

通过以上步骤,你可以快速上手使用PaddleSpeech与PaddleNLP实现语音工单信息提取的应用,提高工作效率与质量。

服务

🛠 博主提供一站式解决方案,让您的工作变得更加轻松、高效!以下是我们提供的服务:

  1. 代部署

    🚀 为您提供快速、稳定的部署方案。无论是您的应用程序、网站还是其他软件项目,我们都可以帮助您将其部署到适当的平台上。

  2. 课程设计选题

    📚 为您量身定制符合课程要求和学生需求的选题方案。无论是基础课程还是高级课程,我们都能够为您提供专业的建议和支持。

  3. 线上辅导

    💻 提供线上辅导服务,为您提供个性化的指导和支持,帮助您解决在学习、工作或研究中遇到的各种问题和困难。
    如有需求,请随时私信

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/264648.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

前后端项目宝塔linux部署(springboot,vue,python)

宝塔linux安装就省略了,网上一堆 1.部署后端 1.首先把自己项目里面打包好的的jar包上传到服务器随便一个地方,我这里就上传到www/wwwroot下面了,宝塔的文件页面可以很便携上传 2.然后到下面这个页面 选那个java环境管理装个jdk&#xff…

vue ts html 中如何遍历 Enum 类型构建页面结构

vue ts html 中如何遍历 Enum 类型构建页面结构 一、需求 定义了一个 Enum 用来标记菜单类型: enum EnumMenuType {目录 1,菜单,按钮,外链 }你得 Enum 知道它的序号是随第一个定义的值自动增长的 现在想在 ElementUI 界面的 radio-group 中遍历它,…

SINAMICS V90 指导手册 第2章 SD卡 功能列表 技术数据 惯量比

微型SD卡 该卡可用于拷贝驱动参数或者执行固件升级,需要注意的是,200V系列的伺服驱动,可以选择Kingston或SanDisk生成的高品质SD卡;而对于400V系列驱动,建议使用西门子的SD卡,订货号:6SL3054-4…

【element+vue】点击加号增加一行,点击减号删除一行

代码实现&#xff1a; 页面部分&#xff1a; vueelement 备注&#xff1a;v-if “i>0” &#xff08;保证第一行不出现减号&#xff09; <div v-for"(item,i) in studentList"><el-form-item label"学生:" prop"name"><el-i…

Jessibuca 插件播放直播流视频

jessibuca官网&#xff1a;http://jessibuca.monibuca.com/player.html git地址&#xff1a;https://gitee.com/huangz2350_admin/jessibuca#https://gitee.com/link?targethttp%3A%2F%2Fjessibuca.monibuca.com%2F 项目需要的文件 1.播放组件 <template ><div i…

【深入理解设计模式】适配器设计模式

适配器设计模式 适配器设计模式是一种结构型设计模式&#xff0c;用于将一个类的接口转换成客户端所期望的另一个接口&#xff0c;从而使得原本由于接口不兼容而不能一起工作的类能够一起工作。适配器模式通常用于以下场景&#xff1a; 现有接口与需求不匹配&#xff1a;当需要…

【力扣 - 买卖股票的最佳时机】

题目描述 给定一个数组 prices &#xff0c;它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。 你只能选择 某一天 买入这只股票&#xff0c;并选择在 未来的某一个不同的日子 卖出该股票。设计一个算法来计算你所能获取的最大利润。 返回你可以从这笔交易中获取的…

【Linux深入剖析】进程优先级 | 命令行参数 | 环境变量

&#x1f4d9; 作者简介 &#xff1a;RO-BERRY &#x1f4d7; 学习方向&#xff1a;致力于C、C、数据结构、TCP/IP、数据库等等一系列知识 &#x1f4d2; 日后方向 : 偏向于CPP开发以及大数据方向&#xff0c;欢迎各位关注&#xff0c;谢谢各位的支持 目录 1.进程优先级2.Linux…

【MySQL面试复习】详细说下事务的特性

系列文章目录 在MySQL中&#xff0c;如何定位慢查询&#xff1f; 发现了某个SQL语句执行很慢&#xff0c;如何进行分析&#xff1f; 了解过索引吗&#xff1f;(索引的底层原理)/B 树和B树的区别是什么&#xff1f; 什么是聚簇索引&#xff08;聚集索引&#xff09;和非聚簇索引…

Unity(第六部)向量的理解和算法

标量:只有大小的量。185 888 999 &#xff08;类似坐标&#xff09; 向量:既有大小&#xff0c;也有方向。&#xff08;类似以个体为主体的方向&#xff0c;前方一百米&#xff09; 向量的模:向量的大小。&#xff08;类似以个体为主体的方向&#xff0c;前方一百米、只取一百米…

Leetcoder Day23| 回溯part03:组合+分割

语言&#xff1a;Java/Go 39. 组合总和 给你一个 无重复元素 的整数数组 candidates 和一个目标整数 target &#xff0c;找出 candidates 中可以使数字和为目标数 target 的所有不同组合 &#xff0c;并以列表形式返回。你可以按任意顺序返回这些组合。 candidates 中的同一个…

状态机-----

1.原理 同步的意思就是状态的跳转都是在时钟的作用下跳转的&#xff0c;有限是指状态机中状态的个数是有限的。两种状态机的共同点都是状态的跳转只和输入有关&#xff0c;区别就是如果最后的输出只和当前状态有关而与输入无关&#xff0c;则是moore型状态机。如果最后的输出不…

Go 如何按行读取(大)文件?尝试 bufio 包提供的几种方式

嗨&#xff0c;大家好&#xff01;我是波罗学。本文是系列文章 Go 技巧第十七篇&#xff0c;系列文章查看&#xff1a;Go 语言技巧。 本文将介绍 Go 如何按行读取文件&#xff0c;基于此会逐步延伸到如何按块读取文件。 引言 我们将要介绍的按行读取文件的方式其实是非常适合…

Laravel04 eloquent

eloquent 1. eloquent2. 创建eloquent model 以及 取数据 1. eloquent 文档地址&#xff1a; https://learnku.com/docs/laravel/8.x/eloquent/9406 下面是我们&#xff0c;通过laravel的DB类从数据库中获取了post记录&#xff0c;那么有没有可能我们直接获取一个post对象&am…

pycharm控制STM32F103ZET6拍照并上位机接收显示(OV7670、照相机、STM32、TFTLCD)

基于STM32的照相机 准备工作最终效果一、下位机1、主函数2、OV7670初始化 二、上位机1、控制拍照2、接收图片数据 三、资源获取 准备工作 一、硬件及片上资源: 1,串口1(波特率:921600,PA9/PA10通过usb转ttl连接电脑&#xff0c;或者其他方法)上传图片数据至上位机 2,串口2(波特…

一文读懂:AWS 网络对等互连(VPC peering)实用操作指南

VPC peering connection-网络对等互连在您的 Atlas VPC 和云提供商的 VPC 之间建立私有连接。该连接将流量与公共网络隔离以提高安全性。本篇文章有VPC peering的操作指南以及价格等信息。如还有疑问请联系我们MongoDB的销售&#xff0c;客户成功经理或解决方案架构师。 1 使用…

【C之·预处理器】

系列文章目录 文章目录 前言一、预处理指令1. #line的用法1.1 概述 2. #error2.1 概述 二、预定义宏三、示例1. #line2. #error3. 预定义宏 总结 前言 C 预处理器不是编译器的组成部分&#xff0c;但是它是编译过程中一个单独的步骤。简言之&#xff0c;C 预处理器只不过是一个…

C++面试宝典第32题:零钱兑换

题目 给定不同面额的硬币coins和一个总金额amount,编写一个函数来计算可以凑成总金额所需的最少的硬币个数。如果没有任何一种硬币组合能组成总金额,则返回-1。说明:你可以认为每种硬币的数量是无限的。 示例1: 输入:coins = [1, 2, 5], amount = 11 输出:3 解释:11 = …

如何使用Douglas-042为威胁搜索和事件应急响应提速

关于Douglas-042 Douglas-042是一款功能强大的PowerShell脚本&#xff0c;该脚本可以提升数据分类的速度&#xff0c;并辅助广大研究人员迅速从取证数据中筛选和提取出关键数据。 该工具能够搜索和识别Windows生态系统中潜在的安全漏洞&#xff0c;Douglas-042会将注意力放在…

Mistral发布语言大模型Mistral Large;法国新星Mistral挑战 OpenAI 霸主地位

&#x1f989; AI新闻 &#x1f680; Mistral发布语言大模型Mistral Large 摘要&#xff1a;Mistral Large 是 Mistral AI 公司最新发布的旗舰语言模型&#xff0c;具备顶尖水平的推理能力。它主要被设计用于处理复杂的多语言推理任务&#xff0c;比如文本理解、转换和代码生…