[streamlit]数据科学科研工作者的神器,必须要推荐一下

1. 前言

做科研当然要有过硬的专业知识,但是也少不了一些辅助,才能最大程度发挥我们的能力。因此,除去我们模型性能优秀,结果良好以外,如何进行一个好的展示,也是非常有必要的。那么今天,我们就隆重介绍,这个几乎可以替代掉Flask作为构建demo首选的streamlit。(这次不是chatGPT了,毕竟chatGPT只会描述,不会感受。)

2. streamlit能干什么

我们为什么要用streamlit呢?
第一,我们想要做个展示我们模型的Demo页面。
第二,自己就只会python,不懂啥三剑客(Html,css,js),但我就想自己去做个界面,怎么整?
第三,不能太复杂,太复杂的光学起来就很吃力了,我就想要个简单的Demo就行。

于是,于是streamlit来了,不仅可以完全满足以上要求,而且还能更加的强大。完全可以由python编写的网页,你想象过长什么样吗?

再给你看看它的一些组件,你就大概知道它能够做什么了。

2.1 普通输出

首先它是可以输出普通文本的,而且支持部分Markdown语法,即使你啥都不写,你就想做一个纯文本的BLOG,它也能够完全满足你。
在这里插入图片描述
在这里插入图片描述

2.2 数据展示

如果你有一堆数据要展示,但是想展示的好看点,Streamlit也可以满足你,比如列表、或者评价指标,甚至是json也可以很好看的展示出来。
在这里插入图片描述

2.3 展示图片

光展示文字或者表格不太直观啊,我们最终还是希望能够用图来展示我们的结果,哦对了,图有两种,一种是Picture一种是Chart,streamlit都可以完美支持,甚至是音频或者视频都可以完美的嵌套在这里面。
在这里插入图片描述
在这里插入图片描述

2.4 交互控件

是的是的,如果你说这上面不就是个静态展示页面么,我用个jekyll更能轻量式的搭建啊,但是下面的交互控件,则是我最看重的地方。话不多说,大家可以看一看效果。从普通的点击按钮,到上传下载文件,甚至是直接调用摄像头拍摄照片都能够很轻松的使用,看起来是不是心动了。
在这里插入图片描述
在这里插入图片描述

2.4 布局

作为网页好不好看,最重要的是布局,streamlit也帮助我们快速搭建美观的布局了。
在这里插入图片描述

2.5 高级功能

当然,streamlit的功能远不于此,还有一个高级功能等待我们去探索,例如使用命令行,主题啊,或者性能优化等等。
在这里插入图片描述

2.6 云发布

最重要的是,streamlit可以有偿云发布,这才是重点,也就是它为什么能够一直做下去的原因,是因为它有盈利点,也有开放性。

streamlit自己构建了关于自己展示的一个demo,其样子和其他网站看起来没什么区别,甚至更好看一些。(不过有一点我自己偷偷吐槽一下,就是构建复杂的网站后,它的响应速度还是需要一定的耐心的。)

3. streamlit该怎么做

光说不练假把式,既然都能吸引我到半夜还在倒腾的东西,那肯定要真正能实践起来才行。当然,我就做了一些简单的demo,主要是为了呈现功能,具体细节还需要进行二次加工。这次,我主要实践了两个比较重要的也比较有用的功能,至于绘图功能,大家可以参考官方文档,讲述的很细致哦。

因此如果想使用streamlit的话,也非常容易,只需要遵循以下3步就可以了。

  1. 使用命令安装streamlit
pip install streamlit
  1. 在自己的项目里增加一个app.py(其实叫啥名字都行),负责整个界面的设计和渲染,大致只包含4个部分。
# 导入包
# 设定运行环境
# 写一个主函数writer()
# 执行函数main
  1. 通过下面命令启动它:
streamlit run app.py # 默认端口8501
or
streamlit run app.py --server.port your_port # 指定端口
  1. 打开浏览器,就可以享用了
http://localhost:8501

3.1 模型demo

我们做人工智能的,模型做的那肯定都是非常优秀的,但是很难让别人能够感受到我们模型的优越性,这是因为我们没有让别人所见即所得,让他们感受一下模型的性能比冷冰冰的数字更加有效。但是我们之前的技能点都点在了科研上了,而如何展示我们的工作则成为我们头疼的事情,因为这是一个偏工程而非科研的工作。

不过好在,streamlit能够帮助我们快速构建一个看起来还可以的demo,大家可以先看一下效果。
在这里插入图片描述
可以看到,很容易生成了一个看起来还可以的界面。左边菜单是用来调节一些模型的参数的,而右边则是主界面。主界面上面是我们的输入栏,下面有一个一键生成摘要按钮,点击后,我们就能够通过我们的模型生成相应的摘要了。最下面还有一些和基准系统的性能比较,看起来是不是美观多了?

如果要从头开始构建这样一个界面,那必然是非常复杂的一个工程。但是streamlit让我们一个py文件就可以解决,主要代码如下:

import streamlit as st
import os
import torch
import timefrom e2e import predict_one_sample
from module.model import MT5PForSequenceClassification
from module.tokenizer import T5PegasusTokenizerst.set_page_config(page_title="Demo", initial_sidebar_state="auto", layout="wide")@st.cache(allow_output_mutation=True)
def get_model(device, vocab_path, model_path):tokenizer = T5PegasusTokenizer.from_pretrained(vocab_path)model = MT5PForSequenceClassification(model_path)#model.load_state_dict(torch.load(model_path))model.to(device)model.eval()return tokenizer, modeldevice_ids = 7
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
os.environ["CUDA_VISIBLE_DEVICES"] = str(device_ids)
device = torch.device("cuda" if torch.cuda.is_available() and int(device_ids) >= 0 else "cpu")
tokenizer, model = get_model(device, "t5_pegasus_torch/vocab.txt", "t5_pegasus_torch/")def writer():st.markdown("""## CAIL 2022 涉法舆情摘要demo""")st.sidebar.subheader("配置参数")max_length = st.sidebar.slider("生成摘要长度", min_value=50, max_value=250, value=200, step=1)top_k = st.sidebar.slider("top_k", min_value=0, max_value=10, value=3, step=1)num_beams = st.sidebar.slider("num_beams", min_value=1, max_value=10, value=3, step=1)top_p = st.sidebar.number_input("top_p", min_value=0.0, max_value=1.0, value=0.95, step=0.01)do_sample = st.sidebar.checkbox('do_sample')content = st.text_area("输入新闻正文", max_chars=1024,height=400)if st.button("一键生成摘要"):start_message = st.empty()start_message.write("正在抽取,请等待...")start_time = time.time()title = predict_one_sample(model, device, tokenizer, content, max_length=max_length,do_sample=do_sample,num_beams=num_beams, top_k=top_k, top_p=top_p)end_time = time.time()start_message.write("抽取完成,耗时{}s".format(end_time - start_time))st.text_area("摘要如下",title)st.markdown("""## 与基准系统T5生成的摘要性能比较""")col1, col2, col3,col4,col5 = st.columns(5)col1.metric("Rouge-1", "48.5", "16%")col2.metric("Rouge-2", "24.6", "-8%")col3.metric("Rouge-L", "34.9", "4%")col4.metric("BLEU", "24.0", "0%")col5.metric("BertScore", "64.7", "-3%")else:st.stop()if __name__ == '__main__':writer()

3.2 性能评估

另一个比较能用得上的是性能评估,这里我们也不多说,直接上图。
在这里插入图片描述
这样的一个网页更加的容易了,下面是其app.py中的主要代码:

import jsonimport streamlit as st
import time
from evaluate import Evaluatorst.set_page_config(page_title="Evaluate", initial_sidebar_state="auto", layout="wide")@st.cache(allow_output_mutation=True)
def get_evaluator():evaluator = Evaluator()return evaluatorevaluator = get_evaluator()def get_sources_targets(baseline_data):objects=json.loads(baseline_data)sources = objects["sources"]targets = objects["targets"]return sources, targetsdef compute_diff(baselines, system):results = zip(baselines, system)diff_list = []for result in results:diff = round((result[1] - result[0]) / result[0], 2)diff_list.append(diff)return diff_listdef set_metric(container, baselines, system=None):col_name_list = ["Rouge-1", "Rouge-2", "Rouge-L", "BLEU", "BertScore"]cols = container.columns(5)if system != None:diff_list = compute_diff(baselines, system)for i in range(5):cols[i].metric(col_name_list[i], str(round(system[i],4)), str(diff_list[i]) + "%")else:for i in range(5):cols[i].metric(col_name_list[i], str(round(baselines[i],4)))def writer():st.markdown("""## 摘要评估""")st.sidebar.subheader("上传/下载")st.sidebar.write("请上传基准系统文件")baseline_uploaded_file = st.sidebar.file_uploader("基准系统")uploaded_files = st.sidebar.file_uploader("测试文件", accept_multiple_files=True)if st.button("一键评估"):start_message = st.empty()start_message.write("正在评估,请等待...")start_time = time.time()baseline_data = baseline_uploaded_file.read().decode('UTF-8')sources, targets = get_sources_targets(baseline_data)baseline_performance = evaluator.compute_all_score(sources, targets)baseline_container = st.container()baseline_container.write("基准系统性能表现")set_metric(baseline_container, baseline_performance)for index, uploaded_file in enumerate(uploaded_files):bytes_data = uploaded_file.read().decode('UTF-8')sources, targets = get_sources_targets(bytes_data)system_performance = evaluator.compute_all_score(sources, targets)container = st.container()container.write(uploaded_file.name + "系统的性能表现")set_metric(container, baseline_performance, system_performance)end_time = time.time()start_message.write("评估完成,耗时{}s".format(end_time - start_time))else:st.stop()if __name__ == '__main__':writer()

以上代码我已整理发布demo_streamlit_text_generation,大家记得关注。

4. 小结

这次我们主要讲述了如何利用streamlit制作我们模型展示的Demo,以及利用它进行一个性能展示和比较。对于曾经开发过网页或者移动端App的人来说,这个半天就学会了。如果是0基础的,根据刘聪大神的说法,最多1天就能学会。不过官方给出的建议是,你可以花30天去学会它,而且给出了教程了《30天学会streamlt》。大家感兴趣的可以自己去尝试,非常实用的一款工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/58792.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大模型高效微调综述上:Adapter Tuning、AdaMix、PET、Prefix-Tuning、Prompt Tuning、P-tuning、P-tuning v2

文章目录 一、背景1.1 Tansformer1.1.1 模型结构1.1.2 注意力机制1.1.3 注意力在Transformer中的应用 1.2 BERT 二、PEFT综述2.1 PEFT的分类2.2 不同PEFT方法的对比 三、Additive methods3.1 Adapter Tuning3.1.1 Adapters(2019.2.2)3.1.2 AdaMix&#x…

AR眼镜——Vuzix Blade填坑笔记

这是市场给挖的坑!! 手里的一个项目,由于商务环节历时1年半的时间,到项目签合同的时候,公司的产品线布局变化极大,我已经很久没做过AR相关的项目了,一直在做VR的东西。合同签完拿给我过参数&…

【人脸识别】VGGFace2数据集介绍

论文题目::《VGGFace2: A dataset for recognising faces across pose and age》 论文地址:https://arxiv.org/pdf/1710.08092.pdf 1. 简介 VGGFace2是一个大规模人脸识别数据集,包含331万图片,9131个ID,平…

window.postMessage()接收不到信息(失效)

问题描述 按照正常的代码逻辑,应该是这个样子,通过iframe打开子窗口,能够正常通信。 // 接收端(父窗口) window.onmessage function (e) {// 逻辑代码 }// 发送端(子窗口) window.parent.po…

什么是人工智能在金融领域的应用?

人工智能在金融领域有很多应用,下面是一些例子: 什么是人工智能在金融领域的应用 风险评估:人工智能可以帮助金融机构评估贷款和投资的风险,例如通过分析借款人或投资对象的信用历史、收入、资产等信息来判断其还款能力和投资回报…

人工智能(AI)在金融行业的应用

人工智能(AI)技术在金融行业的应用日益广泛,为金融机构提供了更高效、更智能的解决方案。以下和大家分享AI在金融行业的一些主要应用,希望对大家有所帮助。北京木奇移动技术有限公司,专业的软件外包开发公司&#xff0…

那些似小实大的工作

上周末在厦门,我跟传奇个人站长高春辉联合在爱特咖啡搞了一场分享会,老高继续巡回分享他ip库的意义和发展历程。 那我分享的时候,就先替老高补充了一个案例,我说2004年底进入百度,2005年初转入商业产品部,然…

新手小白学JAVA 面向对象之多态

多态 1. 概念 多态是面向对象程序设计(OOP)的一个重要特征,指同一个实体同时具有多种形式,即同一个对象,在不同时刻,代表的对象不一样,指的是对象的多种形态。 可以把不同的子类对象都当作父…

Flask 安装与基础结构

Flask介绍: Flask 是由python开发的轻量的web框架,小巧、灵活。一个脚本就可以启动web项目。 Flask部署: 1、创建虚拟环境 命令行输入:conda -create -n 项目名 Python版本号 启动虚拟环境 activate 环境名 2、安装flask框…

小学生智力测试软件,考验小学生的智商测试,全答对算你厉害

这几年来,小学生的题目让很多人脑筋急转还是弯不过来,答不上。要是小学生能够答出来了而你不能,那你会不会觉得自己的智商遭到了碾压?肯定会吧!想不想扳回?想的话就赶紧把这道智商测试题做了吧,…

再看SimCSE

一、概述 二、要点分析原始ppt解读 2.1 作用:语义表达作用检索聚类 2.2 简述:简单的对比学习来做语义表征 预训练对比学习:最佳的语义表征方法 无监督:dropout有监督:NLI 蕴含矛盾数据 原理: 利用对比学习…

MIT最新成果:这款能「自我复制」的机器人,从飞机到火箭都能自己造!

来源:新智元 本文约2300字,建议阅读5分钟科幻成真!《超能陆战队》里能自我复制的微型机器人,被MIT造出来了? 现在的机器人,能力究竟有多离谱? 实在难以想象,就连造飞机、造火箭都成了…

PowerGram:一款功能强大的跨平台Telegram Bot工具

关于PowerGram PowerGram是一款功能强大的跨平台Telegram Bot工具,该工具基于纯PowerShell开发,支持在Windows、Linux和macOS系统上运行。如需使用PowerGram,只需要安装PowerShell 4或更高版本并连接网络即可。 Bot和Telegram服务器之间的所…

HackingTeam重磅炸弹: 估值超1000万美金带有军火交易性质的木马病毒以及远控源码泄露

[简介] 常用网名: 猪头三 出生日期: 1981.XX.XX 个人网站: http://www.x86asm.com QQ交流: 643439947 编程生涯: 2001年~至今[共14年] 职业生涯: 12年 开发语言: C/C、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python 开发工具: Visual Studio、Delphi、XCode、E…

Transformers 如何模仿大脑的某些部分

来源:ScienceAI 编译:白菜叶 了解大脑如何组织和访问空间信息「我们在哪里」,「拐角处有什么」,「如何到达那里」,这仍然是一项艰巨的挑战。该过程涉及从数百亿个神经元中调用整个记忆网络和存储的空间数据&#xff0c…

攻防世界_Crypto_告诉你个秘密

攻防世界刷题记录Crypto篇 文章目录 攻防世界刷题记录Crypto篇解题步骤1.下载题目附件查看内容2.借助Python来解码3.从键盘上找到每组字母包围的字母 解题步骤 1.下载题目附件查看内容 如图所示,题目附件给出的是一个txt文件里面有两行字符串。因为只有不超过F的大…

来自Transformer + Bert + GPT 的灵魂拷问

Transformer Q:Transformer如何解决梯度消失问题的? A:残差连接 Q:为何Transformer中使用Layer Normalization而不用Batch Normalization? A:BatchNorm是对一个batch-size样本内的每个特征做归一化,LayerNorm是对每…

基于tkwinter制作的exe小工具

前言 最近事没那么多,然后同事基于tkwinter制作了一款exe造单工具,感觉挺好玩的,然后叫同事分享了一下源码,自己去学习了tkwinter各大组件的相关语法及操作,所以写篇博客分享一下 同事款工具 下面是同事写的小工具&…

【WAX链游】发布一个免费开源的Alien Worlds【外星世界】合约脚本TLM

前言 《链游Farmers World【农民世界】爆火,发布一个免费开源的脚本》 在之前的文章中,我们分享了一个开源的农民世界(Farmers World)脚本 【OpenFarmer】:https://github.com/encoderlee/OpenFarmer 经过这段时间以来的不断学习&#xff…

量子计算机细思极恐,宇宙或许只是一套虚拟程序,科学家:还有一种可能细思极恐!...

原标题:宇宙或许只是一套虚拟程序,科学家:还有一种可能细思极恐! 我不知道你是否有过类似的经历:刚从沉睡中醒来,你周围的世界就有一种奇怪的虚幻和朦胧感,当意识浮出水面,你周围的事物就回到了…