GPT自动理解视频、法律顾问、大模型安全围栏

每天都要浏览大量AI相关新闻，是不是感到信息量爆炸，有效信息少，无从看起？

这么多新产品和新工具，到底哪些是真正是有价值的，哪些只是浮躁的热点？

想参与AI产品和工具的开发，但苦于没有灵感，从哪里能够获得大量的灵感和思路？

我会把自己浏览和使用过的AI相关新闻、产品、工具、模型等，整理在这里，帮助大家去除信息噪音，简化阅读，更高效的了解AI前沿发展。主要围绕：

作为本期刊的第一期，我们主要围绕2023年4月发布的相关产品和技术工具。

终端产品

GitHub - lvwzhen/law-cn-ai: ⚖️ AI 法律助手

该项目把中国法律文书作为知识库，将知识库embedding后存入向量数据库，然后向用户提供了完整界面，用户可以用自然语言提问，后台使用openAI的API，结合知识库的现有知识进行自然语言的回答。

主要技术：

Hugging Face发布了一个ChatGPT开源替代品名为HuggingChat。Hugging Face大家都懂的，可以理解成AI界的Github，很多注明的开源模型都在上面首发。

底层模型目前有两种选择：

FinChat - AI Chat for Financial Analysts | FinChat.io

FinChat.io是由ChatGPT提供技术支持的工具。它利用人工智能生成关于公共公司和投资者的问题的答案。为了提供准确的答案，FinChat会提供推理、来源和数据等支持。实测效果有点酷炫。

Microsoft Designer - Stunning designs in a flash

输入文字，通过AI生成一个合适的设计图，且支持动态图。例如下面的文字描述"为我的油管频道‘Science for Littles’设计一个动态的广告"生成了右方的一些设计图，生成速度非常快，还可调节图片尺寸。

选择了右方较为满意的设计后，可以继续在在线编辑器中修改你的设计，支持自由导出各种格式与下载。

GitHub - BuilderIO/ai-shell: A CLI that converts natural language to shell commands.

将chatGPT整合到你的shell中，用ai命令进行操作

GitHub - showlab/VLog: Transform Video as a Document with ChatGPT, CLIP, BLIP2, GRIT, Whisper, LangChain.

V是大写，他可以将一段长视频转换成包含视觉和音频信息的文档。通过将此文档发送到ChatGPT，我们可以针对这个视频的内容进行自然语言聊天！当然，需要消耗你自己的openAI API额度。

AudioGPT - a Hugging Face Space by AIGC-Audio

这个工具集里包含了大量音频相关的处理能力工具，大部分工具使用时需要填写你自己的GPT API key，消耗你的额度，我试了一下，文字转语音，一句5个词的句子，消耗了我4000个token！（暴风哭泣！）

演讲：

唱歌：

音频处理：

https://github.com/NVIDIA/NeMo-Guardrails

NeMo Guardrails 是一个开源工具包，可以轻松地将可编程护栏添加到基于 LLM 的对话系统中。Guardrails（或简称“rails”）是控制大型语言模型输出的特定方式，例如不谈论政治、以特定方式响应特定用户请求、遵循预定义的对话路径、使用特定语言风格、提取结构化数据等。

主要优势：

构建值得信赖、安全可靠的 LLM 对话系统：使用 NeMo Guardrails 的核心价值是能够编写 rails 来指导对话。开发人员可以选择定义他们的 LLM 驱动的机器人在某些主题上的行为，并让他们的创造力不受其他人的影响！
通过操作连接模型、链、服务等： LLM 不需要解决所有挑战。NeMo Guardrails 提供了将您的代码库或服务无缝安全地连接到聊天机器人的能力！