大模型日报
2024-05-15
大模型资讯
- OpenAI推出全新AI模型GPT-4o,具备文本、图像和音频处理能力
- 摘要: OpenAI公司继ChatGPT后,最新推出了名为GPT-4o的AI模型。这一模型不仅能够理解和生成文本,还新增了图像和音频的解释及生成功能。GPT-4o作为一个对话式数字个人助理,将进一步扩展人工智能在多媒体交互领域的应用。
- 【插入一个GPT升级小教程】
如果需要升级 Plus,目前国内升级 Plus 最方便快捷的便是,虚拟卡,虚拟卡可以理解为一张充值卡,你把钱充在里面,然后使用它去支付 Plus 费用。
目前用过最好用的虚拟卡平台是 wildcard,网址:
https://wildcard.com.cn/i/GPT0123 (PS: 邀请码记得填上 GPT0123,这样有后续信用卡支付会有 2 美元优惠
这个平台最方便的是,可以快速一键升级完你的 GPT 账号,之前我在其它虚拟卡平台购买的卡片信息,需要自己去 openai 官网输入卡账号等信息,还会因为 IP 在国内被拒绝支付,所以这个平台的一键升级就解决了这些问题,非常丝滑~
- 阿联酋科技创新研究所推出视觉到语言人工智能
- 摘要: 阿联酋的科技创新研究所(TII)近日宣布推出了一种新的大型语言模型(LLM)。该模型是人工智能领域的一项重要创新,能够将视觉信息转换为语言描述,这标志着视觉到语言AI技术的一大进步。
- 富士通和理研合作,日本获得大型语言模型
- 摘要: 由于训练大型语言模型(LLM)需要庞大的计算资源,世界上很少有组织能够在短时间内完成此任务。富士通和日本理化学研究所(RIKEN)合作,成功为日本开发了一款大型语言模型,展示了他们在高性能计算方面的实力。
- 英特尔发布低比特量化开放大型语言模型(LLM)排行榜
- 摘要: 英特尔最近推出了一个专注于大型语言模型(LLM)量化的新排行榜,该排行榜通过10个关键基准测试来评估语言模型的性能。这一领域的发展引起了业界关注,因为它有可能让强大的AI技术更加高效和易于部署。
大模型产品
- Voicenotes:智能AI语音笔记
- 摘要: Voicenotes是一款智能语音笔记应用,能够自由记录你的想法,并通过尖端AI技术进行转录。你可以查询录音中的每一个词汇,让笔记记录变得更加高效。
- BoodleBox:集成AI协作平台
- 摘要: BoodleBox是一个集成多种AI工具的团队协作平台,包括ChatGPT、Claude等,提供1000+定制GPT。旨在帮助团队更好决策、个性化结果,并降低成本。
- Stunning: AI快速建站全套工具
- 摘要: Stunning是面向营销机构的一站式解决方案。用户能够利用AI技术快速为客户构建网站、社交媒体内容、博客、引导潜在客户,甚至批量创建SEO优化网站。
- Wegic:首款AI网页设计开发助手
- 摘要: Wegic是首款由GPT-4o模型驱动的AI网页设计与开发助手。用户只需通过简单对话,即可创建和修改多种语言的网站,让你的创意快速变为现实。
- SimplifiedIQ:智能数据评估工具
- 摘要: SimplifiedIQ助您快速创建和自动评分定制化评估。该数据驱动解决方案节省时间资源,提供深刻洞察,支持明智决策。
- fynk:AI智能合同管理平台
- 摘要: fynk不仅仅是合同管理工具。它内置强大的AI功能,能无缝导入整合现有及外部合同,实现创建、自动化、管理、协作和签署的一体化工作流程。
- AIWatchfulCompanion:AI照护助手
- 摘要: AIWatchfulCompanion是一款AI照护应用,旨在减轻照护者压力,确保亲人安全。它能将普通设备转变为智能照护者,即使你不在现场也能守护亲人。现可在官网加入等待名单。
- SaveDay:瞬间摘要工具应用
- 摘要: SaveDay应用可即刻生成文章和YouTube视频摘要,并提问。用户能将内容保存至知识库,方便后续查找和回顾。
- 创意验证器:获取商业想法真实反馈
- 摘要: 「创意验证器」旨在为您的商业构想提供真诚的反馈,帮助您打造人们真正需要的产品。通过AI在短短10秒内完成,且完全免费。
大模型论文
- Plot2Code: 科学图表代码生成评测
- 摘要: 介绍Plot2Code,针对多模态大型语言模型将科学图表转换为可执行代码能力的评测基准。通过132个matplotlib图表及其源码和GPT-4总结说明,提出三种自动评估指标。
- MedVersa:多功能医学图像解读AI
- 摘要: MedVersa是一种通用学习者,可灵活学习和执行医学图像解读任务。利用大型语言模型,支持多模态输入和实时任务指定,通过最大的多模态数据集MedInterp实现,并在9项任务中达到最佳性能。
- PyZoBot: 高级文献管理与信息提取
- 摘要: 本文介绍了PyZoBot,这是一个结合Zotero文献管理和OpenAI大型语言模型的平台。它能高效从科研文献库中提取和综合信息,应对科研文献的信息过载问题。
- AgentClinic:AI临床模拟评测基准
- 摘要: AgentClinic是一个多模态基准,用于评估AI作为代理在模拟临床环境中的表现。通过对话和主动数据收集揭示诊断,发现引入偏见会显著降低诊断准确性,并影响患者代理的合作意愿。
- EconLogicQA: 经济推理能力评估
- 摘要: 本文提出EconLogicQA基准测试,用于评估大型语言模型在经济、商业和供应链管理领域内的顺序推理能力。该基准包含多事件经济文章场景,测试模型理解事件的时序和逻辑关系。
- PARDEN:防御语言模型越狱
- 摘要: 研究提出PARDEN方法,通过让语言模型重复输出来检测并防御越狱行为,无需微调或模型内部访问,有效降低了错误正例率。
- 利用文本语义改善VLM的泛化
- 摘要: 研究提出一种新的提示调整方法,通过利用大型语言模型得到的类别描述,构建图像和文本特征的部分视图,并对其进行对齐,以学习更具泛化能力的提示。在11个基准数据集上的实验表明,该方法优于现有技术。
- 大型语言模型蒸馏及重排序研究
- 摘要: 本文提出Rank-DistiLLM数据集,研究将手动标注数据微调交叉编码器的技术应用于大型语言模型蒸馏。通过这种方法,可以训练出效率更高、效果接近大型语言模型的交叉编码器。相关代码和数据已公开。
- 在线迭代RLHF工作流程研究
- 摘要: 本技术报告介绍在线迭代人类反馈强化学习(RLHF)的工作流程,该方法在大型语言模型中优于离线方法。报告详细描述了在线RLHF的理论、算法原则及实践实现,并提供了开源数据集、模型和实现指南。
- 利用LLMs预测印度选举结果
- 摘要: 本研究提出了一种新方法,利用大型语言模型(LLMs)分析社交媒体数据,预测印度州议会选举结果。通过情感分析推特数据,证明了其预测能力超越传统民调。
大模型开源项目
- Bisheng开源LLM DevOps平台
- 摘要: Bisheng是一个用Python编写的开源LLM DevOps平台,旨在为下一代AI应用提供支持和开发便利,通过集成先进的机器学习模型,推动AI技术的快速发展。
- AI大模型一键生成高清短视频
- 摘要: harry0703项目使用AI大模型,通过简单的一键操作即可快速生成高清短视频。该项目基于Python语言开发,便捷地为用户提供视频创作的解决方案。
- Fishaudio:新型TTS方案
- 摘要: Fishaudio是一个全新的文本到语音转换解决方案,该项目使用Python语言编写,旨在提供高效、易用的TTS工具。
- 阿里巴巴达摩院开源视频剪辑工具
- 摘要: 阿里巴巴达摩院推出的开源视频剪辑工具,特点是精准、易用。该工具基于Python开发,集成了大语言模型(LLM)的AI智能剪辑功能,能够提高视频编辑的效率和质量。
- 基于哔哩哔哩评论的本地聊天机器人
- 摘要: 项目名称为linyiLYi,是一个用Python编写的聊天机器人。该项目通过对哔哩哔哩用户评论的精调,实现了更加本地化和个性化的交流体验。
- danny-avila:高级ChatGPT克隆项目
- 摘要: danny-avila项目是一个开源的高级ChatGPT克隆,整合了多个AI服务与技术,包括OpenAI、Azure等,支持GPT-4,提供多用户安全系统,具备模型切换、消息搜索等功能。