计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-07

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-07

目录

文章目录

  • 计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-07
    • 目录
    • 1. Evaluation of Large Language Models for Summarization Tasks in the Medical Domain: A Narrative Review
      • 摘要
      • 研究背景
      • 问题与挑战
      • 如何解决
      • 创新点
      • 算法模型
      • 实验效果
      • 推荐阅读指数
      • 推荐理由
    • 2. Advancing Object Detection in Transportation with Multimodal Large Language Models (MLLMs): A Comprehensive Review and Empirical Testing
      • 摘要
      • 研究背景
      • 问题与挑战
      • 如何解决
      • 创新点
      • 算法模型
      • 实验效果
      • 推荐阅读指数
      • 推荐理由
    • 3. Beyond Single-Audio: Advancing Multi-Audio Processing in Audio Large Language Models
      • 摘要
      • 研究背景
      • 问题与挑战
      • 如何解决
      • 创新点
      • 算法模型
      • 实验效果
      • 推荐阅读指数
      • 推荐理由
    • 4. A Survey on the Honesty of Large Language Models
    • 5. FoodMLLM-JP: Leveraging Multimodal Large Language Models for Japanese Recipe Generation
      • 摘要:
      • 研究背景:
      • 问题与挑战:
      • 如何解决:
      • 创新点:
      • 算法模型:
      • 实验效果:
      • 推荐阅读指数:
      • 推荐理由:
    • 6. CurricuLLM: Automatic Task Curricula Design for Learning Complex Robot Skills using Large Language Models
      • 摘要
      • 研究背景
      • 问题与挑战
      • 如何解决
      • 创新点
      • 算法模型
      • 实验效果
      • 重要数据与结论
      • 推荐阅读指数
      • 推荐理由
    • 7. Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey
      • 摘要:
      • 研究背景:
      • 问题与挑战:
      • 如何解决:
      • 创新点:
      • 算法模型:
      • 实验效果:
      • 推荐阅读指数:
      • 推荐理由:
    • 后记


1. Evaluation of Large Language Models for Summarization Tasks in the Medical Domain: A Narrative Review

E Croxford, Y Gao, N Pellegrino, KK Wong, G Wills… - arXiv preprint arXiv …, 2024
https://arxiv.org/pdf/2409.18170

大型语言模型在医学领域摘要任务的评估:一项叙述性综述

摘要

本文是一篇叙述性综述,旨在评估大型语言模型(LLMs)在临床摘要任务中的当前评估状态,并提出未来的方向,以解决专家人工评估的资源限制问题。

研究背景

大型语言模型(LLMs)在自然语言生成(NLG)领域取得了显著进展,尤其在医疗领域,LLMs有助于减轻医疗保健提供者的文档负担。然而,医学的高风险性质要求对LLMs的性能进行可靠评估,这仍然是一个挑战。
在这里插入图片描述
在这里插入图片描述

问题与挑战

在医学等高风险环境中应用LLMs的一个主要挑战是确保它们的性能得到可靠评估。现有的评估指标(如n-gram重叠和语义分数)对于医学领域的细微需求来说是不够的。

如何解决

文章提出了使用LLMs作为评估工具的概念,通过指令调整和强化学习与人类反馈(RLHF)的方法,使LLMs能够更精确地遵循评估标准。

创新点

  • LLM作为评估者:提出使用LLMs作为人类专家评估的补充,通过模拟人类评估者的行为来进行评估。
  • 指令调整:通过指令工程来调整LLMs,使其能够执行特定任务。
  • 参数高效微调:使用量化和低秩适配器来微调模型,以嵌入任务特定知识。

算法模型

  • BERTScore:用于评估文本生成质量的度量。
  • 直接偏好优化(DPO):一种基于人类偏好的直接优化方法,用于微调LLMs。

实验效果

文章没有提供具体的实验数据,因为它是一篇叙述性回顾,而不是实验性研究。它讨论了评估LLMs的不同方法,并提出了未来研究的方向。

推荐阅读指数

7/10

推荐理由

这篇文章为理解LLMs在医学摘要任务中的评估挑战提供了全面的视角,并探讨了如何通过LLMs本身来改进评估过程。

2. Advancing Object Detection in Transportation with Multimodal Large Language Models (MLLMs): A Comprehensive Review and Empirical Testing

HI Ashqar, A Jaber, TI Alhadidi, M Elhenawy - arXiv preprint arXiv:2409.18286, 2024
https://arxiv.org/abs/2409.18286

使用多模态大型语言模型(MLLMs)推进交通系统中的目标检测:一项全面回顾和实证测试

摘要

本研究旨在全面回顾和实证评估多模态大型语言模型(MLLMs)和大型视觉模型(VLMs)在交通系统目标检测中的应用。研究首先提供了MLLMs在交通应用中的潜在优势的背景,并回顾了先前研究中当前MLLM技术的有效性和局限性。然后提供了交通应用中端到端目标检测的分类法和未来方向的概述。在此基础之上,提出了对三个实际交通问题的MLLMs进行实证分析,包括道路安全属性提取、安全关键事件检测和热图像视觉推理。研究结果提供了对MLLM性能的详细评估,揭示了其优势和改进领域。

研究背景

目标检测在交通领域变得越来越重要,因为它对交通安全、效率至关重要。MLLMs代表了一种突破性进展,作为具有多模态数据处理能力的AI模型,能够处理和分析来自多个来源的数据,包括文本、图像、视频和传感器数据。
在这里插入图片描述

问题与挑战

现有的目标检测技术在效率和准确性方面存在局限性。特别是在复杂场景中,这些方法可能效率低下或缺乏必要的准确性。此外,传统目标检测算法通常使用水平边界框来标记图像中的物体,可能会导致准确性问题,并包含过多的背景信息。

如何解决

研究提出了使用MLLMs进行目标检测的方法,这些模型能够处理不同类型的数据,如图像、视频和文本,开辟了提高目标检测准确性和上下文感知的新途径。
在这里插入图片描述

创新点

  • 多模态数据处理:MLLMs能够处理包括文本、图像、视频和传感器数据在内的多种数据类型。
  • 零样本和少样本学习:MLLMs即使在训练数据不足的情况下也能表现出色,减少了对大量标注数据集的依赖。
  • 实时推荐:MLLMs能够提供实时建议,提高了交通系统的效率和安全性。

算法模型

  • MLLMs/VLMs:使用诸如GPT-4和Vision Transformer模型等大型语言模型进行目标检测。
  • 零样本学习:在没有明确训练的情况下,利用MLLMs的基础知识和理解来生成准确的响应。

实验效果

  • 道路安全属性提取:在11个选定的iRAP标准中,模型在8个属性上的准确度超过80%。
  • 安全关键事件检测:Gemini-pro-vision 1.0在视频输入配置中表现优于其他配置,整体性能指标为74.67%。
  • 热图像视觉推理:Gemini 1.0 Pro Vision在自行车、汽车和摩托车检测方面优于GPT-4 Vision Preview,而GPT-4 Vision Preview在行人检测方面表现更好。

推荐阅读指数

8/10

推荐理由

这篇文章为理解MLLMs在交通领域目标检测中的应用提供了全面的视角,并探讨了如何通过多模态数据流的集成来提高目标检测能力。对于对自然语言处理和计算机视觉领域感兴趣的研究人员和实践者来说,这是一篇值得阅读的文章。

3. Beyond Single-Audio: Advancing Multi-Audio Processing in Audio Large Language Models

Y Chen, X Yue, X Gao, C Zhang, LF D’Haro, RT Tan… - arXiv preprint arXiv …, 2024
https://arxiv.org/pdf/2409.18680

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
超越单一音频:推进音频大型语言模型中的多音频处理

摘要

最近探索了各种音频大型语言模型(ALLMs),这些模型使用单一的、统一的模型同时处理不同的音频任务。尽管现有的ALLMs评估主要集中在单一音频任务上,但现实世界的应用通常涉及同时处理多个音频流。为了弥补这一差距,我们提出了第一个多音频评估(MAE)基准,它包括来自11个多音频任务的20个数据集,涵盖语音和声音场景。在MAE上的全面实验表明,现有的ALLMs在理解单个音频输入中的主要音频元素方面非常强大,但在处理多音频场景时却很困难。为此,我们提出了一种新颖的多音频大型语言模型(MALLM),通过我们提出的合成数据上的判别学习来捕获多个相似音频之间的音频上下文。结果表明,我们提出的MALLM在所有基线上都取得了优异的性能,并且在使用合成数据时具有高数据效率,无需人工注释。

研究背景

大型语言模型(LLMs)在自然语言处理(NLP)的各个任务中取得了显著进展。最近在LLMs的进展也推动了各种强大的音频大型语言模型(ALLMs)的发展,这些模型在自动语音识别、语音合成、声音事件分类等一系列音频任务上取得了令人印象深刻的结果。

问题与挑战

现有的ALLMs训练和评估主要集中在单一音频输入上,这在现实世界的应用中是一个重大缺陷,因为现实世界的应用,如虚拟助手,通常需要同时处理多个音频流。

如何解决

为了解决这个问题,作者提出了第一个多音频评估(MAE)基准,用于评估ALLMs的多音频处理能力。此外,作者还开发了一个新颖的多音频大型语言模型(MALLM),通过合成数据上的判别学习来提高模型处理多个音频流的能力。

创新点

  • 多音频评估(MAE)基准:这是第一个专门为评估ALLMs的多音频处理能力而设计的基准。
  • 多音频大型语言模型(MALLM):这是第一个为多音频任务量身定制的ALLM,它在处理多个音频流的同时保持了单一音频任务的竞争力。

算法模型

  • MALLM:通过合成数据上的判别学习进行训练,以发现两个相似音频样本之间的微妙差异。
  • 合成数据策略:提出了一种可扩展的音频对合成策略,无需数据收集和人工标注即可实现多音频处理能力。

实验效果

  • MAE基准:在MAE基准上的实验结果显示,现有的开源ALLMs在多音频场景中表现不佳。
  • MALLM性能:新开发的MALLM在多音频理解方面显著优于所有现有的开源ALLMs,并且在单一音频任务上也保持了竞争力。

推荐阅读指数

8/10

推荐理由

这篇文章为音频领域的大型语言模型提供了新的视角和方法,特别是在处理多音频任务方面。

4. A Survey on the Honesty of Large Language Models

S Li, C Yang, T Wu, C Shi, Y Zhang, X Zhu, Z Cheng… - arXiv preprint arXiv …, 2024
https://arxiv.org/pdf/2409.18786
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
大型语言模型的诚实性研究综述

摘要:
文章讨论了大型语言模型(LLMs)的诚实性问题,诚实性是指模型能够认识到它们所知道和不知道的事物,并能够忠实地表达它们的知识。尽管LLMs在很多方面表现出了巨大潜力,但它们在表达时仍会出现显著的不诚实行为,例如错误地自信地提供错误答案,或未能表达它们所知道的信息。文章提供了对LLMs诚实性研究的综述,包括诚实性的澄清、评估方法和改进策略,并为未来的研究提供了见解。

研究背景:
诚实性是将LLMs与人类价值观对齐的基本原则之一,特别是在医学、法律和金融等高风险领域。然而,当前的LLMs模型经常表现出不诚实的行为,比如过于自信地给出错误答案,或者无法准确表达其内部状态。

问题与挑战:
LLMs的诚实性研究面临几个挑战:诚实性在LLMs中的定义各不相同,识别已知和未知知识之间的区别存在困难,并且对相关研究的全面理解不足。

如何解决:
文章通过提供对LLMs诚实性的综述来解决这些问题,包括其定义、评估方法和改进策略。

创新点:
文章的主要创新点在于提供了一个全面的诚实性研究综述,这有助于统一对LLMs诚实性的理解,并为未来的研究提供了清晰的方向。

算法模型:
文章没有提出新的算法模型,而是对现有的评估和改进LLMs诚实性的方法进行了综述。

实验效果:
文章没有提供具体的实验数据,因为它是一个综述性质的文章,而不是一个实验性的研究。它总结了现有的研究成果,并提出了未来研究的方向。

推荐阅读指数:
8/10

推荐理由:
这篇文章是对LLMs诚实性研究的一个很好的概述,适合那些对LLMs的可靠性、评估标准和改进方法感兴趣的研究人员和从业者。

5. FoodMLLM-JP: Leveraging Multimodal Large Language Models for Japanese Recipe Generation

Y Imajuku, Y Yamakata, K Aizawa - arXiv preprint arXiv:2409.18459, 2024
https://arxiv.org/pdf/2409.18459

在这里插入图片描述
FoodMLLM-JP:利用多模态大型语言模型进行日文食谱生成

摘要:

这篇文章探讨了如何使用多模态大型语言模型(MLLMs)来理解食物图像,并生成对应的日文食谱。鉴于食物与人们生活的密切关系,这一研究领域对于实际应用(如饮食管理)至关重要。文章中,作者们对现有的MLLMs进行了微调,并在日文食谱数据集上进行了性能评估,与封闭模型GPT-4o进行了对比。研究表明,经过食谱数据训练的开放模型在生成食材方面的表现超过了GPT-4o。

研究背景:

食物图像理解是一个活跃的研究领域,它涉及到从食物图像中估计菜肴名称和食材等任务。随着MLLMs的出现,这些模型在处理图像和文本数据方面展现出了巨大潜力。

问题与挑战:

尽管MLLMs在处理英语方面表现出色,但对非英语语言(如日语)的支持还有待提高。此外,食物图像的理解需要模型能够准确地从图像中提取食材和烹饪步骤信息。

如何解决:

作者们通过对现有的MLLMs进行微调,使其能够更好地理解和生成日文食谱。他们还引入了一种新方法,即在训练过程中加入非食物图像及其标题,使模型能够在生成食谱文本之前判断输入图像是否为食物图像。

创新点:

  • 提出了一个全面的流程,包括微调开源MLLMs和基于考虑食物文化的策划评估数据的评估。
  • 利用MLLMs的多功能性,保留了人类创建的原始食谱文本,同时在训练过程中加入非食物图像及其标题,增加了数据多样性。
  • 通过食谱文本生成任务,分析了不同基础MLLMs和微调MLLMs时调整参数的性能差异。

算法模型:

文章中使用了LLaVA-1.5和Phi-3 Vision这两个开放的MLLMs,并在日文食谱数据集上进行了微调。此外,还使用了GPT-4o作为封闭模型进行对比。

实验效果:

  • 在食材生成方面,作者们的模型达到了0.531的F1分数,超过了GPT-4o的0.481,显示出更高的准确性。
  • 在烹饪步骤文本生成方面,作者们的模型达到了6.261的sacreBLEU分数,与GPT-4o的7.223分数相当。

推荐阅读指数:

7/10

推荐理由:

这篇文章对于那些对使用人工智能进行食物图像理解和食谱生成感兴趣的研究人员和开发者来说是很有价值的。它提供了对现有技术的深入分析,以及在非英语语境下的应用探索。

6. CurricuLLM: Automatic Task Curricula Design for Learning Complex Robot Skills using Large Language Models

K Ryu, Q Liao, Z Li, K Sreenath, N Mehr - arXiv preprint arXiv:2409.18382, 2024
https://arxiv.org/pdf/2409.18382

CurricuLLM: 使用大型语言模型自动设计学习复杂机器人技能的教学大纲

摘要

CurricuLLM 是一种利用大型语言模型(LLMs)为复杂机器人控制任务自动生成教学大纲的方法。该方法通过逐步增加任务难度来促进目标任务的学习。CurricuLLM 包括生成子任务序列的自然语言描述、将子任务描述翻译成可执行的任务代码,以及基于轨迹回滚和子任务描述评估训练策略。在多种机器人模拟环境中评估了 CurricuLLM,并在现实世界中验证了通过 CurricuLLM 学习到的类人机器人运动策略。

研究背景

深度强化学习(DRL)在机器人任务中取得了显著成功,但需要大量有信息量的样本进行学习,对于复杂任务来说效率很低。人类学习策略通常是从简单任务开始,逐渐增加难度。课程学习正是基于这种结构化学习方法,目的是以有意义的顺序训练模型,逐步提高训练数据的复杂性或任务本身的难度。

问题与挑战

为特定任务设计有效的课程通常需要大量的领域知识和人为干预,这限制了其在不同领域的应用性。自动课程学习(ACL)需要确定与目标任务一致的子任务、对每个子任务的难度进行排序,并按难度递增的顺序组织它们。

如何解决

CurricuLLM 利用大型语言模型(LLMs)在多样化语言数据上的广泛训练和封装世界知识的能力,有效地分解任务,并在不同的机器人环境中分解技能。此外,LLMs 在将自然语言翻译成 RL 代理可执行代码方面的成功,加强了它们在生成任务课程中的作用。

创新点

  1. 提出了 CurricuLLM,一个使用 LLMs 的高级规划和编码能力的面向任务的课程设计者。
  2. 在多样化的机器人模拟环境中评估 CurricuLLM,证明了其在复杂控制任务中的有效性。
  3. 在 Berkeley Humanoid 上验证了通过 CurricuLLM 训练的策略,展示了通过 CurricuLLM 学习到的策略可以转移到现实世界。

算法模型

CurricuLLM 包括三个主要模块:

  1. 课程设计:生成子任务的自然语言序列。
  2. 任务代码采样:为给定的子任务描述生成 K 个任务代码候选项,并用于微调以前子任务训练的策略。
  3. 最优策略选择:评估不同任务代码候选项训练出的政策,并选择与当前子任务最符合的策略。

实验效果

  • 在 Gymnasium 环境中的操纵和导航任务中,CurricuLLM 显示出与基线相当的或更高的成功率。
  • 在 Berkeley Humanoid 环境中,CurricuLLM 与复杂的人为设计的奖励函数相比,跟踪误差和失败率相当。
  • 在现实世界中的 Berkeley Humanoid 上的硬件验证表明,通过 CurricuLLM 学习到的控制策略在真实世界中是有效的。

重要数据与结论

  • CurricuLLM 在所有任务中,尤其是在最具挑战性的 AntMaze 环境中,显示出优越的性能。
  • CurricuLLM 生成的奖励代码涵盖了对实现目标任务有益的多种行为。
  • 在现实世界的硬件实验中,CurricuLLM 成功地控制了机器人按照给定的命令移动。

推荐阅读指数

★★★★☆

推荐理由

CurricuLLM 的方法在多个模拟环境和真实世界机器人上都显示出了有效性,对于希望探索如何将 AI 技术应用于机器人学习领域的研究人员和工程师来说,这是一个值得关注的研究方向。

7. Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey

T Huang, S Hu, F Ilhan, SF Tekin, L Liu - arXiv preprint arXiv:2409.18169, 2024
https://arxiv.org/pdf/2409.18169

在这里插入图片描述
大型语言模型的有害微调攻击与防御:一项综述

摘要:

文章讨论了大型语言模型(LLMs)在微调即服务(fine-tuning-as-a-service)模式下可能面临的安全问题。微调过程中,如果用户上传的数据包含有害信息,可能会破坏模型的安全对齐。这种攻击被称为有害微调攻击,引起了广泛研究兴趣。文章旨在澄清攻击设定中的一些常见问题,并正式建立研究问题。介绍了问题的危害模型,系统地调查了攻击、防御和机械分析方面的现有文献,并概述了未来的研究方向。

研究背景:

随着LLMs的广泛应用,其安全性问题逐渐凸显。有害微调攻击能够通过微调过程改变模型的行为,使其产生不符合安全预期的输出。

问题与挑战:

有害微调攻击是一个新的研究领域,目前存在对该攻击的普遍误解。此外,如何设计有效的防御机制以抵御此类攻击,同时保持模型性能的稳定性和鲁棒性,是一个挑战。

如何解决:

文章首先介绍了有害微调攻击的威胁模型,然后系统地梳理了现有的攻击和防御方法,并对实验评估方法进行了概述。最后,提出了未来可能的研究方向。

创新点:

该综述提供了对有害微调攻击的全面概述,包括攻击方法、防御策略和评估方法。此外,文章还提供了一个相关问题的列表,这些问题可能在同行评审过程中被问到。

算法模型:

文章没有提出新的算法模型,而是对现有的攻击和防御方法进行了分类和总结。

实验效果:

文章没有提供具体的实验数据,因为它是一个综述性质的文章,而不是一个实验性的研究。它总结了现有的研究成果,并提出了未来研究的方向。

推荐阅读指数:

7/10

推荐理由:

这篇文章是对LLMs有害微调攻击与防御研究的一个很好的概述,适合那些对LLMs安全性感兴趣的研究人员和开发者。它提供了对现有攻击和防御技术的全面理解,并为未来的研究方向提供了指导。


后记

如果您对我的博客内容感兴趣,欢迎三连击(点赞,关注和评论),我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型,深度学习,计算机视觉相关方向)最新学术论文及工程实践方面的内容分享,助力您更快更准更系统地了解 AI前沿技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/441037.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【大语言模型-论文精读】谷歌-BERT:用于语言理解的预训练深度双向Transformers

【大语言模型-论文精读】谷歌-BERT:用于语言理解的预训练深度双向Transformers 目录 文章目录 【大语言模型-论文精读】谷歌-BERT:用于语言理解的预训练深度双向Transformers目录0. 引言1. 简介2 相关工作2.1 基于特征的无监督方法2.2 无监督微调方法2.3…

基于深度学习的多焦点图像融合系统【数据集+深度学习模型+源码+PyQt5界面】

深度学习多焦点聚焦图像融合 文章目录 研究背景代码下载链接一、效果演示1.1 界面设计1.2 图像融合演示11.3 图像融合演示21.4 图像融合演示3 二、技术原理2.1 引言2.2 融合策略2.3 深度特征的提取2.4 融合策略2.4.1 利用深度特征计算模糊度2.4.2 去噪与平滑2.4.3 图像融合 三、…

【MYSQL】mysql约束---自增长约束(auto_increment)

1、概念 在Mysql中,当主键为自增长后,这个主键的值就不再需要用户输入数据了,而由数据库系统根据定义自动赋值。每增加一条记录,主键会自动以相同的步长进行增长。 注意:自增长约束通常与主键放在一起使用。 通过给…

【CKA】十七、集群故障排查-node节点kubelet服务异常

17、集群故障排查-node节点kubelet服务异常 1. 考题内容: 2. 答题思路: 1、考试环境就是:kubelet这个服务没有设置开机自启,导致node节点状态异常。 2、只需要切换环境,登录到指定主机,获取root权限后&am…

LeetCode 54 Spiral Matrix 解题思路和python代码

题目: Given an m x n matrix, return all elements of the matrix in spiral order. Example 1: Input: matrix [[1,2,3],[4,5,6],[7,8,9]] Output: [1,2,3,6,9,8,7,4,5] Example 2: Input: matrix [[1,2,3,4],[5,6,7,8],[9,10,11,12]] Output: [1,2,3,4,8,1…

73.【C语言】C/C++的内存区域划分

目录 1.内存里的几个区域 2.示意图 3.解释 1.内存里的几个区域 除了耳熟能详的栈区,堆区,静态区,还有内核空间,内存映射段,数据段,代码段 2.示意图 3.解释 栈区(stack area):局部变量,函数参数,返回数据,返回地址 内存映射段:将文件映射到内存 映射的含义: 如果看过李忠…

【python实操】python小程序之对象的属性操作

引言 python小程序之对象的属性操作 文章目录 引言一、对象的属性操作1.1 题目1.2 代码1.3 代码解释 二、思考2.1 添加属性2.2 获取属性 一、对象的属性操作 1.1 题目 给对象添加属性 1.2 代码 class Cat:# 在缩进中书写⽅法def eat(self):# self 会⾃动出现,暂不管print(f…

OpenAI 推出全新 “Canvas” 工具的系统提示词泄露

OpenAI 推出了一款叫做 Canvas 的新工具,用来帮助用户更好地与 ChatGPT 协作写作和编程。 Canvas 允许用户和 ChatGPT 在一个独立的窗口中协作,实时修改内容。这个工具可以帮助改进文本、调整语言、审查和修复代码,甚至转换成不同编程语言。…

大模型之RAG-关键字检索的认识与实战(混合检索进阶储备)

前言 按照我们之前的分享(大模型应用RAG系列3-1从0搭建一个RAG:做好文档切分): RAG系统搭建的基本流程 准备对应的垂域资料文档的读取解析,进行文档切分将分割好的文本灌入检索引擎(向量数据库&#xff…

【单例模式】

单例模式是指在内存中只会创建且仅创建一次对象的设计模式。 一、实现方式 1. 饿汉式 在类加载的时候就创建实例,无论是否使用,实例都会被创建。优点是实现简单,线程安全。缺点是可能造成资源浪费,而程序可能不一定会使用这个实例…

【Linux】自主shell编写

如果学习了常见的Linux命令,exec*函数,环境变量,那你就可以尝试一下写一个简单的shell; 下面跟着我的步骤来吧!!🤩🤩 输入命令行 既然要写一个shell,我们第一步先把这个输入命令行…

Java中数组的应用

Java中数组的应用 数组数组的使用使用方式1-动态初始化数组的定义:数组的引用(使用/访问/获取数组元素):快速入门案例 使用方式2-动态初始化**先声明**数组**再创建**数组使用方式1和2的比较 使用方式3-静态初始化初始化数组快速入…

【AI知识点】残差网络(ResNet,Residual Networks)

残差网络(ResNet,Residual Networks) 是由微软研究院的何凯明等人在 2015 年提出的一种深度神经网络架构,在深度学习领域取得了巨大的成功。它通过引入残差连接(Residual Connection) 解决了深层神经网络中…

数学公式编辑器免费版下载,mathtype和latex哪个好用

选择适合自己的公式编辑器需要考虑多个因素。首先,您需要确定编辑器支持的功能和格式是否符合您的需求,例如是否可以插入图片、导出各种文件格式等。其次,您可以考虑编辑器的易用性和界面设计是否符合您的个人喜好。另外,您还可以…

蓝桥杯【物联网】零基础到国奖之路:十八. 扩展模块之光敏和AS312

蓝桥杯【物联网】零基础到国奖之路:十八.扩展模块之光敏和AS312 第一节 硬件解读第二节 CubeMX配置第二节 代码 第一节 硬件解读 光敏和AS312如下图: 光敏电阻接到了扩展模块的5号引脚,5号引脚接了2个电阻,R8和光敏电阻。我们通过ADC读取这…

Excel实现省-市-区/县级联

数据准备 准备省份-城市映射数据,如下: 新建sheet页,命名为:省-市数据源,然后准备数据,如下所示: 准备城市-区|县映射数据,如下: 新建sheet页,命名为&#x…

C语言的柔性数组

目录 柔性数组1.柔性数组的特点:2.柔性数组的使用3.柔性数组的优势 柔性数组 也许你从来没有听说过柔性数组(flexible array)这个概念,但是它确实是存在的。 C99 中,结构体中的最后⼀个元素允许是未知⼤⼩的数组&…

分治算法(2)_快速排序_排序数组

个人主页:C忠实粉丝 欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 C忠实粉丝 原创 分治算法(2)_快速排序_排序数组 收录于专栏【经典算法练习】 本专栏旨在分享学习算法的一点学习笔记,欢迎大家在评论区交流讨论💌 目录 …

消息称苹果iPhone系列将完全放弃LCD屏幕

近日,据日经亚洲消息,苹果公司将于明年初推出搭载OLED显示屏的 iPhone SE 4,标志其整个iPhone系列已进入从 LCD 过渡到 OLED 技术的最后阶段,2025年及之后销售的所有iPhone机型均将搭载OLED屏幕。 由此,两家日本面板供…

【STM32开发环境搭建】-4-在STM32CubeMX中新增Keil(MDK-ARM) 5的工程目录(包含指定路径的C和H文件)

案例背景: 由于Keil(MDK-ARM)5工程:DEMO_STM32F030C8T6.uvprojx是由STM32CubeMX工具生成的,如果我们在Keil工程中手动添加了一些c文件和h文件的Include Path包含路径,会在STM32CubeMX下一次生成uvprojx文件时,被删除&…