chatgpt如何引入领域知识？mit团队利用gpt4做数据增强来提升小模型在特定领域的效果

title：Dr. LLaMA: Improving Small Language Models in Domain-Specific QA via Generative Data Augmentation

论文地址：Paper page - Dr. LLaMA: Improving Small Language Models in Domain-Specific QA via Generative Data Augmentation

代码：GitHub - zguo0525/Dr.LLaMA

1.1 Motivation

1.2 Methods

1.3 Conclusion

大模型可以有效的refine和生成各式各样的QA对数据，利用这些领域内的数据进行fine-tuning后，小的多的模型在该领域上可以带来一个不错的提升。
Prefix Tuning and Low-rank Adaptation对于SLMs是一个有效的训练方法，并且low-rank adaptation对超参数选择上比较鲁棒。
大模型LLMs在领域知识上做fine-tuning能极大的提升特定领域任务的表现。
结合知识蒸馏，对比学习等技术，加上本文提到的利用LLM做数据增强的方法，训练SLMs小预训练模型来解决特定领域的应用上可能更有效。

1 小模型经过微调后于大模型Chatgpt3.5-turbo以及GPT-4对比

2 本文用到的微调技术

3 不同模型效果对比

4 哪种数据增强的效果比较好？

rewriteQA：重新改写已有的QA对，使其多样化
newQA：生成新的QA对
结论1:GPT-3.5-turbo：有能力去使已有的QA对refine和多样化，给模型带来一定提升，但是缺乏领域知识，生成的新的QA来做数据增强对并不能带来效果提升。
结论2:GPT-4有pubmedQA的领域知识，生成的新的QA对质量更高，所带来的提升也越大。
结论3:BioGPT-Large：在医疗领域进行了预训练，效果还是比没有经过预训练的LLaMA-7b要好，还是说明了领域预训练的重要性。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/51375.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！