无监督的预训练和有监督任务的微调

news/2025/7/9 5:21:24/

无监督的预训练和有监督任务的微调”,结合自回归模型(GPT 基于自回归架构 )

一、无监督预训练例子

无监督预训练是让模型在大量无标注文本上学习语言规律,像从海量网页文本、书籍语料里 “自学” 。

1. 文本续写学习

比如互联网上有无数公开的故事片段,像 “在一个宁静的小镇,午后的阳光透过斑驳的树叶,洒在________” ,模型在预训练时,会基于前面 “在一个宁静的小镇,午后的阳光透过斑驳的树叶,洒在” 这些内容,学习预测后面该接什么合理文字,可能是 “古老的青石板路上” 这类表述,通过海量类似文本,掌握如何依据前文逻辑、语义延续内容,这就是利用自回归方式(从左到右利用上文预测下文 )在无监督场景学习。

2. 语法与语义知识习得

假设有大量新闻文本,如 “人工智能技术近年来发展迅猛,它在________、________等领域展现出巨大潜力” ,模型接触多了,会知道后面可能填 “医疗诊断”“自动驾驶” 这类常和人工智能搭配、符合语义与逻辑的领域词汇,逐步掌握语言的语法规则、语义关联,构建起对语言模式的理解,这些知识都是在无标注(无监督 )的预训练阶段积累的。

二、有监督任务微调例子

有监督微调是用标注好的数据集,让模型在特定任务上更精准,常见的有文本分类、问答等任务 。

1. 情感分类任务微调
  • 场景:要让 GPT 能判断电影评论是 “积极” 还是 “消极” 。
  • 数据准备:收集一批标注好的评论,比如 “这部电影剧情紧凑,演员演技精湛,太好看了!—— 积极”“电影特效廉价,故事逻辑混乱,很差劲 —— 消极” 。
  • 微调过程:把这些带标签的样本输入模型,模型用预训练学到的语言基础,聚焦学习 “什么样的文本表述对应积极 / 消极情感” ,调整自身参数。微调后,再遇到新评论 “影片配乐动人,情节跌宕,值得推荐” ,就能更准确分类为 “积极” ,这就是在有监督(有情感标签 )下,基于预训练能力做特定任务优化。
2. 问答任务微调
  • 场景:让模型能回答历史知识类问题,像 “秦始皇统一六国的时间是?” 。
  • 数据准备:整理大量问答对,如 “问题:秦始皇统一六国的时间是?答案:公元前 221 年”“问题:赤壁之战的交战双方是?答案:孙刘联军与曹军” 。
  • 微调过程:模型利用预训练时学会的语言理解、知识存储能力,在这些标注数据上 “打磨” ,学习如何从问题里提取关键信息,关联到正确答案。微调后,面对用户提问 “谁领导了美国独立战争?” ,就能更精准输出 “华盛顿” 这类答案,实现特定问答任务的能力提升。

简单说,无监督预训练是让模型 “广泛读书学语言” ,有监督微调是 “带着明确任务做专项练习” ,二者结合让 GPT 既懂通用语言规律,又能在具体任务上表现出色,而自回归的预测方式(基于前文生成下文 )贯穿预训练等过程,是 GPT 工作的基础逻辑之一 。


http://www.ppmy.cn/news/1758999.html

相关文章

各种运算符的学习心得

一、关系运算符: 从图片中我们不难看出,关系运算符的计算结果就是真或假(true or false),所以我们经常在if等其他语句中使用到关系运算符。 二、逻辑运算符: 这里需要注意的就是“ ^ ”这个符号的意义&a…

RK全志平台WiFiBT调试思路

调试前 WiFi常见的通信接口:PCIE、SDIO、USB。 BT 常见的通信接口: UART、SDIO、USB。 模组厂商提供: (1)固件(用来控制模组硬件行为); (2)模组驱动源码…

芯片测试之 trim修调详解

文章目录 1. trim的概念和目的2. trim方式2.1 OTP(One-Time Programmable)一次性修调2.2 EEPROM(Electrically Erasable PROM)修调 3. trim算法3.1 电压trim code table3.2 电压测量函数3.3 公式法验证3.4 线性法验证3.5 二分法验…

Verilog自适应位宽与指定位宽不同导致模块无法正常执行

Verilog自适应位宽与固定位宽的不兼容问题 问题起源 我在写verilog代码的时候,有两个模块shifter和round,参数化的shifter模块已经通过了测试,round模块是shifter的上层模块,对round模块进行16位测试的时候,顺利通过…

Linux命令练习篇

1. grep 命令练习 1.在 /var/1og/messages 中查找所有包含 error 的行(忽路大小写) grep -i "error" //var/log/messages 2.统计 /var/1og/secure 中 Failed password 出现的次数。 grep -c "Failed password" /var/log/seccure 3.列出 /ete 目录下所有…

Java大模型开发入门 (11/15):让AI自主行动 - 初探LangChain4j中的智能体(Agents)

前言 在过去的十篇文章里,我们已经打造出了一个相当强大的AI应用。它有记忆,能进行多轮对话;它有知识,能通过RAG回答关于我们私有文档的问题。它就像一个博学的“学者”,你可以向它请教任何在其知识范围内的问题。 但…

FreeRTOS的低功耗Tickless模式

一、摘要 在电池供电的物联网(IoT)、可穿戴设备等嵌入式应用中,功耗优化至关重要。FreeRTOS 作为流行的实时操作系统,其传统的周期性系统心跳(tick)中断虽然简化了任务调度,却成为深度休眠的障碍——它频繁唤醒CPU,导致功耗居高不…

IO之详解cin(c++IO关键理解)

目录 cin原理介绍 控制符(hex、oct、dec) cin如何检查输入 cin与字符串 cin.get(char ch) cin.get(void) istream &get(char*,int) istream &get(char*,int,char) istream &getline(char*,int); 遇到文件结尾EOF 无法完成一次完整输入:设置f…