AIGC: 关于ChatGPT这个智能工具带来的几点思考

news/2023/12/9 15:22:51

ChatGPT的出现

  • 2022年11月底,ChatGPT 上线,引爆 AI 圈 和 科技圈,2023年春节后, 人人都开始关注并讨论这项新技术
  • 它是 OpenAI 研发的智能聊天工具, 基于GPT语言模型,模拟人类的对话方式
  • 默认只能用文字进行交互,理解多种语言,有一些插件,可用语音,图表等
  • 截止现在,ChatGPT热度依旧火热,也已被大众所知晓并普遍使用

什么是ChatGPT

  • 是一个预训练的对话式的文本生成AI工具
    • 第一个呢是预训练。
    • 第二个是对话式的文本生成
  • Chat 包括输入端即发出有效提问(Prompt) 和 输出端的智能参考答案
  • GPT
    • G: Generative, 是一个生成式的模型,可以生成符合语法和语义规则的自然语言的文本, 重点是生成式的模型
    • P: Pre-trained,基于大规模的文本数据的预训练, 可以使自己更加的聪明。
    • T: Transformer, 使用 Transformer 的架构来有序的处理文本
  • GPT不是通过搜索而拼凑答案,而是更像一个大脑
  • 当我们提交完问题之后,GPT会基于它预训练好的能力计算出结果
  • GPT 是一种语言逻辑推理的大模型也叫 LLM (Large Language Model 大型语言模型)
  • 这个模型是一种神经网络,能够读取,并且理解大量的自然语言的文本,能够像人类一样去驾驭这些语言。
  • 比如我们可以通过中文去和GPT去进行交流。

GPT 和 AIGC 的关系

  • GPT是具有代表性的大型的语言生成模型之一, 是比较优秀的LLM的实现,也是其技术实现的代表之一
  • LLM 就是基于大量的训练数据训练的,能够生成高质量的人工语言的神经网络的模型
  • AIGC 是由人工算法自动生成文本图片等多种类型的数字内容
  • 所以,GPT, LLM, AIGC是紧密相关的
  • GPT 是 AIGC 重要的组成之一,AIGC采用大模型的技术来生成高质量的文章和其他的内容
  • 通过分析海量的数据,大模型可以自主的去生成文本,实现对AIGC技术的支持
  • 三者相互促进,并推动着彼此的发展

ChatGPT的能力

  • 通过先给它提供一个庞大的语料库,让模型通过上千亿个参数,对这些文本去进行标记和学习
  • 最终构建出一个复杂的预测模型,然后根据这个预测模型去生成我们的数据
  • 这种预测的模式跟我们的大脑学习和加工的模式是非常相似的

1 ) 拟人化的能力

  • 因为运作模式类似人脑,这也使得GPT能够更加的拟人化, 正是由于它的这种拟人化
  • 能够让它可以像真人一样,和我们正常的聊天,回答各种各样的问题,甚至可以理解人的感情

2 )了解全领域的知识

  • 我们发现GPT好像所有的知识它都会, 真正的做到了,上知天文下知地理
  • 我们可以向它来提问各个领域的知识,比如让他帮我们写代码和我们写文档等等。
  • 随着它的模型的迭代,参数的变化,GPT对于整个世界的认知,也将会发生质变
  • 和之前传统的预测模型不一样,它不再是单纯的去记录预训练的这些信息。
  • 同时还会基于预训练的信息去提炼成知识,可以说他有了超越认知的创造力。

3 )会表达,具有中立,客观,安全的语言表达能力

  • 同时GPT有中立客观安全的语言表达能力, 当我们询问问题的时候, GPT的回答往往是比较准确和客观的,而且非常具备条理性。
  • 随着GPT的发展,对于一些涉及到不良影响的问题,GPT是拒绝回答的,也就是具备中立和客观的表达的能力。

4 )具备复杂的推理能力,可根据上下文语义自行推理

  • GPT具备复杂的推理能力, GPT3之后的模型泛化出了思维链的能力
  • 这个能力是模型涌现出新能力的关键机制,可以根据上下文的语义去进行自行推理

5 )接受身份设定,可以告诉它是谁,特长是什么

  • GPT接受身份设定的能力,可以不停的告诉GPT它是谁?它的特长是什么?
  • 然后GPT就可以根据我们的设定和提示来帮助我们解决问题
  • GBT它的这些能力都是以海量的知识和数据作为基础的。
  • 简单点来说,就是将所有的语料送进大语言模型当中,然后让他去预测下一个词汇是什么
  • 与传统的语言模型不同的点在于GPT接收到的语料数据是极其庞大的

GPT训练数据的演变


OpenAI学习资料参数量
GPT15GB1.17亿
GPT240GB15亿
ChatGPT45TB+1750亿+
  • 从始至终语言模型,它的训练机制都没有变化, 变的只是模型的量级,俗话说量变引起质变
  • 相较于传统的语言模型呢,GPT就是一个量变引起质变的一个结果

生成大预言模型的过程

  • 第一步是预训练为语言模型灌输知识
  • 第二步是通过模板规范,也就是将人工标注好的这些范例输入到语言模型当中
  • 第三步是创意引导,对GPT生成的结果去进行打标签
  • 基于超大规模的数据,经过这三个步骤造就了今天最强的语言模型ChatGPT

类GPT类的产品对当今工作的替代性


1 )容易被GPT取代的工作场景

  • 客服代表,电话销售
  • 语言翻译员,文字工作者
  • 基础数据分析师
  • 普通程序员
  • 普通助理等水平一般的工作人员

2 ) 不容易被GPT替代的工作场景

  • 需要判断和决策工作,通过复杂的分析和判断来做出决策的工作
  • 需要创造力和想象力的工作,如艺术家,作家
  • 人际交往和情感互动的工作,如心理治疗师, 临床医生,教育工作者

对GPT这类AI产品的认识

  • 类似汽车出现代替了马车, AI 不是新事物,很早就有语音识别,人脸识别,智能机器人等产品
  • GPT 多年前开始研发的,只是这两年厚积薄发,横空出世
  • 任何行业都会关注效率和成本, 能用AI做的,就不会雇佣人工
  • 它们只是工具,现在的AI都是人工智能辅助
  • AI工具早就应用于生产生活,都是小众或专业领域
  • GPT 广泛应用于日常办公领域,尤其是互联网行业
  • GPT 更接近人类沟通方式,更能直接体现 图灵测试
  • 它们没有思想和意识,没有办法自主完成从0到1的工作
  • 我们要从面向google编程进阶到面向AI编程

GPT对程序员的影响

  • 未来已来, 不懂得使用类GPT工具的程序员, 工程师将会很难生存发展
  • 初级/普通水平的程序员可能会面临替代, 也可能因GPT而快速进阶为高级工程师
  • 使用GPT, 咨询问题 (代替搜索引擎)
  • 使用GPT, 写技术解决方案
  • 使用GPT, 开发智能工具
  • 使用GPT, 提升开发效率 (快速生成代码,快速解决bug)
  • 使用GPT, 将 ChatGPT的能力融合到工作场景中
  • 使用GPT, 提升自身溢价空间,向着工具无法替代的方向努力

GPT目前的应用场景

  • 基于ChatGpt 搜索,生成文档,编写代码,总结知识
  • 结合其他组件,生成动画,视频,PPT
  • 将ChatGpt的能力融合到工作当中
    • 如数据开发IDE的智能化
    • Cursor编辑器 (当前集成了GPT4)
    • 目前IDE(eg: vscode)的智能插件Github Copilot

GPT 国内发展

  • 各大厂商推出国内大模型,如: 百度的文心一言, 阿里的通义千问 , 腾讯的混元,华为的盘古
  • 各类AI场景逐步集成落地,如钉钉集成的通义前文,WPS集成AI

GPT的未来

  • 当前几年是GPT发展初期,也是各行各业使用开发GPT能力的红利期
  • GPT可能会在不久的将来,在各个行业形成一个完善的产业链来协助提升社会生产力

http://www.ppmy.cn/news/1230930.html

相关文章

打印工具HandyPrint Pro Mac中文版软件特点

HandyPrint Pro Mac是一款打印工具,它支持AIrPrint协议,可以让用户在iPhone、iPad、iPod等设备上进行打印操作,只需要将这些设备连接到Mac电脑的WiFi网络中即可实现打印功能。 ​ HandyPrint Pro Mac软件特点 简单易用:用户只需…

【机器学习】对比学习(contrastive learning)

对比学习是一种机器学习技术,算法学习区分相似和不相似的数据点。对比学习的目标是学习数据的表示,以捕捉不同数据点之间的基本结构和关系。 在对比学习中,算法被训练最大化相似数据点之间的相似度,并最小化不相似数据点之间的相似…

Java-抽象类、抽象方法

【1】抽象类和抽象方法的关系: 抽象类中可以定义0-n个抽象方法。 【2】抽象类作用: 在抽象类中定义抽象方法,目的是为了为子类提供一个通用的模板,子类可以在模板的基础上进行开发,先重写父类的抽象方法&#xff0c…

Spring+Mybatis解析

源码执行流程 通过MapperScan导入MapperScannerRegistrar类MapperScannerRegistrar类实现了ImportBeanDefinitionRegistrar接口,Spring启动会调MapperScannerRegistrar类中的registerBeanDefinitions方法在registerBeanDefinitions方法中注册一个MapperScannerConf…

使用大语言模型 LLM 做文本分析

本文主要分享 传统聚类算法 LLM与嵌入算法 嵌入算法聚类 LLM的其他用法 聚类是一种无监督机器学习技术,旨在根据相似的数据点的特征将其分组在一起。使用聚类成簇,有助于解决各种问题,例如客户细分、异常检测和文本分类等。尽管传统的聚…

(二)汇编语句组成

一个完整的 RISC-V 汇编程序有多条 语句(statement) 组成。 一条典型的 RISC-V 汇编 语句 由 3 部分组成: 1.标签 List item label(标签): 标签是标识程序位置的记号。通常定义一个名称然后加上":"后缀。…

【机器学习】交叉验证 Cross-validation

交叉验证(CrossValidation)方法思想简介 以下简称交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set),首先用训练集对分类器进…

# 学习 Prolog 和 离散逻辑的16个等价公式:一趟有趣的逻辑之旅

Prolog 的语法很奇怪,需要一些时间来适应,所以我花了点时间,想用Prolot来表示和验证离散逻辑的16组等价公式。 1. 双重否定律 (Double Negation Law) A ⇔A 首先,我们来看看双重否定律。在 Prolog 中,我们可以这样验证它: fun1(A,Z):-membe…

接口自动化项目落地之HTTPBin网站

原文:https://www.cnblogs.com/df888/p/16011061.html 接口自动化项目落地系列 找个开源网站或开源项目,用tep实现整套pytest接口自动化项目落地,归档到电子书,作为tep完整教程的项目篇一部分。自从tep完整教程发布以后&#…

使用 Core Tools 在本地开发 Azure Functions

学习模块 使用 Core Tools 在本地创建和运行 Azure Functions - Training | Microsoft Learn 文档 使用 Core Tools 在本地开发 Azure Functions | Microsoft Learn GitHub - Azure/azure-functions-core-tools: Command line tools for Azure Functions 其它 安装适用于 A…

公网环境固定域名异地远程访问内网BUG管理系统

文章目录 前言1. 本地安装配置BUG管理系统2. 内网穿透2.1 安装cpolar内网穿透2.2 创建隧道映射本地服务3. 测试公网远程访问4. 配置固定二级子域名4.1 保留一个二级子域名5.1 配置二级子域名6. 使用固定二级子域名远程 前言 BUG管理软件,作为软件测试工程师的必备工具之一。在…

深入分析TaskView源码之触摸相关

问题背景 hi,粉丝朋友们: 大家好!android 10以后TaskView作为替代ActivityView的容器,在课程的分屏pip自由窗口专题也进行了相关的详细介绍分析。 这里再补充一下相关的TaskView和桌面内嵌情况下的触摸分析 主要问题点&#xff…

NGINX缓存详解之服务端缓存

服务端缓存 proxy cache属于服务端缓存,主要实现 nginx 服务器对客户端数据请求的快速响应。 nginx 服务器在接收到被代理服务器的响应数据之后,一方面将数据传递给客户端,另一方面根据proxy cache的配置将这些数据缓存到本地硬盘上。 当客户端再次访问相同的数据时,nginx…

合并区间(排序、贪心)

LCR 074. 合并区间 - 力扣(LeetCode) 题目描述 以数组 intervals 表示若干个区间的集合,其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间,并返回一个不重叠的区间数组,该数组需恰好覆盖输入中…

Pytorch完整的模型训练套路

Pytorch完整的模型训练套路 文章目录 Pytorch完整的模型训练套路以CIFAR10为例实践 数据集加载步骤 使用适当的库加载数据集,例如torchvision、TensorFlow的tf.data等。 将数据集分为训练集和测试集,并进行必要的预处理,如归一化、数据增强等…

【头歌-Python】Python第二章作业(初级)

文章目录 第1关:三角形周长及面积任务描述输入格式输出格式示例参考代码 第2关:三角函数计算任务描述输入格式输出格式示例参考代码 第3关:表达式求值任务描述输入格式输出格式示例参考代码 第4关:计算矩形面积任务描述输入格式输…

计算机基础知识54

ORM的介绍 # ORM是什么? 我们在使用Django框架开发web应用的过程中,不可避免地会涉及到数据的管理操作(增、删、改、查),而一旦谈到数据的管理操作,就需要用到数据库管理软件,例如mysql、oracle…

数据集笔记:NGSIM (next generation simulation)

1 数据集介绍 数据介绍s Next Generation Simulation (NGSIM) Open Data (transportation.gov) 数据地址:Next Generation Simulation (NGSIM) Vehicle Trajectories and Supporting Data | Department of Transportation - Data Portal 时间2005年到2006年间地…

桌面运维。

Windows运行命令: color 01/02切换字符颜色cls 清屏ipconfig 设备的ip信息ipconfig /all 设备ip的所有信息 破解系统密码: 进PE系统,使用里面的工具破解 vmware workstation安装 网卡 网卡:ncpa.cpl window远程控制 mstsc …
最新文章