[ 网络 ] 应用层协议 —— HTTP协议

news/2024/4/24 5:03:16/

目录

1.HTTP协议

1.1URL

urlencode和urldecode

2. HTTP协议格式

HTTP请求

HTTP响应

3.告知服务器意图的HTTP方法

GET:获取资源

POST:传输实体主体

GET和POST的区别

使用Cookie的状态管理

4.返回结果的HTTP状态码

状态码告知从服务器端返回的请求结果

2XX成功

3XX重定向

4XX客户端错误

5XX服务器错误

 5.HTTP的缺点


1.HTTP协议

应用层协议已经有大佬定义了一些现成的,有非常好用的应用层协议,我们可以直接参考使用。例如本篇所提到的HTTP(超文本传输协议)就是其中之一。

1.1URL

URL(统一资源定位符)就是我们俗称的"网址"

我们所常见到的网址:例如 https://www.baidu.com/ 是域名,这种字符串风格的域名,具有更好的字描述性。域名在解析时必须被转换成为IP地址,要访问网络服务,又必须具有port.

协议方案名和服务器端口号是强绑定的:

比如httpserver --- 80 ; httpsServer  --- 443 ; sshd --- 22

HTTP协议的本质是要获得某种"资源",比如我们请求百度的官网时,我们所获取的资源是百度首页的网页信息。我们可以理解为HTTP是 获取网页资源的(视频,音乐等)。HTTP是向特定的服务器向特定端口申请特定的"资源"的,获取到本地进行展示或者某种展示的。而对应服务器上,你所要的资源所在的位置就是URL中带层次的文件路径。

实际上,上网的大部分行为,都在进行这进程间通信。既然是通信,就是获取信息和发送信息。所以我们对应到生活中,大部分的上网行为,无非两种:

  1. 把服务器上面的资源数据拿到本地(短视频,小说等等)
  2. 把本都的数据推送到服务器(搜索,注册,登录,下单等)

urlencode和urldecode

在URL中,像 / ? 等这样的字符已经被URL当做特殊意义理解了。因此这些字符不能随意出现。

 比如:某个参数中需要带有这些特殊字符,就必须先对特殊字符进行转义。

转义规则:将需要转码的字符转为16进制,然后从右到做,取4位(不足4位直接处理),每2位做一位,前面加上%,编码成%XY格式。

我们可以看到 "C++" 中 "+"被转义成了 "%2B" 我们可以使用urlencode工具验证上述过程

UrlEncode编码/UrlDecode解码  |  urldecode就是urlencode的逆过程。

2. HTTP协议格式

HTTP请求

  •  首行:【方法】+【URL】+【版本】
  • Header:请求的属性,冒号分割的键值对;每组属性之间使用\n分割;遇到空行表示Header部分结束
  • Body:空行后面的内容都是Body.Body允许为空字符串.如果Body存在,则在Header中会有一个Content-Length字段用来表示Body的长度

常规情况下,HTTP(HTTPS)底层使用的传输层协议是TCP.

我们通过一段tcp套接字编程来查看HTTP请求格式

#include <iostream>
#include <cstring>
#include <cstdlib>
#include <unistd.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/wait.h>using namespace std;
int main()
{int listen_sock = socket(AF_INET,SOCK_STREAM,0);if(listen_sock < 0){std::cout<<"socket error" <<std::endl;return 1;}struct sockaddr_in local;memset(&local,0,sizeof(local));local.sin_family = AF_INET;local.sin_port = htons(8082);local.sin_addr.s_addr = INADDR_ANY;if(bind(listen_sock,(struct sockaddr*)&local, sizeof(local))<0){std::cout<<"bind error" << std::endl;return 2;}if(listen(listen_sock,5) < 0){std::cout<<"listen error" << std::endl;return 3;}struct sockaddr_in peer;for(;;){socklen_t len = sizeof(peer);int sock = accept(listen_sock,(struct sockaddr*)&peer,&len);if(sock < 0){std::cout<<"accept error "<<std::endl;continue;}if(fork() == 0){if(fork() > 0) exit(0);close(listen_sock);char buffer[1024];recv(sock,buffer,sizeof(buffer),0);std::cout<<"###################HTTP request begin####################"<<std::endl;std::cout<< buffer << std::endl;std::cout<<"###################HTTP request end####################"<<std::endl;exit(0);}close(sock);waitpid(-1,nullptr,0);}
}

我们在直接打印出请求的格式

第一部分 首行:请求方法 请求url HTTP协议的版本

常用的请求方法:GET和POST (后面详解)

刚刚我们请求的是 /  . " / " 是Web根目录不是系统根目录。那我们也可以请求 /a/b/c/d.html 我们再次看看请求报文:

 

第二部分是一组Key:value的请求报头

请求报头是一堆Key: Value 请求属性,包括是否需要长链接,浏览器的编码类型,数据类型,我们想发送给服务器的相关信息等等.....通常存在多行,是一堆的Key: Value值

服务器端可以按行循环读取,一直读到\n (空行)就证明已经把报头读完了

第三部分:空行 

是报头和有效载荷的分离符,为了就是将报头和有效载荷进行分离

 前三部分都必须是按行方式陈列的

第四部分:请求正文(有效载荷)  ——非必须 | 可以没有

根据我们的需求,有时候我们需要登录账号和密码,个人信息,音乐,视频等等一般都是用户的相关信息或者数据。

以上就是HTTP协议的请求(HTTP request)。

HTTP响应

  • 首行: 【版本号】 + 【状态码】 + 【状态码解释】
  • Header: 请求的属性, 冒号分割的键值对;每组属性之间使用\n分隔;遇到空行表示Header部分结束
  • Body: 空行后面的内容都是Body. Body允许为空字符串. 如果Body存在, 则在Header中会有一个Content-Length属性来标识Body的长度; 如果服务器返回了一个html页面, 那么html页面内容就是在body中.

HTTP响应也是由4部分组成,其中响应正文也是可以被省略的。客户端如何判断已经将response报头读取完毕呢,仍然是客户端可以循环按行读取,知道读取到空行。

#include <iostream>
#include <string>
#include <cstring>
#include <cstdlib>
#include <unistd.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/wait.h>
#include <fstream>using namespace std;
int main()
{int listen_sock = socket(AF_INET,SOCK_STREAM,0);if(listen_sock < 0){std::cout<<"socket error" <<std::endl;return 1;}struct sockaddr_in local;memset(&local,0,sizeof(local));local.sin_family = AF_INET;local.sin_port = htons(8083);local.sin_addr.s_addr = INADDR_ANY;if(bind(listen_sock,(struct sockaddr*)&local, sizeof(local))<0){std::cout<<"bind error" << std::endl;return 2;}if(listen(listen_sock,5) < 0){std::cout<<"listen error" << std::endl;return 3;}struct sockaddr_in peer;for(;;){socklen_t len = sizeof(peer);int sock = accept(listen_sock,(struct sockaddr*)&peer,&len);if(sock < 0){std::cout<<"accept error "<<std::endl;continue;}if(fork() == 0){if(fork() > 0) exit(0);close(listen_sock);char buffer[1024];recv(sock,buffer,sizeof(buffer),0);// std::cout<<"###################HTTP request begin####################"<<std::endl;// std::cout<< buffer << std::endl;// std::cout<<"###################HTTP request end####################"<<std::endl;#define PAGE "./wwwroot/index.html"std::ifstream in(PAGE);if(in.is_open()){in.seekg(0,std::ios::end);size_t len = in.tellg();in.seekg(0,std::ios::beg);char *file = new char[len];in.read(file,len);in.close();std::string status_line = "http/1.0 200 OK\n";std::string response_header = "Content-Length: "+std::to_string(len);response_header+="\n";std::string blank = "\n";send(sock,status_line.c_str(),status_line.size(),0);send(sock,response_header.c_str(),response_header.size(),0);send(sock,blank.c_str(),blank.size(),0);send(sock,file,len,0);delete[] file;}close(sock);exit(0);}close(sock);waitpid(-1,nullptr,0);}
}

  

3.告知服务器意图的HTTP方法

在众多的HTTP方法中最常用的是GET和POST方法,因此在此我们对GET和POST进行详细了解

GET:获取资源

GET方法是用来请求访问已被URL识别的资源。指定的资源经服务器端解析后返回响应内容。

我们也可以使用Postman工具抓取HTTP请求

POST:传输实体主体

POST方法是用来传输实体的主体

虽然用GET方法也可以传输实体的主体,但是一般不用GET方法进行传输,而是用POST方法。虽然POST的功能和GET很相似,但是POST的主要目的并不是获取响应的主体内容。

GET和POST的区别

  • GET方法可以带参,参数在URL " ?"的后面
  • POST方法通过正文传参
  • GET方法传参不私密
  • POST方法因为通过正文传参,所以相对私密一些

GET通过url传参,POST通过正文传参,所以一般一些大的内容都是通过POST传参。

使用Cookie的状态管理

HTTP是无状态协议,它不对之前发生过的请求和响应的状态进行管理。也就是说,无法根据之前的状态进行本次的请求管理。那么我们在日常上网的过程中,假设要求登录认证的Web页面本身无法进行状态的管理(不记录已登录的状态),那么每次跳转新页面的时候都要再次登录,或者每次请求报文中附加参数来管理登录状态。那么这对我们用户是非常不友好的,就相当于我们每次登录C站我们都要进行登录认证。因此Cookie技术就是通过在请求和响应报文中写入Cookie信息来控制客户端的状态。

Cookie会根据从服务器端发送的响应报文内的一个叫Set-Cookie的首部字段信息,通知客户端保存Cookie。当下次客户端再往服务器发送请求时,客户端会自动在请求报文中加入Cookie值后发送出去。服务器端发现过来的Cookie后,会检查究竟是从哪一个客户端的连接请求,然后对比服务器上的记录,最后得到之前的状态信息。

举例:我们用B站来进行举例。

我只要登录过B站之后,再之后再次登录B站时会自动登录我的账号, 点击网址左边的锁,就会看到Cookie,点进去就会看到当前页面下的Cookie信息,我们全部进行删除后点击完成,再次刷新该页面,就发现无法找到之前的登录信息了。登录后再次查询发现Cookie信息被重新填写上了。

 

 

4.返回结果的HTTP状态码

HTTP状态码负责表示客户端HTTP请求的返回结果,标记服务器端的处理是否正常,通知出现的错误等工作。

状态码告知从服务器端返回的请求结果

状态码的职责是当客户端向服务器端发送请求时,描述返回的请求结果。借助状态码,用户可以知道服务器端是正常处理了请求还是出现了错误。

状态码的类别

2XX成功

2XX的响应结果表明请求被正常处理了。

例如:

  1. 200 OK表示从客户端发来的请求在服务器端被正常处理了。
  2. 204 No Content 表示服务器接受的请求已成功处理,但在返回的响应报文中不含有实体的主体部分,也就是说请求处理成功但是没有资源可以返回。因此返回204响应后浏览器的显示页面不会发生更新。

3XX重定向

  1. 301 Moved Permanently 永久重定向。该状态码表示请求的资源已被分配了新的URL,以后应使用现在所指的URL。
  2. 302 Found 临时重定向。该状态码表示请求的资源已被分配了新的URL,希望用户本次能使用新的URL访问。
    1. 302和301状态码相似,但是302状态码代表的资源不是永久移动,只是临时性质的。换句话说,302的资源对应的URL将来还有可能发生变。
        if(fork() == 0){if(fork() > 0) exit(0);close(listen_sock);char buffer[1024];recv(sock,buffer,sizeof(buffer),0);//重定向到腾讯网std::string response = "HTTP/1.1 301 Permanently Moved\r\n";response += "Location: https://www.qq.com/\r\n"; response += "\r\n";send(sock, response.c_str(), response.size(), 0);close(sock);exit(0);}

当服务器启动之后在浏览器输入ip:port后按下回车发现URL自动跳转到了腾讯网

  

4XX客户端错误

  1. 403 Forbidden 表示请求资源的访问被服务器拒绝了。服务器端没有必要给出拒绝的详细理由。
    1. 发生403的原因:未获得文件系统的访问授权,访问权限出现某些问题(从未授权的发送源IP地址试图访问)
  2. 404 Not Found 表示服务器上无法找到请求的资源。除此之外,也可能在服务器端拒绝请求且不想说明理由时使用。

5XX服务器错误

5XX的响应结果表名服务器本身发生错误

  1. 500 Internal Server Error 表示服务器端在执行请求时发生了错误。也可能是Web应用存在的Bug或某些临时的故障。

 5.HTTP的缺点

HTTP主要有如下不足之处:

  1. 通信使用明文(不加密),内容可能会被窃听
  2. 不验证通信方的身份,因此有可能遭遇伪装
  3. 无法证明报文的完整性,所以有可能已经遭到篡改

因此解决如上三个不足之处正是HTTPS的主要功能,因此HTTPS = HTTP+加密+认证+完整性保护。具体3个功能的实现细节,将单独整理成一篇博客HTTPS


http://www.ppmy.cn/news/34725.html

相关文章

Chapter8.1:控制系统校正与综合基础

该系列博客主要讲述Matlab软件在自动控制方面的应用&#xff0c;如无自动控制理论基础&#xff0c;请先学习自动控制系列博文&#xff0c;该系列博客不再详细讲解自动控制理论知识。 自动控制理论基础相关链接&#xff1a;https://blog.csdn.net/qq_39032096/category_10287468…

【C语言蓝桥杯每日一题】——排序

【C语言蓝桥杯每日一题】—— 排序&#x1f60e;前言&#x1f64c;排序&#x1f64c;总结撒花&#x1f49e;&#x1f60e;博客昵称&#xff1a;博客小梦 &#x1f60a;最喜欢的座右铭&#xff1a;全神贯注的上吧&#xff01;&#xff01;&#xff01; &#x1f60a;作者简介&am…

堆叠注入--攻防世界CTF赛题学习

在一次联系CTF赛题中才了解到堆叠注入&#xff0c;在这里简单介绍一下。 堆叠注入的原理什么的一搜一大堆&#xff0c;我就不引用百度了&#xff0c;直接进入正题。 这个是攻防世界的一道CTF赛题。 采用寻常思路来寻找sql注入漏洞。 payload:1 and 11-- 利用payload: and 12…

vue使用keep-alive后从部分页面进入不缓存

需求&#xff1a; 1&#xff1a;当前有页面A-B-C三个板块&#xff1b; 2&#xff1a;从页面C返回页面B时&#xff0c;B页面数据之前数据不会被清空&#xff08;keep-alive&#xff09;&#xff0c;且C页面携带到B页面的数据缓存(event-bus/vuex)&#xff1b; 3&#xff1a;从A-…

手撕红黑树

​ 终于来到了期待已久的红黑树教学环境&#xff0c;相信大家已经期待已久了吧。大名鼎鼎的红黑树在我最早学习编程的时候就已听说过&#xff0c;当然网上虽然说这块内容难度很高&#xff0c;但是看过我之前文章的一些朋友们面对这一块内容的话应该不会那么艰难&#xff0c;当然…

有手就行 -- 搭建图床(PicGo+腾讯云)

&#x1f373;作者&#xff1a;贤蛋大眼萌&#xff0c;一名很普通但不想普通的程序媛\color{#FF0000}{贤蛋 大眼萌 &#xff0c;一名很普通但不想普通的程序媛}贤蛋大眼萌&#xff0c;一名很普通但不想普通的程序媛&#x1f933; &#x1f64a;语录&#xff1a;多一些不为什么的…

2023最新最详细【接口测试总结】

序章 ​ 说起接口测试&#xff0c;网上有很多例子&#xff0c;但是当初做为新手的我来说&#xff0c;看了不不知道他们说的什么&#xff0c;觉得接口测试&#xff0c;好高大上。认为学会了接口测试就能屌丝逆袭&#xff0c;走上人生巅峰&#xff0c;迎娶白富美。因此学了点开发…

PyTorch 之 基于经典网络架构训练图像分类模型

文章目录一、 模块简单介绍1. 数据预处理部分2. 网络模块设置3. 网络模型保存与测试二、数据读取与预处理操作1. 制作数据源2. 读取标签对应的实际名字3. 展示数据三、模型构建与实现1. 加载 models 中提供的模型&#xff0c;并且直接用训练的好权重当做初始化参数2. 参考 pyto…

《论文阅读》Autoregressive Entity Generation for End-to-End Task-Oriented Dialog

《论文阅读》Autoregressive Entity Generation for End-to-End Task-Oriented Dialog 前言2023-3-24组会记录端到端的任务型对话系统前言实体不一致性结合实体回复实体关系检索方式解决方法1. 数据增强2. 实体生成3. 前缀树约束4. 回复生成问题与回答前言 2023-3-24组会记录 …

3 天交付新需求?极狐GitLab APP 「极限编程 XP」实践

近日&#xff0c;中移物联网有限公司、北京青云科技股份有限公司联合举办的 “2023 云原生重庆站技术分享会” 如期召开。会上&#xff0c;极狐(GitLab) 高级解决方案架构师刘剑桥带来《云原生极限编程 101》主题分享。本文整理自演讲内容&#xff0c;你可以阅读到&#xff1a;…

Vector - CAPL - CAN Message关键字

在CAPL脚本开发的CAN相关测试中&#xff0c;message关键字永远是我们避不开的话题&#xff0c;然而它到底都包含哪些信息呢&#xff1f;今天我们来介绍一下&#xff0c;让它方便我们脚本开发的使用&#xff1b;今天本篇文章主要来介绍它到底都有什么信息。定义message变量messa…

Linux:主机USB设备驱动简析

文章目录1. 前言2. 分析背景3. USB 总线硬件拓扑4. USB 协议栈概览4.1 Linux USB 子系统概览4.2 USB外设(如U盘)固件基础5. Linux USB 子系统初始化6. Linux USB 主机控制器(HCD) 驱动6.1 USB 主机控制器驱动初始化6.2 USB 主机控制器设备对象注册和驱动加载7. Linux USB 设备驱…

20美刀一个月的ChatGPT架构师,性价比逆天了

文章目录20美刀一个月的ChatGPT架构师&#xff0c;性价比逆天了1.角色设定2.基本描述3.解决方案4.物理网络蓝图5.系统集成接口5.1 系统集成接口设计5.1.1 前端服务器与后端服务器接口&#xff1a;5.1.2 后端服务器与去背景处理服务接口&#xff1a;5.2 系统集成接口展示6.部署环…

美国在制药、医疗器械和生物技术等行业的人才数量均排在首位

哈喽大家好&#xff0c;大健康行业是一个不断发展和扩大的行业,大健康领域的人才需求正在逐渐增加&#xff0c;同时大健康领域需要医学、生物科技、信息技术和市场营销等多个领域的专业人才共同协作发展。这里整理了2022年大健康领域行业人才的一些数据情况&#xff0c;在这里小…

leetcode 删除有序数组中的重复项

题目 给你一个 升序排列 的数组 nums &#xff0c;请你 原地 删除重复出现的元素&#xff0c;使每个元素 只出现一次 &#xff0c;返回删除后数组的新长度。元素的 相对顺序 应该保持 一致 。 由于在某些语言中不能改变数组的长度&#xff0c;所以必须将结果放在数组nums的第一…

走进Vue【三】vue-router详解

目录&#x1f31f;前言&#x1f31f;路由&#x1f31f;什么是前端路由&#xff1f;&#x1f31f;前端路由优点缺点&#x1f31f;vue-router&#x1f31f;安装&#x1f31f;路由初体验1.路由组件router-linkrouter-view2.步骤1. 定义路由组件2. 定义路由3. 创建 router 实例4. 挂…

java程序员转正述职报告PPT

新公司转正述职报告&#xff0c;花了些时间准备了ppt和讲稿&#xff0c;这里分享一下 述职报告 时间过得很快&#xff0c;转眼就已经三个月了&#xff0c;三个月时间不长&#xff0c;完成的工作也有限&#xff0c;但是在这些工作中&#xff0c;我也学到了很多&#xff0c;现在…

CentOS 7 安装 mysql 8.0 客户端

只想安装 mysql-client 8.0 &#xff0c; 结果发现直接 yum install mysql mysql-client 安装的版本是 mysql Ver 15.1 Distrib 5.5.68-MariaDB &#xff0c;这个版本太低&#xff0c;连接其他服务器上的 mysql 8.0 时总是失败&#xff0c;因为 mysql 8.0 加密方式改变了&#…

第七讲 贪心

文章目录股票买卖 II货仓选址&#xff08;贪心:排序中位数&#xff09;糖果传递&#xff08;❗贪心&#xff1a;中位数&#xff09;雷达设备&#xff08;贪心排序&#xff09;付账问题&#xff08;平均值排序❓&#xff09;乘积最大&#xff08;排序/双指针&#xff09;后缀表达…

java如何手动导jar包

今天用IDEA&#xff0c;需要导入一个Jar包&#xff0c;因为以前都是用eclipse的&#xff0c;所以对这个idea还不怎么上手&#xff0c;连打个Jar包都是谷歌了一下。 但是发现网上谷歌到的做法一般都是去File –> Project Structure中去设置&#xff0c;有没有如同eclipse一样…