【网络原理】从零开始深入理解HTTP的报文格式(一)

在这里插入图片描述

本篇博客给大家带来的是网络HTTP协议的知识点, 重点介绍HTTP的报文格式.
🐎文章专栏: JavaEE初阶
🚀若有问题 评论区见
欢迎大家点赞 评论 收藏 分享
如果你不知道分享给谁,那就分享给薯条.
你们的支持是我不断创作的动力 .

王子,公主请阅🚀

  • 要开心
    • 要快乐
      • 顺便进步
  • 1. 什么是HTTP
  • 2. Fiddler
  • 3. HTTP 协议格式
  • 4. HTTP请求
    • 4.1 认识URL
    • 4.2 认识 "方法" (method)
      • 4.2.1 GET方法
      • 4.2.2 POST方法
      • 4.2.3 其他方法
    • 4.3 认识请求"报头"(header)
    • 4.4 认识正文(body)

要开心

要快乐

顺便进步

1. 什么是HTTP

HTTP (全称为 “超文本传输协议”) 是一种应用非常广泛的应用层协议.

在这里插入图片描述

HTTP 往往是基于传输层的 TCP 协议实现的. (HTTP1.0, HTTP1.1, HTTP2.0 均基于TCP, HTTP3 基于UDP 实现).
目前我们主要使用的还是 HTTP1.1 和 HTTP2.0. 文章讨论的 HTTP 以 1.1 版本为主.
平时打开一个网站, 就是通过 HTTP 协议来传输数据的.

在这里插入图片描述


当我们在浏览器中输入一个 百度搜索的 “网址” (URL) 时, 浏览器就给搜狗的服务器发送了一个 HTTP请求, 搜狗的服务器返回了一个 HTTP 响应.
这个响应结果被浏览器解析之后, 就展示成我们看到的页面内容. (这个过程中浏览器可能会给服务器发送多个 HTTP 请求, 服务器会对应返回多个响应, 这些响应里就包含了页面 HTML, CSS, JavaScript, 图片, 字体等信息).
“超文本” 的含义, 就是传输的内容不仅仅是文本(比如 html, css 这个就是文本), 还可以是一些其他的资源, 比如图片, 视频, 音频等二进制的数据.

HTTP 协议是一种"一问一答"结构模型的协议.
一问一答,访问网站.
多问一答,上传文件.
一问多答,下载文件.
多问多答,串流/远程桌面.
和前面的 TCP/IP/UDP 和这些不同,HTTP 的报文格式,要分两个部分来看待:请求+响应. 学习HTTP协议就是学习HTTP的报文格式.


2. Fiddler

Fiddler工具是专门用来抓HTTP的抓包工具. Fiddler下载路径

在这里插入图片描述


下载完直接一路next即可. 下完之后打开Fidder,根据以下步骤, 配置一下, 才能抓取https数据包.
在这里插入图片描述

点HTTPS的时候, 会弹出一个窗口, 点击yes即可. 然后按下图把能勾的全部勾选.

在这里插入图片描述
注意: 使用Fiddler的时候, 加速器和VPN都不要开. 代理程序之间可能会冲突.

3. HTTP 协议格式

Ⅰ 抓取一个包

在这里插入图片描述
使用 ctrl + a 全选左侧的抓包结果, delete 键清除所有被选中的结果.

在这里插入图片描述
刷新搜狗搜索页面:

在这里插入图片描述

左侧蓝色那一条响应就是html(网页)需要重点关注. 灰色的可以直接忽略.
右侧点击Raw, (raw表示原始的), 上方的数据表示请求, 下方的数据表示响应.

Ⅱ 分析请求

在这里插入图片描述
点击红圈处, 将请求以文本形式呈现. 关闭文本的自动换行.

在这里插入图片描述
HTTP 协议是文本格式的协议, 协议里的内容都是字符串.
TCP,UDP,IP. 都是二进制格式的协议.

① 首行
首行有三个部分信息, 三个部分使用空格分割.
1.GET, HTTP请求的"方法"(method)
2.URL 唯一资源定位符,描述一个资源在网络上的位置.

在这里插入图片描述

3.版本号(HTTP/1.1)

② 请求头(header)
请求头是一个键值对结构的数据.(有很多键值对)每个键值对,都是独占一行的.
键和值之间,使用 :空格 来区分
这里的键值对都是属于"标准规定"的.

在这里插入图片描述

③ 空行, 请求头的结束标记.

④ 正文(body)
有的 HTTP 请求有,有的HTTP没有, 如上图的例子中就没有.

Ⅱ 分析响应

在这里插入图片描述

① 首行
首行同样分为三个部分:
1.版本号 HTTP/1.1
2.状态码(200) 描述了请求的结果.
3.状态码描述(OK)

② 响应头
也是键值对结构(有多个键值对)每个键值对独占一行.键和值之间使用 :空格 来区分键值对也是"标准规定”的.

③ 空行
响应头的结束标记.

④ 正文 (body)
正文里的内容可能比较长,可能是多种格式,HTML, CSS, JS, JSON, XML, 图片, 字体, 视频,音频.


4. HTTP请求

了解了HTTP协议格式之后, 我们来看看请求中某些重要部分的的具体细节.

4.1 认识URL

平时我们俗称的 “网址” 其实就是说的 URL (Uniform Resource Locator 统一资源定位符).
互联网上的每个问文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它. URL 的详细规则由 因特网标准RFC1738 进行了约定.

文档链接

Ⅰ URL 基本格式

在这里插入图片描述

一个具体的 URL:

https://v.bitedu.vip/personInf/student?userId=10000&classId=100

在这个 URL 中有些信息被省略了.
① https : 协议方案名. 常见的有 http 和 https, 也有其他的类型. (例如访问 mysql 时用的jdbc:mysql)
② user:pass : 登陆信息. 一般都会省略.
③ v.bitedu.vip : 服务器地址. 此处是一个 “域名”, 域名会通过 DNS 系统解析成一个具体的 IP 地址. 这个位置可以是域名也可以是IP地址.
④端口号: 上面的 URL 中端口号被省略了. 当端口号省略的时候, 浏览器会根据协议类型自动决定使用哪个端口. 例如 http 协议默认使用 80 端口, https 协议默认使用 443 端口.
⑤ /personInf/student : 带层次的文件路径.
⑥ userId=10000&classId=100 : 查询字符串(query string). 本质是一个键值对结构. 键值对之间使用 & 分隔. 键和值之间使用 = 分隔.
⑦ 片段标识: 此 URL 中省略了片段标识. 片段标识主要用于页面内跳转.例如 Vue 官方文档:链接: Vue 通过不同的片段标识跳转到文档的不同章节

使用 ping 命令查看域名对应的 IP 地址. 以如下链接为例

https://cn.vuejs.org/guide/essentials/application.html

① 在开始菜单中输入 cmd , 打开 命令提示符.
② 在 cmd 中输入 ping cn.vuejs.org , 即可看到域名解析的结果.

在这里插入图片描述

关于 query string
query string 中的内容是键值对结构. 其中的 key 和 value 的取值和个数, 完全都是程序猿自己约定的. 我们可以通过这样的方式来自定制传输我们需要的信息给服务器.

URL 中的可省略部分

① 协议名: 可以省略, 省略后默认为 http://
② ip 地址 / 域名: 在 HTML 中可以省略(比如 img, link, script, a 标签的 src 或者 href 属性). 省略后表示服务器的 ip / 域名与当前 HTML 所属的 ip / 域名一致.
③ 端口号: 可以省略. 省略后如果是 http 协议, 端口号自动设为 80; 如果是 https 协议, 端口号自动设为443.
④ 带层次的文件路径: 可以省略. 省略后相当于 / . 有些服务器会在发现 / 路径的时候自动访问/index.html.
⑤ 查询字符串: 可以省略.
⑥ 片段标识: 可以省略.

关于 urlencode

urlencode 本质上是一种转义字符. 像 / ? : 等这样的字符, 已经被url当做特殊意义理解了. 因此这些字符不能随意出现.
比如, 某个参数中需要带有这些特殊字符, 就必须先对特殊字符进行转义. 像中文,汉字也需要转义. urlencode工具

怎么转义呢?
比如: + 的十六进制是 2B.那么 + 转义后的结果就是 %2B.

后面使用 url 的时候, 要记得针对 query string 的内容进行好urlencode 工作. 如果不处理好,有些浏览器就可能会解析失败,导致请求无法正常进行.

4.2 认识 “方法” (method)

在这里插入图片描述

4.2.1 GET方法

GET 是最常用的 HTTP 方法. 常用于获取服务器上的某个资源.
在浏览器中直接输入 URL, 此时浏览器就会发送出一个 GET 请求.
另外, HTML 中的 link, img, script 等标签, 也会触发 GET 请求.
使用 JavaScript 中的 ajax 也能构造 GET 请求.

Ⅰ 使用 Fiddler 观察 GET 请求

打开搜狗主页,观察抓包结果.

在这里插入图片描述

在上图中可以看到,红线上的HTTPS发送GET请求.

Ⅱ GET请求的特点

在这里插入图片描述

① 首行的第一部分为 GET.
② URL 的 query string 可以为空, 也可以不为空.
③ header 部分有若干个键值对结构.
④ body 部分为空.
⑤ GET 请求的 URL 长度问题,RFC 2616 标准文档中没有对URL的长度有任何限制,实际 URL 的长度取决于浏览器的实现和 HTTP 服务器端的实现.

4.2.2 POST方法

POST 方法也是一种常见的方法. 多用于提交用户输入的数据给服务器(例如登陆页面,上传文件等).

Ⅰ 使用Fiddler观察POST方法.

在这里插入图片描述
点击请求,查看请求详情.

在这里插入图片描述

Ⅱ POST请求的特点

① 首行的第一部分为 POST.
② URL 的 query string 一般为空 (也可以不为空).
③ header 部分有若干个键值对结构.
④ body 部分一般不为空. body 内的数据格式通过 header 中的 Content-Type 指定. body 的长度由 header 中的 Content-Length 指定.

Ⅲ 经典面试题: GET和POST的区别

GET和POST没有本质区别, 双方各自应用的场景可以替换. 虽然没有本质区别,但是使用习惯上还是存在一些差异.

① GET 经常是把传递给服务器的数据放到 query string 中; POST则是经常放到 body 中. 当然这种情况也并非绝对, GET 也可以使用 body, POST 也可以使用query string.
② GET 大多数还是用来获取数据;
POST 大多数还是用来提交数据(登录 + 上传);
③ GET 请求一般是幂等的, POST 请求一般是不幂等的.(如果多次请求得到的结果一样, 就视为请求是幂等的). 这一条也不绝对,具体取决于代码的实现;
④ GET 请求一般可以被浏览器缓存,POST 一般不可以被缓存(幂等性的延续.如果请求是幂等,自然就可以缓存);

Ⅳ 补充说明

① 关于安全性

有些资料上说 “POST 比 GET 请安全”. 这样的说法是不科学的. 是否安全取决于前端在传输密码等敏感信息时是否进行加密, 和 GET POST 无关.

在这里插入图片描述
就像上图POST 请求确实会给出登录名和密码,但那通常都是加密后的结果, 就算被黑客获取到, 想要解密也绝非易事, 对安全性来说, 如果黑客解密的成本高于账号本身的价值, 那就是安全的. 就像造假钞, 如果造一张一百的纸币成本需要一百一十,那就不怕别人造假钞.

② 关于传输数据量

有的资料上说 “GET 传输的数据量小, POST 传输数据量大”. 这个也是不科学的, 标准没有规定 GET 的 URL 的长度, 也没有规定 POST 的 body 的长度. 传输数据量多少, 完全取决于不同浏览器和不同服务器之间的实现区别.

③ 关于传输数据类型

有的资料上说 “GET 只能传输文本数据, POST 可以传输二进制数据”. 这个也是不科学的. GET 的 query string 虽然无法直接传输二进制数据, 但是可以针对二进制数据进行 base64转码.

4.2.3 其他方法


① PUT 与 POST 相似,只是具有幂等特性,一般用于更新;
② DELETE 删除服务器指定资源;
③ OPTIONS 返回服务器所支持的请求放法;
④ HEAD 类似于GET,只不过响应体不返回,只返回响应头;
⑤ TRACE 回显服务器端收到的请求,测试的时候会用到这个;
⑥ CONNECT 预留,暂无使用;

4.3 认识请求"报头"(header)

header 的整体的格式也是 “键值对” 结构.
每个键值对占一行. 键和值之间使用分号分割.
报头的种类有很多, 本文仅介绍几个常见的

① Host

表示服务器主机的地址和端口.

② Content-Length

表示 body 中的数据长度.

③ Content-Type

在这里插入图片描述

表示请求的 body 中的数据格式.

②和③ 有这两个属性的前提示请求里有body.
TCP 涉及到 粘包 问题.
HTTP 在传输层就是基于 TCP 的.
这两个属性就可以解决粘包问题.

④ User-Agent (简称 UA)

表示浏览器/操作系统的属性.

在这里插入图片描述

⑤ Referer
表示这个页面是从哪个页面跳转过来的. 形如

在这里插入图片描述
如果直接在浏览器中输入URL, 或者直接通过收藏夹访问页面时是没有 Referer 的.

⑥ Cookie

Cookie 中存储了一个字符串, 这个数据可能是客户端(网页)自行通过 JS 写入的, 也可能来自于服务器
(服务器在 HTTP 响应的 header 中通过 Set-Cookie 字段给浏览器返回数据).
每个不同的域名下都可以有不同的 Cookie, 不同网站之间的 Cookie 并不冲突.
往往可以通过这个字段实现 “身份标识” 的功能.

4.4 认识正文(body)

如下图所示, 前面抓取过的包, 不再多说.

在这里插入图片描述






本篇博客到这里就结束啦, 感谢观看, 下篇揭晓HTTP响应的具体组成部分.🐱‍🚀 ❤❤❤

🐎期待与你的下一次相遇😊😊😊

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/904290.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ElasticSearch深入解析(九):Object、Nested、Flattened类型

文章目录 一、Object 类型:默认的嵌套对象处理方式核心原理典型场景关键限制 二、Nested 类型:解决嵌套数组的关联查询核心原理典型场景使用示例注意事项 三、Join 类型:跨文档的父子关联核心原理典型场景使用示例注意事项 四、Flattened 类型…

36、C#中的⽅法声明参数关键字params,ref,out的意义及⽤法

在C#中,params、ref 和 out 是方法声明中用于修饰参数的关键字,它们各自有不同的用途和语义。以下是它们的详细说明和用法: 1、 params 关键字 意义 params 允许方法接受可变数量的参数,这些参数会被编译为一个数组。适用于参数…

【大模型实战篇】华为信创环境采用vllm部署QwQ-32B模型

1. 背景 本文分享在华为昇腾机器上部署QwQ-32B模型的实践。 首先华为自己是提供了一套在信创机器(NPU)上部署模型的方案【1】,但是部署之后,测试发现会有输出截断的现象。QwQ-32B本身是支持128k的最大上下文长度,定位…

前端面经-VUE3篇(二)--vue3基础知识(二)计算属性(computed)、监听属性(Watch)

一、计算属性(computed) 计算属性(Computed Properties)是 Vue 中一种特殊的响应式数据,它能基于已有的响应式数据动态计算出新的数据。 计算属性有以下特性: 自动缓存:只有当它依赖的响应式数据发生变化时&#xff…

[预备知识] 5. 优化理论(一)

优化理论 梯度下降(Gradient Descent) 数学原理与可视化 梯度下降是优化领域的基石算法,其核心思想是沿负梯度方向迭代更新参数。数学表达式为: θ t 1 θ t − α ∇ θ J ( θ t ) \theta_{t1} \theta_t - \alpha \nabla…

大模型微调Fine-tuning:从概念到实践的全面解析

目录 引言 一、什么是大模型微调? 1.1 预训练与微调的区别 1.2 微调的技术演进 二、为什么需要微调? 2.1 解决大模型的固有局限 2.2 微调的优势 三、主流微调方法 3.1 全参数微调 3.2 参数高效微调(PEFT) 四、微调实践指…

Docker 使用下 (二)

Docker 使用下 (二) 文章目录 Docker 使用下 (二)前言一、初识Docker1.1 、Docker概述1.2 、Docker的历史1.3 、Docker解决了什么问题1.4 、Docker 的优点1.5 、Docker的架构图 二、镜像三、容器四、数据卷4.1、数据卷的概念4.2 、…

洛谷P12238 [蓝桥杯 2023 国 Java A] 单词分类

[Problem Discription] \color{blue}{\texttt{[Problem Discription]}} [Problem Discription] Copy from luogu. [Analysis] \color{blue}{\texttt{[Analysis]}} [Analysis] 既然都是字符串前缀的问题了,那当然首先就应该想到 Trie \text{Trie} Trie 树。 我们可…

pta作业中有启发性的程序题

1 【知识点】&#xff1a;多态 函数接口定义&#xff1a; 以Student为基类&#xff0c;构建GroupA, GroupB和GroupC三个类 裁判测试程序样例&#xff1a; #include<iostream> #include <string> using namespace std;/* 请在这里填写答案 */int main() {const …

Scrapy框架之CrawlSpider爬虫 实战 详解

CrawlSpider 是 Scrapy 框架中一个非常实用的爬虫基类&#xff0c;它继承自 Spider 类&#xff0c;主要用于实现基于规则的网页爬取。相较于普通的 Spider 类&#xff0c;CrawlSpider 可以根据预定义的规则自动跟进页面中的链接&#xff0c;从而实现更高效、更灵活的爬取。 Scr…

Glide 如何加载远程 Base64 图片

最近有个需求&#xff0c;后端给出的图片地址并不是正常的 URL&#xff0c;而且需要一个接口去请求&#xff0c;但是返回的是 base64 数据流。这里不关心为啥要这么多&#xff0c;原因有很多&#xff0c;可能是系统的问题&#xff0c;也可能是能力问题。当然作为我们 Android 程…

004-nlohmann/json 快速认识-C++开源库108杰

了解 nlohmann/json 的特点&#xff1b;理解编程中 “数据战场”划分的概念&#xff1b;迅速上手多种方式构建一个JSON对象&#xff1b; 1 特点与安装 nlohmann/json 是一个在 github 长期霸占 “JSON” 热搜版第1的CJSON处理库。它的最大优点是与 C 标准库的容器数据&#xf…

#基础Machine Learning 算法(上)

机器学习算法的分类 机器学习算法大致可以分为三类&#xff1a; 监督学习算法 (Supervised Algorithms&#xff09;:在监督学习训练过程中&#xff0c;可以由训练数据集学到或建立一个模式&#xff08;函数 / learning model&#xff09;&#xff0c;并依此模式推测新的实例。…

正弦波、方波、三角波和锯齿波信号发生器——Multisim电路仿真

目录 Multisim使用教程说明链接 一、正弦波信号发生电路 1.1正弦波发生电路 电路组成 工作原理 振荡频率 1.2 正弦波发生电路仿真分析 工程文件链接 二、方波信号发生电路 2.1 方波发生电路可调频率 工作原理 详细过程 2.2 方波发生电路可调频率/可调占空比 调节占空比 方波产生…

【AND-OR-~OR锁存器设计】2022-8-31

缘由锁存器11111111111-硬件开发-CSDN问答 重置1&#xff0c;不论输入什么&#xff0c;输出都为0&#xff1b; 重置0&#xff0c;输入1就锁住1 此时输入再次变为0&#xff0c;输出不变&#xff0c;为锁住。

力扣-字符串-468 检查ip

思路 考察字符串的使用&#xff0c;还有对所有边界条件的检查 spilt&#xff08;“\.”&#xff09;&#xff0c;toCharArray&#xff0c;Integer.parseInt() 代码 class Solution {boolean checkIpv4Segment(String str){if(str.length() 0 || str.length() > 4) retur…

BC8 十六进制转十进制

题目&#xff1a;BC8 十六进制转十进制 描述 BoBo写了一个十六进制整数ABCDEF&#xff0c;他问KiKi对应的十进制整数是多少。 输入描述&#xff1a; 无 输出描述&#xff1a; 十六进制整数ABCDEF对应的十进制整数&#xff0c;所占域宽为15。 备注&#xff1a; printf可以使用…

ARM子程序和栈

微处理器中的栈由栈指针指向存储器中的栈顶来实现&#xff0c;当数据项入栈时&#xff0c;栈 指针向上移动&#xff0c;当数据项出栈时&#xff0c;栈指针向下移动。 实现栈时需要做出两个决定&#xff1a;一是当数据项进栈时是向低位地址方向向上生 长&#xff08;图a和图b&a…

jwt身份验证和基本的利用方式

前言 &#xff1a; 什么是jwt&#xff08;json web token&#xff09;&#xff1f; 看看英文单词的意思就是 json形式的token 他的基本的特征 &#xff1a; 类似于这样的 他有2个点 分割 解码的时候会有三个部分 头部 payload 对称密钥 这个就是对称加密 头部&am…

n8n工作流自动化平台的实操:利用本地嵌入模型,完成文件内容的向量化及入库

1.成果展示 1.1n8n的工作流 牵涉节点&#xff1a;FTP、Code、Milvus Vector Store、Embeddings OpenAI、Default Data Loader、Recursive Character Text Splitter 12.向量库的结果 2.实操过程 2.1发布本地嵌入模型服务 将bge-m3嵌入模型&#xff0c;发布成满足open api接口…