Python进阶----粘包,解决粘包(旗舰版)

mac2022-06-30 81

Python进阶----粘包,解决粘包(旗舰版)

一丶粘包

只有TCP有粘包现象，UDP永远不会粘包

什么是粘包

存在于客户端接收数据时,不能一次性收取全部缓冲区中的数据.当下一次再有数据来时,缓冲区中剩余的数据会和新的数据'粘连'在一起.这就是粘包现象

### 什么是粘包？ # 存在于TCP/IP协议中数据粘连在一起, ### socket中造成粘包现象的原因是什么？ # 客户端不能一次性接收完缓冲区里的所有数据, # 服务端接受客户端发送数据时,由于缓冲区没有存满,回先把数据'聚合'在客户端的缓冲区中,当客户端缓存区存满之后,在发给服务端 ### 那些情况会发生粘包现象？ # 1. 客户端多次send少量数据, 会在客户端send输出缓冲区堆积, 当缓冲区堆积到一定程度 .会一次性把缓冲区的数据发给服务端 # 造成粘包现象 # 2. 客户端接收服务端发送的数据,会在客户端的recv输入缓存堆积,由于每次接收数据有限,当第二次服务端把数据发送过来时 # 数据会堆积在客户端的输入缓冲区.造成粘包

简单代码,产生粘包现象:?

### 客户端 # -*-coding:utf-8-*- # Author:Ds import socket client=socket.socket() client.connect(('127.0.0.1',7777)) while 1: ui=input('请输入有命令:>>').strip() client.send(ui.encode('utf-8')) # 向服务端发送指令 ###***重点 # 客户端 send完之后, 就会执行recv() 等待接收数据 # 第一次输入:dir指令能够一次性接收完服务端返回的数据 # 第二次输入:ipconfig指令不能一次性接收完服务端返回的数据,部分残余数据放在缓冲区中 # 第三次输入:dir指令时由于上一次的返回的数据还没全部取完,新的指令数据还未到达缓冲区. # 总结: 如果缓冲区承载的数据过大时,每次只接收1024字节,当新的指令执行完,返回回来的数据会'怼'到缓冲区,造成数据粘连现象. 这就是粘包 ser_data=client.recv(1024) # 接收到服务端发送的字节码 print(ser_data.decode('utf-8')) # 解码输出 client.close() ### 服务端 # -*-coding:utf-8-*- # Author:Ds import socket import subprocess # 执行系统cmd指令 server=socket.socket() server.bind(("127.0.0.1",7777)) # 绑定IP和端口 server.listen(5) while 1: conn , addr=server.accept() # 等待接收连接 print(conn,addr) while 1: try: cmd=conn.recv(1024) # 接收客户端发送过来的数据 cmd=cmd.decode('utf-8') # 将客户端发送过来的字节进行解码 # 执行客户端发来的系统命令 obj=subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE) # 这是执行系统命令之后产生正确结果或错误结果, # 字节形式 result=(obj.stdout.read()+obj.stderr.read()).decode('gbk') conn.send(result.encode('utf-8') ) # 向客户端发送结果,字节形式 except Exception : break conn.close() server.close()

二丶系统缓冲区

socket缓冲区

如下图:?

1.每个socket被创建后,都会分配两个缓冲区,输入缓冲区(recv)和输出缓冲区(send)

2.send和recv都不是直接从网络中直接读取数据,而是从各自缓冲区读入和输出数据.

3.数据有可能刚被写入缓冲区就发送到网络，也可能在缓冲区中不断积压，多次写入的数据被一次性发送到网络，这取决于当时的网络情况、当前线程是否空闲等诸多因素，不由程序员控制

I/O缓存区特性

# 1.I/O缓冲区在每个TCP套接字中单独存在； # 2.I/O缓冲区在创建套接字时自动生成； # 3.即使关闭套接字也会继续传送输出缓冲区中遗留的数据； # 4.关闭套接字将丢失输入缓冲区中的数据。

缓冲区的作用:

a、提高执行效率。协调数据的收发（接受和处理）速度 b、减少内存负担。减少和磁盘的交互 c、保持数据稳定性

利用socket查看系统缓冲区的大小(8K)

# -*-coding:utf-8-*- # Author:Ds import socket server = socket.socket() server.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1) # 重用ip地址和端口 server.bind(('127.0.0.1',8010)) server.listen(3) print(server.getsockopt(socket.SOL_SOCKET,socket.SO_SNDBUF)) # 输出缓冲区大小 print(server.getsockopt(socket.SOL_SOCKET,socket.SO_RCVBUF)) # 输入缓冲区大小 # 65536 1K=1024B 1B=8bit

三丶产生粘包的原因

两种原因:

一:客户端(recv)不能一次性读取缓冲区中的数据.服务端发送的数据大于客户端能够接受的数据量,客户端下次接收的时候先去接收上次遗留在缓冲区中的数据.造成粘包

代码如下:?

### 服务端 # -*-coding:utf-8-*- # Author:Ds import socket import subprocess phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM) phone.bind(('127.0.0.1', 8080)) phone.listen(5) while 1: # 循环连接客户端 conn, client_addr = phone.accept() print(client_addr) while 1: try: cmd = conn.recv(1024) ret = subprocess.Popen(cmd.decode('utf-8'), shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE) correct_msg = ret.stdout.read() error_msg = ret.stderr.read() conn.send(correct_msg + error_msg) except ConnectionResetError: break conn.close() phone.close() #### 客户端 # -*-coding:utf-8-*- # Author:Ds import socket phone = socket.socket(socket.AF_INET,socket.SOCK_STREAM) # 买电话 phone.connect(('127.0.0.1',8080)) # 与客户端建立连接，拨号 while 1: cmd = input('>>>') phone.send(cmd.encode('utf-8')) from_server_data = phone.recv(1024) print(from_server_data.decode('gbk')) phone.close() # 由于客户端发的命令获取的结果大小已经超过1024，那么下次在输入命令，会继续取上次残留到缓存区的数据

二:客户端(send)向服务端发送数据的时候,发送多条少量数据. 由于缓冲区的没有存满,缓冲区会把这些数据聚集在一起发送个服务端.造成粘包

代码如下:?

### 服务端 # -*-coding:utf-8-*- # Author:Ds import socket server=socket.socket() server.bind(('127.0.0.1',7878)) server.listen(5) conn ,addr = server.accept() print(conn,addr) data1=conn.recv(1024) data2=conn.recv(1024) data=data1+data2 print(data.decode('utf-8')) conn.close() server.close() #### 客户端 # -*-coding:utf-8-*- # Author:Ds import socket client=socket.socket() client.connect(('127.0.0.1',7878)) client.send('123'.encode('utf-8')) client.send('abc'.encode('utf-8')) client.close() ## 两次返送信息时间间隔太短，数据小，造成服务端一次收取

四丶解决粘包(recv的工作原理)

简易版解决粘包

### 客户端 # -*-coding:utf-8-*- # Author:Ds import socket client=socket.socket() client.connect(('127.0.0.1',9989)) while 1: ui=input('请输入指令:>>>').strip() if len(ui)<0:continue if ui.upper()=='Q':break client.send(ui.encode('utf-8')) message_size=int(client.recv(1024).decode('utf-8')) client.send(b'recv_ready') recv_size=0 data=b'' while recv_size<message_size: data+=client.recv(1024) recv_size+=len(data) print(data.decode('utf-8')) ### 服务端 # -*-coding:utf-8-*- # Author:Ds import socket import subprocess server=socket.socket() server.bind(('127.0.0.1',9989)) server.listen(5) while 1: conn,addr=server.accept() print(conn,addr) while 1: cmd=conn.recv(1024).decode('utf-8') obj=subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE) result=(obj.stdout.read()+obj.stderr.read()).decode('gbk').encode('utf-8') conn.send(str(len(result)).encode('utf-8')) data=conn.recv(1024).decode('utf-8') if data=='recv_ready': conn.sendall(result) conn.close() server.close()

使用struct模块

将一串数字转换成等长的字节.

格式多种: 常用 i

代码如下:?

# -*-coding:utf-8-*- # Author:Ds import struct # 'i' 的取值范围 -2147483648 <= number <= 2147483647 # i 模式等长四位 , 将一个数字转化成等长度的bytes类型。 res=struct.pack('i',123456) print(res,len(res)) ### 通过unpack反解回来 data=struct.unpack('i',res) print(data) ### 但是通过struct 处理不能处理太大 ret = struct.pack('q', 4323241232132324) print(ret, type(ret), len(ret)) # 报错

low版本解决粘包

### 服务端 import socket import subprocess import struct phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM) phone.bind(('127.0.0.1', 8080)) phone.listen(5) while 1: conn, client_addr = phone.accept() print(client_addr) while 1: try: cmd = conn.recv(1024) ret = subprocess.Popen(cmd.decode('utf-8'), shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE) correct_msg = ret.stdout.read() error_msg = ret.stderr.read() # 1 制作固定报头 total_size = len(correct_msg) + len(error_msg) header = struct.pack('i', total_size) # 2 发送报头 conn.send(header) # 发送真实数据： conn.send(correct_msg) conn.send(error_msg) except ConnectionResetError: break conn.close() phone.close() # 但是low版本有问题： # 1，报头不只有总数据大小，而是还应该有MD5数据，文件名等等一些数据。 # 2，通过struct模块直接数据处理，不能处理太大。 ### 客户端 import socket import struct phone = socket.socket(socket.AF_INET,socket.SOCK_STREAM) phone.connect(('127.0.0.1',8080)) while 1: cmd = input('>>>').strip() if not cmd: continue phone.send(cmd.encode('utf-8')) # 1，接收固定报头 header = phone.recv(4) # 2，解析报头 print(struct.unpack('i', header)) # 这是一个元组 (xxx,) total_size = struct.unpack('i', header)[0] # 取第一个元素 # 3，根据报头信息，接收真实数据 recv_size = 0 res = b'' while recv_size < total_size: recv_data = phone.recv(1024) res += recv_data recv_size += len(recv_data) print(res.decode('gbk')) phone.close()

旗舰版解决粘包

### 步骤解释 # 报头做成字典，字典里包含将要发送的真实数据的详细信息，然后json序列化，然后用struck将序列化后的数据长度打包成4个字节 #发送时： 1.先发报头长度 2.再编码报头内容然后发送 3.最后发真实内容 #接收时： 1.先手报头长度，用struct取出来 2.根据取出的长度收取报头内容，然后解码，反序列化 3.从反序列化的结果中取出待取数据的详细信息，然后去取真实的数据内容

案例代码,如下?:

### 客户端 # -*-coding:utf-8-*- # Author:Ds import socket import struct import json client = socket.socket() # 实例化 socket对象 client.connect(('127.0.0.1', 8898)) # socket 连接IP和端口 while 1: ui = input('请输入指令:>>').strip() # 1. 发送用户输入指令 client.send(ui.encode('utf-8')) #2. 接收 struct 封装的头字节形式 , 接收4个字节 head head = client.recv(4) # 3. struct反解 ,获得自定义报头的长度 dic_length = struct.unpack('i', head)[0] #4. 接收自定义字典报头内容字节形式 head_dic = client.recv(int(dic_length)) #5. 反序列化自定义字典,先解码在反序列化 dic = json.loads(head_dic.decode('utf-8')) #6. 得到真实内容的长度 content_length = dic['size'] # 7 设置一个字节变量用于接收真实数据 content = b'' # 8 设置一个客户端接收长度 recv_size = 0 # 9 当客户端接收长度小于源数据长度,一直接收 while recv_size < content_length: # 累加真实数据,以字节形式 content += client.recv(1024) # 累加客户端接收的长度 recv_size += len(content) # 接收完毕,解码内容 print(content.decode('utf-8')) client.close() ### 服务端 # -*-coding:utf-8-*- # Author:Ds import socket import struct import json import time import subprocess server = socket.socket() # 实例化 socket对象 server.bind(('127.0.0.1', 8898)) # 绑定ip和端口 server.listen(5) # 邦迪监听连接 while 1: conn, addr = server.accept() # 等待连接 print(conn, addr) # 打印连接,和连接ip while 1: try: # 1. 接收客户端发送的指令 ,字节形式 cmd = conn.recv(1024) # 2. 执行指令,得到结果 , 指令是字符形式(需要解码) obj = subprocess.Popen(cmd.decode('utf-8'), shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE) #3.得到结果字节 ,转换成utf-8的字节格式 result = (obj.stdout.read() + obj.stderr.read()).decode('gbk').encode('utf-8') #4. 获得真实数据的字节长度 total_res_bytes = len(result) #5. 自定制字典报头 head_dic = { 'time': time.localtime(time.time()), 'size': total_res_bytes, # 字节长度 'MD5': 'XXXXX', 'file_name': '婚前视频', } # 6. 序列化字典 ,并将其转换成字节形式 head_dic_bytes = json.dumps(head_dic).encode('utf-8') #7. 使用 struct 封装报头字典head_dic_bytes ,固定长度(4个字节) # 封装成字节,发送给客户端,还是按照字节取出来. head = struct.pack('i', len(head_dic_bytes)) # 8 , 先将固定头发送给客户端 conn.send(head) # 9 . 再将自定制报头发送给客户端 conn.send(head_dic_bytes) # 10. 最后将真实结果发送给客户端 conn.send(result) ### 这里就是拼接字节 # 格式: 固定头 + 自定义报头 +真实数据 except Exception: break conn.close() server.close()

转载于:https://www.cnblogs.com/dengl/p/11202806.html

相关资源：Python进阶者笔记（粘包、粘包解决方案）

最新回复(0)