其他分享
首页 > 其他分享> > 解决套接字粘包,udp套接字对象的使用和socketserver模块实现并发

解决套接字粘包,udp套接字对象的使用和socketserver模块实现并发

作者:互联网

昨天我们讲到了怎么去使用socket模块去创建了一个tcp的通信案例

那我们今天接着往下讲.

既然tcp我们学会了,那么它的好基友 udp我们学起来就很简单了

基于UDP的套接字

udp是无连接的,先启动哪一端都不会报错

这一点,可不比tcp,tcp可得先打开服务端,不然就会提醒你,服务端积极拒绝,你的客户端可是会报错的

那么我们介绍一下,upd的服务端和客户端的搭建

upd的大概搭建模板

upd服务端

server = socket()   # 一样先创建一个服务器的套接字
server.bind()  # 绑定服务器套接字
inf_loop:  # 服务器无限循环
    cs = server,recvfrom()  # 接收
    server.sendto()  # 发送
server.close()

udp客户端

cs = socket()   # 创建客户套接字
comm_loop:      # 通讯循环
    cs.sendto()/cs.recvfrom()   # 对话(发送/接收)
cs.close()                      # 关闭客户套接字

udp套接字简单示例

服务器端

from socket import *

server = socket(AF_INET, SOCK_DGRAM)

server.bind(("127.0.0.1", 8181))

while True:

    data, client_addr = server.recvfrom(1024)

    print(data, client_addr)
    server.sendto(data.upper(), client_addr)

客户端

from socket import *

client = socket(AF_INET, SOCK_DGRAM)

while True:
    msg = input('>>>>: ').strip()
    client.sendto(msg.encode('utf-8'), ("127.0.0.1", 8181))
    # data = None
    # server_addr = None
    recv_num = 4
    try:
        data, server_addr = client.recvfrom(recv_num)
    except OSError as e:
        # 将 4个长度的 数据 取出来
        msg = msg[0:recv_num]
        client.sendto(msg.encode('utf-8'), ("127.0.0.1", 8181))
        data, server_addr = client.recvfrom(recv_num)
    print(data.decode('utf-8'), f"服务端ip和端口>>:{server_addr}")

因为udp是一个面向无连接的,我们一般会用来做效率快,但信息不是那么重要的

*qq聊天(由于udp无连接,所以可以同时多个客户端去跟服务端通信)*

udp服务端

import socket
ip_port=('127.0.0.1',8081)
udp_server_sock=socket.socket(socket.AF_INET,socket.SOCK_DGRAM) #买手机
udp_server_sock.bind(ip_port)

while True:
    qq_msg,addr=udp_server_sock.recvfrom(1024)
    print('来自[%s:%s]的一条消息:\033[1;44m%s\033[0m' %(addr[0],addr[1],qq_msg.decode('utf-8')))
    back_msg=input('回复消息: ').strip()

    udp_server_sock.sendto(back_msg.encode('utf-8'),addr)

客户端

import socket
BUFSIZE=1024
udp_client_socket=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)

qq_name_dic={
    'jkey':('127.0.0.1',8081),
    'liu':('127.0.0.1',8081),
    'song':('127.0.0.1',8081),
    'xue':('127.0.0.1',8081),
}


while True:
    qq_name=input('请选择聊天对象: ').strip()
    while True:
        msg=input('请输入消息,回车发送: ').strip()
        if msg == 'quit':break
        if not msg or not qq_name or qq_name not in qq_name_dic:continue
        udp_client_socket.sendto(msg.encode('utf-8'),qq_name_dic[qq_name])

        back_msg,addr=udp_client_socket.recvfrom(BUFSIZE)
        print('来自[%s:%s]的一条消息:\033[1;44m%s\033[0m' %(addr[0],addr[1],back_msg.decode('utf-8')))

udp_client_socket.close()

时间服务器

按用户输入的格式返回这个格式的时间信息

服务器端

from socket import *
from time import strftime

ip_port=('127.0.0.1',9000)
bufsize=1024

tcp_server=socket(AF_INET,SOCK_DGRAM)
tcp_server.bind(ip_port)

while True:
    msg,addr=tcp_server.recvfrom(bufsize)
    print('===>',msg)
    
    if not msg:
        time_fmt='%Y-%m-%d %X'
    else:
        time_fmt=msg.decode('utf-8')
    back_msg=strftime(time_fmt)

    tcp_server.sendto(back_msg.encode('utf-8'),addr)

tcp_server.close()

客户端

from socket import *
ip_port=('127.0.0.1',9000)
bufsize=1024

tcp_client=socket(AF_INET,SOCK_DGRAM)



while True:
    msg=input('请输入时间格式(例%Y %m %d)>>: ').strip()
    tcp_client.sendto(msg.encode('utf-8'),ip_port)

    data=tcp_client.recv(bufsize)

    print(data.decode('utf-8'))

tcp_client.close()

upd的简单使用就没啦

注意接下来是重点知识了

其实我们昨天写的基于tcp的套接字交流小程序是有问题的.

我们先拿到我们昨天的案例

让我们基于tcp先制作一个远程执行命令的程序(1:执行错误命令 2:执行ls 3:执行ifconfig)

注意:

res=subprocess.Popen(cmd.decode('utf-8'),
shell=True,
stderr=subprocess.PIPE,
stdout=subprocess.PIPE)

的结果的编码是以当前所在的系统为准的,如果是windows,那么res.stdout.read()读出的就是GBK编码的,在接收端需要用GBK解码

且只能从管道里读一次结果

服务器端

# -*- coding: utf-8 -*-
# @Author  : JKey  
# Timer    : 2021/1/15 10:39

import socket
import subprocess

# 相当于买了一个手机
phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM)  
# 相当于给手机插上了手机卡
phone.bind(('192.168.12.61', 8081))  
# 相当于一次最大能接5个人的电话
phone.listen(5)

while True:
    # 相当于等待对方打电话的过程
    conn, client_addr = phone.accept()  # conn表示套接字对象  client_addr 表示客户端的ip和端口
    print(client_addr)

    while True:
        try:  # 当服务器还在连接中,而客户端强行断开连接时,windows会直接抛异常 
            data = conn.recv(1024)  # 接收的是一个二进制
            if len(data) == 0:  # 而Linux会在判断收到了一个空数据,会一直循环收
                break
            cmd = data.decode('utf-8')  # 需要转成字符串
            s = subprocess.Popen(cmd, shell=True,
                                 stdout=subprocess.PIPE,
                                 stderr=subprocess.PIPE
                                 )  # 创建一个子进程,让用户输入什么就返回shell语句的结果
            res1 = s.stdout.read()
            res2 = s.stderr.read()
            conn.send(res1 + res2)
        except ConnectionResetError:  # 客户端非正常断开连接时widows抛出的异常类型
            break

    conn.close()  # 关闭客户端连接
phone.close()  # 关闭手机

客户端

# -*- coding: utf-8 -*-
# @Author  : JKey  
# Timer    : 2021/1/15 10:39
import socket

# 获取客户端套接字对象
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# 客户端向对应得服务端发连接请求
client.connect(('192.168.12.61', 8081))

while True:
    i = input('>>:').strip()
    if len(i) == 0:continue
    client.send(i.encode('utf-8'))  # 客户端发送信息

    data = client.recv(1024)  # 客户端接收信息

    print(data.decode('gbk'))

client.close()

当我们输入的指令的返回值是小于1024的话,是没有什么问题的,但当我们输入的命令的返回结果大于1024的时候,我们会发现下一次输入别的命令时,返回的还是上一次指令返回的没收完结果

这种现象就叫做粘包

而我们的udp是不会出现这样的情况的,因为udp是不需要连接的,它拿到数据和ip+port就发出去了,发出去的也不会理会了.

什么是粘包

那讲的具体一点

什么是粘包呢?

需知:只有TCP有粘包现象,UDP永远不会粘包,为何,且听我娓娓道来

首先需要掌握一个socket收发消息的原理

img

发送端可以是一K一K地发送数据,而接收端的应用程序可以两K两K地提走数据,当然也有可能一次提走3K或6K数据,或者一次只提走几个字节的数据,也就是说,应用程序所看到的数据是一个整体,或说是一个流(stream),一条消息有多少字节对应用程序是不可见的,因此TCP协议是面向流的协议,这也是容易出现粘包问题的原因。而UDP是面向消息的协议,每个UDP段都是一条消息,应用程序必须以消息为单位提取数据,不能一次提取任意字节的数据,这一点和TCP是很不同的。怎样定义消息呢?可以认为对方一次性write/send的数据为一个消息,需要明白的是当对方send一条信息的时候,无论底层怎样分段分片,TCP协议层会把构成整条消息的数据段排序完成后才呈现在内核缓冲区。

例如基于tcp的套接字客户端往服务端上传文件,发送时文件内容是按照一段一段的字节流发送的,在接收方看了,根本不知道该文件的字节流从何处开始,在何处结束

所谓粘包问题主要还是因为接收方不知道消息之间的界限,不知道一次性提取多少字节的数据所造成的。

此外,发送方引起的粘包是由TCP协议本身造成的,TCP为提高传输效率,发送方往往要收集到足够多的数据后才发送一个TCP段。若连续几次需要send的数据都很少,通常TCP会根据优化算法把这些数据合成一个TCP段后一次发送出去,这样接收方就收到了粘包数据。

  1. TCP(transport control protocol,传输控制协议)是面向连接的,面向流的,提供高可靠性服务。收发两端(客户端和服务器端)都要有一一成对的socket,因此,发送端为了将多个发往接收端的包,更有效的发到对方,使用了优化方法(Nagle算法),将多次间隔较小且数据量小的数据,合并成一个大的数据块,然后进行封包。这样,接收端,就难于分辨出来了,必须提供科学的拆包机制。 即面向流的通信是无消息保护边界的。
  2. UDP(user datagram protocol,用户数据报协议)是无连接的,面向消息的,提供高效率服务。不会使用块的合并优化算法,, 由于UDP支持的是一对多的模式,所以接收端的skbuff(套接字缓冲区)采用了链式结构来记录每一个到达的UDP包,在每个UDP包中就有了消息头(消息来源地址,端口等信息),这样,对于接收端来说,就容易进行区分处理了。 即面向消息的通信是有消息保护边界的。
  3. tcp是基于数据流的,于是收发的消息不能为空,这就需要在客户端和服务端都添加空消息的处理机制,防止程序卡住,而udp是基于数据报的,即便是你输入的是空内容(直接回车),那也不是空消息,udp协议会帮你封装上消息头

udp的recvfrom是阻塞的,一个recvfrom(x)必须对唯一一个sendinto(y),收完了x个字节的数据就算完成,若是y>x数据就丢失,这意味着udp根本不会粘包,但是会丢数据,不可靠

tcp的协议数据不会丢,没有收完包,下次接收,会继续上次继续接收,己端总是在收到ack时才会清除缓冲区内容。数据是可靠的,但是会粘包。

两种情况下会发生粘包。

发送端需要等缓冲区满才发送出去,造成粘包(发送数据时间间隔很短,数据了很小,会合到一起,产生粘包)

接收方不及时接收缓冲区的包,造成多个包接收(客户端发送了一段数据,服务端只收了一小部分,服务端下次再收的时候还是从缓冲区拿上次遗留的数据,产生粘包)

send(字节流)和recv(1024)及sendall

recv里指定的1024意思是从缓存里一次拿出1024个字节的数据

send的字节流是先放入己端缓存,然后由协议控制将缓存内容发往对端,如果待发送的字节流大小大于缓存剩余空间,那么数据丢失,用sendall就会循环调用send,数据不会丢失

那我们如何解决这些粘包问题呢??

1解决粘包比较low的方法

粘包的问题根源在于,接收端不知道发送端将要传输的字节流的长度,所以解决粘包的方法就是围绕.如何让发送端在发送数据前,把自己将要发送的字节流总大小让接收端知晓,然后接收端来一个死循环接收完所有数据

low的版本

先发送一个真实数据的长度给接收端,接收端收到后,回一个已收到的提示,反发回去

服务端

import socket,subprocess
ip_port=('127.0.0.1',8080)
s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
s.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)

s.bind(ip_port)
s.listen(5)

while True:
    conn,addr=s.accept()
    print('客户端',addr)
    while True:
        msg=conn.recv(1024)
        if not msg:break
        res=subprocess.Popen(msg.decode('utf-8'),shell=True,\
                            stdin=subprocess.PIPE,\
                         stderr=subprocess.PIPE,\
                         stdout=subprocess.PIPE)
        err=res.stderr.read()
        if err:
            ret=err
        else:
            ret=res.stdout.read()
        data_length=len(ret)
        conn.send(str(data_length).encode('utf-8'))  # 先发送,真实数据的长度
        data=conn.recv(1024).decode('utf-8')  # 再确认接收那边回的信息
        if data == 'recv_ready':
            conn.sendall(ret)
    conn.close()

客户端

import socket,time
s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
res=s.connect_ex(('127.0.0.1',8080))

while True:
    msg=input('>>: ').strip()
    if len(msg) == 0:continue
    if msg == 'quit':break

    s.send(msg.encode('utf-8'))
    length=int(s.recv(1024).decode('utf-8'))
    s.send('recv_ready'.encode('utf-8'))
    send_size=0
    recv_size=0
    data=b''
    while recv_size < length:
        data+=s.recv(1024)
        recv_size+=len(data)


    print(data.decode('utf-8'))

为何low:

程序的运行速度远快于网络传输速度,所以在发送一段字节前,先用send去发送该字节流长度,这种方式会放大网络延迟带来的性能损耗

struct模块

2 用struct模块.实现定长头部信息

为字节流加上自定义固定长度报头,报头中包含字节流长度,然后一次send到对端,对端在接收时,先从缓存中取出定长的报头,然后再取真实数据

该模块可以把一个类型,如数字,转成固定长度的bytes

>>> struct.pack('i',1111111111111)

struct.error: 'i' format requires -2147483648 <= number <= 2147483647 #这个是范围

img

import json,struct
#假设通过客户端上传1T:1073741824000的文件a.txt

#为避免粘包,必须自定制报头
header={'file_size':1073741824000,'file_name':'/a/b/c/d/e/a.txt','md5':'8f6fbf8347faa4924a76856701edb0f3'} #1T数据,文件路径和md5值

#为了该报头能传送,需要序列化并且转为bytes
head_bytes=bytes(json.dumps(header),encoding='utf-8') #序列化并转成bytes,用于传输

#为了让客户端知道报头的长度,用struck将报头长度这个数字转成固定长度:4个字节
head_len_bytes=struct.pack('i',len(head_bytes)) #这4个字节里只包含了一个数字,该数字是报头的长度

#客户端开始发送
conn.send(head_len_bytes) #先发报头的长度,4个bytes
conn.send(head_bytes) #再发报头的字节格式
conn.sendall(文件内容) #然后发真实内容的字节格式

#服务端开始接收
head_len_bytes=s.recv(4) #先收报头4个bytes,得到报头长度的字节格式
x=struct.unpack('i',head_len_bytes)[0] #提取报头的长度

head_bytes=s.recv(x) #按照报头长度x,收取报头的bytes格式
header=json.loads(json.dumps(header)) #提取报头

#最后根据报头的内容提取真实的数据,比如
real_data_len=s.recv(header['file_size'])
s.recv(real_data_len)
import struct
import binascii
import ctypes

values1 = (1, 'abc'.encode('utf-8'), 2.7)
values2 = ('defg'.encode('utf-8'),101)
s1 = struct.Struct('I3sf')
s2 = struct.Struct('4sI')

print(s1.size,s2.size)
prebuffer=ctypes.create_string_buffer(s1.size+s2.size)
print('Before : ',binascii.hexlify(prebuffer))
# t=binascii.hexlify('asdfaf'.encode('utf-8'))
# print(t)


s1.pack_into(prebuffer,0,*values1)
s2.pack_into(prebuffer,s1.size,*values2)

print('After pack',binascii.hexlify(prebuffer))
print(s1.unpack_from(prebuffer,0))
print(s2.unpack_from(prebuffer,s1.size))

s3=struct.Struct('ii')
s3.pack_into(prebuffer,0,123,123)
print('After pack',binascii.hexlify(prebuffer))
print(s3.unpack_from(prebuffer,0))

将其运用到我们的案例中就可以变成

服务器端

# -*- coding: utf-8 -*-
# @Author  : JKey  
# Timer    : 2021/1/18 9:23

# 基于tcp的粘包问题
from socket import *
import json, struct, subprocess

server = socket(AF_INET, SOCK_STREAM)

server.bind(('127.0.0.1', 8080))

server.listen(5)

while True:
    conn, addr = server.accept()
    print(addr)

    try:
        cmd = conn.recv(1024)
        if len(cmd) == 0: break
        cmd = cmd.decode('utf-8')
        res_obj = subprocess.Popen(cmd, shell=True,
                                   stdout=subprocess.PIPE,
                                   stderr=subprocess.PIPE
                                   )
        res1 = res_obj.stdout.read()
        res2 = res_obj.stderr.read()
        header = len(res1 + res2)

        # 先制造字典
        header_dic = {
            "file_name": 'a.txt',
            'total_size': header,
            'md5': 'hih1jk5jk151jk51'
        }

        # 将字典变为bytes类型的字典
        header_bytes = json.dumps(header_dic)
        conn.send(struct.pack('i', len(header_bytes)))

        # 再发送header_bytes 到接收端
        conn.send(header_bytes.encode('utf-8'))

        # # 发送真正的数据
        conn.send(res1)
        conn.send(res2)
    except Exception:
        break

客户端

# -*- coding: utf-8 -*-
# @Author  : JKey  
# Timer    : 2021/1/18 9:23
from socket import *
import struct
import json


client = socket(AF_INET, SOCK_STREAM)

client.connect(("127.0.0.1", 8080))

while True:
    cmd = input('cmd >>>: ').strip()
    if len(cmd) == 0: continue
    client.send(cmd.encode('utf-8'))

    # 先接收固定的四个长度
    heard = client.recv(4)

    # 根据这个长度可以获取到header_bytes
    header_bytes_len = struct.unpack('i', heard)[0]
    header_bytes = client.recv(header_bytes_len)

    # 解码,反序列化成json的字符串的 header_dic

    header_dic = json.loads(header_bytes.decode('utf-8'))
    # 再根据获取到字典 获取到真实数据的大小
    total_size = header_dic['total_size']
    # 再接收真实的数据
    recv_size = 0
    res = b''
    while recv_size < total_size:
        data = client.recv(1024)
        recv_size += len(data)
        res += data

    print(res.decode('gbk'))

socketserver模块

因为我们现在还没有学到并发编程的概念

所有我们这里可以先用一下,python封装好的实现多并发的socketserver模块

介绍:

ftpserver=socketserver.ThreadingTCPServer(('127.0.0.1',8080),FtpServer)

ftpserver.serve_forever()

查找属性的顺序:ThreadingTCPServer->ThreadingMixIn->TCPServer->BaseServer

  1. 实例化得到ftpserver,先找类ThreadingTCPServer的__init__,在TCPServer中找到,进而执行server_bind,server_active
  2. 找ftpserver下的serve_forever,在BaseServer中找到,进而执行self._handle_request_noblock(),该方法同样是在BaseServer中
  3. 执行self._handle_request_noblock()进而执行request, client_address = self.get_request()(就是TCPServer中的self.socket.accept()),然后执行self.process_request(request, client_address)
  4. 在ThreadingMixIn中找到process_request,开启多线程应对并发,进而执行process_request_thread,执行self.finish_request(request, client_address)
  5. 上述四部分完成了链接循环,本部分开始进入处理通讯部分,在BaseServer中找到finish_request,触发我们自己定义的类的实例化,去找__init__方法,而我们自己定义的类没有该方法,则去它的父类也就是BaseRequestHandler中找....

源码分析总结:

基于tcp的socketserver我们自己定义的类中的

  1.   self.server即套接字对象
  2.   self.request即一个链接
  3.   self.client_address即客户端地址

基于udp的socketserver我们自己定义的类中的

  1.   self.request是一个元组(第一个元素是客户端发来的数据,第二部分是服务端的udp套接字对象),如(b'adsf', <socket.socket fd=200, family=AddressFamily.AF_INET, type=SocketKind.SOCK_DGRAM, proto=0, laddr=('127.0.0.1', 8080)>)
  2.   self.client_address即客户端地址

即实际代码可以为

tcp 的 socketserver

服务器端

# -*- coding: utf-8 -*-
# @Author  : JKey  
# Timer    : 2021/1/18 17:24

import socketserver


class MyRequestHandler(socketserver.BaseRequestHandler):

    def handle(self) -> None:
        """
        放的是通信循环
        self.request --> conn 连接对象
        :return:
        """
        while True:
            data = self.request.recv(1024)
            print(data.decode('utf-8'))

            self.request.send(data.upper())


accept = socketserver.ThreadingTCPServer(('127.0.0.1', 8282), MyRequestHandler, bind_and_activate=True)  # 表示该服务器的ip+port  
accept.serve_forever()  # 表示该服务器对外一直服务

udp的服务器端

# -*- coding: utf-8 -*-
# @Author  : JKey  
# Timer    : 2021/1/19 9:20
import socketserver


class MyRequestHandler(socketserver.BaseRequestHandler):

    def handle(self) -> None:
        print(self.request)  # 是一个小元组,第一个值为客户端发送的数据, 第二个值为自己的套接字对象
        data, server = self.request

        server.sendto(data.upper(), self.client_address)


server1 = socketserver.ThreadingUDPServer(("127.0.0.1", 8787), MyRequestHandler)
server1.serve_forever()

客户端

# -*- coding: utf-8 -*-
# @Author  : JKey  
# Timer    : 2021/1/19 9:21

from socket import *

client = socket(AF_INET, SOCK_DGRAM)

while True:
    msg = input('>>>>: ').strip()
    if len(msg) == 0: continue
    client.sendto(msg.encode('utf-8'), ("127.0.0.1", 8787))
    data, client_addr = client.recvfrom(1024)  # 返回的是一个小元组, 元组的第一个值为接收的数据,第二个为客户端的ip+port
    print(data.decode('utf-8'))

最后补上一个我写的简单的FTP的上传下载功能

服务器端

# -*- coding: utf-8 -*-
# @Author  : JKey  
# Timer    : 2021/1/18 18:00
import socket
import socketserver
import struct
import time
import json
import os
import hashlib


class TcpServer(socketserver.BaseRequestHandler):
    server_inet = socket.AF_INET
    server_type = socket.SOCK_STREAM
    server_ip_port = ('127.0.0.1', 8484)
    server_listen = 5

    def handle(self) -> None:
        while True:
            try:
                cmd = self.request.recv(1024)  # b 'get a.txt'
                if len(cmd) == 0:
                    break
                cmd = cmd.decode('utf-8')  # get a.txt
                func, file_name = cmd.split(' ')  # func = get/put 上传下载 file_name = 文件名
                if hasattr(self, func):
                    try:
                        getattr(self, func)(file_name)
                    except FileNotFoundError:
                        print('没有该文件')
                        return
                else:
                    print('暂不支持')
            except ConnectionResetError:
                break

    def get(self, file_name):
        print(f'客户端正在下载文件{file_name}')

        header_dic = {
            'file_name': file_name,
            'file_size': 0,
            'md5': None,
        }
        header_bytes_len = struct.pack('i', os.path.getsize(file_name))
        self.request.send(header_bytes_len)

        with open(file_name, 'rb') as r_f:
            for line in r_f:
                header_dic['file_size'] = len(line)
                mm = hashlib.md5()
                mm.update(line)
                header_dic['md5'] = mm.hexdigest()
                header_json = json.dumps(header_dic)

                header_bytes = header_json.encode('utf-8')
                header_bytes_len = struct.pack('i', len(header_bytes))

                self.request.send(header_bytes_len)
                self.request.send(header_bytes)
                self.request.send(line)
                time.sleep(0.01)

    def put(self, file_name):
        print(f'客户端正在上传文件{file_name}')
        file_size = struct.unpack('i', self.request.recv(4))[0]
        s_size = 0
        file_data = b''
        while s_size < file_size:
            # 先接收4个字节 文件的头部信息
            header = self.request.recv(4)
            header_bytes_len = struct.unpack('i', header)[0]

            header_bytes = self.request.recv(header_bytes_len)
            header_bytes_json = header_bytes.decode('utf-8')

            header_dic = json.loads(header_bytes_json)
            line_size = header_dic['file_size']
            start_size = 0
            line_data = b''

            while start_size < line_size:
                data = self.request.recv(1024)
                start_size += len(data)
                line_data += data

            mm = hashlib.md5()
            mm.update(line_data)

            if mm.hexdigest() == header_dic['md5']:
                file_data += line_data
                s_size += line_size

            else:
                print('下载文件不完整有误')
                break
        else:
            with open(file_name, 'ab') as w_f:
                w_f.write(file_data)
            self.request.send(f'{file_name} 上传成功'.encode('utf-8'))


server_obj = socketserver.ThreadingTCPServer(('127.0.0.1', 8484), TcpServer, bind_and_activate=True)
server_obj.serve_forever()
server_obj.handle_request()

客户端

# -*- coding: utf-8 -*-
# @Author  : JKey  
# Timer    : 2021/1/18 18:00
import socket
import struct
import os
import json
import hashlib
import time


class TcpClient:
    client_inet = socket.AF_INET
    client_type = socket.SOCK_STREAM
    server_ip_port = ('127.0.0.1', 8484)

    @staticmethod
    def __progress(percent, width=50):

        if percent < 1:
            show_str = ('[%%-%ds]' % width) % (int(width * percent) * '#')
            print('\r%s %d%%' % (show_str, int(100 * percent)), end='')
        elif percent >= 1:
            percent = 1
            show_str = ('[%%-%ds]' % width) % (int(width * percent) * '#')
            print('\r%s %d%%' % (show_str, int(100 * percent)))

    def handle_request(self):
        client = socket.socket(self.client_inet, self.client_type)
        client.connect(self.server_ip_port)
        while True:
            cmd = input('请输入您的指令>>:').strip()
            if len(cmd) == 0:
                continue
            if ' ' not in cmd:
                print('请输入正确的指令')
                continue
            if len(cmd.split(' ')) != 2:
                print('请输入正确的指令')
            client.send(cmd.encode('utf-8'))
            func, file_name = cmd.split(' ')

            if hasattr(self, func):
                getattr(self, func)(file_name, client)
            else:
                print('没有该功能')

    def get(self, file_name, client):

        # 先接收到文件的全部大小
        print(f'客户端正在下载文件{file_name}')
        if os.path.exists(file_name):
            print('该文件已存在')
            i = input('是否继续下载>>:').strip()
            if i == 'y':
                file_name = file_name + '(1)'
            else:
                return
        try:
            file_size = struct.unpack('i', client.recv(4))[0]
        except struct.error:
            print('服务器端没有该文件')
            return

        s_size = 0
        file_data = b''
        while s_size < file_size:
            # 先接收4个字节 文件的头部信息
            header = client.recv(4)
            header_bytes_len = struct.unpack('i', header)[0]

            header_bytes = client.recv(header_bytes_len)
            header_bytes_json = header_bytes.decode('utf-8')

            header_dic = json.loads(header_bytes_json)
            line_size = header_dic['file_size']
            start_size = 0
            line_data = b''

            while start_size < line_size:
                data = client.recv(1024)
                start_size += len(data)
                line_data += data

            mm = hashlib.md5()
            mm.update(line_data)

            if mm.hexdigest() == header_dic['md5']:
                file_data += line_data
                s_size += line_size
                percent = s_size / file_size
                self.__progress(percent, width=70)
            else:
                print('下载文件不完整有误')
                break
        else:
            with open(file_name, 'ab') as w_f:
                w_f.write(file_data)
            print(f'{file_name} 下载成功')

    def put(self, file_name, client):
        """客户端上传文件"""
        print(f'客户端正在上传文件{file_name}')
        if not os.path.exists(file_name):
            print('没有该文件')
            return
        header_dic = {
            'file_name': file_name,
            'file_size': 0,
            'md5': None,
        }
        header_bytes_len = struct.pack('i', os.path.getsize(file_name))
        client.send(header_bytes_len)
        file_size = os.path.getsize(file_name)
        line_size = 0
        with open(file_name, 'rb') as r_f:
            for line in r_f:
                header_dic['file_size'] = len(line)
                line_size += len(line)
                mm = hashlib.md5()
                mm.update(line)
                header_dic['md5'] = mm.hexdigest()
                header_json = json.dumps(header_dic)

                header_bytes = header_json.encode('utf-8')
                header_bytes_len = struct.pack('i', len(header_bytes))

                client.send(header_bytes_len)
                client.send(header_bytes)
                client.send(line)
                self.__progress(line_size / file_size)
                time.sleep(0.01)


client1 = TcpClient()
client1.handle_request()

其实我们以后接触到的输出层协议还是以tcp为多,所有我们必须要知道怎么处理tcp的粘包问题.

标签:udp,socket,socketserver,header,client,file,接字,data,size
来源: https://www.cnblogs.com/jkeykey/p/14304878.html