首页 > 其他分享> > 第八天集合和字符串

第八天集合和字符串

2021-12-09 22:02:47 作者：互联网

1. 什么是集合(set)

集合是容器型数据类型；将{}作为容器的标志，里面多个元素用逗号隔开：{元素1, 元素2, 元素3,…}
可变的；无序
元素的要求：
a.必须是不可变类型的数据
b.元素是唯一的（自动去重）

空集合

s1 = set()
print(len(s1), type(s1))        # 0 <class 'set'>

集合无序

print({10, 20, 30} == {30, 20, 10})     # True

元素是不可变类型的数据

s2 = {10, 'abc', 23.9, (1, 2)}
print(s2)

s3 = {10, ‘abc’, 23.9, [1, 2]} # 报错！列表是可变数据不能作为集合元素

元素是唯一的

s4 = {10, 20, 10, 10, 30, 30}
print(s4)       # {10, 20, 30}

2.增删改查

1) 查 - 只能遍历

s5 = {29, 80, 56, 324}
for x in s5:
    print('x:', x)

2) 增

集合.add(元素) - 将元素添加到集合中

s5.add(100)
print(s5)       # {100, 324, 80, 56, 29}

3) 删

集合.remove(元素) - 删除指定元素，元素不存在报错
集合.discard(元素) - 删除指定元素，元素不存在不报错

s5.remove(80)
print(s5)       # {100, 324, 56, 29}

s5.discard(56)
print(s5)       # {100, 324, 29}

4）改 - 没有改的语法，如果要改就删除旧的，添加新的

python中的集合支持的数学集合运算：并集(|)、交集(&)、差集(-)、对称差集(^)、子集(>=、<=)、真子集(>、<)
A = {1, 2, 3, 4, 5, 6, 7}
B = {5, 6, 7, 8, 9}

1. 并集(|)

集合1 | 集合2 - 将两个集合合并产生一个新的集合
print(A | B) # {1, 2, 3, 4, 5, 6, 7, 8, 9}

2. 交集(&)

集合1 & 集合2 - 获取两个集合公共部分产生一个新的集合
print(A & B) # {5, 6, 7}

3. 差集(-)

集合1 - 集合2 - 获取集合1中没有包含在集合2中的元素，得到一个新的集合
集合2 - 集合1 - 获取集合2中没有包含在集合1中的元素，得到一个新的集合
print(A - B) # {1, 2, 3, 4}
print(B - A) # {8, 9}

4. 对称差集(^)

集合1 ^ 集合2 - 两个集合合并去掉公共部分
print(A ^ B) # {1, 2, 3, 4, 8, 9}

5.子集和真子集

{1, 2, 3}的子集有：{}、{1}、{2}、{3}、{1, 2}、{2, 3}、{1, 3}、{1, 2, 3} - >=、<=
集合1 >= 集合2 - 判断集合2是否是集合1的子集
集合1 <= 集合2 - 判断集合1是否是集合2的子集

{1, 2, 3}的真子集有：{}、{1}、{2}、{3}、{1, 2}、{2, 3}、{1, 3}
集合1 > 集合2 - 判断集合2是否是集合1的真子集
集合1 < 集合2 - 判断集合1是否是集合2的真子集

print({1, 2, 3} > {0}) # False
print({1, 2, 3} > {1}) # True

1. 字符串(str)

1)字符串是容器型数据类型；将’’、""、""""""、’’’’’'作为容器的标志，里面的每一个符号就是它的一个元素。
2)字符串不可变；字符串有序
3)字符串元素：引号中的每一个符号都是字符串的元素，又叫字符。
字符分为普通字符和转义字符两种：
普通字符 - 在字符串中表示符号本身的字符

1）三个引号开头的字符串，字符串内容可以直接换行

str1 = 'abc'
str2 = "abc"
str3 = '''abc'''
str4 = """abc"""
print(type(str1), type(str2), type(str3), type(str4))

str5 = """床前明月光，
疑是地上霜；
举头望明月，
低头思故乡。"""
print(str5)

2）字符 - 字符串的元素

普通字符

转义字符

str1 = '\tabc\n123\u4e00'
print(str1)

3）字符串有序

print(‘abc’ == ‘bac’) # False

1. 字符 - 字符串的每个元素

1)转义字符 - 在特定的一些符号前加\来表示特殊功能或者特殊意义的符号

常用的转义字符：
\n - 换行(相当于按回车)
\t - 水平制表符(相当于按tab键)
’ - 一个普通的单引号
" - 一个普通的单引号
\ - 一个普通的反斜杠

\u4位的16进制数 - 编码字符

print(’\tabc\n123’)

2) R语法

#如果在字符串的最前面加r或者R可以让字符串中所有的转义字符功能消失，每个符号都会变成普通字符

str1 = R'\tabc\n123\'mn'
print(str1)    # \tabc\n123\'mn

1. 计算机存储数据的原理

计算机只具备存储数字的能力

2. 字符编码

为了能够让计算机存储文字信息，给每一个符号对应了一个固定的数字，每次需要存储文字符号的时候就存储这个符号对应的数字。
这个数字就是这个符号编码值。

3.编码表 - 保存不同字符对应的编码值的表

1）ASCII码表
有128个符号(美国符号)
数字在大写字母的前面，大写字母在小写字母前面，大写字母和小写字母之间有间隙

2）Unicode编码表（Python）
Unicode编码表中包含了ASCII码表
Unicode包含了世界上所有的国家所有的民族的所有符号，又叫万国码
中文范围：4e00 ~ 9fa5

4.Python对编码值的使用

1)chr函数chr(编码值) - 获取编码值对应的字符

print(chr(97))     # 'a'
print(chr(0x9e00))      # '鸀'

# 打印所有中文
num = 0
for x in range(0x4e00, 0x9fa5+1):
    print(chr(x), end=' ')
    num += 1
    if num % 30 == 0:
        print()
print(num)

2)ord函数

ord(字符) - 获取字符对应的编码值

3)编码字符

\u4的16进制数 - 创建一个字符，字符就是4的16进制数作为编码值对应的字符

str1 = '\u3991\u3938\u5437'
print(str1)

x = '好'
print('\u4e00' <= x <= '\u9fa5')

2. 二进制

基数：0、1
表示方式: 加前缀0b、0B
转换方法：bin(其他进制的数)

print(0b1100)       # 12
print(12 + 1)       # 13
print(0b1100 + 1)   # 13
print(bin(12))      # 0b1100
print(bin(42))      # 0b101010

3.八进制

基数：0、1、2、3、4、5、6、7
表示方式：加前缀0o、0O
转换方式：oct(其他进制的数据)


print(0o56)     # 46

4.十六进制

基数：0、1、2、3、4、5、6、7、8、9、a/A、b/B、c/C、d/D、e/E、f/F
表示方式：加前缀0x、0X
转换方式：hex(其他进制的数)

字符串不可变，所以只支持查操作

1. 查 - 获取字符

字符串获取字符和列表获取元素对应的语法一模一样的

str1 = 'abc123'
print(str1[2], str1[-4])

print(str1[1:])    # 'bc123'
print(str1[1:-1:2])     # 'b1'
print(str1[3:1:2])      # ''

for x in str1:
    print('x:', x)

每一个有效转义字符的长度都是1

str2 = '\ta\u4e00bc\n123\\'
print(str2[1])
print(str2[3])

str2 = r'\ta\u4e00bc\n123\\'
print(str2[2])
print(str2[9])

2. in 和 not in

字符串1 in 字符串2 - 判断字符串2中是否包含字符串1（判断字符串1是否是字符串2的子串）

print('ab' in 'abc')        # True
print('a' in 'abc')         # True
print('ab' in 'acb')        # False

用三个集合表示三门学科的选课学生姓名(一个学生可以同时选多门课)

art = {'小樱', '井野', '天天', '雏田', '迪达拉'}
gym = {'佐助', '鸣人', '天天', '小樱'}
music = {'小樱', '佐助', '雏田', '鹿丸'}

求选课学生总共有多少人

stu1 = art | gym | music
print('选课学生总共有:', len(stu1))

求只选了第一个学科的人的数量和对应的名字

stu2 = art - gym - music
print("只选了第一门学科的人数为:", len(stu2))
print("只选了第一门学科的人有:", end=" ")
for x in stu2:
    print(x, end=" ")

求只选了一门学科的学生的数量和对应的名字

stu2 = art - gym - music
stu3 = gym - art - music
stu4 = music - art - gym
stu5 = stu2 | stu3 | stu4
print("只选了一门学科的人数为:", len(stu5))
print("只选了一门学科的人有:", end=" ")
for x in stu5:
    print(x, end=" ")

求只选了两门学科的学生的数量和对应的名字

stu6 = art & gym - music
stu7 = gym & music - art
stu8 = music & art - gym
stu9 = stu6 | stu7 | stu8
print("只选了两门学科的人数为:", len(stu9))
print("只选了两门学科的人有:", end=" ")
for x in stu9:
    print(x, end=" ")

求选了三门学生的学生的数量和对应的名字

stu = art.intersection(gym, music)
print("选了三门学科的人数为:", len(stu))
print("选了三门学科的人有:", end=" ")
for x in stu:
    print(x, end=" ")

输入一个字符串，打印所有奇数位上的字符(下标是1，3，5，7…位上的字符)

例如: 输入’abcd1234 ’ 输出’bd24’

str1 = input('请输入一个字符串：')
for x in range(1, len(str1), 2):
    print(str1[x], end='')

输入用户名，判断用户名是否合法(用户名长度6~10位)

str1 = input('请输入用户名：')
if 6 <= len(str1) <= 20:
    print('用户名合法')
else:
    print('用户名不合法')

输入用户名，判断用户名是否合法(用户名中只能由数字和字母组成)

例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法

str1 = input('请输入用户名：')                                                                                                                                          
for index in str1:                                                                                                                                               
    if not ('0' <= index <= '9' or 'a' <= index <= 'z' or 'A' <= index <= 'Z'):                                                                                  
        print('用户名不合法')                                                                                                                                          
        break                                                                                                                                                    
else:                                                                                                                                                            
    print('用户名合法')

输入用户名，判断用户名是否合法(用户名必须包含且只能包含数字和字母，并且第一个字符必须是大写字母)

例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法

str1 = input('请输入用户名：')                                                                               
count = 0                                                                                             
if 'A' <= str1[0] <= 'Z':                                                                             
    for index in str1:                                                                                
        if not ('0' <= index <= '9' or 'a' <= index <= 'z' or 'A' <= index <= 'Z'):                   
            print('用户名不合法')                                                                           
            break                                                                                     
        else:                                                                                         
            if '0' <= index <= '9':                                                                   
                count += 1                                                                            
    else:                                                                                             
        if count > 0:                                                                                 
            print('用户名合法')                                                                            
        else:                                                                                         
            print('用户名不合法')                                                                           
else:                                                                                                 
    print('用户名不合法')

输入一个字符串，将字符串中所有的数字字符取出来产生一个新的字符串

例如：输入**‘abc1shj23kls99+2kkk’** 输出：'123992’

str1 = input('请输入一个字符串：')
str2 = ''
for x in str1:
    if '0' <= x <= '9':
        str2 += x
print(str2)

输入一个字符串，将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)

例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'

# 方法1
str1 = input('请输入一个字符串：')
print(str1.upper())

# 方法2
str1 = input('请输入一个字符串：')
str2 = ''
for x in str1:
    if not 'a' <= x <= 'z':
        str2 += x
    elif 'a' <= x <= 'z':
        x = chr(ord(x) - 32)
        str2 += x
print(str2)

输入一个小于1000的数字，产生对应的学号

例如: 输入**‘23’，输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’，输出’py1901123’**

num = input('输入一个小于1000的数字：')
print('py1901'+num.zfill(3))

输入一个字符串，统计字符串中非数字字母的字符的个数

例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3

str1 = input('输入一个字符串：')
count = 0
for index in str1:
    if not ('0' <= index <= '9' or 'a' <= index <= 'z' or 'A' <= index <= 'Z'):
        count += 1
print(count)

输入字符串，将字符串的开头和结尾变成’+’，产生一个新的字符串

例如: 输入字符串**‘abc123’, 输出’+bc12+’**

str1 = input('请输入字符串：')
result = '+' + str1 + '+'
print(result)

输入字符串，获取字符串的中间字符

例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**

str1 = input('请输入字符串：')
length = len(str1)
if length % 2 == 0:
    print(str1[length//2-1:length//2+1])
else:
    print(str1[length // 2])

写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)

例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8

str1 = input('请输入字符串：')
str2 = input('查找的字符串：')
length1 = len(str1)
length2 = len(str2)
for i in range(length1 - length2 + 1):
    if str1[i:i + length2] == str2:
        print(i)
        break
else:
    print('没有!')

获取两个字符串中公共的字符

例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

str1 = input('请输入字符串1：')
str2 = input('请输入字符串2：')
str3 = ''
for i in str1:
    if i in str2 and i not in str3:
        str3 += i
print(str3)

标签：字符,第八天,str1,print,集合,字符串,输入
来源： https://blog.csdn.net/weixin_63123211/article/details/121833991

第八天 集合和字符串