其他分享
首页 > 其他分享> > 实验八 文件

实验八 文件

作者:互联网

安徽工程大学

Python 程序设计 实验报告

班级_物流192__________姓名__吴陈燕________

学号_3190505219__________成绩___________

日期_2020.06.03___________指导教师____修宇_______

 

 

实验八  文件

 

【实验目的】  

       掌握读写文本文件或 CSV 文件,进而对数据进行处理的方法。

【实验条件】  

PC机或者远程编程环境

【实验内容】

完成二个编程题。

一,水浒传词频统计

水浒传-词频统计

描述

使用词频统计的方法,生成《水浒传》出场次数最多的10个人物的姓名。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

 水浒传文本下载:

 

 

读取《水浒传》文本文件的代码如下:‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

txt = open("AllManAreBrothers.txt", "r", encoding="utf-8").read()

 

代码模板:

# ThreeKingdomsV2

import jieba

# 读取txt文件,获取需要统计词汇的文本

txt = open("AllManAreBrothers.txt", "r", encoding="utf-8").read()

# 设置需要输出最多的前n位人物的数量

n = 10

# 请在下列exludes集合中,自行补充其他需要排除的词汇

excludes = {

    "两个", "一个", "只见", "如何", "那里", "哥哥",

}

words = jieba.lcut(txt)

counts = {}

# 请扩展下列分支结构,转换更多替代词

for word in words:

    if len(word) == 1:

        continue

    elif word == "宋江道":

        rword = "宋江"

    else:

        rword = word

    counts[rword] = counts.get(rword, 0) + 1

    

# 实现删除干扰词汇功能(此处约2行代码)    

# 使用列表和lambda功能实现 词汇的排序 (此处约2行代码)    

# 依次输出统计次数最多的前n位(此处约3行代码)  

【实验记录】

(1)第一次输入,书写错误,如图代码第23行elif判断语句后忘记加“:”冒号

 

 

(2)第二次错误提示:未定位名称Ture,如图,单词拼写错误,“true”写成了“ture”

 

 

(3)第三次错误提示:期望输出与我的输出不符,如图,反复检查发现错误,修改后正确

 

 

二,血压心率分析

描述

BP.txt”是以逗号分隔的日期、血压、心率记录数据文本文件( open('BP.txt',encoding="gbk"))

 

 

 

统计收缩压、舒张压、心率的总平均值(保留3位小数)。

 

【实验记录】

(1)第一次错误提示:文件未找到错误,如图,单词大小写错误,将“BP”写成了“Bp”

 

 

(2)第二次输出格式不同,输出格式中的冒号是中文版“:”修改后正确,如图所示

 

 

标签:文件,rword,word,水浒传,代码,实验,txt
来源: https://www.cnblogs.com/521092521388wcy/p/13035275.html