首页 > 数据库> > 自己设计大学排名—数据库实践

自己设计大学排名—数据库实践

2019-06-05 15:37:48 作者：互联网

一、操作数据库（以SQLite3为例）

　　SQLite3 可使用 sqlite3 模块与 Python 进行集成。sqlite3 模块是由 Gerhard Haring 编写的。它提供了一个与 PEP 249 描述的 DB-API 2.0 规范兼容的 SQL 接口。我们不需要单独安装该模块，因为 Python 2.5.x 以上版本默认自带了该模块。

为了使用 sqlite3 模块，首先必须创建一个表示数据库的连接对象，然后可以有选择地创建光标对象，这将帮助执行所有的 SQL 语句。

API	描述
sqlite3.connect(database [,timeout ,other optional arguments])	该 API 打开一个到 SQLite 数据库文件 database 的链接。您可以使用 ":memory:" 来在 RAM 中打开一个到 database 的数据库连接，而不是在磁盘上打开。如果数据库成功打开，则返回一个连接对象。当一个数据库被多个连接访问，且其中一个修改了数据库，此时 SQLite 数据库被锁定，直到事务提交。timeout 参数表示连接等待锁定的持续时间，直到发生异常断开连接。timeout 参数默认是 5.0（5 秒）。如果给定的数据库名称 filename 不存在，则该调用将创建一个数据库。如果您不想在当前目录中创建数据库，那么您可以指定带有路径的文件名，这样您就能在任意地方创建数据库。
connection.cursor([cursorClass])	该例程创建一个 cursor，将在 Python 数据库编程中用到。该方法接受一个单一的可选的参数 cursorClass。如果提供了该参数，则它必须是一个扩展自 sqlite3.Cursor 的自定义的 cursor 类。
cursor.execute(sql [, optional parameters])	该例程执行一个 SQL 语句。该 SQL 语句可以被参数化（即使用占位符代替 SQL 文本）。sqlite3 模块支持两种类型的占位符：问号和命名占位符（命名样式）。例如：cursor.execute("insert into people values (?, ?)", (who, age))
connection.execute(sql [, optional parameters])	该例程是上面执行的由光标（cursor）对象提供的方法的快捷方式，它通过调用光标（cursor）方法创建了一个中间的光标对象，然后通过给定的参数调用光标的 execute 方法。
cursor.executemany(sql, seq_of_parameters)	该例程对 seq_of_parameters 中的所有参数或映射执行一个 SQL 命令。
connection.executemany(sql[, parameters])	该例程是一个由调用光标（cursor）方法创建的中间的光标对象的快捷方式，然后通过给定的参数调用光标的 executemany 方法。
cursor.executescript(sql_script)	该例程一旦接收到脚本，会执行多个 SQL 语句。它首先执行 COMMIT 语句，然后执行作为参数传入的 SQL 脚本。所有的 SQL 语句应该用分号（;）分隔。
connection.executescript(sql_script)	该例程是一个由调用光标（cursor）方法创建的中间的光标对象的快捷方式，然后通过给定的参数调用光标的 executescript 方法。
connection.total_changes()	该例程返回自数据库连接打开以来被修改、插入或删除的数据库总行数。
connection.commit()	该方法提交当前的事务。如果您未调用该方法，那么自您上一次调用 commit() 以来所做的任何动作对其他数据库连接来说是不可见的。
connection.rollback()	该方法回滚自上一次调用 commit() 以来对数据库所做的更改。
connection.close()	该方法关闭数据库连接。请注意，这不会自动调用 commit()。如果您之前未调用 commit() 方法，就直接关闭数据库连接，您所做的所有更改将全部丢失！
cursor.fetchone()	该方法获取查询结果集中的下一行，返回一个单一的序列，当没有更多可用的数据时，则返回 None。
cursor.fetchmany([size=cursor.arraysize])	该方法获取查询结果集中的下一行组，返回一个列表。当没有更多的可用的行时，则返回一个空的列表。该方法尝试获取由 size 参数指定的尽可能多的行。
cursor.fetchall()	该例程获取查询结果集中所有（剩余）的行，返回一个列表。当没有可用的行时，则返回一个空的列表。

接下来演示一些关于数据库的基础操作

　　　　• 连接数据库

　　　　　　下面操作是连接到一个现有的数据库，如果数据库不存在，则它会被创建，最后将返回一个数据库对象。

1 import sqlite3
2 
3 conn = sqlite3.connect('test.db')
4 
5 print("Opened database successfully")

　如果数据库成功创建，那么会显示此语句:

　　　　　　Open database successfully

　　　　• 创建表

　　　　　　下面操作是在先前创建的数据库中创建一个表。

 1 import sqlite3
 2 
 3 conn = sqlite3.connect('test.db')
 4 print("Opened database successfully")
 5 c = conn.cursor()
 6 c.execute('''CREATE TABLE COMPANY
 7        (ID INT PRIMARY KEY     NOT NULL,
 8        NAME           TEXT    NOT NULL,
 9        AGE            INT     NOT NULL,
10        ADDRESS        CHAR(50),
11        SALARY         REAL);''')
12 print("Table created successfully")
13 conn.commit()
14 conn.close()

　• INSERT操作

　　　　　　下面操作是在先前创建的表中创建记录。

 1 import sqlite3
 2 
 3 conn = sqlite3.connect('test.db')
 4 c = conn.cursor()
 5 print("Opened database successfully")
 6 
 7 c.execute("INSERT INTO COMPANY (ID,NAME,AGE,ADDRESS,SALARY) \
 8       VALUES (1, 'Paul', 32, 'California', 20000.00 )");
 9 
10 c.execute("INSERT INTO COMPANY (ID,NAME,AGE,ADDRESS,SALARY) \
11       VALUES (2, 'Allen', 25, 'Texas', 15000.00 )");
12 
13 c.execute("INSERT INTO COMPANY (ID,NAME,AGE,ADDRESS,SALARY) \
14       VALUES (3, 'Teddy', 23, 'Norway', 20000.00 )");
15 
16 c.execute("INSERT INTO COMPANY (ID,NAME,AGE,ADDRESS,SALARY) \
17       VALUES (4, 'Mark', 25, 'Rich-Mond ', 65000.00 )");
18 
19 conn.commit()
20 print("Records created successfully")
21 conn.close()

　• SELECT操作

　　　　　　　下面操作是获取先前创建表的数据并显示。

1 import sqlite3
 2 
 3 conn = sqlite3.connect('test.db')
 4 c = conn.cursor()
 5 print("Opened database successfully")
 6 
 7 cursor = c.execute("SELECT id, name, address, salary  from COMPANY")
 8 for row in cursor:
 9    print("ID = ", row[0])
10    print("NAME = ", row[1])
11    print("ADDRESS = ", row[2])
12    print("SALARY = ", row[3], "\n")
13 
14 print("Operation done successfully")
15 conn.close()

效果如下：

　　　　• UPDATE操作

　　　　　　　下面操作是使用UPDATE语句更新任何记录，然后从表中获取并显示更新的记录。

 1 import sqlite3
 2 
 3 conn = sqlite3.connect('test.db')
 4 c = conn.cursor()
 5 print("Opened database successfully")
 6 
 7 c.execute("UPDATE COMPANY set SALARY = 25000.00 where ID=1")
 8 conn.commit()
 9 print("Total number of rows updated :", conn.total_changes)
10 
11 cursor = conn.execute("SELECT id, name, address, salary  from COMPANY")
12 for row in cursor:
13    print("ID = ", row[0])
14    print("NAME = ", row[1])
15    print("ADDRESS = ", row[2])
16    print("SALARY = ", row[3], "\n")
17 
18 print("Operation done successfully")
19 conn.close()

　效果如下：

　　　　• DELETE操作

　　　　　　　下面操作是使用DELETE语句删除任何记录，然后从表中获取并显示剩余的记录。

 1 import sqlite3
 2 
 3 conn = sqlite3.connect('test.db')
 4 c = conn.cursor()
 5 print("Opened database successfully")
 6 
 7 c.execute("DELETE from COMPANY where ID=2;")
 8 conn.commit()
 9 print("Total number of rows deleted :", conn.total_changes)
10 
11 cursor = conn.execute("SELECT id, name, address, salary  from COMPANY")
12 for row in cursor:
13    print("ID = ", row[0])
14    print("NAME = ", row[1])
15    print("ADDRESS = ", row[2])
16    print("SALARY = ", row[3], "\n")
17 
18 print("Operation done successfully")
19 conn.close()

　效果如下：

二、实例操作（2015大学排名）

根据上周作业，制作了2015年大学排名的csv文件，下面的操作都将基于该csv文件进行。

　　• 将csv文件写入数据库

　　　　代码如下：

1 # -*- coding: utf-8 -*-
 2 """
 3 Created on Fri May 31 12:33:56 2019
 4 
 5 @author: Regan_White_Lin    12
 6 """
 7 
 8 import pandas
 9 import sqlite3
10 conn= sqlite3.connect("2015大学排名(12).db")
11 k = pandas.read_csv('2015中国大学排名爬虫.csv',encoding='gbk')
12 k.to_sql('University', conn, if_exists='append', index=False)
13 print('success') 
14 conn = sqlite3.connect('2015大学排名(12).db')
15 cur = conn.cursor()
16 cur.execute('SELECT * FROM University')
17 li = cur.fetchall()   
18 i=0               
19 for line in li:
20     i+=1
21     for item in line:
22         print(item, end=' ')
23     print()
24     if i==192:
25         break
26 conn.close()

　输出结果：

　　　　数据较多···

　　• 查询本校排名及得分

　　　　代码如下：

 1 # -*- coding: utf-8 -*-
 2 """
 3 Created on Fri May 31 12:54:03 2019
 4 
 5 @author: Regan_White_Lin        12
 6 """
 7 
 8 import sqlite3
 9 conn= sqlite3.connect("2015大学排名(12).db")
10 cur = conn.cursor()
11 cur.execute('SELECT * FROM University')
12 li = cur.fetchall()                  #返回所有查询结果
13 for line in li:
14     if "广东技术师范大学" in line:
15         print(line)
16         break
17 else:
18     print("查无该校数据")
19 conn.close()

　输出结果：

　　　　后来我自己自行在该csv文件中寻找“广东技术师范大学”，发现真的没有排名（非常难受），为了确定是真的没有而非程序本身问题，我再查询了一下中山大学，得到的结果是这样的：

　　　　看来程序本身没有问题，确实可以查找学校数据。

　　• 查询并显示广东省学校的排名及得分

代码如下：

 1 # -*- coding: utf-8 -*-
 2 """
 3 Created on Fri May 31 13:07:46 2019
 4 
 5 @author: Regan_White_Lin       12
 6 """
 7 
 8 import sqlite3
 9 conn= sqlite3.connect("2015大学排名(12).db")
10 cur = conn.cursor()
11 cur.execute('SELECT * FROM University')
12 li = cur.fetchall()                  #返回所有查询结果
13 for line in li:
14     if "广东" in line:
15         print("{} {} {} {}".format(line[0],line[1],line[2],line[5]))
16 conn.close()

　　输出结果：

三、对广东省内大学的排名

　　在上面，我们已经输出了广东省内大学的名单，但是它们的排序方式仍然是原始的综合排名，而我们想要让名单根据某一特定方式排序（即根据各项数据进行权重分配，权重大的优先排序，次者次排序以此类推），首先将得到的名单先输出为csv文件格式，再将它写入数据库的一个新表中。

代码（输出为csv格式文件）如下：

1 # -*- coding: utf-8 -*-
 2 """
 3 Created on Fri May 31 13:07:46 2019
 4 
 5 @author: Regan_White_Lin        12
 6 """
 7 
 8 import sqlite3
 9 import pandas
10 def saveAsCsv(filename, tabel_list):
11     FormData = pandas.DataFrame(tabel_list)
12     FormData.columns = ["排名","学校名称","省市","总分","生源质量","培养结果","人才培养得分"]
13     FormData.to_csv(filename,encoding="gbk")
14     
15 conn= sqlite3.connect("2015大学排名(12).db")
16 cur = conn.cursor()
17 cur.execute('SELECT * FROM University')
18 li = cur.fetchall()   
19             #返回所有查询结果
20 list=[]
21 for line in li:
22     if "广东" in line:
23         list.append(line)
24         print("{} {} {} {}".format(line[0],line[1],line[2],line[5]))
25 saveAsCsv("2015广东大学排名爬虫.csv", list)
26 conn.close()

代码（将数据写入数据库的新表）如下：

1 # -*- coding: utf-8 -*-
 2 """
 3 Created on Fri May 31 12:33:56 2019
 4 
 5 @author: Regan_White_Lin        12
 6 """
 7 
 8 import pandas
 9 import sqlite3
10 conn= sqlite3.connect("2015大学排名(12).db")
11 k = pandas.read_csv('2015广东大学排名爬虫.csv',encoding='gbk')
12 k.to_sql('Guangdong', conn, if_exists='append', index=False)
13 print('success') 
14 conn = sqlite3.connect('2015大学排名(12).db')
15 cur = conn.cursor()
16 cur.execute('SELECT * FROM Guangdong')
17 li = cur.fetchall()   
18 i=0               
19 for line in li:
20     i+=1
21     for item in line:
22         print(item, end=' ')
23     print()
24     if i==10:
25         break
26 conn.close()

效果如下：

根据培养结果，从高到低排序结果如下：

标签：12,大学排名,数据库,实践,cursor,sqlite3,print,conn
来源： https://www.cnblogs.com/meirenjiajing/p/10979907.html