mysql-在数据库中存储距离矩阵
作者:互联网
我需要在网页上显示城市附近所有位置的距离矩阵.
我想从Web服务中获取所有这些数据并预先保存在数据库中.
我试图找出最佳的关系数据库设计来保存此类数据.
我要避免冗余数据,也要避免提供最佳性能的设计.
我知道,关系数据库不是为此的最佳选择,但是这是我目前不禁要解决的问题.
问题:那么,存储此类信息的最佳数据库模式设计是什么?我只需要查询仅提供一个城市的数据库,就必须显示5或10个最近城市的矩阵.
出行时间并不重要,我主要关注距离.
解决方法:
为了提高性能,并假设您使用的是InnoDB,我可能会对数据进行非规范化,如下所示:
CREATE TABLE CITY (
CITY_ID INT PRIMARY KEY
);
CREATE TABLE CITY_DISTANCE (
CITY1_ID INT,
CITY2_ID INT,
DISTANCE NUMERIC NOT NULL,
PRIMARY KEY (CITY1_ID, DISTANCE, CITY2_ID),
FOREIGN KEY (CITY1_ID) REFERENCES CITY (CITY_ID),
FOREIGN KEY (CITY2_ID) REFERENCES CITY (CITY_ID)
);
每对城市在CITY_DISTANCE中有2行,每行包含相同的DISTANCE(每个方向一个).显然,这可能会使它变得非常大,并可能导致数据不一致(数据库无法保护自己免受相同城市之间不匹配的DISTANCE值的影响),并且DISTANCE在逻辑上不属于PK,但请耐心等待…
InnoDB tables are clustered,这意味着通过以这种特定方式声明PK,我们将整个表放入B-Tree,该树特别适合于这样的查询:
SELECT CITY2_ID, DISTANCE
FROM CITY_DISTANCE
WHERE CITY1_ID = 1
ORDER BY DISTANCE
LIMIT 5
该查询返回最接近的5个城市(由1标识),并且可以通过上述B树上的简单范围扫描来满足:
id select_type table type possible_keys key key_len ref rows Extra
1 SIMPLE CITY_DISTANCE ref PRIMARY PRIMARY 4 const 6 "Using where; Using index"
顺便说一句,由于第二个FK,InnoDB将自动在CITY2_ID上再创建一个索引,该索引还将包括CITY1_ID和DISTANCE,因为聚簇表中的二级索引必须包含PK.您可能可以利用它来避免重复的DISTANCE(在{CITY2_ID,DISTANCE,CITY1_ID}上明确创建索引,并让FK重用它,并检查(CITY1_ID< CITY2_ID)),但是MySQL查询优化器可能不够聪明,无法处理在这种结构上需要的查询.
标签:database-design,mysql,database 来源: https://codeday.me/bug/20191127/2075915.html