数据库
首页 > 数据库> > mysql-在数据库中存储距离矩阵

mysql-在数据库中存储距离矩阵

作者:互联网

我需要在网页上显示城市附近所有位置的距离矩阵.

我想从Web服务中获取所有这些数据并预先保存在数据库中.
我试图找出最佳的关系数据库设计来保存此类数据.

我要避免冗余数据,也要避免提供最佳性能的设计.

我知道,关系数据库不是为此的最佳选择,但是这是我目前不禁要解决的问题.

问题:那么,存储此类信息的最佳数据库模式设计是什么?我只需要查询仅提供一个城市的数据库,就必须显示5或10个最近城市的矩阵.

出行时间并不重要,我主要关注距离.

解决方法:

为了提高性能,并假设您使用的是InnoDB,我可能会对数据进行非规范化,如下所示:

CREATE TABLE CITY (
    CITY_ID INT PRIMARY KEY
);

CREATE TABLE CITY_DISTANCE (
    CITY1_ID INT,
    CITY2_ID INT,
    DISTANCE NUMERIC NOT NULL,
    PRIMARY KEY (CITY1_ID, DISTANCE, CITY2_ID),
    FOREIGN KEY (CITY1_ID) REFERENCES CITY (CITY_ID),
    FOREIGN KEY (CITY2_ID) REFERENCES CITY (CITY_ID)
);

每对城市在CITY_DISTANCE中有2行,每行包含相同的DISTANCE(每个方向一个).显然,这可能会使它变得非常大,并可能导致数据不一致(数据库无法保护自己免受相同城市之间不匹配的DISTANCE值的影响),并且DISTANCE在逻辑上不属于PK,但请耐心等待…

InnoDB tables are clustered,这意味着通过以这种特定方式声明PK,我们将整个表放入B-Tree,该树特别适合于这样的查询:

SELECT CITY2_ID, DISTANCE
FROM CITY_DISTANCE
WHERE CITY1_ID = 1
ORDER BY DISTANCE
LIMIT 5

该查询返回最接近的5个城市(由1标识),并且可以通过上述B树上的简单范围扫描来满足:

id  select_type table           type    possible_keys   key     key_len ref     rows    Extra
1   SIMPLE      CITY_DISTANCE   ref     PRIMARY         PRIMARY 4       const   6       "Using where; Using index"

顺便说一句,由于第二个FK,InnoDB将自动在CITY2_ID上再创建一个索引,该索引还将包括CITY1_ID和DISTANCE,因为聚簇表中的二级索引必须包含PK.您可能可以利用它来避免重复的DISTANCE(在{CITY2_ID,DISTANCE,CITY1_ID}上明确创建索引,并让FK重用它,并检查(CITY1_ID< CITY2_ID)),但是MySQL查询优化器可能不够聪明,无法处理在这种结构上需要的查询.

标签:database-design,mysql,database
来源: https://codeday.me/bug/20191127/2075915.html