学习笔记四十一:基于CMS的渗透
作者:互联网
CMS:
内容管理系统(content management system,CMS),是一种位于WEB前端(Web 服务器)和后端办公系统或流程(内容创作、编辑)之间的软件系统。内容的创作人员、编辑人员、发布人员使用内容管理系统来提交、修改、审批、发布内容。这里指的“内容”可能包括文件、表格、图片、数据库中的数据甚至视频等一切你想要发布到Internet、Intranet以及Extranet网站的信息。内容管理还可选地提供内容抓取工具,将第三方信息来源,比如将文本文件、HTML网页、Web服务、关系数据库等的内容自动抓取,并经分析处理后放到自身的内容库中。注:内容管理系统_百度百科 (baidu.com)
可以理解为一个模板,就是许多网站在建立的时候都会采用的模板(与这个笔记内容有交叉的是笔记三十三)
怎么识别CMS:
识别原理:
通过某项特征来识别,获得网站某个文件的MD5或者用正则表达式与字典里面的关键字进行匹配,如果匹配成功就说明这个站点是属于对应的cms的。
比如,在要识别的网站URL后加上/data/admin/ver.txt 要是反馈出的页面只有一串数字,那基本可以判断这是织梦dedecms。
或者还可以右键查看网页源码若是发现代码,则可以判断这是dedecms。
国内的在线web指纹识别系统:
- 云悉:云悉互联网WEB资产在线梳理|在线CMS指纹识别平台 - 云悉安全平台 (yunsee.cn)
- 潮汐指纹:TideFinger 潮汐指纹 TideFinger 潮汐指纹 (tidesec.net)
- who am i web指纹识别:已支持识别的的cms列表,cms识别,源码识别,在线工具--BugScaner
国外的在线web指纹识别系统:
其他工具:
用Google或者其他什么搜索引擎搜索 site:github.com cms识别工具
robots.txt文件:
robots协议也叫robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不应被搜索引擎的漫游器获取的,哪些是可以被漫游器获取的。因为一些系统中的URL是大小写敏感的,所以robots.txt的文件名应统一为小写。robots.txt应放置于网站的根目录下。如果想单独定义搜索引擎的漫游器访问子目录时的行为,那么可以将自定的设置合并到根目录下的robots.txt,或者使用robots元数据(Metadata,又称元数据)。robots协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。 注:robots协议_百度百科 (baidu.com)
404报错
其他
怎么渗透:
因为这些cms都是开源的,所以普遍是通过对这些源代码进行审计(也即是我们通常说的代码审计),经过长时间的审计与利用,很多cms就会被爆出很多漏洞及其利用方式,我们只要把相应的请求发到目标网站,就可以成功利用,并获取到漏洞带来的权益。
标签:识别,CMS,robots,笔记,四十一,内容,txt,cms 来源: https://www.cnblogs.com/ling-chen/p/15755407.html