URL的格式及钓鱼网站识别基础知识

URL是指:Uniform Resource Locator,也就是统一资源定位器。一般情况下每个URL指向一个资源,当然动态网页可以根据一些条件(如访问者的IP)来动态调整网页的内容。URL指向的资源可以是一个网页,一个图片,一个CSS样式表,或者是一个供用户下载的应用程序、文档或者其他格式的文件。在网络畅通的情况下,我们在浏览器的地址栏输入URL地址就可以打开对应的资源。

完整的URL格式:

格式 abc :// user : password @ host. domain /folder /file.htm ? key1=v1&key2=v2 # fragment
说明 协议 用户名 密码 主机 域名 目录 文件名 参数 书签
举例 http :// abc : 123 @ www. zhaoxugeng.cn /blog/article /index.php ? type=list&category=1 # top

说明:▲代表分隔符号

我们平时访问网站的时候并没有输入这么多的信息,也就是说许多项目是可选的。

协议:常见的有http,https, ftp,rtmp等,如果我们不输入,则一般情况下浏览器默认为http。

用户名和密码:公开访问的网站一般不需要,部分ftp服务器支持直接用这种格式登录。

主机和域名:域名是网站所有者注册的一个名称,具有唯一性。主机名加域名有时也被认为是二级域名。网站通常使用www作为主机名。部分网站也支持IP地址访问,也就是说用IP地址代替主机名加域名。

目录和文件名:被访问的资源在服务器上的相对目录位置。如果不写,根据服务器配置的不同,一般默认为index.htm、 default.htm、 index.html、 default.html、 index.php、 default.php、 index.asp、 default.asp等。进入网站首页后通过点击首页的各个链接进入相应页面,省去了记忆复杂目录结构的麻烦。

参数:传入服务器的参数用于服务器判断用户行为以便提供个性化的显示。

书签:定位显示的页面。

由上面的分析可以看出:只有域名是统一注册且全网唯一的,其余的信息都可以由网站设计者自由定义。例如本站的域名是zhaoxugeng.cn,cn是中国国家域名,类似的还有tw是中国台湾的域名,hk是中国香港的域名,mo是中国澳门的域名,sd.cn是中国山东的域名,he.cn是中国河北,hb.cn是中国湖北等。四大行的域名:

中国银行:boc.cn
中国农业银行:abchina.com
中国工商银行:icbc.com.cn
中国建设银行:ccb.com

域名是从后往前看的,以下域名都不是中行的域名(为了防止误点击或者误收录,所有字母用单元格分开):

w w w . b o c 111 . cn
w w w . b o c .xxxx . cn
w w w . b o c .cn @ xxxx.cn