使用python解析抽取url中各级域名信息

使用python解析抽取url中各级域名信息

又是周五了,又有饭局了….  大家在分析日志及数据分析的时候,会遇到一些url抽取域名信息的需求。虽然urlparse可以把所有的域名给提取出来,但是不能精确到一级域名,二级域名,x级域名。

下面是我封装的一个小模块,性能还可以…至于代码实现也比较的简单,就是预先加载一些常用的域名的后缀,然后用re正则来模糊匹配。

项目名字, ExtractLevelDomain

功能介绍, 通过URL抽取各层各级的域名(一级域名,二级域名….) . 这模块本来是用来分析日志及数据分析的.

pypi install

source install

Usage Document:

END….

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">