![大数据平台异常检测分析系统的若干关键技术研究](https://wfqqreader-1252317822.image.myqcloud.com/cover/238/33692238/b_33692238.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.2 日志
本书以Web日志为主要研究对象,通过分析Web日志可得到用户访问网站的特性,包括其频率和内容。目前常见的两种Web日志格式是Apache的NCSA日志格式和IIS的W3C日志格式。图2.1所示为一个基于NCSA扩展Web日志格式的Apache日志样例。
![img](https://epubservercos.yuewen.com/71F883/18002371101924606/epubprivate/OEBPS/Images/txt002_1.jpg?sign=1739582002-5bkcNvjAsygjjWDGk48WVsEOK69K1qCC-0-6df672055f6907bf7fc8f6146073eb2c)
图2.1 基于NCSA扩展Web日志格式的Apache日志样例
一条Web日志表示用户的一次请求,包括请求的资源路径、用户的来源地址、日期和时间、状态码、传输字节数等字段。表2.1所示为日志中的各字段及其字段含义。
表2.1 日志中的各字段及其字段含义
![img](https://epubservercos.yuewen.com/71F883/18002371101924606/epubprivate/OEBPS/Images/txt002_2.jpg?sign=1739582002-jzAtKAHRApPMBvOvuIyPClISiM9SQvVm-0-522880aa90921594a08b0d35baa699bf)
(续表)
![img](https://epubservercos.yuewen.com/71F883/18002371101924606/epubprivate/OEBPS/Images/txt002_3.jpg?sign=1739582002-psgv25CmdPQCXY0du298N03hpc0dGeCC-0-5450d373b49fb23389a4b9507b0a9d67)