Nginx

分析Nginx日志统计每个IP访问状态码数量（$status）？

参考答案：

要分析Nginx日志并统计每个IP访问的状态码数量，你可以使用awk、grep、sort、uniq和cut等Unix/Linux命令行工具。以下是一个基本的步骤和命令示例：

日志格式：首先，确保你知道Nginx的日志格式。默认情况下，Nginx的访问日志可能类似于以下格式：

127.0.0.1 - - [10/Oct/2023:13:55:36 +0000] "GET / HTTP/1.1" 200 612 "-" "Mozilla/5.0 ..."

其中，200是状态码。 2. 提取IP和状态码：使用awk从日志中提取IP和状态码：

awk '{print $1,$status}' access.log

这将输出每行的IP和状态码。 3. 统计每个IP的每个状态码的数量：为了统计每个IP的每个状态码的数量，你可以使用sort和uniq -c命令：

awk '{print $1,$status}' access.log | sort | uniq -c

但这样只会给出每个唯一的IP和状态码组合的数量，而不是按IP分组的状态码数量。要按IP分组并列出其每个状态码的数量，你需要更复杂的awk脚本或使用其他工具如perl或python。 4. 使用更复杂的awk脚本进行统计：以下是一个更复杂的awk脚本，用于按IP分组并列出其每个状态码的数量：

awk '{count[$1 ":" $status]++} END {for (line in count) print line, count[line]}' access.log | sort

这将输出每个IP和状态码的组合及其出现的次数。为了更清晰地查看，你可能还想按IP进行分组并列出其所有状态码：

awk '{count[$1 "," $status]++} END {for (ip in count) {printf "%s: ", ip; for (status in count) {if (index(status, ip) == 1) {print count[status] " (" status ")"}} print ""}}' access.log | sort

这个命令稍微复杂一些，但它会为每个IP列出其所有状态码及其数量。 5. 使用其他工具或语言：除了awk之外，你还可以使用其他工具或编程语言（如Python、Perl等）来分析日志并生成所需的统计信息。这些工具通常提供更强大的文本处理和数据分析能力。 6. 注意事项： * 确保你的Nginx日志没有轮换或压缩，否则你需要考虑如何处理这些文件。 * 如果你的日志文件非常大，处理它们可能需要一些时间，并可能消耗大量内存。在这种情况下，考虑使用更高效的工具或方法，或者将大文件分割成较小的部分进行处理。