Мониторинг качеството на нета
Wednesday, March 11th, 2009Терминът "качество на нета" по-скоро е взет от някой тинейджърски журнал, но уцелва точно нуждите на крайния клиент. Аз като клиент на моя ISP се нуждая от две неща - ниска (по възможност - никаква) загуба на пакети и ниско (по възможност - никакво) забавяне на пакетите. Това трябва да ми се поднесе разбираемо, с картинка.
Нужен софтуер:
- RRDtool - има страхотни възможности за представяне на числова информация. За примерни графики вижте галерията им.
- ping - резултата от изпълнението на ping съдържа всичко необходимо за изграждане на статистиката ни - Round trip time и Packet loss
- Perl - или друг удобен ви език. Трябва ви за парсване на изхода от ping
- crontab - искаме статистиката да се събира през определен интервал от време
Системата може да бъде разделена на две части: част за събиране на статистика и част за графично представяне на данните.
Събиране на статистика
На всеки 5 минути ще се пуска ping до няколко избрани хоста в различни зони на пиъринга. Естествено върнатите резултати ще са субективни, защото зависят от параметрите на отсрещната точка. Все пак цялото задание "качество на нета" е субективно, така че да продължаваме
Избрал съм единия хост да бъде шлюза на доставчика ми, втория хост да бъде dir.bg (тест на bg пиъринга) и третия хост да бъде ivanatora.info (за тест на международната свързаност).
Логът се изгражда от следния скрипт:
/home/ivanatora/perl_razni/ping_stats.pl
-
-
#!/usr/bin/perl
-
$target = $ARGV[0]; # тук ще идва адреса на целта
-
$db = $ARGV[1]; # тук ще идва в коя база ще се записва
-
$dump = "/home/ivanatora/stats_ping/$target.log"; # лога с крайните резултати
-
$rrd_path = "/home/ivanatora/rrd/temps/pings"; # директорията с RRD базите
-
$mon++;
-
$year += 1900;
-
$output = `/bin/ping -q -c100 -w100 $target`; # пуска ping със 100 пакета и чака максимално 100 секунди за изпълнението на командата
-
-
if ($output =~ /(\d+?)% packet loss/){
-
$loss = $1;
-
}
-
if ($output =~ /rtt min\/avg\/max\/mdev = .+?\/(.+?)\//){
-
$avg = $1;
-
print FH "$time : $percent% loss to $target Average: $1 ms\n";
-
# update RRD
-
$ts = time;
-
$mod = $ts % 300;
-
$ts -= $mod;
-
$avg =~ /^(.+?)\./;
-
$rtt = $1;
-
`/home/ivanatora/rrd/bin/rrdtool update $rrd_path/$db.rrd $ts:$loss:$rtt`; # командата за ъпдейт на базата; TODO: да направя пътя до изпълнимия файл на rrdtool в променлива
-
}
-
Малко изпреварвам времето, защото още не сме създали RRD базите. Каква е идеята на RRD? Round Robin Database е способ за запазване на постоянно изменяща се информация във времето, като всяка промяна се регистрира в цикличен буфер. Ако имаме един буфер със 12 слота и ъпдейтваме базата през 5 минути, във всеки момент ще имаме данните от предния час. Какво става с по-старите данни - губят ли се? Да. Ако ни трябват ще направим още един буфер, който ще се ъпдейтва на всяко цялостно извъртане на часовия буфер - ще взима средната стойност на всички измервания и ще го записва в един негов слот. Така ако този буфер има 24 слота ще имаме статистика на средната часова стойност на измерванията. Може да имате колкото си искате вторични буфери и всички се съхраняват в една и съща база и се ъпдейтват автоматично. Освен това в един буфер може да пазите стойностите на няколко променливи. Предимствата на RRD е че всяка промяна се регистрира, като размера на базата не нараства линейно във времето.
До тук вероятно имаме лог с нещо такова:
/home/ivanatora/stats_ping/dir.bg.log
11/03/2009 00:05:01 : 0% loss to dir.bg Average: 7.271 ms
11/03/2009 00:10:01 : 0% loss to dir.bg Average: 9.091 ms
11/03/2009 00:15:01 : 0% loss to dir.bg Average: 7.466 ms
11/03/2009 00:20:01 : 1% loss to dir.bg Average: 7.152 ms
11/03/2009 00:25:01 : 0% loss to dir.bg Average: 8.273 ms
11/03/2009 00:30:01 : 0% loss to dir.bg Average: 6.863 ms
11/03/2009 00:35:01 : 0% loss to dir.bg Average: 11.690 ms
Този лог може да използваме за каквото си искаме, а може и въобще да не го правим. Горния скрипт работи ъпдейтва директно rrdtool, така че ако не искате излишни логове да се пазят на машината ви насочете $dump = "/dev/null"; ![]()
Създаване на RRD бази.
За всеки изследван хост ще направим по една база. В тази база ще се съхраняват стойностите за Round Trip Time и Packet Loss.
Правим си следното bash скриптче (освен ако не ви мързи да го пишете на ръка за всяка база - може да имате и повече от три бази):
-
-
#!/bin/bash
-
NOW=`date +%s`
-
rrdtool create $1.rrd --start $NOW --step 300 \
-
DS:PacketLoss:GAUGE:300:0:100 \
-
DS:RTT:GAUGE:300:0:10000 \
-
RRA:LAST:0.5:1:288 \
-
RRA:AVERAGE:0.5:6:336 \
-
RRA:AVERAGE:0.5:24:360 \
-
RRA:AVERAGE:0.5:288:365
-
Подробностите за синтаксиса можете да намерите в документацията на RRDtool. На кратко - създаваме база с 2 източника на данни (променливи, които ще следим): PacketLoss и RTT. Задават се интервалите на ъпдейт на всеки източник,минимални и максимални допустими стойности. След това се правят 4 Round Robin Archives (буферите, за които говорихме по-рано).
Създаваме трите бази:
[ivanatora@~/rrd/temps/pings]$ sh create_script.sh bg
[ivanatora@~/rrd/temps/pings]$ sh create_script.sh gw
[ivanatora@~/rrd/temps/pings]$ sh create_script.sh int
Слагаме cronjob за изпълнение на ъпдейтващия скрипт на 5 минути:
*/5 * * * * perl /home/ivanatora/perl_razni/ping_stats.pl 87.120.194.1 gw
*/5 * * * * perl /home/ivanatora/perl_razni/ping_stats.pl dir.bg bg
*/5 * * * * perl /home/ivanatora/perl_razni/ping_stats.pl ivanatora.info int
Както видяхме скрипта приема два аргумента: адрес за ping и име на базата, която ъпдейтва.
Рисуване на графиките
Ще имаме отделна графика за всяка следена величина. Може да комбинираме няколко от графиките на една, но само ако очаквате там приблизително еднакви резултати. Големите отклонения на величините карат rrdtool да измества разделителната способност на графиката и една от графиките в общата картинка не се вижда добре. Ще имаме два скрипта за чертане на графики - един за Round Trip Time и един за Packet Loss.
/home/ivanatora/rrd/temps/pings/loss_graph.sh
-
-
#!/bin/bash
-
PATH=$PATH:/home/ivanatora/rrd/bin
-
DIR=/home/ivanatora/rrd/temps/pings/
-
rrdtool graph $DIR/img/loss-$1.png \
-
--title="<$1> Packet loss" \
-
--color CANVAS#000000 \
-
--color BACK#000000 \
-
--color GRID#006600 \
-
--color MGRID#003300 \
-
--color AXIS#00ff00 \
-
--color FONT#00ff00 \
-
--color SHADEA#000000 \
-
--color SHADEB#000000 \
-
--slope-mode \
-
--upper-limit 100 \
-
--rigid \
-
--width 480 \
-
--height 300 \
-
--font DEFAULT:10:Arial \
-
DEF:loss=$DIR/$1.rrd:PacketLoss:LAST \
-
DEF:rtt=$DIR/$1.rrd:RTT:LAST \
-
AREA:loss#00FF00:"Packet loss (%)"
-
/home/ivanatora/rrd/temps/pings/rtt_graph.sh
-
-
#!/bin/bash
-
PATH=$PATH:/home/ivanatora/rrd/bin
-
DIR=/home/ivanatora/rrd/temps/pings/
-
rrdtool graph $DIR/img/rtt-$1.png \
-
--title="<$1> Round trip time" \
-
--color CANVAS#000000 \
-
--color BACK#000000 \
-
--color GRID#006600 \
-
--color MGRID#003300 \
-
--color AXIS#00ff00 \
-
--color FONT#00ff00 \
-
--color SHADEA#000000 \
-
--color SHADEB#000000 \
-
--slope-mode \
-
--width 480 \
-
--height 300 \
-
--font DEFAULT:10:Arial \
-
DEF:loss=$DIR/$1.rrd:PacketLoss:LAST \
-
DEF:rtt=$DIR/$1.rrd:RTT:LAST \
-
AREA:rtt#00FF00:"Round trip time (ms)"
-
Тук можем да си поиграем с цветовете и крайния резултат да е доста eye-candy. Важните редове са DEF - където се извличат стойностите на променливите от базата и AREA - самото изчертаване. За повече подробности - документацията на RRDtool.
След това правим един скрипт, който да задейства изчертаване на всички графики:
/home/ivanatora/rrd/temps/pings/graph_all.sh
-
-
#!/bin/bash
-
DIR=/home/ivanatora/rrd/temps/pings/
-
$DIR/loss_graph.sh int
-
$DIR/loss_graph.sh bg
-
$DIR/loss_graph.sh gw
-
$DIR/rtt_graph.sh int
-
$DIR/rtt_graph.sh bg
-
$DIR/rtt_graph.sh gw
-
И поставяме съответната задача в crontab:
*/5 * * * * sh /home/ivanatora/rrd/temps/pings/graph_all.sh
В резултат всичките изображения се намират в директорията pings/img/. Остава да направим красива HTML страничка, която да събира всичко в едно.
Резултата можете да го видите тук.
