รายการอุปกรณ์เครือข่ายเสียล่าสุด 6 รายการ

[22-05-2018 12:44:38] nagios2 แจ้งไม่สามารถเข้าถึงเครือข่ายภายในและภายนอกม.อ.ได้ ---- haruthai.s at Tue 22-05-2018 13:22:50 ----
[22-05-2018 12:44:38] HOST ALERT: www.cc;DOWN;SOFT;1;CRITICAL - Socket timeout after 10 seconds

เมื่อทำการเชื่อมต่อกับเครือข่ายของ 3BB พบว่าสามารถเปิดหน้าเว็บได้ปกติ คาดว่าอาจเป็นปัญหาจากเครือข่าย TOT ที่ใช้ในการตรวจสอบ
 
HS
[22-05-2018 09:16:55] sw-dorm7,wisw-Dorm7_1, wisw-Dorm7_2 down ---- tipaporn.p at Tue 22-05-2018 09:59:20 ----
[22-05-2018 09:16:55] HOST ALERT: sw-dorm7;DOWN;SOFT;1;PING CRITICAL - Packet loss = 100%
[22-05-2018 09:16:25] HOST ALERT: wisw-Dorm7_1;DOWN;SOFT;1;PING CRITICAL - Packet loss = 100%
[22-05-2018 09:16:25] HOST ALERT: wisw-Dorm7_2;UNREACHABLE;SOFT;1;PING CRITICAL - Packet loss = 100%

- โทรสอบถามเจ้าหน้าที่หอพักแต่โทรไม่มีคนรับ ภายหลังโทรติด เจ้าหน้าที่ให้ข้อมูลว่า มีเสียงร้องดังมาก จากเครื่องสำรองไฟ
- แจ้งเจ้าหน้าที่เข้าไปตรวจสอบแล้ว

TI
[22-05-2018 09:16:55] sw-dorm7,wisw-Dorm7_1, wisw-Dorm7_2 down ---- tipaporn.p at Tue 22-05-2018 10:20:50 ----
[22-05-2018 10:04:55] SERVICE ALERT: sw-dorm7;HTTP;OK;HARD;1;HTTP OK: HTTP/1.1 301 Moved Permanently - 127 bytes in 3.012 second response time
[22-05-2018 10:04:05] HOST ALERT: wisw-Dorm7_1;UP;HARD;1;PING OK - Packet loss = 0%, RTA = 2.55 ms
[22-05-2018 10:04:15] HOST ALERT: wisw-Dorm7_2;UP;HARD;1;PING OK - Packet loss = 0%, RTA = 10.46 ms

guaranteed downtime: 48 m
cause: broken UPS
solution: bypass UPS

SR# 21355
[22-05-2018 05:44:55] cs-gw down ---- tipaporn.p at Tue 22-05-2018 08:31:14 ----
[22-05-2018 05:44:55] HOST ALERT: cs-gw;DOWN;SOFT;1;PING CRITICAL - Packet loss = 100%

ตรวจสอบสถานะบนพอร์ต esw-c1 พบว่า พอร์ต down ไฟไม่ติด 

โทรติดต่อเจ้าหน้าที่ของภาควิชาวิทยาการคอมพิวเตอร์ แต่ไม่มีคนรับสาย

ได้ประสานงานให้คุณมหามัดราฟี ช่วยตรวจสอบไฟเบอร์แล้ว 

สาเหตุเกิดจากเบรกเกอร์ทริป ทำให้อุปกรณ์ down

[22-05-2018 08:54:55] HOST ALERT: cs-gw;UP;HARD;1;PING OK - Packet loss = 0%, RTA = 1.34 ms

downtime: 3h 10m

SR# 21354

TI
[21-05-2018 18:28:55] tfw;DOWN ---- ponpitak.s at Mon 21-05-2018 18:42:11 ----
[21-05-2018 18:30:15] HOST ALERT: tfw;DOWN;SOFT;2;PING CRITICAL - Packet loss = 100%
[21-05-2018 18:29:15] SERVICE ALERT: tfw;SSH;CRITICAL;HARD;1;CRITICAL - Socket timeout after 10 seconds
[21-05-2018 18:29:15] SERVICE ALERT: tfw;HTTPS;CRITICAL;HARD;1;CRITICAL - Socket timeout after 10 seconds
[21-05-2018 18:28:55] HOST ALERT: tfw;DOWN;SOFT;1;PING CRITICAL - Packet loss = 100%

ยังไม่ทราบสาเหตุ
ยังติดต่อแจ้ง admin ของวข.ตรังไม่ได้
[21-05-2018 18:28:55] tfw;DOWN ---- ponpitak.s at Mon 21-05-2018 22:26:23 ----
[21-05-2018 18:44:15] HOST ALERT: tfw;UP;HARD;1;PING OK - Packet loss = 0%, RTA = 3.91 ms
[21-05-2018 18:44:05] SERVICE ALERT: tfw;SSH;OK;HARD;1;SSH OK - i7i (protocol 2.0)
[21-05-2018 18:44:05] SERVICE ALERT: tfw;HTTPS;OK;HARD;1;HTTP OK: HTTP/1.1 200 OK - 365 bytes in 0.032 second response time

*** ปิด case ***
สาเหตุ : ไม่ทราบ
แก้ไข : n/a
เริ่ม down เวลา 21-05-2018 18:28
เริ่ม up      เวลา 21-05-2018 18:44
down time ในเวลาประกัน  16 นาที  นอกเวลาประกัน ไม่มี
บันทึกเก็บไว้คิด KPI
[20-05-2018 10:16:45] wisw-Dorm7_1, sw-dorm7, wisw-Dorm7_2 down ---- tipaporn.p at Sun 20-05-2018 11:08:36 ----
[20-05-2018 10:16:45] HOST ALERT: wisw-Dorm7_1;DOWN;SOFT;1;PING CRITICAL - Packet loss = 100%
[20-05-2018 10:16:25] HOST ALERT: sw-dorm7;DOWN;SOFT;1;PING CRITICAL - Packet loss = 100%

นอกจากนี้อุปกรณ์ wisw-RongChang_1, wisw8-RongChang_2,  sw-dorm7, wisw-Dorm15_2 , wisw-Dorm14 ก็ down เช่นกัน แต่พบว่า up กลับมาทำงานตามปกติแล้ว

หลังจากโทรสอบถามเจ้าหน้าที่หอพัก ทราบว่า หม้อแปลงระเบิด แต่ขณะนี้ไฟฟ้าในส่วนแสงสว่างของหอ 7 มาแล้ว แต่พบว่ายังไม่สามารถใช้งานในส่วนของเครือข่าย และกล้องวงจรปิดได้

โทรสอบถามเพิ่มเติมจากรปภ. ทราบว่า เกิดจากฟิวส์ที่หม้อแปลงระเบิด

TI
[20-05-2018 10:16:45] wisw-Dorm7_1, sw-dorm7, wisw-Dorm7_2 down ---- samphan at Mon 21-05-2018 11:04:07 ----
[21-05-2018 09:38:35] HOST ALERT: wisw-Dorm7_1;UP;SOFT;2;PING OK - Packet loss = 83%, RTA = 5.62 ms
[21-05-2018 09:35:55] HOST ALERT: sw-dorm7;UP;HARD;1;PING OK - Packet loss = 0%, RTA = 2.62 ms

อุปกรณ์อัพแล้ว สาเหตุที่ดาวน์เนื่องจาก UPS ที่อุปกรณ์ต่ออยู่เสียหาย ไม่มีไฟเข้าอุปกรณ์ โดยที่ตัว UPS ขึ้นสถานะว่าแบตเตอรี่มีปัญหา ให้ Replace Battery แต่เมื่อปลดโหลดออกพบว่า UPS ไม่แสดงสถานะว่ามีปัญหา 
จึงแก้ปัญหาโดยการปลด UPS ออกแล้วต่ออุปกรณ์ตรงกับแหล่งจ่ายไฟ

***Case closed***
Cause: Power outage caused UPS malfunctioned
Solution: Bypass UPS
Total downtime in guaranteed period: 1 hr 8 mins
Total downtime in non-guaranteed period: 22 hrs 14 mins

บันทึกลงไฟล์ excel แต่ไม่คิด KPI เนื่องจากเกิดจากปัญหาระบบไฟฟ้า

SL
[15-05-2018 15:57:45] esw-sport down ---- haruthai.s at Tue 15-05-2018 16:07:26 ----
[15-05-2018 15:57:45] HOST ALERT: esw-sport;DOWN;SOFT;1;PING CRITICAL - Packet loss = 100%

เบื้องต้นได้โทรสอบถามศูนย์รปภ. ทราบว่าไฟฟ้าไม่ได้ดับ
เจ้าหน้าที่กำลังตรวจสอบสาเหตุต่อไป

HS
[15-05-2018 15:57:45] esw-sport down ---- haruthai.s at Tue 15-05-2018 16:28:28 ----
[15-05-2018 16:07:45] HOST ALERT: esw-sport;UP;HARD;1;PING OK - Packet loss = 0%, RTA = 0.95 ms

guaranteed downtime: 10 mins
cause: มีการปรับปรุงพื้นที่บางส่วน ทำให้ต้องปิด breaker ห้องเครือข่ายช่วงสั้นๆ
solution: การดำเนินการดังกล่าวแล้วเสร็จ

HS