리눅스/이슈 확인

[ISSUE] Bonding status : going back 현상

ㅎㄷㄹㅁㅇ 2021. 4. 29. 16:04


MII Status : going back 


going back 현상 발생

# cat /proc/net/bonding/bond0

Ethernet Channel Bonding Driver: v3.6.0 (September 26, 2009)

Bonding Mode: fault-tolerance (active-backup)
Primary Slave: None
Currently Active Slave: eth0
MII Status: up
MII Polling Interval (ms): 0
Up Delay (ms): 0
Down Delay (ms): 0
ARP Polling Interval (ms): 2000
ARP IP target/s (n.n.n.n form): 


Slave Interface: eth0
MII Status: up
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 1
Permanent HW addr: 
Slave queue ID: 0


Slave Interface: eth1
MII Status: going back
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 3
Permanent HW addr:
Slave queue ID: 0



going back 이란?

네트워크 인터페이스가 down -> up 될 경우 updelay 가 설정되어 있는 시간 만큼 표시 될 수 있습니다. 

Slave 인터페이스가 down 상태로 변경되기전에 up 상태에서 arp 응답을 받지못하면 going back 상태가 될 수 있습니다.

going back 상태로 표시되는 인터페이스가 다시 Active Slave가 될 때에 스위치로부터 arp 패킷을 받으면 정상적으로 up 상태가 됩니다. 



패치 내역

 - [netdrv] bonding: Fix ARP monitor validation (Jarod Wilson) [1244170]

the issue is when the bonding interface comes up, in some cases, the network switches doesn't respond within the interval. It causes that the bonding device doesn't come up.

We have a fix for this issue, https://marc.info/?l=linux-netdev&m=145444897031047&w=2,  

RHEL6.8's kernel, kernel-2.6.32-642.el6 or later resolves this issue.

The changelog is     - [netdrv] bonding: Fix ARP monitor validation (Jarod Wilson) [1244170]


- Bonding 인터페이스가 up이 될 때 arp interval 이 도래하여도 스위치가 응답하지 않아 up이 되지 않는 버그가 패치 되었다는 내용으로 going back 상태가 나타나지 않는 것은 아니며​ 해당 패치로 인해 going back 상태가 확인되는 빈도 수가 낮아진 것으로 보입니다. 



