LINUX.ORG.RU
решено ФорумAdmin

Мистические проблемы с сетью в Proxmox

 , ,


0

1

Proxmox 8.1.10. Сервер расположен у hetzner. Две ночи подряд сервер теряет доступ в Интернет. Перезагрузка не помогает. Помогает только *service networkmanager restart* - через KVM. Где копать решение проблемы?

etc/network/interfaces

# network interface settings; autogenerated
# Please do NOT modify this file directly, unless you know what
# you're doing.
#
# If you want to manage parts of the network configuration manually,
# please utilize the 'source' or 'source-directory' directives to do
# so.
# PVE will preserve these directives, but will NOT read its network
# configuration from sourced files, so do not attempt to move any of
# the PVE managed interfaces into external files!

source /etc/network/interfaces.d/*

auto lo
iface lo inet loopback

iface lo inet6 loopback

auto enp193s0f0np0
iface enp193s0f0np0 inet manual
# address 142.xx.xx.253/26
# gateway 142.xx.xx.193
# up route add -net 142.xx.xx.192 netmask 255.255.255.192 gw 142.xx.xx.193 dev enp193s0f0np0
# route 142.xx.xx.192/26 via 142.xx.xx.193

iface enp193s0f1np1 inet manual

iface enxb68244e54cdd inet manual

auto vmbr0
iface vmbr0 inet static
address 142.xx.xx.253/25
gateway 142.xx.xx.193
bridge-ports enp193s0f0np0
bridge-stp off
bridge-fd 0
# up route add -net 142.xx.xx.192 netmask 255.255.255.192 gw 142.xx.xx.193 dev enp193s0f0np0

auto vmbr2
iface vmbr2 inet static
address 192.168.0.1/24
bridge-ports none
bridge-stp off
bridge-fd 0
post-up echo 1 > /proc/sys/net/ipv4/ip_forward
post-up iptables -t nat -A POSTROUTING -s '192.168.0.1/24' -o vmbr0 -j MASQUERADE
post-down iptables -t nat -D POSTROUTING -s '192.168.0.1/24' -o vmbr0 -j MASQUERADE 

*service networkmanager restart*
etc/network/interfaces

что?! у nm конфиги в другом месте лежат, и proxmox его не использует (хотя я pve 8 не видел, может уже стали), так что отключай nm

Почему тебе тогда помогает его перезапуск? ну предположу что он все интерфейсы дергает и сеть восстанавливается, смотри в dmesg какие ошибки есть в момент проблемы

Kolins ★★★★
()
Последнее исправление: Kolins (всего исправлений: 1)
Ответ на: комментарий от Dimez

[code]root@Prox96 ~ # lshw -class network *-network:0 description: Ethernet interface product: BCM57414 NetXtreme-E 10Gb/25Gb RDMA Ethernet Controller vendor: Broadcom Inc. and subsidiaries physical id: 0 bus info: pci@0000:c1:00.0 logical name: enp193s0f0np0 version: 01 serial: 9c:6b:00:46:a2:14 size: 1Gbit/s capacity: 10Gbit/s width: 64 bits clock: 33MHz [/code]

timoniks
() автор топика
Ответ на: комментарий от anonymous
root@Prox96 ~ # lspci -k
............
c1:00.0 Ethernet controller: Broadcom Inc. and subsidiaries BCM57414 NetXtreme-E 10Gb/25Gb RDMA Ethernet Controller (rev 01)
        Subsystem: ASRock Incorporation BCM57414 NetXtreme-E 10Gb/25Gb RDMA Ethernet Controller
        Kernel driver in use: bnxt_en
        Kernel modules: bnxt_en
c1:00.1 Ethernet controller: Broadcom Inc. and subsidiaries BCM57414 NetXtreme-E 10Gb/25Gb RDMA Ethernet Controller (rev 01)
        Subsystem: ASRock Incorporation BCM57414 NetXtreme-E 10Gb/25Gb RDMA Ethernet Controller
        Kernel driver in use: bnxt_en
        Kernel modules: bnxt_en
c2:00.0 Non-Volatile memory controller: Micron Technology Inc 7450 PRO NVMe SSD (rev 01)
        Subsystem: Micron Technology Inc 7450 PRO NVMe SSD
        Kernel driver in use: nvme
        Kernel modules: nvme
c4:00.0 Non-Volatile memory controller: Micron Technology Inc 7450 PRO NVMe SSD (rev 01)
        Subsystem: Micron Technology Inc 7450 PRO NVMe SSD
        Kernel driver in use: nvme
        Kernel modules: nvme
.............
timoniks
() автор топика
Ответ на: комментарий от Aceler

Вот выжимка из мануала на сайте Hetzner

# /etc/network/interfaces

auto lo
iface lo inet loopback

auto enp0s31f6
iface enp0s31f6 inet manual

auto vmbr0
iface vmbr0 inet static
        address 198.51.100.10/32    # Main IP
        gateway 198.51.100.1        # Gateway
        bridge-ports enp0s31f6
        bridge-stp off
        bridge-fd 0
timoniks
() автор топика
Ответ на: комментарий от timoniks

Еще заметил что логах что постоянное подключение к хранилищу идет.

May 08 15:52:43 Prox96 pvestatd[2059]: connection check for storage 'Cloud_07' failed - tree connect failed: NT_STATUS_ACCESS_DENIED
May 08 15:52:43 Prox96 pvestatd[2059]: connection check for storage 'Cloud_05' failed - tree connect failed: NT_STATUS_ACCESS_DENIED
May 08 15:52:54 Prox96 pvestatd[2059]: connection check for storage 'Cloud_05' failed - tree connect failed: NT_STATUS_ACCESS_DENIED

Хотя сервера копируются нормально, может ли быть сбой из-за подобного…

timoniks
() автор топика
Ответ на: комментарий от timoniks

Удалил все сетевых подключения бэкапов к хранилищам и облакам. Добавил их чуть по другому, двое суток проблема не появляется. Спасибо всем за ответы.

timoniks
() автор топика