Уважаемые коллеги, чтобы такого не было - грамотно проектируйте систему. А слова о том что "один из датасторов (расположенный на дешевом NAS) пропадает (с включенными на нем тестовыми ВМ)" "iscsi без избыточного подключения, уронили порт, перезагрузился коммутатор" - это всё явные ошибки проектирования. Лаба - отдельно, продакшен -отдельно. У меня лаба: лезвие с виртуальными гипервизорами, вцентром, эмуляторами схд, все через прайват виланы - в тоге лаба вообще никак не влияет на продкшен.
По поводу "Самое интересное что при восстановлении связи с потерянной луной в течении короткого промежутка времени (тестировал до часа), гипервизор очухивается и продолжает работать дальше, отвечать на команды, самое страшное что может тут произойти это таймаут в гостевой ОС к дискам, но это естественно. " - это так работает. При правильном пректировании такой ситуации не бывает, а если бывает, то есть план Б.
Это я к тому, что так и должно работать.