Статьи

12 контрольных вопросов при обслуживании серверов

Чеклист для плановой регулярной проверки серверовКак и любому компьютерному оборудованию, серверам требуется периодическое техническое обслуживание. Здесь я привожу чеклист для плановой регулярной проверки. Он не претендует на исчерпывающий список и не объясняет подробно процедуры обследования. Но четко следуя всем этим пунктам, я избавляю себя от многих проблем. И хотя перечислена лишь немногое из того, что я делаю для моих серверов на базе Linux, этот чек-лист не теряет актуальности и для Windows-систем.


Более 500 моделей серверов по самым лучшим ценам. Под любые задачи. Мы профессионально занимаемся этим направлением.


1. Проверьте работоспособность резервных копий. 

Прежде чем вносить любые изменения в производственную систему, я проверяю резервные копии. Иногда я даже провожу тестовые восстановления, если собираюсь стирать критические данные. Также важно убедиться, что резервная копия размещена в правильном месте. 


2. Проверьте использование дисков. 

Не используйте производственную систему в качестве архивной. Я, например, стираю старые логи, сообщения электронной почты и ставшие ненужными приложения. Освобождение системы от старых программ помогает мне повысить безопасность. Чем меньше дискового пространства используется, тем быстрее я восстановлю систему при сбое диска. Если у вас занято более 90% объема диска, либо высвободите место, либо увеличьте объем. Если объем занятого пространства достигнет 100%, сервер может перестать отвечать на запросы. Могут повредиться таблицы базы данных, и данные могут быть утеряны. 


3. Проверьте оповещения RAID. 

Если вы (как и я) используете RAID, проверьте систему оповещения об ошибках. Она должна не только быть правильно настроена, но и функционировать должна правильно. Большинство уровней RAID допускают не более одного отказа диска. Если вы пропустите оповещение RAID, обычная замена диска может обернуться катастрофой. 


4. Обновляйте операционную систему.

 Обновления для Linux систем выходят практически ежедневно. Многие из них решают критические для системы проблемы безопасности. Лично я обновляю систему каждый день (а иногда и чаще). Если у вас нет административной службы, или не настроено автообновление, придется проверять наличие критических обновлений безопасности для ОС самостоятельно. Для этого будет полезно подписаться на рассылку. И помните, что при обновлении ядра нужно перезагрузить сервер. Конечно, если вы не пользуетесь утилитой наподобие Ksplice, как это делаю я. 


5. Обновляйте панель управления. 

Если пользуетесь хостинговой или серверной панелью управления, не забывайте обновлять ее. Иногда требуется обновление не только самой панели управления, но и контролируемых ей приложений. Например, для WHM/cPanel мне приходится вручную обновлять версию PHP для устранения ошибок. Обновление самой панели управления не означает обновления версий Apache и PHP, используемых ОС. 


6. Проверяйте обновления для приложений.

 По моим наблюдениям, многие проблемы безопасности вызваны устаревшими веб-приложениями. Обновив сервер, проверьте и обновите также свои веб-приложения. 


7. Проверьте средства удаленного управления.

 Если у вас колокационный или выделенный сервер, проверьте работоспособность инструментов удаленного управления. Удаленная консоль, удаленная перезагрузка и удаленное восстановление – вот три наиважнейших средства удаленного администрирования серверов. Вам необходимо убедиться в том, что в нужный момент они не подведут. 


8. Проверьте систему на отсутствие аппаратных ошибок. 

Можно проверить системные логи на наличие каких-либо признаков аппаратных сбоев. Сообщения о перегреве, ошибки чтения дисков, сбой сети – всё это ранние признаки потенциального отказа оборудования. У меня такое встречается редко, но все же лучше лишний раз проверить. Особенно если система какое-то время не функционировала в нормальных условиях. 


9. Проверьте загрузку сервера.

 Проверьте загрузку жесткого диска, процессора, оперативной памяти и сети. Если вы приблизились к предельным значениям, то придется добавить ресурсы или же мигрировать на новый сервер. 


10. Проверьте учетные записи пользователей. 

Если в IT-отделе менялся персонал, расторгались договора с клиентами или были еще какие-то изменения состава пользователей, удаляйте старые учетные записи из системы. Сохранение старых паролей и логинов – это риск безопасности. 


11. Проверьте пароли. 

Я рекомендую менять пароли каждые 6-12 месяцев. Особенно если они передавались другим людям. 


12. Проверяйте безопасность системы. 

Лично я провожу периодическую проверку безопасности системы утилитой Nessus, чего и всем желаю. Это средство для удаленного аудита серверов производит регулярный аудит безопасности: проверку конфигурации системы, обновлений ОС и других потенциальных угроз. По моему мнению, выполнять такой аудит стоит по меньшей мере 4 раза в год. А еще лучше ежемесячно.  


10 непреложных законов администрирования безопасности информационных систем


Петр Чикорский

ведущий технический специалист компании Larga




Комментировать