Какие файлы и папки находятся на сервере
Как уже было сказано ранее, если процедура регистрации нового сайта прошла успешно, то через сутки-двое новый сайт будет доступен в сети Интернет.
Для начала давайте установим связь с нашим удаленным сервером и посмотрим что на нем находится, в качестве файлового менеджера для установки связи с сервером можно использовать программы CuteFTP, TotalCommander (или другой файловый менеджер, который вам больше по душе):
- залогиниваемся в свою админ-панель на хостинге;
- смотрим свои данные для ФТП-доступа: Хостинг - FTP-Shell;
- в файловом менеджере делаем новое FTP-соединение (обычно комбинация клавиш Ctrl+N);
- в окне нового соединения вводим необходимые данные для соединения из админ-панели хостинга;
- жмем кнопку "Соединить", если все введено правильно, файловый менеджер произведет соединение с удаленным сервером.
Более подробно процесс соединения с удаленным сервером описан на странице Загрузка сайта на сервер. Файловый менеджер CuteFTP.
Когда соединение произошло, файловый менеджер в одном окне показывает содержимое папки нашего компьютера, а в другом - корень вашей серверной папки. Что же там находится (описывается сервер hqhost.net):
- в корне находится папка domains, содержащая все ваши сайты на этом сервере;
- проходим путь: domains - v-mire-givotnih.ru (имя вашего сайта);
- наш сайт содержит две папки: html (файлы сайта), logs (лог-файлы, содержащие статистику посещений);
- папка html изначально содержит две папки: cgi-bin (служебная папка для хранения серверных скриптов), webalizer (статистика сайта);
- в папку html мы и будем выгружать файлы для своего сайта.
Ниже мы рассмотрим какие именно файлы должны находиться в корневой папке сайта.
Файл index.html (index.htm)
В корне сайта обычно находится множетсво различных файлов и папок. Если путь к файлу указан полоностью (например, http://v-mire-givotnyh.ru/index.html), то никаких вопросов не возникает - браузер находит файл и открывает его. Но, зачастую указывается неполный путь (например, http://v-mire-givotnyh.ru/) - как быть в этой ситуации? Какой файл нужно открывать? На момент написания статьи самым популярным веб-сервером является Apache. В большинстве случаев, он настроен таким образом, что при неявном указании пути ищется и открывается файл с именем index (index.html, index.htm, index.php). Файл с таким именем сервер считает файлом главной страницы, с которой надо начинать просмотр.
Поэтому, в корне сайта обязательно должен присутствовать файл главной страницы с именем index.
Чтобы возникало меньше непредвиденных ситуаций, возмите за правило в каждой вновь созданной папке (в которой планируется размещать html-страницы) первым делом определять файл главной страницы с именем index.html (index.htm).
Если по каким-то причинам ваш сервер не открывает по умолчанию файл главной страницы при неявном указании пути, то ситуацию можно исправить, прописав в конфигурационном файле .htaccess (о нем речь пойдет ниже) следующую строку:
DirectoryIndex index.html index.htm
Для главной страницы сайта подготовим и выгрузим на сервер файл с именем index.html следующего содержания:
Файл robots.txt
Robots.txt - это простой текстовый файл, который располагается в корне сайта, и предназначен для роботов поисковых систем. В этом файле указываются параметры индексирования сайта как для всех роботов сразу, так и для каждой поисковой системы по отдельности.
Более подробно о файле robots.txt читайте в хэлпе Яндекса или на специализированных ресурсах, например, robotstxt.org.ru/.
Посетив вышеуказанные ресурсы, вам будет понятна следующая запись в файле robots.txt, которую мы сделаем и потом выгрузим на сервер:
User-agent: * Disallow: /cgi-bin Disallow: /webalizer
Для тех, кто поленился почитать о robots.txt, скажем, что данная запись относится к роботам всех поисковых систем, и запрещает им индексировать содержимое папок cgi-bin, webalizer. Это вполне логично, т.к. содержимое этих папок не представляет никакой ценности посетителям вашего сайта.
Файл .htaccess
Файл .htaccess - это конфигурационный файл сервера Apache, в котором прописываются различные директивы, согласно которым сервер настраивает свою работу. Выше мы уже прописали в него одну директиву, которая указывает серверу какие файлы он должен открывать при неявном указании пути в строке браузера. Давайте сразу пропишем еще несколько полезных директив, которые заметно упростят нашу дальнейшую работу с сайтом.
Иногда возникают ситуации, когда искомая страница не находится (была удалена или перемещена ранее, был введен неправильный адрес...) - в таком случае сервер выдает ошибку 404 (страница не найдена). В таких случаях уместно выводить пользователю соответствующим образом оформленную веб-страницу (назовем ее error_404.html), на которой объяснять ситуацию. Для этого надо страниц-заглушку выгрузить в корень сайта, а в конфигурационном файле прописать такую строку:
ErrorDocument 404 /error_404.html
Еще одной полезной директивой будет подключение различных модулей к нашей html-странице (об этом поговорим позже). Для этого надо в файл .htaccess прописать директиву, которая позволяет серверу читать и исполнять встроенный в html-страницу, программный код php:
RemoveHandler .html .htm AddType application/x-httpd-php .php .htm .html
Всем желающим познакомиться ближе с конфигурированием сервера Apache посредством файла .htaccess, рекомендую посетить специализированный сайт htaccess.net.ru.
ИТОГ
Мы создали четыре важных файла, которые надо выгрузить в корень сайта:
- index.html - файл главной страницы сайта;
- error_404.html - файл-заглушка, если искомая страница не находится (содержимое этого файла подготовьте самостоятельно по аналогии с файлом index.html);
- robots.txt - файл для управления роботами поисковиков;
- .htaccess - конфигурационный файл сервера Apache.
Теперь при помощи файлового менеджера выгружаем подготовленный материал на свой сервер, и смотрим результат.