- Повнота індексу - це важливо
- Багато сторінок в індексі - це ще не все
- Системи аналітики - твої найкращі друзі
- Сайт повинен бути «вилизаний» з технічного боку
- Коли у тебе багато сторінок, завжди можна безкарно наробити ще
- І ще сторінок!
- Серйозного сайту - серйозну структуру
- Внутрішня перелінковка - це сила
В останні пару місяців писав аудити і рекомендації по старту для декількох великих сайтів (від 200 000 сторінок і більше). Займатися такими проектами цікаво - мимоволі робиш упор на стратегію, а не на деталі. Радує також можливість отримати швидку віддачу ( недавній приклад ). Тут розповім про ключові особливості роботи з такими сайтами. Звичайно, пост ні в якій мірі не є інструкцією (інструкція нагадувала б дисертацію). Це просто пам'ятка для себе, перерахування моментів, які варто тримати в голові при роботі.
Повнота індексу - це важливо
Не варто думати, що у «жирних» сайтів не буває проблем з індексацією. Пошукові роботи можуть буквально не вилазити з сайту, але цього не завжди вистачає, щоб в індексі присутні всі сторінки.
Приклад - houzz.ru, представництво гігантського англомовного сайту з величезною базою і мільйонами сторінок в Google. А в Яндексі так:

Скрін зроблений ще влітку, але зараз ситуація не особливо змінилася. Яндекс бачить близько 20-30 тисяч сторінок, це крапля в морі.
Тому відразу ж завжди перевіряємо, чи відповідає індекс реальної кількості сторінок на сайті. Якщо немає - добиваємося, щоб відповідав. І регулярно моніторимо ситуацію.
Багато сторінок в індексі - це ще не все
Повна індексація - це тільки умова отримання хорошого трафіку, а не самоціль. Після повного «загону» в індекс потрібно братися за роботу з «відстаючими» в плані відвідуваності розділами. Зрозуміло, що основний трафік будуть приносити чарівні 20%, але у інших, за рахунок хостових факторів теж хороший потенціал, потрібно використовувати його на повну котушку.
Системи аналітики - твої найкращі друзі
Великий проект хороший тим, що швидко дає досить багато внутрішньої статистики (починаючи з банальних ключових слів для розширення семантичного ядра і закінчуючи складними закономірностями, пов'язаними з конверсією).
Сайт повинен бути «вилизаний» з технічного боку
Все просто: невелика помилка в одному шаблоні може привести до тиражування негідних сторінок. Єдиним невірним рухом можна наробити 100 000 повних дублів, наприклад.
Коли у тебе багато сторінок, завжди можна безкарно наробити ще
Один із трендів останніх років - роздування сайту за рахунок тегірованія. На сайті з невеликою кількістю матеріалів можна впровадити зовсім небагато тегів і доводиться вибирати найбільш важливі. Інакше є ризик отримати купу неякісних сторінок-тегів. Поки, до речі, за це особливо не карають (тсс!), Схоже Яндекс бореться переважно з посиланнями і текстовим спамом. Але все може змінитися (і зміниться, якщо люто тегованих почнуть і в заштатних SEO-конторах).
Але великим сайтам такі зміни до лампочки: при величезній кількості сторінок, мінімально грамотна угруповання ніяк не зашкодить; це - природний шлях полегшення навігації.
І ще сторінок!
Для звичайного корпоративного сайту спроба наповнити пару нових розділів парсером може призводити до просідання по головним запитам. А може і не приводити, але в будь-якому випадку [невміла] вивантаження неунікальний матеріалів це ризик. Великому сайту додавання 20 - 30 тисяч неунікальний сторінок навряд чи може пошкодити. А ось користь принести може, як безпосередньо - за рахунок збільшення числа точок входу, так і побічно, за рахунок більш повного охоплення семантики.
До речі: мене завжди дивувало, чому «парсинг» багато хто вважає синонімом «злодійства контенту». Можна добувати контент і не порушуючи нічиїх прав 😉
Серйозного сайту - серйозну структуру
Структурування контенту ще важливіше, ніж зазвичай. Причому як на рівні всього сайту, так і на рівні сторінки. Важливо створити досить багато шаблонів сторінок з різною структурою і різними механізмами формування мета-тегів. Друге дозволяє, як і в попередньому пункті, природним чином збільшити «хмара» запитів, яким відповідає сайт за рахунок переформуліровок і синонімів.
Внутрішня перелінковка - це сила
За важливим запитам в плані перелинковки можна і потрібно працювати точково, не покладаючись на загальну кількість посилань структуру. Багато сторінок - багато можливостей для нагона ваги на важливі «вузли».
Це все, що згадав на даний момент. Хто доповнить список в коментах - герой!