- Што такое латэнтна-семантычнае індэксаванне LSI
- Што такое LSI SEO капірайтынгу
- Адрозненне LSI-капірайтынгу ад SEO-капірайтынгу
- Асноўныя патрабаванні да стварэння LSI-тэкстаў
- Паглыбленае даследаванне ключавых слоў з LSI
- Як шукаць рэлевантныя LSI ключавыя словы (rLSI)
- Як шукаць сінанімічныя LSI Ключавыя словы (sLSI)
- Іншыя метады выяўлення LSI слоў
- Як ствараць кантэнт з улікам LSI?
Што такое латэнтна-семантычнае індэксаванне LSI
Тэрмін LSI (latent semantic indexing) азначае вонкава нябачнае (латэнтны) семантычнае індэксаванне . Гэтая методыка дазваляе пошукавым сістэмам пашырыць сваё разуменне адпаведнасці пошукавых запытаў тэксту на сайце і рэкамендаваць чытачу найбольш прыдатныя тэматычныя вынікі. Для гэтага праводзіцца аналіз спадарожных пошукаваму запыту слоў.
У строга навуковым сэнсе LSI - сінгулярнасць разлажэнне тэрм-дакументнай матрыцы, з яе выкарыстаннем кампрэсіі да загадзя абранага колькасці m. Такім чынам, магчымая разбіўка ўсёй калекцыі на m тэматык, што дае магчымасць казаць аб прыналежнасці тэрміна або словы да пэўнай тэматыцы.
Тэрміны, якія так ці інакш ставяцца да latent semantic indexing, прыведзены ніжэй:
- Латэнтна-семантычны аналіз (Latent Semantic Analysis).
- Апрацоўка натуральнага мовы (Natural Language Processing).
- Фразавае індэксаванне і выманне дадзеных (Phrase-Based Indexing and Retrieval).
- Частата словы - зваротная частата дакумента (Term Frequency - Inverse Document Frequency).
- Схаванае размеркаванне Дирихле (Latent Dirichlet Allocation).
- Імавернасны латэнтна-семантычны аналіз (Probabilistic Latent Semantic Analysis).
- Мадэль схаваных ланцугоў Маркава (Hidden Topic Markov Model).
Латэнтна-семантычны аналіз (LSA) [1] дазваляе ліквідаваць асноўны недахоп SEO-тэкстаў, а менавіта іх нечитабельность і высокую шчыльнасцю ключавых слоў. У большасці тэматык такія тэксты будуць ніжэй у пошукавай выдачы, чым добра напісаны LSI-тэкст. Цалкам магчыма, што дынаміка якасных змен у пошукавай выдачы будзе назірацца аж да 2019 года, асабліва, па камерцыйных запытам.
Хоць латэнтна-семантычны аналіз быў запатэнтаваны яшчэ ў 1988 годзе, аб LSI капірайтынгу актыўна загаварылі і пачалі эксперыментаваць з ім толькі дзякуючы прэсінгу новых алгарытмаў Гугл і Яндэкс. Так, у 2012 годзе галоўны інжынер пошукавай аптымізацыі Google Мэт катт, заклікаў ствараць матэрыялы, якія мелі б каштоўнасць для жывых наведвальнікаў, а не пошукавых робатаў. А ўжо ў 2013 карпарацыя Google запусціла алгарытм Hummingbird (Калібры), які ўплывае на генерацыю старонак пошукавай сістэмай, у адказ на запыт карыстальніка (SERPы). [2, 4]
Што такое LSI SEO капірайтынгу
LSI-капірайтынгу закліканы павялічыць рэлевантнасць вынікаў пошуку, шляхам перакананні пошукавых машын у дакладнасці, актуальнасці і карыснасці кантэнту на сайце без переспама тэкстаў па ключавых словах. Для гэтага копірайтэр аналізуе сінонімы і рэлевантныя ключавыя запыты, а таксама ўтрыманне і агульны сэнсу тэксту з пункту гледжання інфарматыўнасці, карыснасці і яго напоўненасці для канчатковага карыстальніка.
У спам-алгарытмах LSI мае куды больш значную вагу, чым пры пошукавым ранжыраванні. Таму да яго ёсць сэнс звяртацца тады, калі ўся базавая аптымізацыя ўжо праведзена.
Адрозненне LSI-капірайтынгу ад SEO-капірайтынгу
Калі для SEO-капірайтынгу базай з'яўляюцца ключавых слоў, частата іх ужывання, размяшчэнне і віды ўваходжання ў тэкст, то методыка LSI, у першую чаргу, ўлічвае семантычную варыятыўнасць пошукавых запытаў і кантэкст іх прымянення. Па-другое, пашукавікі звяртаюць увагу на якасць самога тэксту, а таксама тэматычныя перавагі мэтавай аўдыторыі, якія можна вызначыць па паказчыку адмоваў. [3]
Досыць цікавы прыклад працы LSA прыводзіць Optimizationtheory .
Прыклад працы схаванай семантычнай індэксацыі
Так, калі карыстальнік шукае банк Mississippi River Bank, семантычна гэты запыт можа быць вытлумачаны, як рака ў штаце Місісіпі і спадарожныя ёй тэматыкі рыбалкі або актыўнага адпачынку, або фінансавая структура ў штаце Місісіпі, звязаная з іпатэчнымі крэдытах і банкаўскай дзейнасцю.
Сістэма LSI-аналізу збірае вялікія масівы тэкстаў, хутчэй за ўсё, на аснове паводніцкіх фактараў і Траставы сайтаў. Выяўляюцца характэрныя для кожнай тэмы тэрміны і словазлучэнні (уключаючы правілы скланенняў, пабудовы фраз і прапаноў канкрэтнага мовы). Такім чынам пошукавік вызначае, якія семантычныя паслядоўнасці можа ўключаць добры тэкст па канкрэтнай тэме, і вышэй ранжыруе патрэбную старонку.
Асноўныя патрабаванні да стварэння LSI-тэкстаў
● Асноўнае правіла маркетынгу - копірайтэр павінен ведаць сваю мэтавую аўдыторыю , Яе патрэбы і перавагі.
● Стыль напісання і тэрміналогія тэксту падбіраюцца, зыходзячы з падрыхтоўкі і прафесіяналізму мэтавай аўдыторыі. Для звычайнага пакупніка тэкст павінен быць простым, зразумелым і які ўтрымлівае ўвагу на сутнасці паведамленні. У той жа час акадэмік чакае больш глыбокі разбор цемя з адпаведнымі спасылкамі на аўтарытэтныя крыніцы і праведзеныя лабараторныя даследаванні.
● Структура тэксту, якая ўключае загалоўкі і падзагалоўкі, нумараваныя і маркіраваныя спісы, графіку і табліцы, чаргаванне кароткіх і доўгіх прапаноў, спрыяюць лепшага глядзельнай ўспрымання тэксту і хуткаму пошуку патрэбнай інфармацыі.
● Пішыце дакладную, актуальную, дакладную, правераную і арыгінальную інфармацыю.
● Граматыка, сінтаксіс, пунктуацыя і структура прапаноў павінны адпавядаць правілам мовы, на якім пішацца LSI-тэкст.
Вось асноўныя элементы старонкі, дзе вы можаце рэалізаваць увесь патэнцыял LSI-слоў, каб атрымаць максімальную аддачу ад іх:
- Загаловак старонкі TITLE.
- Тэгі H1 і H2.
- URL-адрас.
- Мета-тэгі.
- Альтэрнатыўны тэкст малюнка.
- Першы і апошні абзац тэксту.
- Цела змесціва.
- Тэкставы якар спасылак.
Паглыбленае даследаванне ключавых слоў з LSI
LSI ключавыя словы можна падзяліць на сінанімічныя (sLSI) і рэлевантныя (rLSI). Сінанімічныя - гэта словы-сінонімы асноўнага запыту. На іх варта рабіць ўпор у першую чаргу. Рэлевантныя - гэта словы, якія дапаўняюць галоўны ключавых слоў, тым самым лепш раскрываючы асноўную тэму.
Як шукаць рэлевантныя LSI ключавыя словы (rLSI)
Найбольш хуткі і дакладны спосаб знайсці рэлевантныя ключавых слоў - гэта выкарыстанне іншых інструментаў. Вам дастаткова будзе ўвесці слова для аналізу, а праграма сама знойдзе і прааналізуе тэксты кожнай артыкулы з ТОП сайтаў у пошукавай выдачы. Затым выдаліць агульныя, нерэлевантных і стоп-словы, а спіс ключавых слоў з найбольш часта выкарыстоўваюцца тэрмінаў верне для далейшай працы.
● lsigraph.com (eng)
● Just-Magic.org (рус)
● SEMrush.com (eng | рус)
Таксама, можна выкарыстоўваць падказкі Google і Яндэкс у поле пошуку. Тыя з іх, якія маюць сэнс і звязаныя з прадметам вашай артыкула, павінны быць выкарыстаны ў якасці ключавога слова.
Звязаныя запыты Google і Яндэкс у ніжняй частцы старонкі пошуку - гэта ключы, якія пашукавікі лічаць якія маюць дачыненне да вашага асноўнага ключавым слове.
Як шукаць сінанімічныя LSI Ключавыя словы (sLSI)
Знайсці sLSI тэрміны нашмат складаней, але іх выкарыстанне, у дадатак да асноўных ключах, патэнцыйна павышае рэйтынг артыкула. Тое ж самае тычыцца пабудовы кантэкстных спасылак. У SEO ёсць некалькі падыходаў да гэтага:
● Выкарыстанне падсвятленняў слоў з сниппетов.
● Частотны слоўнік па топу.
● Аналіз з дапамогай іншых алгарытмаў.
Гугл і Яндэкс часта вылучаюць словы, якіх няма ў запыце карыстальніка. Гэта могуць быць тапонімы (назвы гарадоў) або іншыя гео-дадзеныя:
Cинонимы:
Дадатковыя словы па тэме:
Частотны слоўнік значна лепш простых падсвятленняў. Дастаткова скласці спіс слоў, якія сустракаюцца ў ТОП выдачы сайтаў па канкрэтнаму запыту і насупраць кожнага з іх запісаць, колькі разоў яно сустрэлася. Чым больш «чашчыннасць» словы, тым больш «тэматычным» яна лiчыцца.
На сярэдне-канкурэнтных запытах вы будзеце часта сутыкацца з няякасным топам, таму правядзенне LSI аналізу ўручную прывядзе толькі да капіявання чужых памылак.
Падлік слоў з выкарыстаннем іншых калекцый, напрыклад, нацыянальнага корпуса рускай мовы або тэкстаў "Вікіпедыі", таксама здольныя даць нядрэнныя вынікі.
Іншыя метады выяўлення LSI слоў
На wordstat.yandex.ru увядзіце асноўнай запыт і паглядзіце, з якімі словамі яго ўжываюць карыстальнікі. Выбіраючы тыя з іх, якія будуць дарэчныя ў кантэксце прасоўваецца сайта або асобнай яго старонкі.
У Google Adwords зайдзіце ў раздзел Keyword Planner Tool (Планоўшчык ключавых слоў) і дадайце новае ключавое слова. Затым на старонцы злева убіце яго ў спіс мінус-слоў. На ўкладцы «варыянты ключавых слоў» вы ўбачыце спіс слоў па рэлевантнасці.
Аналагічную аперацыю можна правесці па мэтавай старонцы. Знайдзіце старонкі-канкурэнтаў з тупае па патрэбным запыце, скапіруйце адрас адной з іх і задайце гэтае URL у планавальніку. Ва ўкладцы «варыянты ключавых слоў» знойдзеце патрэбны спіс rLSI і sLSI кейворды.
Як ствараць кантэнт з улікам LSI?
Вы ўжо ведаеце, што 2-3% шчыльнасць ключавых слоў па-ранейшаму мае значэнне, у той час як дакладнае ўваходжанне ключавога слова - не. Таму, вы па-ранейшаму павінны дакладна вызначыць мэтавую аўдыторыю і асноўныя ключавыя словы для гэтага спісу. Затым, шукаць rLSI і sLSI словы і спалучэнні для вашых асноўных ключавых слоў.
Прычым rLSI выкарыстоўваецца для «пашырэння» і «паглыблення» вашых артыкулаў, а sLSI - для павышэння шчыльнасці асноўных тэматычных слоў у артыкуле, па якім вы праводзіце прасоўванне сайта. Пры гэтым вы, з аднаго боку, ствараеце кантэнт для карыстальнікаў, а з другога - прымаеце пад увагу механізмы працы пошукавых сістэм.
Пераканайцеся, што вашыя ключавыя словы выкарыстоўваюцца хоць бы адзін раз у першым абзацы старонкі, а таксама задзейнічаны ў мета-дадзеных і семантычнай разметцы.
1. Habrahabr. Латэнтна-семантычны аналіз
2. Reuters. Google introduces new ' Hummingbird 'Search algorithm.
3. Seobook. Google Semantically Related Words & Latent Semantic Indexing Technology
4. Gianluca Fiorelli. Hummingbird Unleashed