ワードサラダとは,スパムに使われる意味不明な自動生成の文章です.
例えば,
これは,Seesaaブログに作られているワードサラダです.
(Word Salad) の多くの目的は,アフィリエイトリンクを大量に作成することで,不正に収益を得ようとするものです.
このワードサラダは,2010年頃までは,猛威を振るっていました.もちろん,2013年現在は,Googleの解析システムが進化したことで,かなり一掃されています.
更に,ありがたいことに,多くのWEB製作者などが,Googleに通報することで撲滅して来ました.
で,ワードサラダってどういう技術?
形態素解析・構文解析を悪用しています。
例えば,「私は,冬にスケボーをしにスキー場に行き,夏はダイビングにハワイに行きます.」
という文章があったとします.
次に,形態素と構文の解析によって,名詞を抽出します.
この場合は,”冬”,”スケボー”,”スキー場”,”夏”,”ハワイ”,”ダイビング”ですね.
すると,順序を入れ替えてしまいます.
「私は,冬にダイビングをしにスキー場に行き,夏はスキーをしにハワイに行きます」
こうすると,検索エンジンのシステムは,文章の意味を理解することが出来ないので,正しい文章か判定できません.
このために,サイトの少ない検索語を中心に,スパムサイトが氾濫する原因となってしまいました.
ワードサラダの対策
1.語句の関連から
先のように,「私は,冬にスケボーをしにスキー場に行き,夏はダイビングにハワイに行きます.」を例にしてみます.
この時,スキー場 – ダイビングという語には,あまり関連性を見いだせません.
同様に,冬 – ダイビングにも見いだせません.
そこで,語句の関連が異常な割合を検出することで,ワードサラダを検出できます.
2.特徴をつかむ
詳しくは触れませんが,ワードサラダ作成ツールに共通する傾向(語尾の特徴,使用する単語の特徴)などから,検出します.
これには,スパムサイトの通報が役立ちました.
3.被リンク
この辺りは,ナチュラルリンクを獲得していない(参考にされていない)情報であると,認識することで間接的に検索結果に載らないようになります.
SEO技術と関連があります.
じゃあ,ワードサラダってどう作るの?
ワードサラダでおいしいspam料理始めました。が参考になります.
[browser-shot width=”600″ url=”http://wordsalad.kotosara.com/tool/”]
ただし,ワードサラダは,(恐らく)もう通用することがないですし,やり過ぎは迷惑になるのでやらないでください.
こんな風に行われていたのか…という意味では参考になると思います.