by
on
under
tagged
Permalink

ワードサラダって何だ?

ワードサラダとは,スパムに使われる意味不明な自動生成の文章です.

ワードサラダ - 参考

ワードサラダの参考に作られました

例えば,

これは,Seesaaブログに作られているワードサラダです.

(Word Salad) の多くの目的は,アフィリエイトリンクを大量に作成することで,不正に収益を得ようとするものです.

このワードサラダは,2010年頃までは,猛威を振るっていました.もちろん,2013年現在は,Googleの解析システムが進化したことで,かなり一掃されています.

更に,ありがたいことに,多くのWEB製作者などが,Googleに通報することで撲滅して来ました.

で,ワードサラダってどういう技術?

形態素解析・構文解析を悪用しています。

例えば,「私は,冬にスケボーをしにスキー場に行き,夏はダイビングにハワイに行きます.」
という文章があったとします.

次に,形態素と構文の解析によって,名詞を抽出します.
この場合は,””,”スケボー”,”スキー場”,””,”ハワイ”,”ダイビング”ですね.

すると,順序を入れ替えてしまいます.
私は,冬にダイビングをしにスキー場に行き,夏はスキーをしにハワイに行きます

こうすると,検索エンジンのシステムは,文章の意味を理解することが出来ないので,正しい文章か判定できません.
このために,サイトの少ない検索語を中心に,スパムサイトが氾濫する原因となってしまいました.

ワードサラダの対策

1.語句の関連から

先のように,「私は,冬にスケボーをしにスキー場に行き,夏はダイビングにハワイに行きます.」を例にしてみます.

この時,スキー場ダイビングという語には,あまり関連性を見いだせません.
同様に,ダイビングにも見いだせません.

そこで,語句の関連が異常な割合を検出することで,ワードサラダを検出できます.

2.特徴をつかむ

詳しくは触れませんが,ワードサラダ作成ツールに共通する傾向(語尾の特徴,使用する単語の特徴)などから,検出します.

これには,スパムサイトの通報が役立ちました.

3.被リンク

この辺りは,ナチュラルリンクを獲得していない(参考にされていない)情報であると,認識することで間接的に検索結果に載らないようになります.

SEO技術と関連があります.

じゃあ,ワードサラダってどう作るの?

ワードサラダでおいしいspam料理始めました。が参考になります.

http://wordsalad.kotosara.com/tool/

ただし,ワードサラダは,(恐らく)もう通用することがないですし,やり過ぎは迷惑になるのでやらないでください.

こんな風に行われていたのか…という意味では参考になると思います.

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です