無料ブログはココログ

スパム考察

連続スパムについて考える

先日、私の管理する掲示板で、短時間に連続して英文のスパムがきた。

さすがに記事を消去するのに手間がかかった。

で、得た教訓。
・過去に同一の題名・タイトルの場合、投稿を受け付けない。
・名前欄に半角および全角スペースの使用の禁止

前者は、連続スパムの場合、同一タイトルで来ることが多いことがわかった。ただし、あまりにも過去のタイトルを捜させ続けるとプログラムのパフォーマンスに影響を及ぼすのである程度のところで区切る必要があるだろう。

後者について、英語圏の連続スパムは名前欄に何らかの文章・英文を埋め込むことがある。通常、名前欄にスペースを使うことはまれなので、これをそっくり禁止してしまう。

いずれにせよ、スパムを止めることは難しく、いかにして被害を少なくするかが重要になりつつあるように感じます。

IPアドレスによる投稿許可判断

掲示板やブログのコメントにスパムやいたずら記事を投稿されることが多々ある。

その際よく用いられるのがIPアドレスによる投稿許可判断

IPアドレスとはインターネットをする端末まいに割りふられるいわば、住所である。
そのため、IPアドレスは世界じゅうに同時に2個以上同じ物は無い。
だからスパムやいたずらをする人の投稿をIPアドレスを使って投稿できないようにする方法がある。

ただしこれは欠点が大きい。短期的には有効な方法であるが、同じ端末でもIPアドレスは一日に一回変わる性質があり、長期的には効果がない。
この対策を行うのも一つの方法であるが、これだけに期待するのは過大となる。

禁止用語の設定

掲示板のスパム対策でよく使われる「禁止用語の設定」について。

これもスパム対策に有効な対策の一つである。ロボットに取る投稿でも手動による投稿でも禁止用語のブラックリストに引っかかれば投稿を拒否できる。

Perlであれば、正規表現を用いて簡単に実現できる。

欠点は、禁止用語のブラックリストの定義が難しい(あまりたくさん制定しすぎると動作処理が重くなるし、場合によっては通常の投稿でも引っかかる可能性もある、特に英単語の場合は偶然の連続で引っかかることもたまにある)。

スパム対策は複数の対策の組み合わせと、日ごろの管理の徹底につきると思うきょうこのごろであります。

2バイト文字の無い投稿をシャットアウト

日本人が掲示板を運営している場合、ほぼ100%投稿は日本語による物です。(たいていは)

なので、海外からの正規の投稿者がほとんど見込めない場合、海外からのスパムを閉め出すのはわりかし簡単で(?)、2バイト文字の含まれない投稿は受け付けないようにすばいいと考えられます。

Perlの場合ですと、正規表現を用いて投稿内容をチェックすれば簡単です。

ただしこの方法だと、ごくごくごくたまに正規の英語圏の投稿があった場合に迷惑を被ることになります。

新企画:スパムについて考える

掲示板・ブログ・メールなどで毎日たくさんの迷惑投稿があります。
それらについて考えていこうと思います。

わたしも掲示板・ブログを管理する者として、これらには悩んでおります。基本的には管理を徹底するにつきますが、限界があるので妙案を考えていこうと思います。

とりあえず、思いついたら書こうと思います。

最近のトラックバック

2016年11月
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30