コンテンツへスキップ

掲示板の宣伝記事削除とリンクを含むメッセージ

このブログの内容について、時々、関連するヤフーファイナンスの掲示板に紹介しているのですが、これをヤフーに消されてしまうことが良くあります。困りますね。

ヤフーファイナンスの掲示板には宣伝記事がかなり書き込まれています。さすがファイナンスだけあって、投資情報を提供する有料サイトの宣伝が多いのですが、その他、出会い系やら特定銘柄を推奨するものなど、千差万別の宣伝が、、、

一応このブログは商売抜きなのですが、アクセスがあって初めて成り立つウエブですから、リンクを他の場所に貼る、という行為は、読者をこのページに導く効果がありまして、宣伝とどこが違うか、といわれれば、紙一重、ですねえ。気違いと天才の差、ですね。

まあしかし、リンクを貼る、というのはウエブのコミュニケーションの優れた機能でして、この機能を生かせるように、ヤフーファイナンスの掲示板にも一応の配慮がなされている。つまり、この掲示板、URLを記述すると、自動的にリンクに変換されて表示される。

この機能の使い道、ニュースやチャートの引用が想定されているのかもしれませんが、今は個人も公開ページを持つ時代、そこへのリンクも便利、ということに気付いたのですね。

これをはじめたのは、ライブドアの騒動のときでして、ライブドアの掲示板、異様に書き込みが多く、自分で書いた記事も、あとで探すのに苦労する。議論もし難いのですね。

でも、ブログに本文を書いて、掲示板にはそのポイントとURLを記述する、そうすれば、長い記事もかけるし、訂正も出来る。落ち着いた議論も出来るのですね。

でもヤフー、こういった記事を、時々、消してしまいます。困りますねえ、、、この、ヤフーのやり方、どうやら人力頼みの、原始的なやり方のように見えるのですね。

公開された掲示板に、読む側には迷惑な宣伝記事を大量に書き込む「スパム」という行為はネットの初期の時代から問題となっていました。このスパムというコトバ、初期に宣伝され、問題視された、ハムの商品名、だそうです。このハム、有名になったものですね。

最近のメイルソフトやウィルス対策ソフトには、迷惑メイル除去機能が付いています。これ、発信者で受信拒否したり、キーワードで宣伝と判断するようになっています。

もちろん、スパムを送る側も、こんなことはすぐにわかってしまいます。で、メイルアドレスをランダムな文字列にしたり、怪しげなキーワードを隠す。

ひところの英文宣伝記事には、バイアグラの宣伝が非常に多かったのですが、Viagra と書くべきところを V i a g r a と書いたり、一部の文字を伏せる、などしてチェックをすり抜けようとするのですね。ま、いたちごっこ、になるのですね。

以前私がネット上のメッセージを分析したときも、スパムは問題になりました。つまり、ネット上のメッセージの機械分析に際してスパムが含まれると、分析結果が狂う。で、スパムは事前に除去したのですが、これ、さほど難しくはなかったのですね。

私が採用した方法は、メッセージの一致度をチェックする方法でして、過去の記事と同じ内容の記事があったらそれを削除する、という方法。これで、スパム以外にも、二重投稿を削除したりできたのですね。

これ、メッセージの全文をチェックすると大変ですので、私は漢字だけチェックしました。英文であれば、短い単語を無視してチェックするなどすれば、扱う情報量を減らせるでしょう。メッセージが同じかどうかのチェックは、ハッシュテーブル、というのを使うと簡単。

この方法を使っても、メッセージの一部を変えるなどの対応が出来ますので、部分的なチェックを組み合わせて、一致度何パーセント以上は削除、などの対応が必要でしょう。

ほとんど同一内容の記事、宣伝以外でもありえるのですが、でもその情報量は無に近い。やはり邪魔な記事であることに、変わりはないのですね。

ふうむ、スパム対策、うまいやり方を考えると、ビジネスになるかもしれませんね。