처음으로 - 방명록 - 관리자
태그 '스팸 필터링' : 해당되는 글 1건
2006/05/15   근래 스팸 트랙백의 경향과 대응 (2)

근래 스팸 트랙백의 경향과 대응

요즘 스팸 트랙백은 과거에 비해 제목과 내용이 짧아졌다. 대체로 두세 단어를 넘기지 않는다. 이는 단어 필터링에 대응해 진화한 것으로 보인다.

단순한 1:1 매칭 단어 필터링만으로는 점점 스팸 트랙백에 효과적으로 대응할 수 없게 되어가고 있다. cialis를 스팸 단어에 등록하더라도 cia1is나 cilais에는 간단히 무력화될 것이다. 설명부에 오타가 없는 것만은 못하겠지만 업자는 구글주스를 조금이라도 얻을 수 있으니 그에게는 별 문제가 아니다.

근래의 행태를 볼 때 트랙백의 내용이 다섯 단어를 넘기지 않으면 스팸으로 추정하는 대응이 필요하다. 짧은 시간 내에 같은 ip에서 여러 개의 트랙백이 집중적으로 날아왔을 때도 스팸으로 추정할 만 하다.

그 외에, 현행 태터에서는 트랙백이 스팸으로 판단되면 흔적도 없이 막아버리는데 이것은 문제가 있다. 어떤 방법이든 항시 예외는 있을 수 있으므로 어디까지나 추정일 수밖에 없다. 앞으로는 여러 근거에 가중치를 두어서 복합적으로 스팸 여부를 판단하는 방식으로 가겠지만, 그 정확도가 높아져도 최종 판단은 사람이 할 수 있는 편이 좋다. 스팸함을 두고 골라낼 수 있게는 해야 한다.


1 /

한 지붕 두 친구

민식과 정헌. 2인조의 끝모르는 잡스러운 이야기들.

RSS FEED

Powered by TatterTools