告知欄です

■掲示板に戻る■ 全部 1- 101- 最新50
雑談とか

143 :skin30-2作者 ★:2007/10/13(土) 18:37:12 ID:???
そしたら、LDRの使い方が激変した。pやvを使わなくなった。
購読フィードもだいぶ増えた。
ただ、この機能は、広告カットと同じ問題を抱えてるため、
広告カットやこういうスクレイピングに対抗するサイトもあり、
REUTERSがものすごい対策を取ってる。

・不正なHTML(bodyが存在しないし、要素の親子関係もめちゃくちゃ)
・文章を短くちぎってpで括って、さらにその間にダミーの要素を入れる
・等幅フォントを用いて、半角空白や罫線AAで表を作成
・ページを複数に分けて、次のページのリンクをjavascriptで隠蔽
・印刷用ページはリファラで監視して、直リン禁止

一見すると、1995年くらいの中学生が作ったHTMLにも見えるけど、
世界的に有名な企業のサイトがこんな間抜けな設計なわけないだろ。
ちゃんと計算されてる。HTMLとか。

スクレイピング対策の結果、またこういう残念な思いのするサイトが
増えていくのかと思うと、スクレイピングは罪作りなのかもね。

48KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail(省略可)

0ch BBS 2005-12-31