熱湯3分

熱湯注いで、フタして3分。何が飛び出す? / 書感、ヲチ、ほか / って小説読む時間が無いよ orz
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

まずは公式マニュアルの「 検索エンジンに拾われにくくする方法 」を参照。

プライベートモード(パスワードを要求するモード)、FC2ブログトップページへの更新通知、pingの送信(FC2ブログ以外のシステムへの更新通知)については、本稿では扱わない。必要に応じて上掲の公式マニュアルを参照せよ。 根本的に検索避けを行ないたければ、(FC2ブログでは)プライベートモードの使用を検討すべきである。

META要素を使う方法は、要約すれば 下記の一文に尽きる。

<meta name="robots" content="noindex,nofollow" />

ここで、 meta は「要素名」、 namecontent は「属性名」、 robotsnoindex,nofollow は「属性の値」 と呼ばれる。

いくつか注意すべき点がある。

  • 要素名と属性名は小文字で書く。
  • 閉じカッコ「 > 」の直前にスラッシュ「 / 」が必要。(注記参照

上記は XHTML の文法上の「お約束」である。 なお属性の値(後述)は、この「お約束」には縛られない。

FC2ブログの魅力の一つはテンプレートによって様々なデザインを楽しめる事だが、 そのテンプレートは主に HTML 4.01 に基づく物と XHTML 1.0 に基づく物とに大別できる。

上記「お約束」は、 HTML のテンプレートを選んだ場合は特に気にしなくても良い事だが XHTML のテンプレートを選んだ場合には厳守する必要がある。 現在 HTML のテンプレートを選んでいる場合でも、将来の衣替え時に慌てない様、 上記「お約束」に留意すべきである。

基本的に HTML と XHTML はよく似た文法ではあるものの、 XHTML の方が厳しい制限を持つ。下に例を示す。

HTML としては正しいが、 XHTML としては正しくない例
<META NAME="robots" CONTENT="noindex,nofollow">
HTML としても XHTML としても正しい例 (注記
<meta name="robots" content="noindex,nofollow" />

次に、属性の値について

robots」 は、 The Web Robots Pages の記述

Note the "robots" name of the tag and the content are case insensitive.

の通り、文字の大小は区別されない。

一方 「noindex,nofollow」 は、一部のロボットは大文字の記述しか解釈しないと聞く。

故に結論は、この通り。

<meta name="robots" content="NOINDEX,NOFOLLOW" />

これが、FC2ブログでの検索避けの書き方である。


なお、FC2ブログでは http://****.blog000.fc2.com/robots.txt の位置にファイルを置けないため、 robots.txt による指定方法や.htaccessファイルによる制限は利用できない。

その代わり FC2ブログには プライベートモード が有り、ブログにパスワードを掛ける事は出来る。 この機能の面白い応用方法が、 「公開パスワード方式」と名付けて ドジっ子Watcher さんのブログで紹介されている。

要約すると 「パスワード入力画面と共に表示されるメッセージを読んで理解できる人なら(誰でも)入れるが、検索エンジンのロボットは理解できないので入れない」という仕掛け。 詳細はリンク先で確認して欲しい。


追記。

上述の方法で「Web魚拓」や「Google 検索」 を制限することは出来るが、別の方法によって画像化されることを防げるわけではない。

そもそも、どんなに検索避けをしても 見付かる時は見付かる物と覚悟し、 見られて困るような内容はブログに書かないように気をつけよう。

Google キャッシュ」を防ぎたければ、content="NOARCHIVE" で。

はてなブックマーク」が 「name="robots"」を解釈するのかは不明。 万全を望むならば、それぞれの説明を参照すべし。


TODO: 「末尾のスラッシュ」についてトラックバックで頂いた指摘を参照しつつ加筆する必要あり。

簡単に言うと、「(HTML として)正しい」と言い切ってしまう事が問題らしい。 詳細を調べるまで、(暫定的に)下記に表現してみる。

HTML としては正しいが、 XHTML としては正しくない
<meta name="robots" content="noindex,nofollow">
末尾にスラッシュが無い。この点が XHTML として問題となる。
HTML としては正しくないと思われる)が、 XHTML としては正しい例
<meta name="robots" content="noindex,nofollow" />
末尾にスラッシュが有る。この点が HTML として問題となる。
HTML としても XHTML としても正しくないと思われる)例
<META NAME="robots" CONTENT="noindex,nofollow" />
末尾にスラッシュが有る。この点が HTML として問題となる。
要素名や属性名が大文字で書かれている。この点が XHTML として問題となる。

調査続行。

関連して、苦手な 英文資料 と格闘中…。


途中経過 <16 de octubre de 2007>

英文資料を #Preface: the validation problem まで読んだ。

XHTML 1.0 W3C勧告付録C. HTML互換性ガイドライン を(解説サイト経由だったか、それは忘れたが)以前に読んだような覚えがある。その記憶に沿って、上述の「末尾のスラッシュ」を書いた。 ところが 勧告の最新版(Second Edition)には、 加筆・編集された部分がある。 旧版(First Edition) と並べて見比べる方が解り易いだろうか? 最新版の冒頭には、こう書き加えられている。

Note that this recommendation does not define how HTML conforming user agents should process HTML documents. Nor does it define the meaning of the Internet Media Type text/html. For these definitions, see [HTML4] and [RFC2854] respectively.

訳してみよう。

この勧告は、 HTML4適合ユーザエージェントがHTML文書をどう扱うべきかも、 インターネットメディア型 text/html の意味も、 定義していないことに注意して欲しい。 それらについては、それぞれ [HTML4][RFC2854] を見よ。

言い換えれば、空要素<meta /> という書き方は あくまでも (HTML4適合UAが読める) XHTML文書の書き方であって、 HTML文書の書き方だとは一言も言っていない、という事だ。

わざわざ加筆するからには、私のように誤解する輩も多かったのだろう。 (誇る事ではない;)


途中経過 <18 de octubre de 2007>

英文資料を #Elements, tags, and "minimization" in SGML and HTML まで読んだ。

ところで、次のサンプルを どう評価・解釈する?

サンプル1
HTML 4.01 Strict で、<body> 開始タグあり
<!DOCTYPE HTML PUBLIC
   "-//W3C//DTD HTML 4.01//EN"
   "http://www.w3.org/TR/html4/strict.dtd">
<title>Sample of &lt;EmptyElement /&gt;</title>
<body>
<div><hr /></div>
</body>
サンプル2
HTML 4.01 Strict で、<body> 開始タグを省略
<!DOCTYPE HTML PUBLIC
   "-//W3C//DTD HTML 4.01//EN"
   "http://www.w3.org/TR/html4/strict.dtd">
<title>Sample of &lt;EmptyElement /&gt;</title>
<!-- body -->
<div><hr /></div>
<!-- /body -->
サンプル3
HTML 4.01 Transitional で、<body> 開始タグあり
<!DOCTYPE HTML PUBLIC
   "-//W3C//DTD HTML 4.01 Transitional//EN"
   "http://www.w3.org/TR/html4/loose.dtd">
<title>Sample of &lt;EmptyElement /&gt;</title>
<body>
<hr />
</body>
サンプル4
HTML 4.01 Transitional で、<body> 開始タグを省略
<!DOCTYPE HTML PUBLIC
   "-//W3C//DTD HTML 4.01 Transitional//EN"
   "http://www.w3.org/TR/html4/loose.dtd">
<title>Sample of &lt;EmptyElement /&gt;</title>
<!-- body -->
<hr />
<!-- /body -->

ただし これを直接 meta 要素に適用する事は出来ないが。


ちょっと一息。 <19 de octubre de 2007>

他所からリンクされる際は、 <a href="" rel="nofollow"> という記法を(リンク元に)検討して貰うのも一案。

FC2ブログを含むレンタルブログでは、 RSSを拾われる可能性 も考えよう。

META要素の書き方については、 同ページ に書かれているように、場合分けして説明する方法が使えるかもしれない。(※コメント参照

ブログのスキンの<head> </head>の間にMETAタグを入れましょう。

もし他のMETAタグが「>」で終わっているのなら下記のものを。
<meta NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">
もし他のMETAタグが「/>」で終わっているのなら下記のものを。
<meta NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW" />


途中経過 <22 de octubre de 2007> 頃

英文資料を #The explanation to the validation problems まで読んだ。

関連サイトを回っている間に

<meta http-equiv="robots" content="noindex">

という記述を見付け、動揺している。これって一体…?

また、content="noindex"content="noarchive" との関係も調べる必要がある。

検索避けに

<meta name="robots" content="noindex,nofollow">

を書いているが、google のキャッシュを消すために

<meta name="robots" content="noarchive">

も加えたい。しかし両方を書くとクローラが誤解する。

キャッシュ消しだけを残したしたら、その隙に また検索エンジンに拾われたよ ワーン

という話を目にするのだが、彼らに content="noindex,nofollow,noarchive" (順不同)を薦められないかと思っている。一方で

content="noindex,nofollow" 以外の記述は認められず、そこに 「,noarchive」 を添えるなど論外だ

といった原理主義的な輩が現れた際の対抗手段も調べる必要があるだろう。


途中経過 <24 de octubre de 2007>

英文資料を #Why is XHTML different from HTML here? まで読んだ。


途中経過 <26 de octubre de 2007>

英文資料を #Empty elements in SGML まで読んだ。


途中経過 <31 de octubre de 2007>

英文資料を #Empty elements in HTML まで読んだ。


途中経過 <2 de noviembre de 2007>

英文資料を #Inclusion-like elements まで読んだ。

HTML 文書を XHTML 文書へと変換する方法の書かれた XML FAQ (How can I make my existing HTML files work in XML?) では、 「 /> 」で終わっていないEMPTY要素 書き換えの説明後、一部の古いブラウザへの影響が言及されている。

Be aware that some obsolete HTML browsers may not accept XML-style EMPTY elements with the trailing slash, so the above changes may not be backwards-compatible.


途中経過 <4 de noviembre de 2007>

英文資料を #Passing data to something external まで読んだ。


途中経過 <5 de noviembre de 2007>

英文資料を #Data hidden in attributes まで読んだ。


途中経過 <6 de noviembre de 2007>

英文資料を読了した。

TBで紹介されていた記事を再読して、今後の展開を考える予定。


途中経過 <20 de noviembre de 2007>

末尾のスラッシュの有無と区別について、別の記事「ソーサレナイ・ブックマーク」で軽く触れた。同記事では、META要素による規制が一部のオンラインブックマークサービスに与える効果について記述している。

テーマ:FC2 BLOG - ジャンル:ブログ


▼この記事へのコメント(あれば表示)
このコメントは管理人のみ閲覧できます
2007/10/14(日) 23:34:42 | | by - (#) [ 編集 ]
常用しているメールサーバーが最近不調でして、
返書が御手元に届くまで時間が掛かるかもしれませんが
お問い合わせの件、OK です。
2007/10/15(月) 04:49:48 | URL | by 即席麺 (#IiwTK0Qw) [ 編集 ]
>META要素の書き方については、 同ページ に書かれているように、

でもその引用元の内容は間違っている
XHTMLの属性名はcase-sensitiveだから(笑)

#ただ、分けて説明する、という話には異論はない。
#a要素にrel属性ってあるのね、初めて知った。(調べればわかっただろうが、使ったことがない)
2007/10/19(金) 04:04:41 | URL | by himajin100000 (#1.FWpkaM) [ 編集 ]
紹介していただいた記事にも書きましたが「公開パスワード方式」はどうでしょうか。
http://blunderer.blog54.fc2.com/blog-entry-144.html
プライベートモードの際表示されるメッセージは自分で入力できるので、そこにパスワードを書いてしまえばいいのです。
2007/10/19(金) 21:55:54 | URL | by 高樹ひろむ (#yu0f4SLA) [ 編集 ]
To: himajin100000 さん。​
>その引用元の内容は間違っている
ええ、まあ、そこは飽くまでも「引用」として引いておりますので…。
本文に反映させる時には忘れず修正します。

>rel属性
この記事を見つけた時、私も心配になって W3C に行って確認してきましたw
加えて "nofollow" という値がどこから出ているのか、探してみたら こんな感じでした。Google, Yahoo, MSN は対応している模様。
News: 米Google、リンク属性を利用したコメントスパム対策機能
http://internet.watch.impress.co.jp/cda/news/2005/01/19/6119.html
Help: Google, Yahoo!
http://www.google.co.jp/support/webmasters/bin/answer.py?answer=33582
http://help.yahoo.co.jp/help/jp/search/indexing/indexing-31.html
Memo: ちょっとしたメモ - rel="nofollow"と文書間の関係
http://www.kanzaki.com/memo/2005/01/23-1

こんな「FCブログに関する質問」も、その足で見付けました。
><link rel="alternate" type="application/rss+xml" title="RSS" href="​~">​
の削除までは思い及びませんでした。嗚呼…
QA: 検索にかからないようにするには?(ブログ)
http://okwave.jp/qa3420864.html

To: 高樹ひろむ さん。​
テクニックを全部パクってしまったら、それこそ無礼者と呼ばれてしまいます;

拝見したところ記事中では FC2WEB を想定した記述になっていますが、FC2ブログのプライベートモードにも応用できる技法ですね。
記事に反映してみました。(robots.txt, .htaccess への言及付近)
2007/10/20(土) 01:23:33 | URL | by 即席麺 (#IiwTK0Qw) [ 編集 ]
確かにテクニックを丸々コピーしたような記事を書いたら問題でしょうが、あくまで一部として書くのならば問題無いと思います。仁義などの点に関しても「こちらで紹介されていますが~」という言葉と共にリンクをするならいいと思いますがいかがでしょうか。

また、公開パスワード方式をブログに使う件についても私の記事に追記させていただきました(一番最後です)。
2007/10/20(土) 20:45:06 | URL | by 高樹ひろむ (#yu0f4SLA) [ 編集 ]
当記事で言う「公開パスワード方式」の同類と思われる機能を
「なぞなぞ認証」と名付けた。

#「はてな」アカウント持ってないけど、一応メモ。
2008/09/12(金) 23:38:06 | URL | by 即席麺 (#IiwTK0Qw) [ 編集 ]

■ コメントを投稿する
管理者にだけ表示を許可する
 


(→ FC2ブログユーザーによるトラックバックはこちらから)

▼この記事へのトラックバック(あれば表示)
http://naniome2.blog67.fc2.com/blog-entry-4933.html何おめ経由http://pastaseca.blog119.fc2.com/&gt;HTML としても XHTML としても正しい例&gt;鳩丸よもやま話-SGML の短縮タグ機構HTMLとして,ではなくSGMLとして解釈可能なんだと思うけど?以下検証結果。#W3C Validato
2007/10/13(土) 16:37:00) | 日々のDraft
なんかキャラ名+型/紙で結構ヒットしてしまってそこそこ人が来てしまい、そういう内容を書いているブログではなく申し訳ないので、とりあえず検索避けに/を入れてみました。ちょろっと書いただけのワードで3位とかに出てしまうのはちょっとアレなものがありますね。ついでな
2007/11/19(月) 13:01:18) | コスプレ衣装をメモするブログ
 カスタマイズの難易度2 ユーザーの方から、検索に拾われ難くする方法についてのご質問を頂戴しました。 残念ながら、管理人はさほど詳...
2010/10/13(水) 18:08:10) | Novel テンプレート
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。