ブログ記事一覧(月別)Archives (Every month)
April 2010 のブログ記事を表示しています。
Nucleus用 robots.txt テンプレ
- 投稿日(04/29 2010, 07:55)
- タグ(robots.txt SEO)
- カテゴリ(Nucleus)
- 記し人(luvsic)
毎回、正しいかどうかチェックするのがめんどうなのでテンプレ
ファイル名:robots.txt
半角小文字がルール。違うと読まれないらしい。
Sitemap: http://luvsic.net/sitemap.xml
User-agent: *
Disallow: /action.php?*
Disallow: /index.php?*
User-agent: Googlebot
Noindex: /action.php?*
Noindex: /index.php?*
1行目「Sitemap~」は、そのサイトのサイトマップを認識させる。
Sitemaps.org形式のXMLサイトマップ形式であること。
3・4行目「User-agent: *」の部分はすべてのクローラに対して行う指定。
Nucleusの初期ファイルでは「/action.php?*」のみがDisallowとなっている。
URL系(NP_customUrlやfancyurls-2等)の実装時のみ、上記サンプルのように「index.php?*」もDisallowするといい。
6・7行目「User-agent: Googlebot」は、グーグルのクローラにのみ対して行う指定。
- Disallow・・・アクセスを禁止する
(他サイトからリンクを張られたりするとインデックスする可能性有) - Noindex・・・インデックスを禁止する
Noindexは今日現在、Googleしか対応していない。
よってrobots.txtではUser-agentを個別指定で行う。
robots.txt 番外編
ウェブ魚拓を拒否する
User-agent: Megalodon
Disallow: /
インターネットアーカイブを拒否する
User-agent: ia_archiver
Disallow: /
Cacoo(カクー) が便利かも・・・!
techcrunchで紹介されていた日本発のCacooは複数ユーザーがリアルタイムで協調しながらデザイン作業ができるすぐれものという記事をみて、そのCacooというサービスが気になって。
「Cacoo(カクー)はWeb上で簡単にサイトマップやワイアーフレーム、UML、ネットワーク図などの図が作成できるドローツールです。ご利用は無料です。」とのこと。さっそく使ってみた
[ 続きを読む ]