業務外
Google AdSenseを復活させ、井戸掘りブログへの広告の再掲載を試みています。そのためには記事内のデットリンク(リンク切れ)の見直しが必要です。記事の投稿数が600件を超えているので、人力では無理!!
Google先生に聞いてみましょう。
最初にヒットしたのが、
W3Cリンクチェッカーです。代表的なツールで無料、かつインストール不要でオンラインでチェックできます。これを試してみましょう。
対象はデットリンクを確認済みの
井戸掘り参考ブログのページです。モバイルバージョンで試してみます。URLを指定して実行します。
248.14秒
1ページで4分強、結構時間が掛かります。ログを見ると井戸掘りダイジェストや、ブログアーカイブのリンクを何十、何百とチェックしています。ガジェット部分のリンクですね。これは無駄。
いったんモバイルバージョンで、これらのガジェットを非表示にしてみます。テーマでHTMLを編集して、以下のガジェットに mobile=′no′ を設定します。
- 自己紹介
- ブログ検索
- コンテンツ
- ラベル
- ブログアーカイブ
- 人気の記事
再実行すると、今度は1/3の時間になりました。リンクチェックするサーバに負荷を掛けないように、各リンクチェックは1秒間隔で実行しているようです。
86.87秒
1分半弱、まーこれでいくか。
以下がリンクチェックの結果のサマリー版です。エラーは15箇所。
サマリーの下に各エラーの詳細が表示されていますが、省略。
Code | Occurr-
ences | What to do |
(N/A) | 6 | The link was not checked due to robots exclusion rules. Check the link manually, and see also the link checker documentation on robots exclusion. |
(N/A) | 2 | Accessing links with this URI scheme has been disabled in link checker. |
404 | 1 | The link is broken. Double-check that you have not made any typo, or mistake in copy-pasting. If the link points to a resource that no longer exists, you may want to remove or fix the link. |
405 | 1 | The server does not allow HTTP HEAD requests, which prevents the Link Checker to check the link automatically. Check the link manually. |
500 | 5 | This is a server side problem. Check the URI. |
各エラーの詳細をChromeのデベロッパーツールで確認していきます。デベロッパーツールの使い方を覚えて良かった。
1行目の6件『The link was not checked due to…』は
検索ロボットの除外ルールにより、リンクはチェックされなかったとのこと。
Bloggerにログインしてブログのソースをデバッグすると、クイック編集の箇所です。Blogger内部の問題なので無視して良いはず。
2行目の2件『Accessing links with this URI…』は、URLへのアクセスが無効になっているとのこと。
これもBlogger内部の問題なので無視します。
Code404はNot Found、ページが見付からないとのこと。
問題の箇所はブログサービス『Yahoo!ジオシティーズ』の終了で、Sorry Pageが表示されていました。これは
修正要です。
Code405はMethod Not Allowed、自動でチェックできないから手動でリンクを確認せよとのこと。
dynamic CSSへのリンクです。アクセスするとCSSは存在するようですが実体は空みたい、良く判らん。これもBlogger内部の問題なので無視します。
Code500はInternal Server Error、6件ありましたがこのURLが見つからず、本当のデットリンクでした。これも
修正要です。
エラーではありませんが、3件のリダイレクトを検出していました。2件はhttpからhttpsへのリダイレクト。1件は日本ブログ村の画像でした。これも
修正しておきましょう。
試してみましたが、W3Cリンクチェッカーは使えます。
外部リンクにはrel="nofollow" を指定してあります。これはロボット検索への禁止指示ですが、このリンクもチェックしてくれます。
また一番気になっていたブログサービスの終了ですが、告知ページへリダイレクトしているのも、デットリンクとして認識してくれます。
感想と構想
ツールは見つけましたが、実際の井戸掘りブログのチェックはどうやってやりますかね。
1ページずつツールに指定するのは馬鹿らしい。ツールのオプションで
リンクの階層を指定できます。最新記事から600階層強を掘れば全記事のチェックができますが、膨大なリンク数になって現実的でないです。
はてさて…。
W3Cリンクチェッカーの使い方は、以下の記事を参考にさせていただきました。
リンク切れやHTMLなどのクオリティ自動チェックツール8選