メインコンテンツにスキップ
すべてのコレクションサイト監査チュートリアル
サイト監査設定を構成するにはどうすればいいですか?
サイト監査設定を構成するにはどうすればいいですか?

サイト監査の設定がどこにあるかについての詳細と、クロールされたいものを正確にクロールするように設定する方法については、こちらをご覧ください。

Constance Tan avatar
対応者:Constance Tan
今週アップデートされました

コンテンツ


サイト監査は、私たちのクローラーによって行われます: AhrefsSiteAudit。 この特定のボット に関する詳細情報。

Ahrefsでは、サイト監査をどのように行うことができるかについて非常に包括的なオプションを提供し、お客様の技術的なサイト監査を完全に柔軟に管理することができます。

各設定セクションの概要

まず、 は、プロジェクトのサイト監査設定 に移動します。 次の3つのセクションがあります:

1. スケジュール

これにより、サイト監査をスケジュールして定期的にウェブサイトをクロールする場合と、その頻度が設定されます。 サイトの監査がクロールされる予定の時間とタイムゾーンまで、すべてを調整できます:

実際のクロールは、選択した時間内にいつでも開始することがありますのでご注意ください。 サイト監査を自動的に実行させたくない場合は、「スケジュールされたクロールの実行」をオフに切り替えます。

2. URL ソース

URLソースは、「シードURL」またはサイト監査が最初に訪問しようとする開始ページを指定します。 デフォルトでは、「ウェブサイト」と「自動検出されたサイトマップ」オプションのみが選択されます。 このプロジェクトのスコープ内のすべてのページをクロールしたい場合に最適です。

💡 特定のサイトマップの URL だけをクロールしたい場合、 このガイド に従ってください。

💡 このトグルをクリックして、5つのURLソースまたはシードURLオプションの詳細を確認します

  1. Website. このチェックボックスをオンにすると、サイト監査はプロジェクトURLをクロールの出発点として取ります。 プロジェクトのスコープ:

  2. サイトマップの自動検出。 このチェックボックスをチェックすると、サイト監査がウェブサイトの robots.txt ファイルにリストされているサイトマップファイルからクロールを開始します。 robots.txt ファイルがサイトマップを一覧表示していない場合、デフォルトのサイトマップの場所を確認します。

    • <your website>.com/sitemap.xml

    • <your website>.com/sitemap_index.xml

  3. 特定のサイトマップ。 このボックスをチェックすると、カスタムのサイトマップファイルからクロールを開始できます。 チェックボックスをオンにするとサイトマップURLに入力する入力ボックスが開きます:

  4. カスタム URL リスト このボックスをチェックすると、サイト監査がクロールを開始するためのURLのリストに入力することができます。 入力ボックスに入力するか、CSV / TXTファイルからアップロードします。 ファイルサイズの上限は16MBです。 プロジェクトの範囲内のURLのみがクロールされることに注意してください。

  5. Backlinks このボックスをチェックすると、サイト監査がデータベースに外部のバックリンクがあるURLからあなたのウェブサイトをクロールし始めることになります。 プロジェクトのURLをサイトエクスプローラに入力し、バックリンクのレポートをチェックすることで、どのURLがあるかを確認できます:

3. クロールの設定

ここで利用可能な設定オプションのかなりのリストがあります。それぞれに各ツールチップについての詳細情報を提供するツールチップがあります:

各設定オプションの詳細については、下の各トグルをクリックしてください:

速度設定

あなたのウェブサイトのクローラー"フォロー"リンクをどのくらい速く制御します。 以下の例では、2秒ごとに1つのリンクが続いています。

サイト監査のクロール速度を制御する設定セクション

設定

  • 以下の設定例では、
    任意のページをチェックするときにクローラーは javascript をレンダリングしません。 しかし、任意の問題については、画像、CSS、およびjavascriptのリンクをチェックします。

  • クローラーはまた非正規のページのリンクをクリックし、nofollowリンクをクリックします。

  • クローラーはプロジェクトのウェブサイトの範囲外のリンクを完全に無視します

  • クローラーは、URLパラメーターを削除せずにリンクを正確に見つけたとおりに確認します

上限

このセクションは、クローラーが新しいページをクロールしようとするのをやめるしきい値を指します。 以下の例では、いずれかの制限に達した場合、クローラーは停止します。

  • 10,000ページがクロールされ

  • クロールには48時間かかります

以下のページは無視されます。

  • シードから16レベル以上高い

  • 16 以上のフォルダの深さ

  • 2048文字以上のURLがあります

  • 12以上のURLクエリパラメータがあります

サイト監査制限

ロボット命令

このセクションでは、クローラーにrobots.txtを無視し、ユーザーエージェントをDesktopからMobileに変更するよう指示できます。 両方の完全なユーザーエージェント文字列は、 AhrefsSiteAudit自身のページ にあります。

この機能は検証済みプロジェクトでのみ使用できます。 これは、ボットによってクロールされることを許可されていないウェブサイトの部分を監査するために便利です。

認証

この機能は高度な購読者以上で利用できます。 ウェブサイトがHTTP認証でパスワードで保護されている場合 トグルをオンにしてクローラーのパスワードを入力して ウェブサイトをクロールする

ページ速度インサイト

PageSpeed Insights (PSI) は、ウェブページのスピードとユーザーエクスペリエンスを得るのに役立ちます。 サイト監査はPSIのスコアが低いページにフラグを立てます。 この機能を使用するには、Google から API を入力する必要があります。

URLを含めて除外しますformat@@2

特定のページをクロールする場合や、正規表現を使用して特定のページをクロールすることを避ける場合に使用します。 こちらの記事 regexの使い方の詳細と、試してみることができる例をご覧ください。

正規表現のみが となりますのでご注意ください。 ボックスに入力されたデータが有効な正規表現を形成していない場合、それは無視されます。 また、ボックス内に空白の行を入力しないでください。

URLリライトルール

このフィールドの使用例(特に正規表現の場合)をこちらで確認できます。

よくある質問

サイト監査は初めてです。 どの設定を使うべきですか?

ウェブサイトを完全にクロールしたい場合は、デフォルトのままにしておくことができます。 ウェブサイトがJavaScriptを使用してページ内のコンテンツを生成する場合は、「Javascriptを実行」のトグルをオンにすることをお勧めします。 まだ不明な点がある場合は、メールまたはライブチャットでサポートチームに連絡できます。

サイト監査の設定を変更しましたが、サイト監査レポートでは何も変更されませんでした。 なぜでしょう?

プロジェクト設定に保存された変更は、新しいサイト監査クロールにのみ適用されます。 サイト監査の過去または進行中のクロールは影響を受けません。

サイトエクスプローラのウェブサイトのデータが間違っている/不完全です。 サイト監査でウェブサイトを適切にクロールしていないからですか?

サイト監査でのクロールは、サイトエクスプローラのデータを更新しません。 サイトエクスプローラのデータは、サイト監査のためのものとは異なるクローラ AhrefsBotによって入力されます。 ウェブサイトが新しい場合は、クローラーがそれに到達するのに時間がかかることがあります。 それ以外の場合は、あなたのウェブサイト ここ を確認して、私たちのクローラーがあなたのウェブサイトを訪問している問題があるかどうかを確認してください。


関連

こちらの回答で解決しましたか?