正規表現 (REGEX または REGEXPとも呼ばれます) は、特定のパターンに一致する URL またはテキストを見つけるのに役立ちます。 REGEXは、APIのサイトエクスプローラ、サイト監査、および特定のエンドポイントでサポートされています。
💡REGEXの使い方や役に立つ例のリストについては、 を参照してください。
AhrefsはどのREGEXシステムを使用していますか?
RE2 を使用します。
このウェブサイトを使用して、Regex式が動作するかどうかをテストできます: https://regex101.com/. 左側のメニューから“Golang” を選択する必要があります。
サイトエクスプローラでのフィルタリング
特定のURL、ドメイン、またはテキストフィールドをフィルタできるレポートは、REGEXフィルタをサポートします。 「正規表現に一致」をフィルタリングするか、「正規表現に一致しません」を選択できます。
以下は、 参照ドメイン レポートでREGEXでフィルタするオプションを見つける例です。
REGEXをサポートする項目については、 より多くのフィルタ を確認することもできます:
サイト監査内のフィルタリング
ビューソースで検索
「正規表現を使用」オプションを選択すると、ページの HTML で特定の URL やテキストを検索できます。
Crawl設定にURLを含めて除外する
任意のプロジェクトの クロール設定 の内 任意のクロールに含めるか除外したい特定の URL セットを定義できます。 これらのフィールドは REGEX をサポートしています:
不正な REGEX 式は無視されます。 https://regex101.com/ のようなツールを使用して、式が正しく動作することを最初に確認すると便利です。
これらのルールは、 シードにも適用されます。 だから、新しいパターンを設定するたびに、クローラーがクロールを開始するために何かを持っていることを確認してください。
両方のフィールドといくつかのURLを使用する場合、「含まれる」と「除外」の両方のパターンと一致する場合、サイト監査はそのURLをクロールから除外します。
URL またはドメインをフィルタリングする際の詳細フィルター
ページエクスプローラとリンクエクスプローラは高度なフィルタをサポートしており、フィルタを設定する際に「正規表現に一致する」を選択するオプションが多くあります。
API内のフィルタ構文
特定のAPIエンドポイントは、サイトエクスプローラーおよびキーワードエクスプローラーツールにおけるwhere
パラメータを許可し、REGEXパターンを使用することができます。
API ドキュメント で、それらをどのように適用できるかについての完全なドキュメントを参照してください。