هدف این نوت بوک Jupyter معرفی Moz Links API با استفاده از پایتون است. این باید روی هر محیط میزبانی نوت بوک مانند Google Colab کار کند.
اگر در Github به این موضوع نگاه میکنید، میتوانید قطعههای کد را در محیط نوت بوک خود کپی/پیست کنید. تا زمانی که این اسکریپت را تا پایین اجرا کنید، از هر نقطه پایانی Moz Links API استفاده کرده اید و می توانید قسمت هایی را که می خواهید برای پروژه خود انتخاب کنید. اسناد رسمی را می توان در اینجا یافت.
سردرگم؟ مطمئن شوید که مقدمه من برای Moz Links API را بررسی کنید.
واردات جهانی انجام دهید
عبارات import در بالای یک برنامه پایتون برای بارگیری منابع خارجی استفاده می شود که به طور پیش فرض در مفسر پایتون بارگذاری نمی شوند. این منابع ممکن است شامل کتابخانه ها یا ماژول هایی باشد که قابلیت های اضافی را برای برنامه فراهم می کند.
عبارات Import معمولاً قبل از اجرای هر کد دیگری در بالای برنامه قرار می گیرند. این به برنامه اجازه می دهد تا هر گونه منابع لازم را قبل از اینکه در برنامه مورد نیاز باشد بارگیری کند.
هنگامی که منابع با استفاده از دستورهای import بارگذاری شدند، می توان آنها را در هر جایی از برنامه استفاده کرد، نه فقط در سلولی که دستور import نوشته شده است. این به برنامه اجازه می دهد تا به عملکرد ارائه شده توسط منابع وارد شده در طول اجرای خود دسترسی داشته باشد.
کتابخانه های اینجا بخشی از کتابخانه استاندارد پایتون نیستند درخواست ها و sqlitedict. می توانید با نصب کنید درخواست های نصب پیپ و پیپ نصب sqlitedict در ترمینال یا سلول Jupyter. اگر از Anaconda استفاده می کنید، درخواست ها از قبل نصب شده است.
import json
import requests
from headlines import *
from pprint import pprint
from sqlitedict import SqliteDict as sqldict
بارگذاری مقادیر ورود به سیستم از فایل خارجی
کد زیر فایلی به نام “linksapi.txt” را از فهرست “assets” می خواند، که حاوی اطلاعات کاربری ورود به سیستم، از جمله شناسه دسترسی و کلید مخفی مورد نیاز برای دسترسی به Moz API است. این اعتبارنامه ها از فایل استخراج شده و به دو متغیر با نام اختصاص داده می شوند دسترسی و SECRETKEY. را با بیانیه برای اطمینان از بسته شدن صحیح فایل پس از خواندن استفاده می شود. فایلی ایجاد کنید که محتویات آن شبیه به این باشد و اعتبار شما به صورت دستی از moz.com بازیابی شده باشد:
ACCESSID: mozscape-1234567890
SECRETKEY: 1234567890abcdef1234567890abcdef
هنگامی که اعتبارنامه ها از فایل استخراج می شوند، در یک تاپل به نام AUTH_TUPLE ذخیره می شوند. این تاپل را می توان به عنوان یک آرگومان برای توابع Moz API برای احراز هویت و مجوز دسترسی به داده ها استفاده کرد.
هدف از این رویکرد جلوگیری از اعتبارنامههای ورود حساس با کدگذاری سخت به طور مستقیم در برنامه است که در صورت اشتراکگذاری یا انتشار عمومی کد میتواند خطر امنیتی ایجاد کند. در عوض، اعتبارنامه ها در یک فایل جداگانه نگهداری می شوند که در مخزن گنجانده نشده است و به راحتی می توان آنها را ایجاد و در صورت نیاز به روز کرد. به این ترتیب، کد را می توان بدون در معرض دید عموم به اشتراک گذاشت.
with open("../assets/linksapi.txt") as fh:
ACCESSID, SECRETKEY = [x.strip().split(" ")[1] for x in fh.readlines()]
AUTH_TUPLE = (ACCESSID, SECRETKEY) # Don't show contents
متغیرها را پیکربندی کنید
در این کد، چندین متغیر پیکربندی وجود دارد که برای تنظیم فراخوانی API به API Moz Links استفاده می شود.
متغیر اول، COMMON_END نکته، ثابتی است که URL نقطه پایانی را برای Moz API ذخیره می کند. متغیر دوم، sub_endpoint، رشته ای است که نشان دهنده زیرمسیر نقطه پایانی برای داده لنگر متن است که به COMMON_END نکته URL برای تشکیل API کامل نقطه پایانی URL.
متغیر چهارم، data_dict، دیکشنری است که شامل پارامترهای درخواست API است. در این مورد، data_dict نشانی اینترنتی هدفی را که میخواهیم دادههای متن لنگر را برای آن بازیابی کنیم، محدوده دادهها (در این مورد، سطح صفحه) و محدودیت 1 نتیجه را مشخص میکند.
در نهایت، json_string متغیر با تبدیل دیکشنری data_dict به یک رشته با فرمت JSON با استفاده از json.dumps() تابع. این رشته به عنوان بدنه درخواست هنگام برقراری تماس API استفاده خواهد شد.
این متغیرها برای پیکربندی و پارامترسازی درخواست API استفاده میشوند و میتوان آنها را برای انجام هر کدام تغییر داد data_dict درخواست در برابر هر Moz Links API sub_endpoint.
COMMON_ENDPOINT = "https://lsapi.seomoz.com/v2/"
sub_endpoint = "anchor_text"
endpoint = COMMON_ENDPOINT + sub_endpoint
data_dict = {"target": "moz.com/blog", "scope": "page", "limit": 1}
json_string = json.dumps(data_dict)
در واقع به API ضربه بزنید (اطمینان از موفقیت)
در JupyterLab، آخرین خط یک سلول کد به طور خودکار در ناحیه خروجی چاپ می شود بدون اینکه نیازی به علامت صریح باشد. چاپ() بیانیه. کدی که ارائه کردید از کد استفاده می کند درخواست ها ماژول برای ارسال درخواست POST به URL آدرس اینترنتی با داده هایی در قالب یک رشته JSON json_string. جزئیات احراز هویت با استفاده از AUTH_TUPLE متغیر.
پس از ارسال درخواست، شی پاسخ r با استفاده از علامت چاپ می شود چاپ() بیانیه. با این کار کد وضعیت HTTP مانند 200 برای موفقیت، 404 برای یافت نشد و غیره به همراه هدرهای پاسخ چاپ می شود.
در نهایت متد .json() روی شی پاسخ فراخوانی می شود واکنش برای تجزیه داده های پاسخ به عنوان JSON و برگرداندن آن به عنوان فرهنگ لغت پایتون. این فرهنگ لغت می تواند به یک متغیر اختصاص داده شود، برای پردازش بیشتر استفاده شود، یا به سادگی در ناحیه خروجی بدون نیاز به بیانیه print() صریح به دلیل رفتار چاپ خودکار JupyterLab برای آخرین خط یک سلول کد، چاپ شود.
response = requests.post(endpoint, data=json_string, auth=AUTH_TUPLE)
pprint(response.json())
خروجی ها:
{'next_token': 'JYkQVg4s9ak8iRBWDiz1qTyguYswnj035nqjRF0IbW96IGJsb2e58hGzcmSomw==',
'results': [{'anchor_text': 'moz',
'external_pages': 7183,
'external_root_domains': 2038}]}
نقاط فرعی را فهرست کنید
این کد لیستی از نقاط پایانی مختلف را تعریف می کند که می توانند به یک پیشوند URL مشترک اضافه شوند تا نقاط پایانی API مختلف ایجاد شوند. یک نقطه پایانی API یک URL است که در آن یک API توسط مشتریان قابل دسترسی است. این یک نقطه ورود به برنامه است که به عنوان یک دروازه بان بین مشتری و سرور عمل می کند. هر نقطه پایانی با یک URL منحصر به فرد شناسایی می شود که می تواند برای تعامل با API استفاده شود.
در این کد، لیستی از نقاط انتهایی در تعریف شده است sub_endpoints متغیر، و هر نقطه پایانی به عنوان یک رشته نمایش داده می شود. حلقه for روی لیست تکرار می شود، شماره شاخص و نام هر نقطه پایانی فرعی را با استفاده از تابع چاپ چاپ می کند و شاخص را 1 افزایش می دهد. برشمردن تابع برای تولید دنباله ای از جفت ها متشکل از یک شاخص و یک مقدار از لیست استفاده می شود.
این کد برای بررسی نقاط پایانی موجود برای یک API خاص و برای انتخاب نقطه پایانی که با عملکرد مورد نظر مطابقت دارد مفید است. با تغییر نقطه پایانی فرعی در URL، کلاینت ها می توانند به منابع مختلف دسترسی داشته باشند یا عملیات متفاوتی را روی سرور انجام دهند.
sub_endpoints = [
"anchor_text",
"final_redirect",
"global_top_pages",
"global_top_root_domains",
"index_metadata",
"link_intersect",
"link_status",
"linking_root_domains",
"links",
"top_pages",
"url_metrics",
"usage_data",
]
for i, sub_endpoint in enumerate(sub_endpoints):
print(i + 1, sub_endpoint)
خروجی ها:
1 anchor_text
2 final_redirect
3 global_top_pages
4 global_top_root_domains
5 index_metadata
6 link_intersect
7 link_status
8 linking_root_domains
9 links
10 top_pages
11 url_metrics
12 usage_data
برچسب های دوستدار انسان
این کد دو لیست را تعریف می کند: نام ها و توضیحات. فهرست اسامی حاوی برچسبهای دوستدار انسان برای مجموعه نقاط پایانی است، در حالی که توضیحات لیست شرح مختصری از هر نقطه پایانی ارائه می دهد. این دو لیست به همان ترتیبی که لیست امتیازاتی که قبلاً در کد تعریف شده بود نگهداری می شوند.
با نگه داشتن سه لیست در یک ترتیب، می توان آنها را با هم در یک لیست واحد از تاپل ها “زیپ” کرد. زیپ تابع. این یک لیست جدید تولید می کند که در آن هر تاپل حاوی نام، نقطه پایانی و توضیحات برای یک نقطه پایانی API خاص است. این باعث میشود که خلاصهای کاربرپسند از هر نقطه پایانی API با نام و توضیحات آن نمایش داده شود.
را زیپ تابع عناصر سه لیست را از نظر عناصر ترکیب می کند، یک تاپلی از عناصر اول از هر لیست، سپس یک تایی از عناصر دوم و غیره را ایجاد می کند. لیست حاصل از تاپل ها را می توان دوباره تکرار کرد و هر تاپل را باز کرد تا به نام، نقطه پایانی و عناصر توضیحات برای هر نقطه پایانی API دسترسی پیدا کند.
names = [
"Anchor Text",
"Final Redirect",
"Global Top Pages",
"Global Top Root Domains",
"Index Metadata",
"Link Intersect",
"Link Status",
"Linking Root Domains",
"Links",
"Top Pages",
"URL Metrics",
"Usage Data",
]
descriptions = [
"Use this endpoint to get data about anchor text used by followed external links to a target. Results are ordered by external_root_domains descending.",
"Use this endpoint to get data about anchor text used by followed external links to a target. Results are ordered by external_root_domains descending.",
"This endpoint returns the top 500 pages in the entire index with the highest Page Authority values, sorted by Page Authority. (Visit the Top 500 Sites list to explore the top root domains on the web, sorted by Domain Authority.)",
"This endpoint returns the top 500 pages in the entire index with the highest Page Authority values, sorted by Page Authority. (Visit the Top 500 Sites list to explore the top root domains on the web, sorted by Domain Authority.)",
"This endpoint returns the top 500 pages in the entire index with the highest Page Authority values, sorted by Page Authority. (Visit the Top 500 Sites list to explore the top root domains on the web, sorted by Domain Authority.)",
"Use this endpoint to get sources that link to at least one of a list of positive targets and don't link to any of a list of negative targets.",
"Use this endpoint to get information about links from many sources to a single target.",
"Use this endpoint to get linking root domains to a target.",
"Use this endpoint to get links to a target.",
"This endpoint returns top pages on a target domain.",
"Use this endpoint to get metrics about one or more urls.",
"This endpoint Returns the number of rows consumed so far in the current billing period. The count returned might not reflect rows consumed in the last hour. The count returned reflects rows consumed by requests to both the v1 (Moz Links API) and v2 Links APIs.",
]
# Simple zipping example
list(zip(names, sub_endpoints, descriptions))
خروجی ها:
[('Anchor Text',
'anchor_text',
'Use this endpoint to get data about anchor text used by followed external links to a target. Results are ordered by external_root_domains descending.'),
('Final Redirect',
'final_redirect',
'Use this endpoint to get data about anchor text used by followed external links to a target. Results are ordered by external_root_domains descending.'),
('Global Top Pages',
'global_top_pages',
'This endpoint returns the top 500 pages in the entire index with the highest Page Authority values, sorted by Page Authority. (Visit the Top 500 Sites list to explore the top root domains on the web, sorted by Domain Authority.)'),
('Global Top Root Domains',
'global_top_root_domains',
'This endpoint returns the top 500 pages in the entire index with the highest Page Authority values, sorted by Page Authority. (Visit the Top 500 Sites list to explore the top root domains on the web, sorted by Domain Authority.)'),
('Index Metadata',
'index_metadata',
'This endpoint returns the top 500 pages in the entire index with the highest Page Authority values, sorted by Page Authority. (Visit the Top 500 Sites list to explore the top root domains on the web, sorted by Domain Authority.)'),
('Link Intersect',
'link_intersect',
"Use this endpoint to get sources that link to at least one of a list of positive targets and don't link to any of a list of negative targets."),
('Link Status',
'link_status',
'Use this endpoint to get information about links from many sources to a single target.'),
('Linking Root Domains',
'linking_root_domains',
'Use this endpoint to get linking root domains to a target.'),
('Links', 'links', 'Use this endpoint to get links to a target.'),
('Top Pages',
'top_pages',
'This endpoint returns top pages on a target domain.'),
('URL Metrics',
'url_metrics',
'Use this endpoint to get metrics about one or more urls.'),
('Usage Data',
'usage_data',
'This endpoint Returns the number of rows consumed so far in the current billing period. The count returned might not reflect rows consumed in the last hour. The count returned reflects rows consumed by requests to both the v1 (Moz Links API) and v2 Links APIs.')]
یک درخواست مثال برای هر نقطه پایانی نشان دهید
این فهرستی از درخواستهای API در قالب Python dict است، که در آن هر فرهنگ لغت یک درخواست به یک نقطه پایانی خاص را نشان میدهد. در تلاش برای خواندن آن، زیاد به مغزتان آسیب نرسانید. فقط بدانید که من هر نمونه را از مستندات اصلی Moz برداشتم و همه آنها را به ترتیب به عنوان دستورات پایتون تودرتو در اینجا فهرست کردم.
می توانید فرمت را دیکته ای از دیکته ها بنامید، که در آن هر زیرفرهنگی با یک نقطه پایانی خاص مطابقت دارد، همان ترتیبی که sub_endpoints، نام ها، و توضیحات لیست هایی برای ترکیب آسان خروجی اجرای سلول زیر این است که لیست-ترکیب را برای مستند کردن هر یک انجام می دهد sub_endpoint.
dict_of_dicts = {
"anchor_text": {"target": "moz.com/blog", "scope": "page", "limit": 5},
"links": {
"target": "moz.com/blog",
"target_scope": "page",
"filter": "external+nofollow",
"limit": 1,
},
"final_redirect": {"page": "seomoz.org/blog"},
"global_top_pages": {"limit": 5},
"global_top_root_domains": {"limit": 5},
"index_metadata": {},
"link_intersect": {
"positive_targets": [
{"target": "latimes.com", "scope": "root_domain"},
{"target": "blog.nytimes.com", "scope": "subdomain"},
],
"negative_targets": [{"target": "moz.com", "scope": "root_domain"}],
"source_scope": "page",
"sort": "source_domain_authority",
"limit": 1,
},
"link_status": {
"target": "moz.com/blog",
"sources": ["twitter.com", "linkedin.com"],
"source_scope": "root_domain",
"target_scope": "page",
},
"linking_root_domains": {
"target": "moz.com/blog",
"target_scope": "page",
"filter": "external",
"sort": "source_domain_authority",
"limit": 5,
},
"top_pages": {"target": "moz.com", "scope": "root_domain", "limit": 5},
"url_metrics": {"targets": ["moz.com", "nytimes.com"]},
"usage_data": {},
}
for i, sub_endpoint in enumerate(sub_endpoints):
h1(f"{i + 1}. {names[i]} ({sub_endpoint})")
print(descriptions[i])
h4("Example request:")
pprint(dict_of_dicts[sub_endpoint])
print()
خروجی ها:
# 2. Final Redirect (final_redirect)
Use this endpoint to get data about anchor text used by followed external links to a target. Results are ordered by external_root_domains descending.
Example request:
{'page': 'seomoz.org/blog'}
[...]
تابعی بنویسید که به API ضربه بزند
اگر بخواهیم یک API را بارها و بارها به روشی مشابه بزنیم، میخواهیم خود را از تایپ مجدد همه چیز دریغ نکنیم. به همین دلیل است که ما توابع را تعریف می کنیم. این دف در سلول زیر است. هنگامی که آن سلول اجرا شد، موز() تابع را می توان در هر نقطه از این نوت بوک استفاده کرد. شما فقط باید آن را به sub_endpoint که می خواهید استفاده کنید و یک دستور Python از درخواست خود تغذیه کنید. پاسخ API را برمی گرداند.
def moz(sub_endpoint, data_dict):
"""Hits Moz Links API with specified endpoint and request and returns results."""
json_string = json.dumps(data_dict)
endpoint = COMMON_ENDPOINT + sub_endpoint
# Below, data is a string (flattened JSON) but auth is a 2-position tuple.
response = requests.post(endpoint, data=json_string, auth=AUTH_TUPLE)
return response
این چیزی به صفحه نمایش خروجی نمی دهد. این فقط تابع را تعریف می کند.
مشروط به API ضربه بزنید
کد از یک بسته پایتون به نام استفاده می کندب که یک شیء ماندگار دیکشنری مانند را فراهم می کند که می تواند با استفاده از موتور پایگاه داده SQLite روی دیسک ذخیره شود. را با عبارت موجود در کد یک مدیر زمینه برای شی SqliteDict تنظیم می کند که به طور خودکار باز و بسته شدن اتصال پایگاه داده را انجام می دهد. فایل پایگاه داده در ذخیره می شود ../dbs/linksapi.db
کد از طریق هر نقطه پایانی در قسمت تکرار می شود sub_endpoints فهرست، و بررسی می کند که آیا آن داده ها قبلاً بازیابی شده اند یا خیر. اگر اینطور نیست، API با استفاده از آن فراخوانی می شود moz() تابع و نتیجه در SqliteDict ذخیره می شود. را db.commit() بیانیه تضمین می کند که تغییرات ایجاد شده در فرهنگ لغت در طول تکرار در پایگاه داده ذخیره می شود.
SqliteDict به عنوان یک حافظه پنهان محلی برای جلوگیری از ضربه زدن به API در هر بار اجرای بلوک کد در صورتی که داده ها قبلاً جمع آوری شده باشند، عمل می کند. با استفاده از این کش، کد تعداد درخواستهای API مورد نیاز را کاهش میدهد، که هنگام کار با APIهایی که دارای محدودیتهای سهمیه هستند، مفید است. تبریک می گویم، شما از یک پایگاه داده استفاده می کنید!
with sqldict("../dbs/linksapi.db") as db:
for sub_endpoint in sub_endpoints:
if sub_endpoint not in db:
print(sub_endpoint)
result = moz(sub_endpoint, dict_of_dicts[sub_endpoint])
db[sub_endpoint] = result
db.commit()
print("API hit and response saved!")
print()
h2("Done")
این چیزی به صفحه نمایش خروجی نمی دهد. نتایج تماس های API را در یک پایگاه داده محلی ذخیره می کند.
پاسخ های API ذخیره شده محلی را نشان دهید
این کد از sqldict مدیر زمینه برای باز کردن پایگاه داده SQLite حاوی داده های API که قبلاً بازیابی شده است. سپس روی کلیدهای پایگاه داده، که با نقاط پایانی که قبلاً بازیابی شده اند مطابقت دارد، تکرار می شود.
برای هر کلید، کد نام نقطه پایانی، توضیحات و داده های بازیابی شده از API را چاپ می کند. تابع pprint برای چاپ دادههای JSON در قالبی قابل خواندن برای انسان، با تورفتگی و شکستگی خط که خواندن آن را آسانتر میکند، استفاده میشود.
with sqldict("../dbs/linksapi.db") as db:
for i, key in enumerate(db):
h1(f"{i + 1}. {names[i]} ({key})")
print(descriptions[i])
print()
pprint(db[key].json())
print()
خروجی ها:
1. Anchor Text (anchor_text)
Use this endpoint to get data about anchor text used by followed external links to a target. Results are ordered by external_root_domains descending.
{'next_token': 'KIkQVg4s9ak8iRBWDiz1qTyguYswnj035n7bYI0Lc2VvbW96IGJsb2dKBcCodcl47Q==',
'results': [{'anchor_text': 'moz',
'external_pages': 7162,
'external_root_domains': 2026},
{'anchor_text': 'moz blog',
'external_pages': 15525,
'external_root_domains': 1364},
{'anchor_text': 'the moz blog',
'external_pages': 7879,
'external_root_domains': 728},
{'anchor_text': 'seomoz',
'external_pages': 17741,
'external_root_domains': 654},
{'anchor_text': 'https://moz.com/blog',
'external_pages': 978,
'external_root_domains': 491}]}
2. Final Redirect (final_redirect)
Use this endpoint to get data about anchor text used by followed external links to a target. Results are ordered by external_root_domains descending.
{'page': 'moz.com/blog'}
3. Global Top Pages (global_top_pages)
This endpoint returns the top 500 pages in the entire index with the highest Page Authority values, sorted by Page Authority. (Visit the Top 500 Sites list to explore the top root domains on the web, sorted by Domain Authority.)
{'next_token': 'BcLbRwBmrXHK',
'results': [{'deleted_pages_to_page': 11932076,
'deleted_pages_to_root_domain': 23942663640,
'deleted_pages_to_subdomain': 21555752652,
'deleted_root_domains_to_page': 64700,
'deleted_root_domains_to_root_domain': 3688228,
'deleted_root_domains_to_subdomain': 3516235,
'domain_authority': 96,
'external_indirect_pages_to_root_domain': 5042652519,
'external_nofollow_pages_to_page': 31163,
'external_nofollow_pages_to_root_domain': 12375460748,
'external_nofollow_pages_to_subdomain': 11393036086,
'external_pages_to_page': 118102549,
'external_pages_to_root_domain': 91362310623,
'external_pages_to_subdomain': 83283626903,
'external_redirect_pages_to_page': 0,
'external_redirect_pages_to_root_domain': 445730476,
'external_redirect_pages_to_subdomain': 432323198,
'http_code': 5,
'indirect_root_domains_to_page': 0,
'indirect_root_domains_to_root_domain': 701121,
'last_crawled': '2023-01-15',
'link_propensity': 1.76710455e-05,
'nofollow_pages_from_page': 0,
'nofollow_pages_from_root_domain': 2,
'nofollow_pages_to_page': 31163,
'nofollow_pages_to_root_domain': 12375623717,
'nofollow_pages_to_subdomain': 11393036179,
'nofollow_root_domains_from_page': 0,
'nofollow_root_domains_from_root_domain': 0,
'nofollow_root_domains_to_page': 980,
'nofollow_root_domains_to_root_domain': 3696150,
'nofollow_root_domains_to_subdomain': 3622349,
'page': 'www.facebook.com/Plesk',
'page_authority': 100,
'pages_crawled_from_root_domain': 1810872,
'pages_from_page': 0,
'pages_from_root_domain': 5289,
'pages_to_page': 118102549,
'pages_to_root_domain': 91368257043,
'pages_to_subdomain': 83288001442,
'redirect_pages_to_page': 0,
'redirect_pages_to_root_domain': 447189164,
'redirect_pages_to_subdomain': 433411292,
'root_domain': 'facebook.com',
'root_domains_from_page': 0,
'root_domains_from_root_domain': 32,
'root_domains_to_page': 491956,
'root_domains_to_root_domain': 59416650,
'root_domains_to_subdomain': 50993087,
'spam_score': 1,
'subdomain': 'www.facebook.com',
'title': ''},
{'deleted_pages_to_page': 5828966,
'deleted_pages_to_root_domain': 79909678,
'deleted_pages_to_subdomain': 79909678,
'deleted_root_domains_to_page': 16552,
'deleted_root_domains_to_root_domain': 98416,
'deleted_root_domains_to_subdomain': 98416,
'domain_authority': 94,
'external_indirect_pages_to_root_domain': 1177381629,
'external_nofollow_pages_to_page': 453328699,
'external_nofollow_pages_to_root_domain': 1643990147,
'external_nofollow_pages_to_subdomain': 1643990147,
'external_pages_to_page': 456279611,
'external_pages_to_root_domain': 2808523112,
'external_pages_to_subdomain': 2808523112,
'external_redirect_pages_to_page': 125,
'external_redirect_pages_to_root_domain': 24941546,
'external_redirect_pages_to_subdomain': 24941546,
'http_code': 3,
'indirect_root_domains_to_page': 723,
'indirect_root_domains_to_root_domain': 252606,
'last_crawled': '2023-01-14',
'link_propensity': 0.118001014,
'nofollow_pages_from_page': 0,
'nofollow_pages_from_root_domain': 121166,
'nofollow_pages_to_page': 453328699,
'nofollow_pages_to_root_domain': 1644293277,
'nofollow_pages_to_subdomain': 1644293277,
'nofollow_root_domains_from_page': 0,
'nofollow_root_domains_from_root_domain': 67627,
'nofollow_root_domains_to_page': 9800973,
'nofollow_root_domains_to_root_domain': 4959747,
'nofollow_root_domains_to_subdomain': 4959747,
'page': 'wordpress.com/?ref=footer_blog',
'page_authority': 100,
'pages_crawled_from_root_domain': 1731019,
'pages_from_page': 0,
'pages_from_root_domain': 1080338,
'pages_to_page': 456293004,
'pages_to_root_domain': 2817137385,
'pages_to_subdomain': 2817137385,
'redirect_pages_to_page': 125,
'redirect_pages_to_root_domain': 25449067,
'redirect_pages_to_subdomain': 25449067,
'root_domain': 'wordpress.com',
'root_domains_from_page': 0,
'root_domains_from_root_domain': 204262,
'root_domains_to_page': 9878742,
'root_domains_to_root_domain': 12653294,
'root_domains_to_subdomain': 12653294,
'spam_score': 1,
'subdomain': 'wordpress.com',
'title': ''},
{'deleted_pages_to_page': 3904778,
'deleted_pages_to_root_domain': 23942663640,
'deleted_pages_to_subdomain': 21555752652,
'deleted_root_domains_to_page': 11671,
'deleted_root_domains_to_root_domain': 3688228,
'deleted_root_domains_to_subdomain': 3516235,
'domain_authority': 96,
'external_indirect_pages_to_root_domain': 5042652519,
'external_nofollow_pages_to_page': 4449343,
'external_nofollow_pages_to_root_domain': 12375460748,
'external_nofollow_pages_to_subdomain': 11393036086,
'external_pages_to_page': 59602588,
'external_pages_to_root_domain': 91362310623,
'external_pages_to_subdomain': 83283626903,
'external_redirect_pages_to_page': 12625,
'external_redirect_pages_to_root_domain': 445730476,
'external_redirect_pages_to_subdomain': 432323198,
'http_code': 5,
'indirect_root_domains_to_page': 1632,
'indirect_root_domains_to_root_domain': 701121,
'last_crawled': '2023-01-16',
'link_propensity': 1.76710455e-05,
'nofollow_pages_from_page': 0,
'nofollow_pages_from_root_domain': 2,
'nofollow_pages_to_page': 4449343,
'nofollow_pages_to_root_domain': 12375623717,
'nofollow_pages_to_subdomain': 11393036179,
'nofollow_root_domains_from_page': 0,
'nofollow_root_domains_from_root_domain': 0,
'nofollow_root_domains_to_page': 28624,
'nofollow_root_domains_to_root_domain': 3696150,
'nofollow_root_domains_to_subdomain': 3622349,
'page': 'www.facebook.com/home.php',
'page_authority': 100,
'pages_crawled_from_root_domain': 1810872,
'pages_from_page': 0,
'pages_from_root_domain': 5289,
'pages_to_page': 59602589,
'pages_to_root_domain': 91368257043,
'pages_to_subdomain': 83288001442,
'redirect_pages_to_page': 12626,
'redirect_pages_to_root_domain': 447189164,
'redirect_pages_to_subdomain': 433411292,
'root_domain': 'facebook.com',
'root_domains_from_page': 0,
'root_domains_from_root_domain': 32,
'root_domains_to_page': 239697,
'root_domains_to_root_domain': 59416650,
'root_domains_to_subdomain': 50993087,
'spam_score': 1,
'subdomain': 'www.facebook.com',
'title': ''},
{'deleted_pages_to_page': 3440567,
'deleted_pages_to_root_domain': 3440700,
'deleted_pages_to_subdomain': 3440700,
'deleted_root_domains_to_page': 60839,
'deleted_root_domains_to_root_domain': 60840,
'deleted_root_domains_to_subdomain': 60840,
'domain_authority': 1,
'external_indirect_pages_to_root_domain': 7,
'external_nofollow_pages_to_page': 288,
'external_nofollow_pages_to_root_domain': 1499,
'external_nofollow_pages_to_subdomain': 1499,
'external_pages_to_page': 140954613,
'external_pages_to_root_domain': 140959216,
'external_pages_to_subdomain': 140959213,
'external_redirect_pages_to_page': 70,
'external_redirect_pages_to_root_domain': 70,
'external_redirect_pages_to_subdomain': 70,
'http_code': 200,
'indirect_root_domains_to_page': 0,
'indirect_root_domains_to_root_domain': 0,
'last_crawled': '2018-02-05',
'link_propensity': 0.3998428881,
'nofollow_pages_from_page': 12,
'nofollow_pages_from_root_domain': 805,
'nofollow_pages_to_page': 288,
'nofollow_pages_to_root_domain': 10799,
'nofollow_pages_to_subdomain': 10799,
'nofollow_root_domains_from_page': 2,
'nofollow_root_domains_from_root_domain': 7,
'nofollow_root_domains_to_page': 30,
'nofollow_root_domains_to_root_domain': 30,
'nofollow_root_domains_to_subdomain': 30,
'page': 'music.skyrock.com/',
'page_authority': 100,
'pages_crawled_from_root_domain': 2546,
'pages_from_page': 61,
'pages_from_root_domain': 3382,
'pages_to_page': 140956009,
'pages_to_root_domain': 141008586,
'pages_to_subdomain': 141008583,
'redirect_pages_to_page': 70,
'redirect_pages_to_root_domain': 70,
'redirect_pages_to_subdomain': 70,
'root_domain': 'music.skyrock.com',
'root_domains_from_page': 19,
'root_domains_from_root_domain': 1018,
'root_domains_to_page': 10609865,
'root_domains_to_root_domain': 10609868,
'root_domains_to_subdomain': 10609868,
'spam_score': 9,
'subdomain': 'music.skyrock.com',
'title': 'Blog de Music - DES NEWS, DES CLIPS, DES INTERVIEWS - '
'Skyrock.com'},
{'deleted_pages_to_page': 64159924,
'deleted_pages_to_root_domain': 17641375891,
'deleted_pages_to_subdomain': 336246205,
'deleted_root_domains_to_page': 63574,
'deleted_root_domains_to_root_domain': 1728606,
'deleted_root_domains_to_subdomain': 234073,
'domain_authority': 100,
'external_indirect_pages_to_root_domain': 19281720347,
'external_nofollow_pages_to_page': 34635431,
'external_nofollow_pages_to_root_domain': 7885369442,
'external_nofollow_pages_to_subdomain': 184067821,
'external_pages_to_page': 285612569,
'external_pages_to_root_domain': 55013651418,
'external_pages_to_subdomain': 1492976347,
'external_redirect_pages_to_page': 593282,
'external_redirect_pages_to_root_domain': 250423075,
'external_redirect_pages_to_subdomain': 5678006,
'http_code': 302,
'indirect_root_domains_to_page': 1072,
'indirect_root_domains_to_root_domain': 231256,
'last_crawled': '2023-04-01',
'link_propensity': 0.006248265505,
'nofollow_pages_from_page': 0,
'nofollow_pages_from_root_domain': 991472,
'nofollow_pages_to_page': 34635436,
'nofollow_pages_to_root_domain': 7948674425,
'nofollow_pages_to_subdomain': 184068512,
'nofollow_root_domains_from_page': 0,
'nofollow_root_domains_from_root_domain': 182393,
'nofollow_root_domains_to_page': 126656,
'nofollow_root_domains_to_root_domain': 2322389,
'nofollow_root_domains_to_subdomain': 304381,
'page': 'youtube.com/',
'page_authority': 100,
'pages_crawled_from_root_domain': 41258009,
'pages_from_page': 0,
'pages_from_root_domain': 11109186,
'pages_to_page': 285612606,
'pages_to_root_domain': 55255620288,
'pages_to_subdomain': 1493073570,
'redirect_pages_to_page': 593282,
'redirect_pages_to_root_domain': 263224806,
'redirect_pages_to_subdomain': 5678383,
'root_domain': 'youtube.com',
'root_domains_from_page': 0,
'root_domains_from_root_domain': 257791,
'root_domains_to_page': 598403,
'root_domains_to_root_domain': 23134271,
'root_domains_to_subdomain': 1927717,
'spam_score': 4,
'subdomain': 'youtube.com',
'title': ''}]}
4. Global Top Root Domains (global_top_root_domains)
This endpoint returns the top 500 pages in the entire index with the highest Page Authority values, sorted by Page Authority. (Visit the Top 500 Sites list to explore the top root domains on the web, sorted by Domain Authority.)
{'next_token': 'BcLbRwBmrXHK',
'results': [{'domain_authority': 100,
'link_propensity': 0.006248265505,
'root_domain': 'youtube.com',
'root_domains_to_root_domain': 23134271,
'spam_score': 4,
'to_target': {'deleted_pages': 0,
'nofollow_pages': 0,
'pages': 0,
'redirect_pages': 0}},
{'domain_authority': 100,
'link_propensity': 0.008422264829,
'root_domain': 'www.google.com',
'root_domains_to_root_domain': 14723695,
'spam_score': 14,
'to_target': {'deleted_pages': 0,
'nofollow_pages': 0,
'pages': 0,
'redirect_pages': 0}},
{'domain_authority': 100,
'link_propensity': 0.0001607139566,
'root_domain': 'www.blogger.com',
'root_domains_to_root_domain': 30580427,
'spam_score': -1,
'to_target': {'deleted_pages': 0,
'nofollow_pages': 0,
'pages': 0,
'redirect_pages': 0}},
{'domain_authority': 99,
'link_propensity': 0.04834850505,
'root_domain': 'linkedin.com',
'root_domains_to_root_domain': 12339087,
'spam_score': 1,
'to_target': {'deleted_pages': 0,
'nofollow_pages': 0,
'pages': 0,
'redirect_pages': 0}},
{'domain_authority': 99,
'link_propensity': 0.006264935713,
'root_domain': 'microsoft.com',
'root_domains_to_root_domain': 5344181,
'spam_score': 11,
'to_target': {'deleted_pages': 0,
'nofollow_pages': 0,
'pages': 0,
'redirect_pages': 0}}]}
5. Index Metadata (index_metadata)
This endpoint returns the top 500 pages in the entire index with the highest Page Authority values, sorted by Page Authority. (Visit the Top 500 Sites list to explore the top root domains on the web, sorted by Domain Authority.)
{'index_id': 'NE+lX5bFh06baS9ojUwVbw==',
'spam_score_update_days': ['2019-02-08',
'2020-03-28',
'2020-08-03',
'2020-11-13',
'2021-02-24',
'2021-05-19',
'2021-08-16',
'2021-11-02',
'2022-02-01',
'2022-05-10',
'2022-11-16']}
6. Link Intersect (link_intersect)
Use this endpoint to get sources that link to at least one of a list of positive targets and don't link to any of a list of negative targets.
{'next_token': 'AcmY2oCXQbbg',
'results': [{'domain_authority': 100,
'matching_target_indexes': [0],
'page': 'www.google.com/amp/www.latimes.com/local/lanow/la-me-ln-aliso-viejo-shooting-20171012-story,amp.html',
'spam_score': 14,
'title': ''}]}
7. Link Status (link_status)
Use this endpoint to get information about links from many sources to a single target.
{'exists': [False, False]}
8. Linking Root Domains (linking_root_domains)
Use this endpoint to get linking root domains to a target.
{'next_token': 'IokQVg4s9ak8iRBWDiz1qTyguYswnj035qBkmE3DU+JTtwAVhsjH7R6XUA==',
'results': [{'domain_authority': 99,
'link_propensity': 0.006264935713,
'root_domain': 'microsoft.com',
'root_domains_to_root_domain': 5344181,
'spam_score': 11,
'to_target': {'deleted_pages': 0,
'nofollow_pages': 0,
'pages': 2,
'redirect_pages': 0}},
{'domain_authority': 98,
'link_propensity': 0.02977741137,
'root_domain': 'wordpress.org',
'root_domains_to_root_domain': 12250296,
'spam_score': 2,
'to_target': {'deleted_pages': 0,
'nofollow_pages': 2,
'pages': 2,
'redirect_pages': 0}},
{'domain_authority': 96,
'link_propensity': 0.09679271281,
'root_domain': 'github.com',
'root_domains_to_root_domain': 2948013,
'spam_score': 2,
'to_target': {'deleted_pages': 0,
'nofollow_pages': 12,
'pages': 12,
'redirect_pages': 0}},
{'domain_authority': 96,
'link_propensity': 0.004641198553,
'root_domain': 'amazon.com',
'root_domains_to_root_domain': 5023132,
'spam_score': 28,
'to_target': {'deleted_pages': 0,
'nofollow_pages': 0,
'pages': 2,
'redirect_pages': 0}},
{'domain_authority': 95,
'link_propensity': 0.005770479795,
'root_domain': 'shopify.com',
'root_domains_to_root_domain': 2948087,
'spam_score': 1,
'to_target': {'deleted_pages': 3,
'nofollow_pages': 0,
'pages': 0,
'redirect_pages': 0}}]}
9. Links (links)
Use this endpoint to get links to a target.
{'next_token': 'AVvpJ4gPPvOY',
'results': [{'anchor_text': 'moz blog',
'date_disappeared': '',
'date_first_seen': '2020-06-29',
'date_last_seen': '2023-01-14',
'nofollow': True,
'redirect': False,
'rel_canonical': False,
'source': {'deleted_pages_to_page': 570,
'deleted_pages_to_root_domain': 1251501128,
'deleted_pages_to_subdomain': 1182759912,
'deleted_root_domains_to_page': 34,
'deleted_root_domains_to_root_domain': 322790,
'deleted_root_domains_to_subdomain': 314554,
'domain_authority': 96,
'external_indirect_pages_to_root_domain': 863103308,
'external_nofollow_pages_to_page': 1407,
'external_nofollow_pages_to_root_domain': 667480081,
'external_nofollow_pages_to_subdomain': 650421076,
'external_pages_to_page': 3710,
'external_pages_to_root_domain': 5309615021,
'external_pages_to_subdomain': 5086141938,
'external_redirect_pages_to_page': 14,
'external_redirect_pages_to_root_domain': 143685025,
'external_redirect_pages_to_subdomain': 142061138,
'http_code': 200,
'indirect_root_domains_to_page': 2,
'indirect_root_domains_to_root_domain': 180014,
'last_crawled': '2023-01-14',
'link_propensity': 0.09679271281,
'nofollow_pages_from_page': 199,
'nofollow_pages_from_root_domain': 7541042,
'nofollow_pages_to_page': 1407,
'nofollow_pages_to_root_domain': 678014273,
'nofollow_pages_to_subdomain': 660443683,
'nofollow_root_domains_from_page': 93,
'nofollow_root_domains_from_root_domain': 564314,
'nofollow_root_domains_to_page': 58,
'nofollow_root_domains_to_root_domain': 186407,
'nofollow_root_domains_to_subdomain': 171632,
'page': 'github.com/mezod/awesome-indie',
'page_authority': 68,
'pages_crawled_from_root_domain': 7254823,
'pages_from_page': 202,
'pages_from_root_domain': 8613796,
'pages_to_page': 3746,
'pages_to_root_domain': 5628821927,
'pages_to_subdomain': 5352019489,
'redirect_pages_to_page': 14,
'redirect_pages_to_root_domain': 145613441,
'redirect_pages_to_subdomain': 142856036,
'root_domain': 'github.com',
'root_domains_from_page': 96,
'root_domains_from_root_domain': 702214,
'root_domains_to_page': 231,
'root_domains_to_root_domain': 2948013,
'root_domains_to_subdomain': 2857538,
'spam_score': 2,
'subdomain': 'github.com',
'title': 'GitHub - mezod/awesome-indie: Resources for '
'independent developers to make money'},
'target': {'deleted_pages_to_page': 169073,
'deleted_pages_to_root_domain': 19022927,
'deleted_pages_to_subdomain': 18554702,
'deleted_root_domains_to_page': 1457,
'deleted_root_domains_to_root_domain': 27522,
'deleted_root_domains_to_subdomain': 27273,
'domain_authority': 91,
'external_indirect_pages_to_root_domain': 45290099,
'external_nofollow_pages_to_page': 7388,
'external_nofollow_pages_to_root_domain': 17425478,
'external_nofollow_pages_to_subdomain': 17269297,
'external_pages_to_page': 553261,
'external_pages_to_root_domain': 69376449,
'external_pages_to_subdomain': 68746190,
'external_redirect_pages_to_page': 265,
'external_redirect_pages_to_root_domain': 41112725,
'external_redirect_pages_to_subdomain': 41109338,
'http_code': 200,
'indirect_root_domains_to_page': 2219,
'indirect_root_domains_to_root_domain': 28779,
'last_crawled': '2023-04-02',
'link_propensity': 0.008849279955,
'nofollow_pages_from_page': 0,
'nofollow_pages_from_root_domain': 209067,
'nofollow_pages_to_page': 7388,
'nofollow_pages_to_root_domain': 17442464,
'nofollow_pages_to_subdomain': 17285191,
'nofollow_root_domains_from_page': 0,
'nofollow_root_domains_from_root_domain': 55943,
'nofollow_root_domains_to_page': 1727,
'nofollow_root_domains_to_root_domain': 37789,
'nofollow_root_domains_to_subdomain': 37690,
'page': 'moz.com/blog',
'page_authority': 69,
'pages_crawled_from_root_domain': 7872618,
'pages_from_page': 7,
'pages_from_root_domain': 343751,
'pages_to_page': 906052,
'pages_to_root_domain': 98442581,
'pages_to_subdomain': 97352802,
'redirect_pages_to_page': 746,
'redirect_pages_to_root_domain': 47575576,
'redirect_pages_to_subdomain': 47570092,
'root_domain': 'moz.com',
'root_domains_from_page': 5,
'root_domains_from_root_domain': 69667,
'root_domains_to_page': 9712,
'root_domains_to_root_domain': 179884,
'root_domains_to_subdomain': 178649,
'spam_score': 1,
'subdomain': 'moz.com',
'title': 'The Moz Blog [SEO] - Moz'},
'via_redirect': False,
'via_rel_canonical': False}]}
10. Top Pages (top_pages)
This endpoint returns top pages on a target domain.
{'next_token': 'BXULGXd3IggK',
'results': [{'deleted_pages_to_page': 1963527,
'deleted_pages_to_root_domain': 19022927,
'deleted_pages_to_subdomain': 18554702,
'deleted_root_domains_to_page': 6527,
'deleted_root_domains_to_root_domain': 27522,
'deleted_root_domains_to_subdomain': 27273,
'domain_authority': 91,
'external_indirect_pages_to_root_domain': 45290099,
'external_nofollow_pages_to_page': 9684724,
'external_nofollow_pages_to_root_domain': 17425478,
'external_nofollow_pages_to_subdomain': 17269297,
'external_pages_to_page': 14981546,
'external_pages_to_root_domain': 69376449,
'external_pages_to_subdomain': 68746190,
'external_redirect_pages_to_page': 3632556,
'external_redirect_pages_to_root_domain': 41112725,
'external_redirect_pages_to_subdomain': 41109338,
'http_code': 200,
'indirect_root_domains_to_page': 10580,
'indirect_root_domains_to_root_domain': 28779,
'last_crawled': '2023-04-01',
'link_propensity': 0.008849279955,
'nofollow_pages_from_page': 0,
'nofollow_pages_from_root_domain': 209067,
'nofollow_pages_to_page': 9684724,
'nofollow_pages_to_root_domain': 17442464,
'nofollow_pages_to_subdomain': 17285191,
'nofollow_root_domains_from_page': 0,
'nofollow_root_domains_from_root_domain': 55943,
'nofollow_root_domains_to_page': 8749,
'nofollow_root_domains_to_root_domain': 37789,
'nofollow_root_domains_to_subdomain': 37690,
'page': 'moz.com/',
'page_authority': 74,
'pages_crawled_from_root_domain': 7872618,
'pages_from_page': 7,
'pages_from_root_domain': 343751,
'pages_to_page': 15343034,
'pages_to_root_domain': 98442581,
'pages_to_subdomain': 97352802,
'redirect_pages_to_page': 3633007,
'redirect_pages_to_root_domain': 47575576,
'redirect_pages_to_subdomain': 47570092,
'root_domain': 'moz.com',
'root_domains_from_page': 5,
'root_domains_from_root_domain': 69667,
'root_domains_to_page': 41190,
'root_domains_to_root_domain': 179884,
'root_domains_to_subdomain': 178649,
'spam_score': 1,
'subdomain': 'moz.com',
'title': 'Moz - SEO Software for Smarter Marketing'},
{'deleted_pages_to_page': 185579,
'deleted_pages_to_root_domain': 19022927,
'deleted_pages_to_subdomain': 18554702,
'deleted_root_domains_to_page': 2440,
'deleted_root_domains_to_root_domain': 27522,
'deleted_root_domains_to_subdomain': 27273,
'domain_authority': 91,
'external_indirect_pages_to_root_domain': 45290099,
'external_nofollow_pages_to_page': 11211,
'external_nofollow_pages_to_root_domain': 17425478,
'external_nofollow_pages_to_subdomain': 17269297,
'external_pages_to_page': 424268,
'external_pages_to_root_domain': 69376449,
'external_pages_to_subdomain': 68746190,
'external_redirect_pages_to_page': 348,
'external_redirect_pages_to_root_domain': 41112725,
'external_redirect_pages_to_subdomain': 41109338,
'http_code': 200,
'indirect_root_domains_to_page': 1389,
'indirect_root_domains_to_root_domain': 28779,
'last_crawled': '2023-04-03',
'link_propensity': 0.008849279955,
'nofollow_pages_from_page': 0,
'nofollow_pages_from_root_domain': 209067,
'nofollow_pages_to_page': 11211,
'nofollow_pages_to_root_domain': 17442464,
'nofollow_pages_to_subdomain': 17285191,
'nofollow_root_domains_from_page': 0,
'nofollow_root_domains_from_root_domain': 55943,
'nofollow_root_domains_to_page': 2487,
'nofollow_root_domains_to_root_domain': 37789,
'nofollow_root_domains_to_subdomain': 37690,
'page': 'moz.com/beginners-guide-to-seo',
'page_authority': 72,
'pages_crawled_from_root_domain': 7872618,
'pages_from_page': 7,
'pages_from_root_domain': 343751,
'pages_to_page': 786960,
'pages_to_root_domain': 98442581,
'pages_to_subdomain': 97352802,
'redirect_pages_to_page': 365,
'redirect_pages_to_root_domain': 47575576,
'redirect_pages_to_subdomain': 47570092,
'root_domain': 'moz.com',
'root_domains_from_page': 5,
'root_domains_from_root_domain': 69667,
'root_domains_to_page': 15276,
'root_domains_to_root_domain': 179884,
'root_domains_to_subdomain': 178649,
'spam_score': 1,
'subdomain': 'moz.com',
'title': "Beginner\'s Guide to SEO [plus FREE quick start "
'checklist] - Moz'},
{'deleted_pages_to_page': 7159,
'deleted_pages_to_root_domain': 19022927,
'deleted_pages_to_subdomain': 18554702,
'deleted_root_domains_to_page': 1382,
'deleted_root_domains_to_root_domain': 27522,
'deleted_root_domains_to_subdomain': 27273,
'domain_authority': 91,
'external_indirect_pages_to_root_domain': 45290099,
'external_nofollow_pages_to_page': 8605,
'external_nofollow_pages_to_root_domain': 17425478,
'external_nofollow_pages_to_subdomain': 17269297,
'external_pages_to_page': 34152,
'external_pages_to_root_domain': 69376449,
'external_pages_to_subdomain': 68746190,
'external_redirect_pages_to_page': 70,
'external_redirect_pages_to_root_domain': 41112725,
'external_redirect_pages_to_subdomain': 41109338,
'http_code': 200,
'indirect_root_domains_to_page': 782,
'indirect_root_domains_to_root_domain': 28779,
'last_crawled': '2023-04-03',
'link_propensity': 0.008849279955,
'nofollow_pages_from_page': 0,
'nofollow_pages_from_root_domain': 209067,
'nofollow_pages_to_page': 8754,
'nofollow_pages_to_root_domain': 17442464,
'nofollow_pages_to_subdomain': 17285191,
'nofollow_root_domains_from_page': 0,
'nofollow_root_domains_from_root_domain': 55943,
'nofollow_root_domains_to_page': 1380,
'nofollow_root_domains_to_root_domain': 37789,
'nofollow_root_domains_to_subdomain': 37690,
'page': 'moz.com/google-algorithm-change',
'page_authority': 70,
'pages_crawled_from_root_domain': 7872618,
'pages_from_page': 420,
'pages_from_root_domain': 343751,
'pages_to_page': 35181,
'pages_to_root_domain': 98442581,
'pages_to_subdomain': 97352802,
'redirect_pages_to_page': 73,
'redirect_pages_to_root_domain': 47575576,
'redirect_pages_to_subdomain': 47570092,
'root_domain': 'moz.com',
'root_domains_from_page': 60,
'root_domains_from_root_domain': 69667,
'root_domains_to_page': 8881,
'root_domains_to_root_domain': 179884,
'root_domains_to_subdomain': 178649,
'spam_score': 1,
'subdomain': 'moz.com',
'title': 'Moz - Google Algorithm Update History'},
{'deleted_pages_to_page': 33133,
'deleted_pages_to_root_domain': 19022927,
'deleted_pages_to_subdomain': 18554702,
'deleted_root_domains_to_page': 1192,
'deleted_root_domains_to_root_domain': 27522,
'deleted_root_domains_to_subdomain': 27273,
'domain_authority': 91,
'external_indirect_pages_to_root_domain': 45290099,
'external_nofollow_pages_to_page': 31500,
'external_nofollow_pages_to_root_domain': 17425478,
'external_nofollow_pages_to_subdomain': 17269297,
'external_pages_to_page': 70673,
'external_pages_to_root_domain': 69376449,
'external_pages_to_subdomain': 68746190,
'external_redirect_pages_to_page': 77,
'external_redirect_pages_to_root_domain': 41112725,
'external_redirect_pages_to_subdomain': 41109338,
'http_code': 301,
'indirect_root_domains_to_page': 315,
'indirect_root_domains_to_root_domain': 28779,
'last_crawled': '2023-04-02',
'link_propensity': 0.008849279955,
'nofollow_pages_from_page': 0,
'nofollow_pages_from_root_domain': 209067,
'nofollow_pages_to_page': 31628,
'nofollow_pages_to_root_domain': 17442464,
'nofollow_pages_to_subdomain': 17285191,
'nofollow_root_domains_from_page': 0,
'nofollow_root_domains_from_root_domain': 55943,
'nofollow_root_domains_to_page': 1689,
'nofollow_root_domains_to_root_domain': 37789,
'nofollow_root_domains_to_subdomain': 37690,
'page': 'moz.com/researchtools/ose/',
'page_authority': 70,
'pages_crawled_from_root_domain': 7872618,
'pages_from_page': 0,
'pages_from_root_domain': 343751,
'pages_to_page': 344305,
'pages_to_root_domain': 98442581,
'pages_to_subdomain': 97352802,
'redirect_pages_to_page': 78,
'redirect_pages_to_root_domain': 47575576,
'redirect_pages_to_subdomain': 47570092,
'root_domain': 'moz.com',
'root_domains_from_page': 0,
'root_domains_from_root_domain': 69667,
'root_domains_to_page': 8086,
'root_domains_to_root_domain': 179884,
'root_domains_to_subdomain': 178649,
'spam_score': 1,
'subdomain': 'moz.com',
'title': ''},
{'deleted_pages_to_page': 169073,
'deleted_pages_to_root_domain': 19022927,
'deleted_pages_to_subdomain': 18554702,
'deleted_root_domains_to_page': 1457,
'deleted_root_domains_to_root_domain': 27522,
'deleted_root_domains_to_subdomain': 27273,
'domain_authority': 91,
'external_indirect_pages_to_root_domain': 45290099,
'external_nofollow_pages_to_page': 7388,
'external_nofollow_pages_to_root_domain': 17425478,
'external_nofollow_pages_to_subdomain': 17269297,
'external_pages_to_page': 553261,
'external_pages_to_root_domain': 69376449,
'external_pages_to_subdomain': 68746190,
'external_redirect_pages_to_page': 265,
'external_redirect_pages_to_root_domain': 41112725,
'external_redirect_pages_to_subdomain': 41109338,
'http_code': 200,
'indirect_root_domains_to_page': 2219,
'indirect_root_domains_to_root_domain': 28779,
'last_crawled': '2023-04-02',
'link_propensity': 0.008849279955,
'nofollow_pages_from_page': 0,
'nofollow_pages_from_root_domain': 209067,
'nofollow_pages_to_page': 7388,
'nofollow_pages_to_root_domain': 17442464,
'nofollow_pages_to_subdomain': 17285191,
'nofollow_root_domains_from_page': 0,
'nofollow_root_domains_from_root_domain': 55943,
'nofollow_root_domains_to_page': 1727,
'nofollow_root_domains_to_root_domain': 37789,
'nofollow_root_domains_to_subdomain': 37690,
'page': 'moz.com/blog',
'page_authority': 69,
'pages_crawled_from_root_domain': 7872618,
'pages_from_page': 7,
'pages_from_root_domain': 343751,
'pages_to_page': 906052,
'pages_to_root_domain': 98442581,
'pages_to_subdomain': 97352802,
'redirect_pages_to_page': 746,
'redirect_pages_to_root_domain': 47575576,
'redirect_pages_to_subdomain': 47570092,
'root_domain': 'moz.com',
'root_domains_from_page': 5,
'root_domains_from_root_domain': 69667,
'root_domains_to_page': 9712,
'root_domains_to_root_domain': 179884,
'root_domains_to_subdomain': 178649,
'spam_score': 1,
'subdomain': 'moz.com',
'title': 'The Moz Blog [SEO] - Moz'}]}
11. URL Metrics (url_metrics)
Use this endpoint to get metrics about one or more urls.
{'results': [{'deleted_pages_to_page': 1963527,
'deleted_pages_to_root_domain': 19022927,
'deleted_pages_to_subdomain': 18554702,
'deleted_root_domains_to_page': 6527,
'deleted_root_domains_to_root_domain': 27522,
'deleted_root_domains_to_subdomain': 27273,
'domain_authority': 91,
'external_indirect_pages_to_root_domain': 45290099,
'external_nofollow_pages_to_page': 9684724,
'external_nofollow_pages_to_root_domain': 17425478,
'external_nofollow_pages_to_subdomain': 17269297,
'external_pages_to_page': 14981546,
'external_pages_to_root_domain': 69376449,
'external_pages_to_subdomain': 68746190,
'external_redirect_pages_to_page': 3632556,
'external_redirect_pages_to_root_domain': 41112725,
'external_redirect_pages_to_subdomain': 41109338,
'http_code': 200,
'indirect_root_domains_to_page': 10580,
'indirect_root_domains_to_root_domain': 28779,
'last_crawled': '2023-04-01',
'link_propensity': 0.008849279955,
'nofollow_pages_from_page': 0,
'nofollow_pages_from_root_domain': 209067,
'nofollow_pages_to_page': 9684724,
'nofollow_pages_to_root_domain': 17442464,
'nofollow_pages_to_subdomain': 17285191,
'nofollow_root_domains_from_page': 0,
'nofollow_root_domains_from_root_domain': 55943,
'nofollow_root_domains_to_page': 8749,
'nofollow_root_domains_to_root_domain': 37789,
'nofollow_root_domains_to_subdomain': 37690,
'page': 'moz.com/',
'page_authority': 74,
'pages_crawled_from_root_domain': 7872618,
'pages_from_page': 7,
'pages_from_root_domain': 343751,
'pages_to_page': 15343034,
'pages_to_root_domain': 98442581,
'pages_to_subdomain': 97352802,
'redirect_pages_to_page': 3633007,
'redirect_pages_to_root_domain': 47575576,
'redirect_pages_to_subdomain': 47570092,
'root_domain': 'moz.com',
'root_domains_from_page': 5,
'root_domains_from_root_domain': 69667,
'root_domains_to_page': 41190,
'root_domains_to_root_domain': 179884,
'root_domains_to_subdomain': 178649,
'spam_score': 1,
'subdomain': 'moz.com',
'title': 'Moz - SEO Software for Smarter Marketing'},
{'deleted_pages_to_page': 249094,
'deleted_pages_to_root_domain': 224212706,
'deleted_pages_to_subdomain': 898844,
'deleted_root_domains_to_page': 3696,
'deleted_root_domains_to_root_domain': 177001,
'deleted_root_domains_to_subdomain': 9251,
'domain_authority': 95,
'external_indirect_pages_to_root_domain': 156562794,
'external_nofollow_pages_to_page': 163849,
'external_nofollow_pages_to_root_domain': 72093550,
'external_nofollow_pages_to_subdomain': 294697,
'external_pages_to_page': 1165187,
'external_pages_to_root_domain': 514661963,
'external_pages_to_subdomain': 2310818,
'external_redirect_pages_to_page': 3049,
'external_redirect_pages_to_root_domain': 4827448,
'external_redirect_pages_to_subdomain': 8140,
'http_code': 301,
'indirect_root_domains_to_page': 1439,
'indirect_root_domains_to_root_domain': 30315,
'last_crawled': '2023-03-31',
'link_propensity': 0.02704063244,
'nofollow_pages_from_page': 0,
'nofollow_pages_from_root_domain': 97163,
'nofollow_pages_to_page': 163881,
'nofollow_pages_to_root_domain': 72644206,
'nofollow_pages_to_subdomain': 294765,
'nofollow_root_domains_from_page': 0,
'nofollow_root_domains_from_root_domain': 22711,
'nofollow_root_domains_to_page': 5647,
'nofollow_root_domains_to_root_domain': 178651,
'nofollow_root_domains_to_subdomain': 11590,
'page': 'nytimes.com/',
'page_authority': 82,
'pages_crawled_from_root_domain': 13567138,
'pages_from_page': 0,
'pages_from_root_domain': 3152122,
'pages_to_page': 1170498,
'pages_to_root_domain': 763781494,
'pages_to_subdomain': 2489707,
'redirect_pages_to_page': 3053,
'redirect_pages_to_root_domain': 9268395,
'redirect_pages_to_subdomain': 14273,
'root_domain': 'nytimes.com',
'root_domains_from_page': 0,
'root_domains_from_root_domain': 366864,
'root_domains_to_page': 25307,
'root_domains_to_root_domain': 2200598,
'root_domains_to_subdomain': 62699,
'spam_score': 1,
'subdomain': 'nytimes.com',
'title': ''}]}
12. Usage Data (usage_data)
This endpoint Returns the number of rows consumed so far in the current billing period. The count returned might not reflect rows consumed in the last hour. The count returned reflects rows consumed by requests to both the v1 (Moz Links API) and v2 Links APIs.
{'rows_consumed': 254}