טוב לאחר כמה שבועות של מנוחה ושל פוסטים תאורטיים מייגעים, הגיע הזמן לחתוך את רצף התיאוריות והדברים המצחיקים של קידום האתרים, ולעשות משהו שאשכרה אפשר להשתמש בו כזה טכני לפנים. ונקדים, זוכרים שלפני כמה חודשים דובר על כך שקישורים שמופנים אל דפי 404 לא יכולים לגרום נזק לאתר משום שדף 404 מבטל את השפעת הקישור שמופנה אליו?  למי שלא זוכר זה לקוח מתוך הקישור הזה ופורסם בכמה בלוגים בחו"ל:

http://productforums.google.com/forum/#!category-topic/webmasters/crawling-indexing–ranking/C-OoaJfb0Yg

קישורים לדפי 404

עכשיו כשנזכרנו מצוין,  אני מניח שגם בלי זה מדובר בנקודה שרוב המקדמים יודעים בין אם זה בצורה אינטואיטיבית או מתוך נסיון של עבודה שוטפת רגילה. אבל כפי שאתם יכולים לתאר לא העלתי את הנושא כדי לדון בעוד איזה נושא שדובר עליו כבר רבות אלא על מנת שנוכל להסתכל על הנושא הזה מזווית קצת אחרת.



הרי ידוע שקישורים שמופנים אל דף שבור אולי לא יזיקו לנו – אך צידו השני של המטבע הוא שידוע שקישורים שמופנים אל דף שבור גם בטוח לא יועילו לנו, או במילים אחרות – כאשר קישור הופנה אל דף מסויים – והדף הזה חדל מלהתקיים, כוחו של אותו קישור ילך גם לאיבוד, על עקרון זה בנויה רוב הטכנאות שעיסוקה היא החלפת דומיינים \ CMSים בצורה בטוחה כך שהמיקומים לא ייפגעו (301 וכו').

ולכן מה שנסביר פה הפעם הוא מתודה פשוטה ביותר איך להחזיר לעצמנו בקלות ובמהירות את כוחם של קישורים שהיו מופנים אל דפים מסויימים שאינם קיימים יותר, כאשר האתר ממשיך להתקיים, גם אם מדובר בכמות די גדולה של קישורים – וזה ללא ביצוע של הפנייה גורפת של כל דף 404 אל דף הבית כדי לא ליצור בלבול אצל גולשים \ גוגל, ובכלל פתרון מאוד גרוע מבחינת UI.

עבור מי המדריך הזה שימושי?

טוב, כמובן לאתר המצוי שלא עבר שינויים מהותיים לא אמור להיות שימוש במתודה כגון זאת חוץ מאולי להכיר אותה ליום סגריר, אך ישנם שני מקרים עיקריים שהם גם די נפוצים אשר בשבילם השימוש במתודה הוא כמעט הכרחי כדי להביא את האתר אל:

  • מיצוי מלא הפוטנציאל שלו
  • כדי למנוע פגיעה קשה במיקומים בשל קישורים שאבדו (אם זה ממש מהיר)
  • לנצל קישורים שהיו קיימים בעבר ואינם כדי לשפר מיקומים (בתנאים מסויימים)
  • לשחזר מיקומים שאבדו

או אם לדייק יותר עבור שתי הסיטואציות הבאות:

דומיינים יד שניה שהיו אליהם קישורים -  חשוב מאוד לזכור שישנה מחלוקת מאוד גדולה לגבי תקופתם של קישורים המופנים אל דומיין שכבר פג תוקפם כפי שדנו פה בעבר, לכן הייתי משייך את הנושא בעיקר לדומיינים שפג תוקפם אבל עדיין מאונדקסים ברמה מסויימת בגוגל.  אם כי ניתן למצוא ראיות די ברורות לכך שקישורים עדיין ממשיכים להשפיע על דומיינים למרות שתוקפם פג (כמו העובדה שעדיין יש להם ציון PR), ולכן לא נכנס לדיון הזה אלא קבלו את הדברים As Is לשיקולכם.

אתרים שעשו "מעבר דירה" לא נכון – וזאת הסיטואציה הנפוצה מבין השתיים, אתרים אשר עברו CMS ומבנה ה-URLים שלהם היה מורכב מידי ורבים מהם לא הופנו בצורה נכונה, אתרים אשר החליפו דומיין ולא הופנו בצורה תקינה, אתרים אשר שינו את מבנה ה-URLים שלהם ולא עשו הפניות 301 כמו שצריך או סתם כאלו שביצעו הפניות 301 בצורה רשלנית והביאו ליצירה של דפי 404 – יצא לי לצערי ולשמחתי להתעסק עם יותר מאתר אחד שהעניין הזה היה רלוונטי לגביו, ולא משנות הסיבות.

מה המצרכים?

  • Scrapebox כמובן
  • Webmaster Tools
  • כלים לבדיקת קישורים נכנסים – מג'סטיק , Opensite וכו'
  • Bulk http Header Checker – זה אמור לעשות את העבודה בצורה מעולה בד"כ: http://www.tomanthony.co.uk/tools/bulk-http-header-compare/
  • תוסף הפניות 301 אם זה וורדפרס או ידע מינימלי ב Htaccess אם זה לא וורדפרס.

ונעבור לשלבים:

1. להוציא את כל הקישורים הנכנסים עם כלים לבדיקת קישורים – בשלב הראשון מה שצריך לעשות הוא להוציא כל הדפים המקושרים שלנו בדומיין הרצוי מתוך הכלים לבדיקת קישורים – הכוונה היא לא להוציא את מקורות הקישורים אלא להוציא את יעדי הקישורים – כלומר את הדפים בדומיין שלנו שמקבלים קישורים, לדוגמא מתוך מג'סטיק:

הורדת הקישורים ממג'סטיק

ניתן לעשות זאת במקרה הזה ע"י הורדת כל הקישורים לקובץ CSV ומשם להוציא את כל הדפים המקושרים שלנו או להוריד ל CSV את כל ה TOP PAGES שלנו ככה נדע בדיוק מה הדפים באתר שלנו שיש אליהם קישורים, רצוי כמובן להשתמש באינדקסים הכמה שיותר וותיקים (Historic Index) כדי למצוא את כל הדפים שהיו קיימים אי פעם ולא רק מהתקופות האחרונות, כך תוכלו למצוא ממצאים ארכיאולוגיים של דפים באתר המדובר שקיבלו קישורים – בשל העדכונים האיטיים של מג'סטיק ודומיו ייתכן גם למצוא קישורים שהופנו אל דפים גם לפני שנים, נקודה שימושית כאשר מדובר בדומיינים יד שנייה.

2. בשלב השני – יש להוציא מה-WMT את כל הקישורים הנכנסים שלנו ואת זה צריך לעשות בשלוש פעולות כדי להיות יסודיים:

  1. להוריד את הטבלא של כל ה-All linked pages
  2. להוריד את – More Sample Links
  3. להוריד את ה-Latest Links

ומדוע להוריד את שלושת הרשימות? יש הבדל בין שלושתם מכוון שיתכן שבכל אחת מהרשימות יהיו כלולים דפים שלא כלולים באחרים (בגלל סינכרון איטי של ה-WMT).

לאחר מכן: את הרשימה של ה-All linked Pages אפשר לאחד עם הרשימה שהוצאנו מהכלים האחרים לבדיקת הקישורים, ולשמור בצד.

לגבי ה-Samples וה-Latest צריך להוציא מהם את יעדים הקישורים שלהם בעזרת Scrapebox שכן הם מפרטים רק את הדפים המקשרים ולא את הדפים המקושרים, כדי לעשות זאת נשתמש בכלי של Scrapebox שמוציא מרשימת כתובות נתונה את כל הקישורים היוצאים הנמצאים בהם, נכנס לתוסף הנ"ל (לאחר התקנתו אם צריך):

מציאת הקישורים היוצאים

ואחר כך לבחור בקישורים היוצאים בלבד ולהריץ – ולאחרי סיום ההרצה ללחוץ על Show Extracted Links:

Link Extractor

לאחר שלחצתם על Show Extracted Links – תקבלו רשימה של כל הקישורים היוצאים שהיו בכל הדומיינים המקשרים אליכם – שזאת תהיה רשימה די ארוכה מן הסתם – אך הרשימה מסודרת לפי הא' ב' אז פשוט תגללו למטה עד שתגיעו לשם הדומיין שלכם ומשם תעשו קופי על כל הדפים הנמצאים (תאורטית) בדומיין שלכם ותעשו פייסט לתוך רשימת הדפים שהוצאתם מ-WMT ומהכלים לבדיקת הקישורים, כך שתקבלו רשימה ארוכה של עמודים מהאתר שלכם.

3. בשלב זה – מה שצריך לעשות הוא לייבא את כל הרשימות שמכילות דפים שלכם אל תוך ScrapeBox ולהסיר כפילויות שמן הסתם יהיו לא מעט כאלו – כגודל האתר, כך גודל הסינון:

ייבוא - סינון

4. עכשיו מה שצריך לעשות הוא לבדוק איזה מהדפים שנשארו לנו ברשימה הם דפים חיים שלא מעניינים אותנו (שכן דף חי עם קישורים הוא בסדר מבחינתנו) ומה הם הדפים השבורים שאנחנו יכולים להשתמש בהם כדי להוסיף קצת Link Juice לאתר הצמא שלנו – ואת זה נעשה עם ידי ייצוא הרשימה -

  • מדוע לא להשתמש ב-Alive Check של ScrapeBox ?  מהסיבה הפשוטה, כי הוא פשוט גרוע ומחזיר שגיאות על כל מה שהוא לא קוד HTTP 200 כלומר גם על הפניות 301 וכ'ו – מה שיגרום לנו להרבה בלבול, צריך משהו קצת יותר מדוייק שיחזיק לנו את קוד ה-HTTP המדוייק.

5. עכשיו מה שצריך הוא לעבור אל: http://www.tomanthony.co.uk/tools/bulk-http-header-compare/   (או לכלי אחר, אם יש לכם משהו יותר טוב – אשמח לשמוע עליו) ולהריץ בדיקה על כל ה-URLים שהוצאנו,  ולאחר ההרצה – ללחוץ על כפתור הייצוא (אל תדאגו לגבי כמות, אפשר לבדוק שם כמה עמודים שרוצים!) מתוך הייצוא לשמור בצד את כל ה-URLים שמחזירים 404,  למחוק את מה שמחזיר 200 ולהריץ שוב כל URL שמחזיר 301 כדי לראות שהיעד הוא הנכון – ואם היעד אינו נכון – כלומר מחזיר 404 אז להוסיף לרשימת ה-404, ואם היעד מחזיר קוד 200 – אפשר למחוק כמובן.

Bulk Http Header Check

6. השלב האחרון והפשוט ביותר הוא פשוט לקחת את כל העמודים שאספנו לנו שהם בעצם רשימת עמודים העונים על שני התנאים האלו:

  • יש אליהם קישורים נכנסים מכל מיני אתרים.
  • באתר שלנו הם מחזירים קוד 404 – היינו שבורים.

ובשלב זה כל מה שנותר לעשות הוא פשוט לקחת את אותם הדפים – ולבצע ברמת האתר \ שרת שלנו (מה שיותר נוח) הפניות 301 ליעדים חדשים עבורם – ובכך להבטיח שכל קישור שהיה לנו שאבד עם הזמן, עדיין יסייע לנו – כבר יצא לי להתקל בכמה פרוייקטים שבצורה זאת קיבלנו "במתנה"  לא פחות ממאות קישורים "חינם"  – ושהיה מספיק רק בפעולה זאת כדי לשחזר מיקומים של אתר שעף לקיבינימט היישר אל הדף הראשון – וכמובן שאותו הדבר תקף גם לגבי דומיינים יד שנייה שהיו אליהם קישורים לכל מיני דפים שאנחנו פשוט יכולים להפנות אל דף הבית – נתעלם לרגע מהמחלוקת אם זה עוזר או לא ונאמר שאם לא יעביר Juice אז לפחות אולי יעביר טראפיק מידי פעם…  (כמובן אם מדובר בדומיין ותיק שהיו לו קישורים טובים ולא סתם זבל שרק יעביר אלינו עונש).

מי שרוצה ממש לשכלל את השיטה יכול בשלב 1 לסנן את רשימות הקישורים הנכנסים לפי איכות ורק עבור דפים איכותיים לנסות לאתר תקלות כאלו – אך זה כבר גובל בהפרעה נפשית ויצמצם משמעותית את מספר העמודים הפוטנציאליים לתיקון.

לסיכום

מקווה שהמדריך הזה יסייע למי שנפל לידיו אחד מהפרוייקטים האלו של "עברתי אתר ואיבדתי את כל המיקומים" או "צריך לעשות 1000 הפניות 301 רק שאין לי מושג מאיזה דפים", בהחלט מצאתי בשיטה הזאת לא מעט שימוש במקרים כאלו, מקווה שגם אחרים ימצאו בה שימוש.

יש לכם הצעות לשיפורים? ספרו לנו בתגובות!

VN:F [1.9.18_1163]

מה דעתכם על הפוסט?

דירוג: 10.0/10 (4 הצבעות )

VN:F [1.9.18_1163]

דירוג: +2 (מתוך 2 הצבעות)

איך נחזיר לעצמנו קישורים אבודים?, 10.0 out of 10 based on 4 ratings


שתפו אותנו בפייסבוק גוגל ובטוויטר!
אהבתם את מה שקראתם? הכניסו את כתובת המייל שלכם
והרשמו לעדכונים כדי שתהיו הראשונים לקבל את המידע שאף אחד לא מספר לכם: