Vi har hashbang-nettadresser med utvidede utf-8 tegn. For eksempel:

https://example.com/#!каталог 

Bing-bot henter HTML-øyeblikksbildet https://example.com?_escaped_fragment_=каталог kodet URL som \xD0\xB0.... Serveren vår svarte med en 400 feil for det. De godtar bare prosent kodede nettadresser. %D0%B0... ville få 200 OK status.

Hvordan kan jeg løse dette problemet?

for eksempel:

  • Er du sikker på at det er en ekte Bingbot? Jeg har sett (i flere logger) mange dårlig skrevet bots som later til å være f.eks. Googlebot.
  • 1 bilde lagt til [oppdatert]. IP-sjekk: dig.whois.com.au/ip/40.77.167.196
  • 1 kan det være en slags, hvordan tomkatten din håndterer urlene, ikke?
+25

Du bør kode billednavnet før du gir det til å gjennomsøke noen bots, dvs. bildenavnet skal være som %2F%D0%B7%D1%83%D1%80%D0%B0%D0%B3.jpg i kildekoden for siden din. Alle moderne nettlesere dekoder den, og for brukere vil UTF-8-tegnene vises på en menneskelig måte.

Så gjør koding på serversiden og kod alle disse tegnene før du inkluderer i kildekoden.

Se kildekoden for denne Wikipedia-siden, og du vil forstå: https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%BE%D0%B3%D1%80%D0%B0% D0% BC% D0% BC% D0% B0_% D1% 80% D0% B0% D0% B7% D0% B2% D0% B8% D1% 82% D0% B8% D1% 8F_% D0% 9E% D0% 9E% D0% 9D

Oppdatering: Basert på en dypere gjennomgang av nettstedet og andre kommentarer fra StackExchange-brukere nedenfor. Det ser ut til at du må kode alle nettadressene dine på nettstedet ditt og XML-sitemap. På nettstedet ditt har du ikke kodede URL-er, så vel som ikke kodede URL-er i XML-sitemap. Bruk UTF-8-kodede nettadresser overalt. Husk at Bingbot er langt bak Googlebot og nylig har begynt å gjengi JS-basert nettsted i større skala. Bruk av ikke-ASCII-tegn kan forårsake feil for Bingbot.

Nettadressene i kildekoden og DOM, så vel som i XML-sitemap, må være kodet slik basert på eksemplet ditt:

https://example.com/#!%D0%BA%D0%B0%D1%82%D0%B0%D0%BB%D0%BE%D0%B3 

Her kan du lese mer om riktig koding av områdekart: https://www.sitemaps.org/protocol.html#escaping

  • Du tror de kobler til зураг.jpg heller enn %D0%B7ураг.jpg ?
  • Ja, jeg antar at i kildekoden er navnet på bildet: зураг.jpg
  • 1 @ ts.tsogtgerel takk for at du delte nettstedet ditt. Nå er alt klart. Hovedproblemet er at nettstedet ditt er i JS og Bing er ekstremt nytt for gjengivelse av JS-innhold og indeksering av JS-basert nettsted. Google er ganske avansert med å gjengi JS-filer og ser innholdet ganske bra, men Bing er en nybegynner her. Kanskje du kan snakke med teamet ditt om et alternativ å forhåndsinnføre innholdet ditt eller noe? Her er en ganske god guide om JS-gjengitte nettsteder. Denne informasjonen vil gi deg mye informasjon om problemet.
  • 1 @ ts.tsogtgerel tilleggsmerknad. På DOM-siden din kan jeg se at URL-ene dine ikke er kodet også. Men i ditt tilfelle kan Bing bot ikke engang se innholdet ditt.
  • 1 "Hovedproblemet er at nettstedet ditt er i JS" - JS-elementet kan hindre Bing fra å gjennomsøke / indeksere nettstedet til å begynne med, men dette bør ikke være grunnen til at Bing har gjennomsøkt feil kodede nettadresser. (?) For øvrig ser det ut til at de ukodede nettadressene også er til stede i XML-områdekartet, som jeg antar at det sannsynligvis blir sendt til Bings verktøy for nettredaktører?

Du må sannsynligvis urlencode Bilder src attributt i html-koder.

  • 2 Dette anses som et svar av lav kvalitet. Kan du forklare tankene dine mer og inkludere noen detaljer? Anta at OP har liten eller ingen anelse om hva du snakker om. Jubel!!

fungert for deg: Charles Robertson | Ønsker du å kontakte oss?