Fri, Apr. 21st, 2017, 04:36 pm
[info]robofob: behind the scenes

Декілька цікавих технічних адрес ЖЖ під інтриґуючою назвою

Політика LiveJournal стосовно ботів

Усі автоматичні боти, павуки, збирачі даних, сканери інформації, тощо, що одержують доступ до інформації за адресою LiveJournal.com, підпадають під наступні правила. Якщо ви були переправлені на цю сторінку, то це через те, що ми гадаємо, що ви під контролем автоматичного бота. Якщо це не так, будь ласка, зв'яжіться з нами за адресою webmaster@livejournal.com.

Формат даних

Ми пропонуємо низку даних користувача у стандартному XML форматі, а саме:

RSS

Останні записи користувача використовують Real Simple Syndication XML формат. Це доступно тільки при публічних запис за адресою:

http://exampleusername.livejournal.com/data/rss

Якщо ви бажаєте, щоб включалися записи, що були обмежені за безпекою та у вас є доступ для їх перегляду, ви можете подати запит для отримання авторської версії потоку, що використовує HTTP Digest auth, використовуючи:

http://exampleusername.livejournal.com/data/rss?auth=digest
Atom

Нещодавні записи користувача об'єднані за допомогою Atom XML формату. Незалежно від того пройдена авторизація чи ні вони доступні за адресою:

http://exampleusername.livejournal.com/data/atom
http://exampleusername.livejournal.com/data/atom?auth=digest
Update Stream

Щоб переглянути он-лайн стрічку усіх записів LiveJournal, скористайтеся:

http://www.livejournal.com/stats/latest-rss.bml
FOAF

Інформаційна сторінка користувача використовує Friend of a Friend XML формат. Доступно за адресою

http://exampleusername.livejournal.com/data/foaf.rdf
Friend-Data

Лінією відділяється перелік імен користувачів, що є у переліку друзів користувача або додали користувача як свого друга. Доступно за адресою

http://www.livejournal.com/misc/fdata.bml?user=exampleusername
Interest-Data

Зацікавлення у відокремленому лінією форматі. Доступно за адресою

http://www.livejournal.com/misc/interestdata.bml?user=exampleusername

Пропонуємо вам використовувати ці ресурси замість того, щоб "зчитувати інформацію з екрану("screen-scraping")" на сторінках користувачів.

Тарифи & Обмеження

Пропонуємо вам кешувати результати запитів вашого боту, це буде економити нам пропускну здатність та процесорний час (CPU). Боти, що роблять повторні запити до того самого ресурсу (URL) за короткий проміжок часу будуть блокуватися. Будь ласка не використовуйте багато поточних ботів для отримання доступу до декількох ресурсів одночасно та не дозволяйте ботам з'єднуватися більше п'яти разів у секунду.

Добре побудовані агенти користувача

Усім ботам необхідно мати добре побудованого агента, що буде містити контактну email адресу для супроводження боту та бажано адресу організації запуску бота. Боти без цієї інформації мають більше шансів бути заблокованими. Приклад добре складеного агента:

Bot - http://example.com/ljtoy.html; bob@example.com

Контактна інформація

Якщо для досліджень чи збору інформації потрібна додаткова інформація, ви завжди можете зв'язатися з нами за адресою webmaster@livejournal.com. Якщо ми заблокували вашого бота і ви б хотіли зв'язатися з нами з цього приводу, будь ласка, напишіть нам листа на адресу webmaster@livejournal.com.

звідсіля


From:
( )Anonymous- this user has disabled anonymous posting.
Identity URL: 
имя пользователя:    
Вы должны предварительно войти в LiveJournal.com
 
E-mail для ответов: 
Вы сможете оставлять комментарии, даже если не введете e-mail.
Но вы не сможете получать уведомления об ответах на ваши комментарии!
Внимание: на указанный адрес будет выслано подтверждение.
Username:
Password:
Subject:
No HTML allowed in subject
Message:



Notice! This user has turned on the option that logs IP addresses of anonymous posters.